פרק 4

מדידה: מהימנות ותוקף

 

הקדמה (מתוך- קראוס, מילר ורובין, 1983)

המחקר הכמותי, כשמו כן הוא- בודק משתנים הניתנים למדידה ולהפעלה (חלקם) במטרה להגיע לחוק כללי בעל תוקף המאפשר הסבר וניבוי. משתנים הניתנים למדידה- זהו תנאי מרכזי במחקר הכמותי. המשתנה מוגדר באופן אופרטיבי ומאפשר בדיקה אמפירית אותה מתרגמים למספרים (מדידה) ועליהם מבצעים ניתוחים סטטיסטיים.

נראה שהבעיה היסודית ביותר במתודולוגיה של המחקר החברתי והחינוכי היא- כיצד לגשת למדידת המשתנים הכלולים בתיאוריה. המדידה היא המגשר היחיד בין המשפטים התיאורטיים לבין התצפיות האמפיריות. ללא הליכי מדידה נאותים אין כל אפשרות להעמיד במבחן את התיאוריות עצמן.

בחיי יום- יום מדידה של משתנים פיזיים (אורך, משקל...) נראית מובנת מאליה. במדעי החברה אנו עוסקים במשתנים מורכבים יותר: אינטליגנציה, הצלחה בלמודים, פופולאריות, מיומנויות חשיבה גבוהות, מוכנות לכיתה א', היפראקטיביות .... ולכן גם באמצעי מדידה מיוחדים ומורכבים יותר. למרות שמשתנים אלו קשים יותר למדידה מאשר משתנים פיזיים, העקרונות הבסיסיים של המדידה זהים בשני המקרים. הבעיה הניצבת בפני מדעני החברה אינה כיצד להגיע לידי מדידה לכשעצמה, אלא כיצד להגיע לידי מדידה טובה, שפירושה השגת ייצוגים משמעותיים וחד משמעיים של התכונות הנדרשות.

מאחר ואין סרגלים פסיכולוגיים שבאמצעותם ניתן למדוד אינטליגנציה, או כל משתנה אחר, המציאו שאלונים ומבחנים הבנויים בקפידה, אך הם אינם מובנים מעליהם כמו הסרגל המודד אורך. תמיד קיימת אי ודאות מסוימת כשעוברים מהמישור האמפירי למישור התיאורטי. הליכים טכניים מסוימים מאפשרים לנו לצמצם אי ודאות זאת, אך היא לעולם אינה ניתנת לחיסול מוחלט!

 

הגדרות אופרטיביות

בעוד המדען הפיזי מתייחס ישירות למדידת אורך או משקל, המדען החברתי מדבר על מדידת האינדיקאטורים (המדדים) המייצגים את המשתנים התיאורטיים. המדען החברתי אינו מודד באופן ישיר אינטליגנציה אלא מודד את מספר הבעיות שהתלמיד מצליח לפתור במבחן מסוים כמדד לרמת האינטליגנציה שלו; חרדה יכולה להימדד על ידי כמות הפרשת הזיעה במצב מסוים; ציון במבחן יכול להיחשב למדד להבנת החומר; ...

בכל אחד מהמקרים אין מודדים ישירות את התכונות הפסיכולוגיות אלא את ההיבטים ההתנהגותיים הניתנים לתצפית והנחשבים למדד/ האינדיקאטור של התכונה. (ההגדרה האופרטיבית של המשתנה הנמדד)

איך נדע אם אדם X אוהב אותנו?

איך נדע את הנטיות הפוליטיות של אנשים?

המשתנים מוגדרים על ידי התצפיות שמשתמשים בהן למדידה, וללא הגדרה תצפיתית כזו אין למשתנה כל משמעות מדעית.

מצב זה יוצר בעייתיות: אם אין אנו יכולים למדוד משתנים חברתיים ישירות, כיצד נוכל לדעת אם האינדיקאטורים אותם קבענו לצרכי המדידה אכן משקפים את המשתנים כפי שהם אמורים לעשות? זו בעיית המדידה!

 

מהי מדידה טובה?

קיימות שתי דרישות בסיסיות לגבי כל מדידה מדעית:

מה אתם מצפים ממשקל? ממבחן אינטליגנציה?

מכשיר המדידה חייב להביא לתוצאות עקביות- תוצאות שאפשר להסתמך עליהן במובן זה שאותו אדם יקבל את אותו דירוג (ציון, תוצאה) גם אם יימדד מספר פעמים, כאשר תנאי המדידה יהיו זהים בכל פעם. המונח מהימנות מתייחס למידת העקביות של מכשיר מדידה.

הליכי מדידה פיזיקאליים באמצעות מכשירים מכוילים בצורה נאותה, הם בעלי מהימנות גבוהה. הסיכוי לטעות מדידה- קטן ועל פי רוב גם ידוע. במדעי החברה קשה יותר להשיג מהימנות גבוהה במדידה. במבחן אינטליגנציה למשל- האם מתקבל על הדעת שציוני המבחן משתנים על פי הבוחן עצמו? נבחן שייבחן על ידי בוחן אחד יקבל ציון: 100 ואילו אם ייבחן על ידי בוחן אחר יקבל ציון גבוה או נמוך יותר? מהי כמות הגיוון בין התוצאות שמקבל אותו אדם, המקובלת עלינו?

מהימנות נמוכה היא צורה של אי דיוק הנגרמת על ידי רגישותו של מכשיר מדידה לגורמים המשתנים באופן מקרי ממצב מדידה אחד למשנהו (בוחן שונה, מזג אויר שונה, מצב רוח שונה, שעה שונה ביום...).

אנו מעוניינים לצמצם את השפעת הגורמים המקריים למינימום. מהימנות היא תוצאה של הדיוק הטמון במכשיר מדידה.

הדרישה השנייה היא שטכניקת המדידה תמדוד את מה שהיא אמורה למדוד ולא משהו אחר. תכונה זו של מדידה ידועה בשם: 'תקפות המדידה', או 'תוקף המדידה'.

מכשיר מדידה יכול להיות מהימן (סרגל) אך אינו תקף (סרגל אינו מודד חוכמה). מכשיר אינו יכול להיות תקף אם אינו מהימן. מבחן בלתי מהימן מעצם הגדרתו אינו מודד דבר (סרגל מגומי) ולכן בשום אופן אינו יכול להיות תקף.

 

קביעת מהימנות

מהימנות נמדדת בדרך כלל על ידי חישוב מידת ההתאמה בין שתי הפעלות של מכשיר המדידה על אותה סדרה של נבדקים. מקדם המתאם בין שתי סדרות המדידה מייצג את מידת המהימנות של המכשיר. מקדם המהימנות יכול להיות בין 0 (אי התאמה- אי מהימנות) לבין 1 (מהימנות מושלמת).

בהקשר זה משתמשים במבחן חוזר לשם קביעת מקדם מהימנות. האם יש עם זה בעיה?

האלטרנטיבה היא העברת מבחנים מקבילים, לשם בדיקת מהימנות, או שיטת 'מבחן חצוי' בו עורכים מדד התאמה בין שני חלקים שווי ערך של המבחן. במקרה זה המהימנות תהיה פונקציה של המתאם שנתקבל בין הציונים בחלק האחד של המבחן ובין הציונים בחלקו השני של המבחן. במקרה של העברת מבחנים מקבילים, המהימנות תהיה פונקציה של המתאם שנקבל בין הציונים של המבחן האחד והציונים של המבחן השני.

מהימנות בין שופטים: כאשר כלי המדידה של המחקר הוא שיקול הדעת של החוקר הנותן ציונים בעקבות תצפית או בפענוח מבחן השלכתי או שאלון שאינו מובנה, נבסס את מהימנות המדידה על ידי התאמתה לתוצאות הניתנות לאותם המבחנים על ידי חוקר אחר (למשל- מהימנות מבחן בגרות בספרות נקבעת על פי מידת ההתאמה בין ציוניהם של שני בוחנים).

 

מהימנות היא דרישה ראשונית חיונית לכל מחקר חברתי ויש לנקוט בצעדים מתאימים כדי להבטיח מהימנותם של כלי המדידה. ללא בדיקה כזו לא נוכל לפרש את הממצאים. ככל שהמשתנה הנמדד הוא מורכב יותר כך ברור יותר שנדרש מדד כלשהו למידת המהימנות של מדידתו.

כאן ראוי לומר שמבחנים פסיכולוגיים רבים עוברים מבדקי מהימנות לפני שהם מתקבלים לשימוש רחב. מהימנות של 0.80 נחשבת בדרך כלל למשביעת רצון. ציון זה מצביע על כך ש 80% מהווריאציות במדידות נגרמות על ידי הבדלים אמיתיים בין הפרטים הנמדדים ורק 20% הם תוצאה של טעויות אקראיות בתהליך המדידה. ישנם מחקרים בהם נדרשת רמת מהימנות גבוהה יותר.

מהימנות מתייחסת גם לבדיקות רפואיות- עד כמה המכשירים אמינים (מכשיר לחץ דם, בדיקות דם, ....). חשוב לדעת מהימנותם של אבחונים פסיכולוגיים.

 

קביעת תוקף

כדי שממצאי המחקר יהיו משמעותיים, על אמצעי המדידה להיות גם תקפים נוסף על היותם מהימנים: עלינו להיות משוכנעים שכלי המדידה אכן מודד את המשתנה הנחקר. התוקף הוא מעין גשר בין התיאוריה למחקר.

האם מבחן ה IQ אכן מודד אינטליגנציה?

האם האבחונים השונים מהווים מדד טוב ללקויות למידה?

האם ציון הפסיכומטרי מנבא טוב הצלחה בלימודים?

האם מבחן הבנת הנקרא אמנם מודד את הבנת הנקרא?

האם כמות הזעה וקצב דפיקות לב מודדים חרדה?

מבחן האינטליגנציה (מבחן ה IQ) הוא המשתנה התצפיתי שנועד לייצג את המשתנה התיאורטי- אינטליגנציה; ציון המבחן הפסיכומטרי הוא המשתנה התצפיתי שנועד לייצג את המשתנה התיאורטי- הצלחה בלימודים...

 

קיים צורך רב במדידה של משתנים תיאורטיים לא רק לצרכי מחקר אלא גם לצורך מיון אנשים- לעבודה, לצבא, ללימודים. המטרה היא להגדיל את הסיכוי לקבל אנשים 'טובים' או 'מתאימים' למערכת. שימוש במבחנים גרפולוגיים, שימוש בריאיון אישי לקבלה לעבודה או ללימודים, מבחני קבלה לישוב קהילתי.....

 

ארבעה סוגי תוקף שונים, בהתאם לשימוש שנעשה במכשיר המדידה (מתוך האוניברסיטה הפתוחה, יחידה 3):

תקפות נראית: המידה שבה המבחן נראה לנבחנים כמודד את מה שהוכרז עליו כנושא המדידה. המבחן 'נראה' הוגן, 'מתאים לכותרת', 'שייך' לחומר...

החוקר המפתח מודד יכול להתייעץ עם מומחים בתחום החקירה ולקבל דעתם על מידת התאמתו של המודד לנושא הנמדד, הסכמה ביניהם מחזקת את התקפות הנראית.

מדד להצלחה בנישואין- השאלה: עד כמה הינך מאושר/ת בנישואיך?

מבחן בעל תקפות נראית נמוכה עלול להחליש את המוטיבציה של הנבחנים.

 

תוקף ניבויי: לעתים מודדים משתנה אחד על מנת לאמוד או לנבא על פיו משתנה אחר-

מבחן פסיכומטרי- על מנת לאמוד הצלחה בלימודים/ התאמה ללימודים אקדמיים

מבחן גרפולוגי על מנת לאמוד התאמה לעבודה

ריאיון על מנת לקבוע יכולת מנהיגות/ התאמה לקורס טיס/ ללימודי רפואה

מבחני מוכנות לכיתה א' כמדד לעמידה בדרישות של כיתה א'

המשתנה הנמדד (המנבא) הוא ציון המבחן, המשתנה שרוצים לנבא הוא הקריטריון.

כדי לאמוד את תוקף הניבוי של המבחן (מכשיר המדידה) מחשבים את הקשר בין ציוני המבחן לבין ציוני הקריטריון. ככל שמדד הקשר (מתאם) גבוה יותר, גם תוקף הניבוי גבוה יותר. המתאם בין המשתנה המנבא (או צרוף של כמה משתנים מנבאים) לבין הקריטריון הוא אומדן לתוקף הניבוי.

בעת פיתוח כלי המדידה מחשבים מתאם בין הציונים המתקבלים באמצעות המבחן ובין ציוני הקריטריון שהתקבלו מאוחר יותר: מתאם בין ציוני המבחן הגרפולוגי ובין מדדים של הצלחה בעבודה; מתאם בין ממצאי הריאיון ובין הביצוע של המתקבל ללימודים.... רק לאחר שתקפות המודד מבוססת יהיה מוכן המודד לשימוש נרחב.

בדרך כלל לא מצפים לערכים גבוהים של תוקף ניבוי במדעי החברה. גם מתאם של 0.3 יכול להיות בעל ערך אם הוא משפר את הניבוי לעומת מצב בו אין משתמשים בשום מכשיר מדידה; מקבלים איזה שהוא אינדיקאטור (מדד) להימצאותה או אי הימצאותה של תכונה כזו או אחרת אצל האדם.

לא תמיד אפשר לאמוד את התוקף הניבוי של מכשיר מדידה: 'מכונת אמת', 'אינטליגנציה'

 

תוקף תוכן: לעתים קרובות מכשיר מדידה לא נועד לנבא משתנה כלשהו, אלא למדוד ביצוע באופן ישיר. מבחני סיום קורס או מבחני הישג הם מבחנים כאלו. המדידה עצמה נחשבת לקריטריון. במקרים כאלו תוקף המבחן תלוי במידה בה פריטי המבחן מייצגים את עולם התוכן בו מעוניין החוקר.

אם מורה לכיתה א' חושבת שידיעת חשבון כוללת יכולת פתירת בעיות מילוליות וכן תרגילים, בתחום הכולל עד 10 וגם מעל 10, הרי שהמבחן הבודק ידיעת חשבון יכלול שאלות ותרגילים בתחום ה- 10 וכן בתחום מעל 10.

תלמידים יטענו שהמבחן אינו 'פייר' (אינו תקף) אם המבחן אינו משקף את החומר הנלמד.

תוקף תוכן הוא אומדן של מידת הייצוגיות של פרטי המבחן את עולם התוכן הנחקר- הנמדד.

על מנת להבטיח תוקף תוכן בשיטה זו יש לערוך ניתוח יסודי של עולם התוכן ולבנות אוסף מייצג של פריטים מעולם תוכן זה. כמו כן יהיה צורך לשים לב גם לניסוח השאלות שגם הוא עלול להשפיע רבות על תוצאות המבחן.

בדיקת תוקף תוכן בשונה מבדיקת תוכן ניבוי, מבוססת בעיקר על היגיון ולא על סטטיסטיקה. מכשיר המדידה נשפט על פי ההתרשמות מן המידה בה הוא מייצג את עולם התוכן הרצוי. לעתים נעזרים במומחים בתחום על מנת לקבוע את תקפות התוכן.

 

תוקף מבנה: לא תמיד תהיה הסכמה בין חוקרים לגבי עולם התוכן של משתנה מסוים (אינטליגנציה, יכולת מנהיגות, מורה טוב...). הקושי לתקף מדדי משתנים הולך וגדל ככל שפוחתת ההסכמה לגבי הגדרתם האופרטיבית. אי הסכמה במישור התיאורטי (מה המדידה אמורה למדוד) בודאי מעוררת קשיים בבדיקת- עד כמה המדידה מודדת את מה שהיא אמורה למדוד.

במקרים כאלו נוקטים בכמה בדיקות סטטיסטיות. למשל: בבואנו לתקף מבחן המודד 'הישגיות' נצפה (על פי התיאוריה) למתאם חיובי בין מבחן זה ובין הצלחה בלימודים/ מבחן יכולת....

תיקוף של מבחן אינטליגנציה חדש יכלול בדיקת התאמה בין ציונים המתקבלים מהמבחן החדש ובין ציוני אינטליגנציה המתקבלים ממבחן אינטליגנציה קיים.

מתאמים בין מבחנים האמורים לבדוק את אותו המשתנה או גם כאלו הבודקים מרכיבים אחדים של המשתנה יתרמו לתוקף המבנה של המבחן. העדר מתאמים, או מתאמים שליליים יטילו ספק בתוקף המבחן- או אולי בתיאוריה עצמה.

התיאוריה שבה מעוגן המבנה (המשתנה התיאורטי) מכתיבה לעתים קרובות, אילו קשרים ניתן לשער שקיימים בין המשתנה הנמדד ובין משתנים אחרים. כל קשר שיימצא בין המבחן המודד משתנה אחד לבין מבחן שמודד משתנה אחר שלפי התיאוריה קשור למשתנה הנמדד (הראשון) יתמוך בתוקף של המבחן הנדון. על פי אותו היגיון נצפה שלא למצוא מתאם גבוה בין המבחן המודד משתנה  מסוים לבין מבחנים המודדים משתנים שאינם אמורים להיות בקשרים עם המשתנה הנמדד.

ישנן בדיקות רבות לתוקף המבנה, אך הרעיון מאחורי כולן הוא זהה: נבחנת מידת ההתאמה בין המבחנים (מתאם חיובי/ שלילי/ נמוך) הזהה למידת ההתאמה בין המשתנים הנמדדים- על פי התיאוריה. כל מדידה כזו שהתוצאה שלה בהלימה לתיאוריה תורמת לתוקף המבנה של המבחן הנדון.

כאן אפשר לראות בעיה שעלולה להתעורר כשתוצאות מבחן תוקף מבנה אינן משביעות רצון. לפני החוקר שלוש מסקנות אפשריות:

  • המבחן אינו מודד את המשתנה הנחקר ולכן אינו תקף
  • יתכן והמערכת התיאורטית מוטעית
  • מערך המחקר אינו בודק את ההשערה כראוי (שיבושים בהעברת השאלון, הקראת ההוראות, סיכום הציון הסופי וכד')

'האם יש להטיל ספק בתוקף המכשיר בלבד או בתוקף התיאוריה כולה- הנטייה לכאן או לכאן תלויה בעצמתה האמפירית של התיאוריה. חוקרים נוטים להטיל ספק בתוקף המכשיר ולא בתיאוריה כולה כאשר מדובר בתיאוריה מבוססת, שרבים מניבוייה אוששו בעבר. לעומת זאת יש נטייה לשנות מרכיבים בתיאוריה כאשר היא נמצאת בשלבי התפתחותה הראשוניים והבסיס האמפירי שלה עדיין חלש.'

 

שימו לב לתוקף הנדרש בהקשר למבחנים הבאים:

  • 'פוליגרף' (נדרש תוקף ניבויי)
  • מבחן הבנת הנקרא לילדי כיתה ד' (תוקף ניבויי- ילד שעבר בהצלחה מסוגל להתמודד בהצלחה עם משימות הדורשות קריאה; תוקף מבנה- ממצאי המדידה יהיו במתאם חיובי עם ציונים במקצועות הדורשים קריאה..; תוקף תוכן- מומחים יחברו את השאלות ויבחרו את הטקסטים למבחן)

השלימו:

  • שאלון המדרג אנשים על המשתנה: ליברליות/ שמרנות
  • מבחן המודד נטיות מוסיקליות
  • מבחני מוכנות לכיתה א'

 

 

סיכום:

מדידת המשתנים הנחקרים כחלק מבדיקת ההשערה, הופכת להיות קריטית בקביעת גורל המחקר ואיכותו. חוקר המפתח כלי מדידה אמור להבטיח שהכלי מהימן ותקף. תהליך תיקוף כלי המדידה וכן קביעת מהימנותו הם תהליכים ארוכים ומסובכים ולכן לרוב יעדיף החוקר להשתמש במבחנים קיימים שמהימנותם בוססה והתוקף שלהם ידוע (אין צורך לבדוק תקפות ומהימנות בכל העברה של המבחן). חשוב לדעת שמבחנים שתוקפו על אוכלוסיה אחת אינם בהכרח מתאימים לאוכלוסייה אחרת. עבודות מחקר רבות מתפרסמות שעיקרן תיקוף מבחנים קיימים לאוכלוסייה אחרת (אוכלוסיית ארה"ב לעומת אוכלוסייה ישראלית).

הדיון הנ"ל על מהימנות מדידה ותקפותה מעלה למודעות את האילוצים בהם נאלץ החוקר להתחשב. כל תרגום של משתנה תיאורטי למשתנה תצפיתי וכן דרך קביעת הציון המודד את המשתנה מהווה פשרה מסוימת בין התיאוריה למציאות. תמיד אפשר יהיה לטעון שהמדידה אינה ממש בודקת את כל מה שהתיאוריה מייחסת למשתנה הנבדק.

אמת זו אמורה לגרום לנו להתייחס בחשדנות כלפי תוצאות מדדים שונים ובודאי להתייחס אליהם בספקנות מסוימת. כבעלי מקצוע אנו מחויבים להיזהר בקביעת המסקנות מהם ובדיווחם (דרושה צניעות בדיווח- של אבחונים למשל- יש להימנע מחד משמעיות). עלינו לדעת שתמיד תהיה קיימת טעות מדידה בייחוד במקרים שאינם קיצוניים.

 

סולמות מדידה (האוניברסיטה הפתוחה, יחידה 3; נחמיאס ונחמיאס, 1982)

ניתן להגדיר 'מדידה': נוהל שעל פיו מקצה החוקר ספרות לתכונות, לגירויים או לאירועים בהתאם לכללים ידועים מראש.

המדידה בסופו של דבר מפיקה סדרת מספרים אשר מייצגים את המידה בה תכונה מסוימת מצויה בנבדקים. המספרים אמורים לשקף את היחסים הקיימים במציאות בין האירועים או העצמים או התכונות הנמדדות.

כשם שהמדידה מעבירה אותנו מרמה מושגית לרמה של מספרים, כך, בסוף תהליך המחקר, נרצה לעבור מרמת המספרים לרמה המושגית. לכן שאלה מאד חשובה היא: אילו מסקנות ניתן להסיק מהמספרים.

המספרים עצמם הם חלק ממערכת מספרית פורמאלית שיש לה תכונות ידועות. למשל: ידוע שההפרש בין 2 ל 4 זהה להפרש בין 4 ל 6; ידוע גם שהמספר 60 הוא גדול פי שניים מהמספר 30 וכד'.

תכונות אלו של השיטה המספרית לא בהכרח תימצאנה בתופעות האמפיריות אותן אנו מודדים: תהא זו טעות לחשוב שהבדל בין ציון 80 ל 90 בבחינה זהה להבדל בין ציון 40 ל 50 בבחינה, או שמי שקבל 80 יודע פי שניים חומר לעומת מי שקיבל 40. מערכות המספרים שהושגו כתוצאה מתהליכי מדידה אינן תמיד בעלות אותם מאפיינים המונחים ביסודה של מערכת המספרים הפורמאלית. לכן לא ניתן לבצע עליהן את כל פעולות החשבון. פעולות ניתוח הנתונים- פעולות החשבון המותרות ביחס למערך נתון של מספרים-  תהיינה תלויות בסולם המדידה שבו השתמשו במחקר/ ברמת המדידה שהושגה. במהלך השנים פותחו שיטות סטטיסטיות לניתוח נתונים המתאימים לסולמות שונים/ רמות מדידה שונות. כל זה על מנת להסיק את המסקנות הנכונות מהניתוח הסטטיסטי שייעשה במעבר מהרמה המספרית לרמה המושגית.

 

חשבו- מה משמעותם של מספרים כמדד/ סימן למשתנים הבאים:

גובה, משקל, גיל

ציונים, דרגות בצה"ל

סולם סוציו- כלכלי

דירוג (מתן מספרים ל-) מכוניות לפי סוג, נפח מנוע, צבע, גיל

בדיקת עמדות: בין 1- 5 ציין עד כמה אתה מסכים עם העמדה.

מספרים הרשומים על חולצותיהם של שחקני כדור רגל, מספרי אוטובוס, מספרי זהות.

 

מערכות המספרים כאן שונות זו מזו לא רק בתכונות שהן מייצגות אלא גם במידה בה הן מאפשרות להסיק מסקנות מהמספרים על התכונות הנמדדות.

נוהגים לסווג מערכות מספרים שונות לארבעה סולמות מדידה: סולם שמי, סולם סדר, סולם רווחים, סולם מנה. סולמות המדידה שבהם נשתמש מגדירים מה אפשר ללמוד מן המספרים לגבי המהויות המתוארות, וכן אילו מדדים אפשר לחשב בכל סולם.

 

סולם שמי: רמת המדידה החלשה ביותר בה המספר משמש קיצור ל 'שם'. המספר נועד למטרות מיון ואין לו שום ערך כמותי, הוא אינו מייצג 'גודל'. כל עוד לתכונות שוות ניתן שם זהה ולתכונות שונות ניתן שם- ערך- שונה- מושגת הרמה השמית של מדידה. הסולם השמי שומר על זהות התכונה: שני פריטים שקיבלו את אותו המספר הם זהים מבחינת התכונה הנמדדת.

 מה ניתן לעשות עם נתונים שמיים: טבלאות שכיחות השוואה בין שתיים או יותר התפלגויות שכיחות, חישוב השכיח- הקטגוריה המכילה את המספר הגדול ביותר של תגובות, פיזור- ככל שיש יותר קטגוריות יש יותר פיזור.

קבוצה דתית: לכל קבוצה ניתן מספר (1,2,3,4,5)

1. פרוטסטנטים- 62: שכיח

2. קתולים- 52

3. יהודים- 10

4. מוסלמים- 12

5. בודהיסטים- 2

 

סולם סדר: תכונות רבות הנחקרות במדעי החברה, לא זו בלבד שהן ניתנות למיון אלא הן גם מציגות סוג כלשהוא של יחס: גבוה, בינוני, נמוך. עמדות בדרך כלל נמדדות באמצעות סדרה של שאלות עם תשובות מדורגות בסדר עולה או יורד (מסכים בהחלט, מסכים, לא מסכים, לא מסכים בהחלט). המספרים מציינים את הסדר, הדירוג וכמובן הזהות. המספרים אינם מבטיחים שהמרווחים בין דירוג ודירוג הם זהים.

מה ניתן לעשות עם נתונים המציינים סדר: כל מה שניתן לעשות עם נתונים שמיים ובנוסף- מציאת החציון (הציון המחלק את מספר העונים לשניים חצי מתחת לציון מסוים וחצי מעליו), אחוזונים (המספר המחלק את הנבדקים לפי אחוזים), פיזור- הטווח בין המספר הקטן ביותר לבין המספר הגדול ביותר, ניתן גם להפעיל שיטות סטטיסטיות לבדיקת השערות (יחס בין משתנים).

תכונה נבדקת: ניכור פוליטי

נבדק

ציון

דרגה

א

10

1

ב

27

2

ג

36

3

 

אפשר להחליט באופן שרירותי: מציון 30- 40- דרגה גבוהה של ניכור, מציון 20- 29- דרגה בינונית של ניוכר, מציון 10- 19- דרגה נמוכה של ניכור.

 

סולם רווחים: בסולם זה ניתן להקיש מהמספרים על התכונות עצמן יותר מאשר בשני הסולמות הקודמים. המספרים בסולם זה מלמדים, בנוסף על זהות הערכים ועל סדרם, גם על ההפרשים שבין הערכים. במקרה זה ניתן להקיש מההפרש בין המספרים על ההפרש שבין התכונות עצמן. ההבדל בין 10 מעלות ל- 20 מעלות צלזיוס זהה להבדל בין 20 מעלות ל- 30 מעלות צלזיוס. לעומת זאת אי אפשר לומר שיום בו נמדדו 20 מעלות הוא חם פי שניים מיום בו נמדדו 10 מעלות צלזיוס. האיסור להקיש על היחסים בין הערכים נובע מכך שבסולם רווחים נקודת ה 0 היא שרירותית- אין לה משמעות של העדר חום מוחלט.

ניתן לבצע כמעט את כל הניתוחים הסטטיסטיים: ממוצע, סטיית תקן, מתאם

 

סולם מנה: סולם רווחים שבו נקודת ה- 0 קבועה ומוחלטת- נקרא סולם מנה. תכונות שיש להן נקודות 0 טבעיות ניתן למדדן ברמת מדידה זו: משקל, גובה, זמן, גיל....

מספרים ברמה זו שומרים על התכונות הבאות:

שומרים על זהות: אנשים המקבלים ציון זהה, הם בעלי אותה רמה של התכונה.

שומרים על הסדר: ציון גבוה מייצג 'יותר' מהתכונה הנמדדת בעוד ציון נמוך מייצג 'פחות' מהתכונה הנמדדת.

שומרים על הפרש, על מרווח קבוע: ההפרש בין הציונים מייצג הפרש ידוע בין התכונות.

שומרים על יחס קבוע: ניתן להסיק באמצעות הציונים על היחסים בין התכונות (יצחק שוקל פי שניים ממשה).

 

חשיבות רמת המדידה

כפי שראינו- רמת המדידה קובעת אילו פעולות חשבוניות ניתן לעשות על הנתונים. בכל מערכת מספרים ניתן לחשב כמעט כל מדד (ממוצע, שונות, חיבור, חיסור....), השאלה המרכזית היא- מה המשמעות של המדד שנתקבל, מה אפשר ללמוד ממנו על התכונה הנמדדת. במחקר החברתי- חינוכי- עיקר השימוש בסטטיסטיקה ובמספרים הוא להגיע להבנה טובה יותר של היחסים בין התכונות. אין משמעות לממוצע מספרים המייצגים תוויות זיהוי בלבד, צבעי מכוניות, מצב משפחתי וכד'; ממוצע הוא משמעותי רק אם חושב על מספרים המייצגים תכונה המסודרת בסולם רווחים או מנה.

 

 

  • הציעו את סולם המדידה הגבוה ביותר שניתן להשתמש בו למדידת המשתנים הבאים, ונמקו את בחירתכם:
    א. המצב המשפחתי של הנחקרים (רווק/ה; נשוי/אה; גרוש/ה; אלמן/ה).
    ב. רמת ההשכלה של הנחקרים (יסודית, תיכונית, על-תיכונית).
    ג. הוצאות חודשיות של משפחה בסעיף "תרבות ופנאי".
    ד. הערך הקלורי של התזונה היומית.
    ה. הישגי התלמידים בבחינה, הממוינים לפי כשלון / הצלחה.
    ו. תאור נבחרות ממדינות שונות על פי המדליות בהן זכו באולימפיאדה.

·        במבחני IQ התקבלו 2 תוצאות לגבי שני נבדקים: א' – 220; ב' – 110 (השמות שמורים במערכת). אפשר לומר ש (ענו ונמקו לגבי כל אחד מההיגדים):
א. נבדק א' פיקח פי שניים מנבדק ב'.
ב. לנבדק ב' יש רמת
IQ נמוכה יותר.
ג. אם לנבדק ג' יש
IQ 110, הרי שג' וב' זהים ביכולות שלהם.
ד. הנבדקים ג' וב' יכולים יחד להפגין יכולות כמו של נבדק א'.
ה. אם מחצית מהנבדקים הגיעו ל
IQ 220,  ומחציתם ל- 110, אפשר לומר שרמת ה IQ  הממוצעת באוכלוסייה שנבדקה היא 165.