פרק 5:

אוכלוסייה ומדגם (האוניברסיטה הפתוחה, יחידה 2)

 

הקדמה

השערות המחקר תמיד מתייחסות לאוכלוסייה מסוימת: בני נוער, ילדי קיבוץ, תושבי מדינת ישראל, נהגים בישראל, ילדים בכיתה א', טעוני טיפוח..

מטעמי תקציב וזמן קשה על החוקר לבדוק את האוכלוסייה כולה ולכן הוא נאלץ בדרך כלל לבדוק רק חלק ממנה. חלק זה נקרא מדגם. עבודת המחקר מתבצעת על מדגם מהאוכלוסייה והחוקר מכליל את תוצאות המחקר על האוכלוסייה כולה.

מכאן ברור שמדגם שאינו מייצג את האוכלוסייה לא יאפשר הכללת התוצאות לאוכלוסייה עצמה.

מכיוון שכל מדגם הוא תמיד רק חלק מהאוכלוסייה, תמיד קיים סיכוי שהתוצאות שיתקבלו לא ישקפו במדויק את התופעה באוכלוסייה כולה.

למרות שאי אפשר להבטיח זהות בין המדגם לאוכלוסיה ישנם ניסיונות למצוא דרכים להגדיל את ייצוגיות המדגם. 'דגימה' הוא תחום ידע בסטטיסטיקה.

טיב המדגם תלוי באופן הדגימה, בגודל המדגם ובאופי האוכלוסייה הנחקרת.

 

אופי האוכלוסייה: אוכלוסייה הומוגנית והטרוגנית

כאשר אנו רוצים לחקור תכונה שהערך הנחקר שלה משותף לאוכלוסייה כולה, נוכל להסתפק במדגם מאד קטן מהאוכלוסייה- אפילו של איש אחד- על מנת לקבוע ערך זה.

תכונה נחקרת: 'שפה מדוברת', הערכים הנבדקים הם: קיומן של אותיות גרוניות בשפה (ח', ע'). אנו מניחים שלכל האוכלוסייה יש את אותו הערך במשתנה הנחקר 'שפה מדוברת'. האוכלוסייה היא הומוגנית במשתנה זה ולכן כל מדגם שניקח ייתן את אותן התוצאות.

'כאשר האוכלוסייה הומוגנית בתכונה נחקרת, אין חשיבות לגודל המדגם או לצורת הדגימה. המדגם המזערי ביותר שיידגם בדרך כלשהי יספיק כדי להסיק על תכונה זו באוכלוסייה כולה'. (יחידה 2)

במידה ונרצה לחקור את המשתנה: הרגלי צפייה בטלוויזיה בקרב אוכלוסיית הילדים במדינת ישראל, יש להניח שלא נסתפק במספר מועט של נבדקים, אלא נרצה לבחור מדגם המייצג גילאים שונים, שכבות אוכלוסייה שונות לפי רמה סוציו אקונומית....

כאשר האוכלוסייה היא הטרוגנית בתכונה הנחקרת אנו נדרשים לדגום מדגם מייצג. טיבו של המדגם יהיה תלוי בגודל המדגם וכן בדרך הדגימה.

מרבית התופעות המעניינות את מדעי החברה והחינוך עוסקות באוכלוסיות הטרוגניות. לכן על מנת לקבל תשובות המשקפות את המציאות- מאפשרות הכללה- יש להקפיד שהמדגם ייצג את האוכלוסייה במשתנים הנחקרים. כך הסיכוי לטעות בהיסק מהמדגם לאוכלוסייה יהיה קטן ככל האפשר.

 

שיטות דגימה

שתי שיטות כלליות לדגימה: דגימה הסתברותית ודגימה לא הסתברותית.

דגימה הסתברותית: מקיימת שלושה תנאים-

  • לכל הפריטים באוכלוסייה הסתברות ידועה וזהה להיבחר למדגם;
  • לשום פריט אין סיכוי ודאי להיבחר למדגם;
  • שום פריט אינו יוצא מכלל האפשרות להיבחר למדגם.

בדגימה הסתברותית ניתן לאמוד את טעות הדגימה/ מידת הדיוק בדגימה.

דגימה לא הסתברותית: כאשר לפחות אחד משלושת תנאים אלו אינו מתקיים.

חוקר יבחר בצורת הדגימה בהתאם לבעיות המתעוררות בכל שלב של איסוף הנתונים- בחירת נבדקים, איתור נבדקים, התקשרות עם נבדקים- ובהתאם לתקציב העומד לרשותו.

 

דוגמאות לדגימה לא הסתברותית-

מדגם כדור שלג- יש לעתים בעיות של התקשרות לקבוצת מחקר מסוימת המהווה את האוכלוסייה הנבדקת (בני העלייה השנייה, מסיימי מחזור מסוים בביה"ס, ניצולי שואה שנולדו בשנה או במקום מסוימים....). אפשר להתגבר על בעיות אלו בעזרת מדגם קטן של 'מודיעים' שמהם מקבלים שמות וכתובות של אנשים נוספים השייכים לקבוצה הנחקרת.

מדגם מתנדבים- במקרה שישנן בעיות של שיתוף פעולה מצד האוכלוסייה הנחקרת.

מדגם נוחות- כשהחוקר בוחר את אותן יחידות דגימה שהן זמינות: תלמידים בכיתה מסוימת... אין כל דרך לאמוד את הייצוגיות של מדגם כזה.

מדגמי מטרה- יחידות הדגימה נבחרות על ידי החוקר על פי שיקול דעתו הסובייקטיבי. החוקר מנסה לקבל מדגם שנראה לו ייצוגי לאוכלוסייה הנבדקת.

כאמור דגימה שאינה הסתברותית אינה מאפשרת לדעת את מידת הייצוגיות של המדגם הנבחר/ טעות הדגימה אינה ידועה.

 

דגימה הסתברותית-

דגימה הסתברותית מבטיחה לחוקר שאם היה חוזר על מחקרו עם מספר מדגמים שונים שהוצאו מתוך האוכלוסייה הנתונה, ממצאיו לא יהיו שונים מציוני האוכלוסייה האמיתית ביותר מכמות מוגדרת. במלים אחרות: מערך מדגם הסתברותי מאפשר לחוקר לאמוד את המידה שבה הממצאים המבוססים על מדגם אחד עשויים להשתנות ממה שהיה מוצא על ידי חקירת האוכלוסייה כולה.

 

 

מסגרת דגימה

כדי להבין את שיטות הדגימה ההסתברותית יש להכיר את המושג: מסגרת דגימה. מסגרת זו כוללת את כל הפריטים שמתוכם נלקח המדגם הלכה למעשה. לכאורה קיימת זהות בין האוכלוסייה הנחקרת ובין מסגרת הדגימה. למעשה- זהות כזו קיימת רק לעתים רחוקות. רק לגבי בעיות מחקר מעטות בלבד ישנה רשימה מפורטת של האוכלוסייה הנחקרת. למשל- הרבה מחקרים בפסיכולוגיה נערכים על סטודנטים שנה א' על מנת לבדוק השערות לגבי אוכלוסיית המבוגרים ולהכליל את התוצאות על אוכלוסייה זו. באופן אינטואיטיבי מניחים שסטודנטים יכולים לייצג נאמנה את אוכלוסיית המבוגרים (במסגרת גיל זו). על כך יכול להיות וויכוח.

אם כך- עומדות בפני החוקר שני היסקים: הרצון להסיק מהמדגם (מדגם של סטודנטים) למסגרת הדגימה (כל הסטודנטים הרשומים)- היסק זה הוא היסק סטטיסטי; הרצון להסיק ממסגרת הדגימה (הסטודנטים הרשומים) לאוכלוסייה הנחקרת (אוכלוסיית המבוגרים).

דיוקו של ההיסק הראשון תלוי במידה בה מייצג המדגם את מסגרת הדגימה, דיוקו של ההיסק השני תלוי במידה בה מייצגת מסגרת הדגימה את האוכלוסייה הנחקרת.

שיטות הדגימה ההסתברותית מנסות להבטיח שהמדגם ייצג את מסגרת הדגימה. ההיסק הזה ייעשה באמצעות שיטות ההסקה הסטטיסטית. ההיסק השני תלוי ברובו בהיגיון. לעתים הטיות מחקר נובעות מחוסר תשומת לב לפער שבין האוכלוסייה לבין מסגרת הדגימה.

 

מחקר הבודק יכולת קוגניטיבית של בני 3. מסגרת הדגימה (ממנה נבחר מדגם של בני 3) גני ילדים. שימו לב שלא כל הילדים בני 3 הולכים לגן ולכן מסגרת הדגימה במקרה זה אינה זהה לאוכלוסייה הנחקרת.

 

שיטות דגימה הסתברותית

דגימה אקראית פשוטה- על מנת להבטיח שתנאי הדגימה ההסתברותית מתקיימים משתמשים ב- שיטת ההגרלה או בשיטת המספרים המקריים. לכל אחד באוכלוסייה ניתן מספר ומגרילים בין כל המספרים מדגם בגודל רצוי.

דגימה שיטתית- המספר הראשון (המייצג אדם במסגרת הדגימה/ באוכלוסייה) נבחר באקראי ולאחריו כל מספר X באופן שיטתי (כל מספר שמיני או שני....).

דגימת שכבות-  פריטי המדגם נבחרים בבחירה הסתברותית מכל שכבה באוכלוסייה לחוד על פי גודלה היחסי של השכבה באוכלוסייה.

למשל: על מנת לבדוק הרגלי צפייה בטלוויזיה, הוחלט לקחת מדגם של 1000 איש מכל האוכלוסייה. החוקר מחלק את האוכלוסייה לשכבות גיל: ילדים בני- 4-8, ילדים בני 9-12, מתבגרים 13- 17, מבוגרים צעירים 18- 24, בוגרים 25- 40.... לפי גודל קבוצות גיל אלו באוכלוסייה החוקר דוגם הסתברותית את הנחקרים מכל שיכבה לחוד. בכך הוא מבטיח ייצוג נאות לכל שכבת גיל. ההנחה של החוקר היא ש 'גיל' הוא משתנה חשוב בקביעת הרגלי צפייה בטלוויזיה.

דגימת אשכולות- כשהאוכלוסייה גדולה מאד ומפוזרת, כשאין רשימה המתארת את מסגרת הדגימה (האוכלוסייה מתוכה החוקר בוחר), כשעבודת השדה באיתור נבדקים ממושכת ויקרה, משתמשים בשיטת דגימה אלטרנטיבית. למשל:

לצורך עריכת מחקר חלקו את לונדון לכמה מאות רבעים, מהם דגמו מקרית מאה רבעים. בכל אחד ממאה הרבעים שנדגמו נבחרו מקרית 10 בלוקים ובכל בלוק שנבחר נדגמו שלושה בתים ובהם ראיינו את כל הגברים בני 20+.

 

נתבונן במקרה הבא: לצורך מחקר על עיסוקי פנאי של ילדים בכיתות א' עד יב' בעיר מסוימת הוחלט להתבסס על מדגם של 1000 ילדים. שתי שיטות דגימה עומדות לדיון:

  1. דגימת שכבות- מ- 12 שכבות גיל ייבחרו ילדים באופן הסתברותי. כל כיתה נחשבת לשכבה.
  2. דגימת אשכולות- מ 12 אשכולות, כשכל כיתה היא אשכול.

איזו שיטת דגימה עדיפה? מדוע?

 

דגימת אשכולות מתאימה כאשר החוקר מאמין שאין הבדלים משמעותיים בין האשכולות השונים. כאשר ההבדלים הם ניכרים ומשמעותיים לנושא המחקר- נעדיף את דגימת השכבות, על מנת לקבל ייצוג לכל שיכבה.

מכיוון שבמדגם שכבות דוגמים מכל שיכבה כמה נבדקים ואין בוחרים את כל השכבה, נקפיד ליצור שכבות השונות זו מזו אך בתוכן- כל שיכבה היא הומוגנית (בתכונה הנבדקת).

בדגימת אשכולות, מאחר וכל אנשי האשכול נבחרים למדגם, חשוב שהאשכולות יהיו דומים זה לזה והשונות תהיה בתוך האשכול עצמו.

 

גודל המדגם

גודל המדגם ייקבע על פי סוג האוכלוסייה וכן על פי גודל הטעות שהחוקר מוכן 'לסבול'. - כבר נאמר שאוכלוסייה הטרוגנית תצריך מדגם גדול יותר, על מנת לייצג נאמנה את האוכלוסייה. אם ידועה השונות שבאוכלוסייה (מידת הגוון שבה)- [מה שניתן לאומדן באמצעות מדגם] - באמצעות חישובים סטטיסטיים יכול הסטטיסטיקאי לומר לנו מה יהיה גודל מדגם אופטימאלי - בעל טעות דגימה נסבלת (שנקבעה על ידי החוקר).

 

 

סיכום

מטרתו של המחקר המדעי, כפי שכבר נאמר, הנה בדיקה אמפירית של השערות מחקריות על מנת להגיע לאמירה כללית לגבי משתנים באוכלוסייה מסוימת. החוק הכללי, כפי שאנו יודעים, מסביר תופעות ומאפשר ניבוי. על מנת להיות מסוגל לנסח חוק כללי שיהיה נכון במידה סבירה לגבי אוכלוסייה שלמה, אין צורך לבדוק כל יחידה ויחידה באוכלוסייה. החוקר בוחר מדגם של מקרים מתוך האוכלוסייה ומהנתונים שהוא אוסף על מקרים אלו הוא מסיק מסקנות לגבי כלל האוכלוסייה. למרבה הפלא- מדגם של 1500 נחקרים ייתן מידע מהימן (שניתן לסמוך עליו) על אוכלוסייה של 6 מליון איש בישראל או על אוכלוסייה אמריקאית של 215 מליון איש. פירושו של דבר הוא שהתוצאות ממדגם אחד תהיינה דמות מאד לתוצאות ממדגם אחר מאותה אוכלוסייה באותם התנאים. אמנם ישנן טעויות הנובעות מדגימה ואין לצפות לזהות מוחלטת בתוצאותיהם של שני מדגמים שונים מאותה אוכלוסייה. אין אפשרות להימנע מטעויות. אבל- על החוקר לדעת את גודל הטעות. השיטה היחידה המאפשרת לחוקר לדגום ולהעריך מראש את סדר גודל הטעות בתוצאות (מול תוצאות אמיתיות שיתקבלו בבדיקת האוכלוסייה עצמה, או מסגרת הדגימה), היא דרך הדגימה ההסתברותית. דרך דגימה זו מאפשרת הכללת ממצאי המחקר  על האוכלוסייה הנחקרת (על מסגרת הדגימה, וממנה על - האוכלוסייה הנחקרת).

חשוב לומר שגם מחקרים שנחקריהם לא נדגמו באופן הסתברותי יהיו בעלי ערך- למשל- המחקר האנתרופולוגי. במחקרים אלו החוקר אינו מעוניין להכליל את תוצאות המחקר לכלל האוכלוסייה. המחקר האיכותני (בו נכלל המחקר האנתרופולוגי) לומד על תופעות או אנשים דרך התבוננות לעומק במי שמייצג את משתני המחקר ללא שנבחרו באופן הסתברותי. יכולת ההכללה שלהם מוגבלת.