למה אנחנו רוצים סקר עם "מדגם מייצג"? (פוסט על שגיאות שאפשר ושאי-אפשר להציג)

תשובה: כי סקר עם מדגם לא מייצג צפוי לתת תוצאה לא אמינה לגבי תוצאות האמת של הבחירות.

לפני שנמשיך לדווח על סקרים ומטא-סקרים, ברשותכם רציתי לעשות קצת סדר בנושא של "מדגם מייצג ואקראי" ולנסות להסביר אותו (מה שמכונה בשפה הסטטיסטית "הטייה"). נתחיל בקריקטורה מתאימה מהבלוג המקסים דברים שקרו באמת:

Servey1500

מעבר לכך שהקריקטורה מאד חמודה, היא מציגה מצב שבו הסקר מבוצע על האוכלוסייה שלא מייצגת את אזרחי ישראל (אלא רק את חתולי ישראל).

גם בסקרי בחירות עלול מצב כזה (של דגימת אוכלוסיה לא מייצגת) להתרחש, אם הסוקר מתקשה להגיע לאוכלוסייה הצעירה, הערבית, החרדית וכן הלאה (לדוגמא, כי אין לו אפשרות לחייג לטלפונים סלולרים של צעירים, או כי קשה לראיין את האוכלוסיה הערבית ללא סוקר שדובר ערבית).

באופן כללי, בסקרי בחירות יש שני סוגים עיקריים של טעויות סטטיסטיות: טעויות "הטייה" (bias) וטעויות "שונות" (variance). המצב שמוצג בקריקטורה הוא של טעות הטייה. כעת נרחיב קצת על שתי הטעויות.

להמשיך לקרוא למה אנחנו רוצים סקר עם "מדגם מייצג"? (פוסט על שגיאות שאפשר ושאי-אפשר להציג)

פרופסור קמיל פוקס בציטוט (קצר) על כך שאין להסתמך על סקר בודד

ציטוט מאת פרופסור קמיל פוקס:

אני מציע להתיחס פחות לתוצאות של כל סקר בנפרד ולבדוק במקום זה מגמות ותוצאות של מספר סקרים ביחד. כי הרי בכל סקר ישנן סטיות מקריות. כאשר מזהים תנודות בין סקר אחד לשני התנודות יכולות להיות עדות למגמה אמיתית או לנבוע מסטיה מקרית.

camil2014-12-25 21_27_33-Clipboard2

הציטוט הגיע לידי בעקבות פגישה מקרית השבוע עם פרופסור קמיל פוקס במסדרונות של אוניברסיטת תל אביב, אשר התפתחה לשיחה ארוכה ומעניינת. בשיחה ציין פוקס את הטקסט הנל שהוא כתב עבור איזשהו ראיון, והסכים לשלוח אלי את צילום המסמך כדי שאשתפו פה בבלוג. תודה רבה פרופ' קמיל פוקס.

עוד ייכתב פה בבלוג על הטיות ושונות. וכמובן, הרעיון של מטא סקר (או סקר-הסקרים או סופר-סקר) הולך להופיע עוד כמה וכמה פעמים. אני שמח שיש אנשים כמו נחמיה (האחראי לפרוייקט 61), אשר מתחילים ליצור סקרים כאלה. אני צופה שנשמע על עוד כאלה ככל שהזמן יחלוף (אצל נחמיה, כאן, ובמקומות נוספים).