האם ישראל ביתנו איבדה מנדטים בסקרים מהיום שאחרי חשיפת "פרשת השחיתות"?

 

העיתון האינטרנטי Times of Israel פירסם היום את הכותרת הבאה:

"In wake of graft scandal, Liberman down one mandate"
תירגום: בעקבות שערורית השוחד, ליברמן איבד מנדט אחד

ובתוך הטקסט נכתב:

The Maariv survey showed […] Yisrael Beytenu received 5 seats, down from 8, following a massive graft scandal affecting the party which was exposed this week.
תירגום: סקר מעריב הראה שישראל ביתנו ירדה ל-5 מושבים, מתוך ה- 8 שהיו לה קודם לכן, בעקבות השערוריה שנחשפה השבוע.

האם זה מה שהסקרים מלמדים? האם נראה שמפלגת ישראל ביתנו איבדה מנדטים בעקבות פרשת השחיתות שפורסמה השבוע ב- 24 לדצמבר?

אם נסתכל אך ורק על סקר מעריב לפני ואחרי, אז זה אכן נכון שבסקר מעריב משבוע שעבר (ה- 16 לדצמבר), ישראל ביתנו קיבלה 8 מנדטים, ומהסקר השבוע (שפורסם היום, שישי ה- 26 לדצמבר) הם קיבלו 5 מנדטים. האם הירידה הזו "מובהקת"? כלומר – האם יש לנו עדות לכך שהפרש המנדטים הזה הוא מעבר לטעות מקרית?

כן ולא.

אם מסתכלים רק על התוצאות של מעריב מהיום למול התוצאות של שבוע שעבר, אז אכן רואים ירידה מ- 8 ל- 5 מנדטים (ירידה "מובהקת" סטטיסטית). אבל אם מסתכלים על הנתונים של 3 סקרים לפני פריצת הפרשה ו-3 סקרים ביום שאחריה, מקבלים שלפני הפרשה מספר המנדטים היה 8 ואחריה הוא היה (בממוצע) 7.6 (ירידה שאיננה יותר מובהקת).

הנה החישוב המדוייק שבוצע:

להמשיך לקרוא האם ישראל ביתנו איבדה מנדטים בסקרים מהיום שאחרי חשיפת "פרשת השחיתות"?

פרופסור קמיל פוקס בציטוט (קצר) על כך שאין להסתמך על סקר בודד

ציטוט מאת פרופסור קמיל פוקס:

אני מציע להתיחס פחות לתוצאות של כל סקר בנפרד ולבדוק במקום זה מגמות ותוצאות של מספר סקרים ביחד. כי הרי בכל סקר ישנן סטיות מקריות. כאשר מזהים תנודות בין סקר אחד לשני התנודות יכולות להיות עדות למגמה אמיתית או לנבוע מסטיה מקרית.

camil2014-12-25 21_27_33-Clipboard2

הציטוט הגיע לידי בעקבות פגישה מקרית השבוע עם פרופסור קמיל פוקס במסדרונות של אוניברסיטת תל אביב, אשר התפתחה לשיחה ארוכה ומעניינת. בשיחה ציין פוקס את הטקסט הנל שהוא כתב עבור איזשהו ראיון, והסכים לשלוח אלי את צילום המסמך כדי שאשתפו פה בבלוג. תודה רבה פרופ' קמיל פוקס.

עוד ייכתב פה בבלוג על הטיות ושונות. וכמובן, הרעיון של מטא סקר (או סקר-הסקרים או סופר-סקר) הולך להופיע עוד כמה וכמה פעמים. אני שמח שיש אנשים כמו נחמיה (האחראי לפרוייקט 61), אשר מתחילים ליצור סקרים כאלה. אני צופה שנשמע על עוד כאלה ככל שהזמן יחלוף (אצל נחמיה, כאן, ובמקומות נוספים).

ראיון אצל יעל דן בגלי צה"ל, עם ד"ר מינה צמח ואיתי

 

אז היום בצהריים (24/12/2014 בשעה 12:30), רואיינתי בתוכנית של יעל דן בגלי צה"ל, על ידי מראיינת נעימה בשם גלית. אפשר להאזין לתוכנית כאן, החל מדקה 34 (וקצת). אחרי הראיון איתי העלו לשידור את ד"ר מינה צמח שאמרה מספר דברים (שחלקו על דברי). אני מביא כאן תמלול של מה שנאמר, ולאחר מכן את תגובתי.

להמשיך לקרוא ראיון אצל יעל דן בגלי צה"ל, עם ד"ר מינה צמח ואיתי

מה סוקרים צריכים לפרסם לפי החוק

נחמיה גרשוני-איילהו העלה סטטוס בדף הפייסבוק של פרוייקט 61 עם הטקסט הבא:

חוק הבחירות (דרכי תעמולה) מחייב פרסום מידע חשוב ומפורט על כל סקר שנערך ופורסם לציבור. החוק מחייב כל גוף שמפרסם סקר לפרסם תוך 24 שעות את הנתונים הבאים:
(1) שמו של הגוף שהזמין את הסקר;
(2) שמו של הגורם שערך את הסקר;
(3) התאריך או התקופה שבה בוצע הסקר;
(4) האוכלוסיה שמתוכה נלקח מדגם המשיבים לסקר;
(5) מספר האנשים שהתבקשו להשתתף בסקר ומספר האנשים שהשתתפו בו בפועל;
(6) מרווח הטעות לגבי הנתונים שהושגו.

בנוסף, החוק מחייב את הסוקר עצמו, להעביר "בהקדם האפשרי" לועדת הבחירות המרכזית לצורך עיון הציבור גם את המידע הבא:
(1) את הנתונים שהוזכרו לעיל.
(2) מידע על השיטה שהשתמשו בה כדי לאסוף את הנתונים שמהם הופקו תוצאות הסקר, לרבות:
(א) שיטת הדגימה;
(ב) גודל המדגם ההתחלתי;
(ג) סוגי האוכלוסיה שנדגמו;
(ד) מספר האנשים שהתבקשו להשתתף בסקר והמספר והאחוז מהם אשר השתתפו בסקר בפועל, סירבו להשתתף בסקר או לא התאימו להשתתף בסקר;
(ה) התאריכים והשעות של הראיונות;
(3) מרווח הטעות לגבי הנתונים שהושגו.

לקריאת החוק:
http://www.nevo.co.il/law_html/Law01/190_003.htm#Seif38

פנינו לוועדת הבחירות המרכזית לקבלת נתוני עבר מהבחירות לכנסת ה-19, והובהר לנו שמעט מאוד סוקרים שיתפו פעולה עם החוק, חרף פניה מפורשת של השופט אליקים רובינשטיין על הנושא.

נחמיה מפעיל את משקלו בכותבו:

בהתאם לכך, ומכיוון שמרבית הסוקרים לא עומדים בחובתם לציבור לפרסם את נתוני הסקר המלאים (למיטב ידיעתנו, הפרופסור קמיל פוקס – דיאלוג – הוא היחיד שפרסם לציבור את הנתונים האלה), אי פרסום מידע יוריד את ציון הסוקרים.

פרויקט 61 דוגל בשקיפות, ובהתאם יפרסם כל מידע שיוכל על נתוני הסקרים ברגע שיעמדו לרשותו.

אם למישהו כאן יש רעיון איך אפשר לקדם את חזון המחוקק של מאגר מרכזי של תוצאות סקרי בחירות, אשמח לקרוא את דעתכם.

מתי סקר הוא "סקר רע"?

 

משפט שאנשים רבים מצטטים הוא שקרים, שקרים ארורים, וסטטיסטיקה. הבלוג הזה לא מאמין במשפט הזה. הבלוג הזה מאמין שנכון שקל לשקר עם סטטיסטיקה, אך זה קשה מאד למצוא את האמת בלעדיה.

התשובה לשאלת הבלוג "סקר רע?" היא "לא, אבל…".

סקרים אינם רעים, אבל פעמים רבות ההצגה שלהם בתקשורת היא רעה בכך שהסקר לא מגיע עם מידע חשוב לגבי איך שהוא בוצע, וההצגה הוויזואלית שלו מקשה על הקורא להבין את מגבלות הסקר.

הבלוג הזה לא צפוי לעסוק בסקרים אשר שוגים במתודולוגיה הסטטיסטית שלהם (כותב הבלוג הזה מאמין שעד שלא הוכח אחרת, חברות הסקרים הן מקצועיות, אתיות, אמינות ועושות עבודה טובה), אלא בעיקר בסקרים שההצגה שלהם בתקשורת היא "רעה".

היות והמילה "רע" היא מילה טעונה ריגשית שאנשים שונים צפויים לפרש ולקשר בדרכים מאד שונות לפי ההקשר. בבלוג הזה, הרשו לי לדבר על כמה משמעויות שונות.

מתודולוגיה

סקר יכול להיות רע מתודולוגית. סקר רע מתודולוגית הוא סקר שנכשל בתיאור האוכלוסיה שמעניינת אותנו (אוכלוסיית הבוחרים בישראל) בגלל שהשיטות הסטטיסטיות אשר שימשו אותו אינן מתאימות. לדוגמא, סקר שהדגימה בו אינה אקראית אלא רק של החברים שלנו הוא סקר שסביר שייכשל בייצוג אוכלוסיית הבוחרים. דוגמא אחרת היא סקר שבו יש אחוז גבוה של אי-השבה, ושהתוצאות היחידות שמוצגות הן של האנשים שהשיבו לשאלון (ללא התייחסות לאי-ההשבה), סביר שיהיה סקר מוטה. כמובן שסקר שנעשה באופן לא אתי, ומציג רק את הדעות של מזמין הסקר צפוי להיות סקר מוטה ורע ביותר.

עלי להדגיש שבבלוג הזה יהיה מאד נדיר שאדבר על סקרים שהם רעים מתודולוגית. זה משום שלרוב אין לנו את המידע הדרוש בשביל לזהות סקרים שגויים מתודלוגית. אי לכך, בבלוג זה, נניח שהסוקרים הם אנשים מקצועיים ואתיים שעושים עבודה איכותית וטובה.

תוצאות

סקר יכול להיות תקין לחלוטין מתודולוגית, אבל עדיין להביא תוצאות לא מספקות (להביא תוצאות רעות). תוצאות רעות הן תוצאות אשר "רחוקות" מהמציאות, למרות שתיכנון הסקר היה חכם ותקין מקצועית.

זה יכול לקרות אם אין לסקר מספיק נבדקים בשביל לענות על השאלה שמעניינת אותנו (בשפה מקצועית זה אומר שהשונות של הסקר גדולה), או שהנבדקים שלסוקר יש אפשרות לדגום אינם מייצגים את האוכלוסיה בגלל אופן הדגימה (בשפה מקצועית – הטייה. לדוגמא, אם לסוקר אין יכולת לדגום מהאוכלוסיה הערבית או החרדית). גם ייתכן שלמרות מאמצי הסוקר המדגם של הסקר יצא במקרה רחוק מהעמדות של האוכלוסיה (דבר שתמיד עלול לקרות כאשר דוגמים תת קבוצה של אוכלוסיה).

בכל המצבים הללו, הסקר לא מביא תוצאות נכונות, אפילו שהסוקר הקפיד על שיטות סטטיסטיות נכונות. עם זאת, כאשר הסוקר עושה עבודה טובה, הסיכוי לתוצאות רעות הוא יחסית נמוך (ועל איך מודדים תוצאה רבה אפשר לדבר הרבה, וכרגע לא נרחיב על כך)

שקיפות

סקר הוא רע מבחינת שקיפות כאשר הוא מפורסם ללא מידע מספק על הדרך שבה הוא בוצע. לדוגמא: מה היו השאלות שהופיעו בסקר, כמה אנשים בסקר נמנעו מלהשיב לסקר, מידע על הדמוגרפיה של המשיבים שהופיעו בסקר, מי הזמין את הסקר, האם היו אוכלוסיות שלא נדגמו (לדוגמא, ערבים או חרדים) וכן הלאה.

לצערי, סקרים רבים שמוצגים בתקשורת מגיעים ללא המידע הזה. אציין לטובה את פרופסור קמיל פוקס אשר מפרסם סקרים עם הרבה מהמידע הרלוונטי על אופן ביצוע הסקר, ואופי האוכלוסיה ותשובותיה. (הערה לקוראים: אם יש לכם דוגמאות לסוקרים אחרים שעונים לכללי השקיפות, אשמח לקישורים ולציין אותם לטובה)

למען הגילוי הנאות: אני מכיר את פרופסור פוקס דרך לימודי באוניברסיטת תל אביב, אך אין לי איתו יחסי עבודה.

תקשורתית

סקר יכול להיות תקין מתודולוגית, להגיע לתוצאות סבירות ולהיות שקוף – ובכל זאת לא להיות מוצג טוב בתקשורת. זה יכול להתרחש בגלל טעויות בשלב יצירת הגרפים (לדוגמא שהעמודות לא קשורות למספר המנדטים), אבל גם אם המידע החשוב איננו מוצג בצורה נגישה לציבור הרחב (לדוגמא – על ידי הצגת טווח המנדטים בהתאם למידת הדיוק של הסקר) אז הצגת הסקר היא, לדעת כותב הבלוג, רעה.

צורך סובייקטיבי

הדבר החשוב ביותר בהסתכלות על סקר הוא האם אנו מאמינים שהסקר מצליח לענות על השאלה שחשובה לנו. סקר הוא רע (סובייקטיבית) אם הוא סקר שלא עונה על שאלות שמעניינות אותנו.

לדוגמא, אפשר לבנות סקר על סמך 10 אנשים. הסקר יכול להיות תקין לחלוטין מתודולוגית, ולהיות מוצג עם כל השיטות התקפות, ובאופן מדוייק ושקוף בתקשורת. אבל רוב הסיכויים שהסקר לא יהיה בעל מספיק מידע כדי לענות על שאלות שמעניינות אותנו לגבי מצב הבחירות.

לפי זה, כל מיני סקרים שנראה לקראת הבחירות צפויים להיות סקרים רעים סובייקטיבית. לא בגלל שהם לא נעשים באופן תקין סטטיסטית (נהפוך הוא, חברות הסקרים העיקריות הן מקצועיות ומעולות!), אלא בגלל שאף אחד מהסקרים בפני עצמן לא יעזרו לענות לנו על השאלות שמעניינות אותנו.

לדוגמא, במערכת הבחירות הקרובה היינו רוצים לדעת למי יהיו יותר מנדטים, לעבודה או לליכוד. וכבר בפוסט הקודם ראינו שההפרש בין המפלגות (על סמך רמת הדיוק של הסקר) יכול להיות בין 2 מנדטים לטובת הליכוד ועד 4 מנדטים לטובת העבודה. שאלה נוספת שתעניין אותנו היא האם יהיה רוב לגוש "שמאל-מרכז", אבל בשביל זה היינו רוצים שתוצאות הסקר שמוצגות יכללו את כל המפלגות, ולא רק את הגדולות ביותר.

מה היו הופך את סקרי הבחירות לסקרים טובים? (הרשימה הבאה היא שאיפה לא ריאלית, אבל זה מה שהיינו רוצים לדמיין שיקרה)

  1. אם הסקרים היו כוללים מספיק נשאלים: צריך כ- 10,000 נבדקים בשביל טעות מדידה של כ- 1.2 מנדטים. אבל בשביל שאלות יותר ממוקדות אפשר להסתפק גם בפחות נבדקים.
  2. אם הסוקרים יצליחו לתקן הטיות שונות: החל מנשאלים שלא משיבים, וכלה במשיבים שמשקרים לסוקר (וידוע שהסוקרים עושים הרבה מאמצים להצליח בכך)
  3. אם הסקר יוצג באופן מלא ומדוייק: עם כל המפלגות וגרפים שכוללים (לפחות) את טווחי השגיאה הצפויים של המנדטים לכל מפלגה (מה שאפשר לכנות קווי-שגיאה)
  4. שהסקר יגיע עם מידע על מידת האמינות שלו: (לכל הפחות) מה היה אחוז הלא משיבים, ובאיזה מידע השתמשו בשביל להתמודד עם זה.
  5. שהסקר יתייחס לאחוז המתלבטים, ולסוגים השונים של אופציות שהם רואים לעצמם (מה שיאפשר לנפח את אי הוודאות לגבי המפלגות הללו).
  6. שהסוקר יודיע לגבי האם הוא "תיקן" את תוצאות הסקר בהתאם לסקרים אחרים. ואם כן, באיזה סקרים הוא השתמש. המידע הזה חשוב כשעושים מטא-סקר, כדי שנדע איך להגדיל את טווח השגיאה שלנו (בהתאם לכך שיש תלות בנתונים)
  7. שהסקר יגיע עם מידע על האינטרסים של הסוקר (מי הזמין את הסקר, מי היו הלקוחות בשנה האחרונה וכו').

זה טיבעי להחליט האם להצביע למפלגה לפי האם היא תהיה המפלגה המובילה בכנסת או האם היא תעבור את אחוז החסימה. גם כשעושים הכל "לפי הספר", קשה מאד לענות על השאלות הללו. בשבועות הקרובים ננסה לעשות כמיטב יכולתנו עם הנתונים שיגיעו, ואני מזהיר מראש שכל התשובות שלנו יתבססו על הרבה הנחות (שלא סביר שנוכל לדעת אם הן נכונות או לאו).

להמשיך לקרוא מתי סקר הוא "סקר רע"?