מגמות הסקרים של הבחירות לכנסת ה-20 (חלק 1)

הודעה חשובה לפני שהפוסט יתחיל: בסוף השבוע יתקיים מפגש דיון בחיזוי תוצאות הבחירות (להרשמה, חינם, למפגש – הקליקו כאן). המפגש מיועד לאנשים העוסקים בניתוח נתונים ומאורגן במטרה לדון בחיזוי תוצאות הבחירות, וגם כדי לעודד אתכם להשתתף בתחרות האיגוד לניבוי תוצאות הבחירות 2015 (תחרות עם פרס בגובה 1,250 ש"ח, ללא דמי השתתפות – לפרטים נוספים והשתתפות, קיראו עוד כאן). ונתחיל את הפוסט:

היום מתחיל השבוע האחרון שלפני הבחירות. אני בטוח שכולנו נרצה להסתכל על הסקרים האחרונים בתקווה לדעת מה יקרה בשבוע הבא. אבל דווקא עכשיו זה הזמן לקחת צעד אחורה, ולהסתכל על התמונה הגדולה. וכך היא נראית (הקליקו על התמונה לגירסה מוגדלת, והסברים מופיעים בהמשך):

2015-03-08 12_47_13-Clipboard

הגרף שמוצג נוצר בעזרת אתר האינטרנט שבנה יוני סידי (הוא בנה את האתר בעזרת שפת R לתכנות סטטיסטי), אשר מסתמך על נתוני הסקרים שאסף נחמיה גרשוני.

הגרף למעלה מאפשר לנו לראות את מגמת התמיכה במפלגות השונות על פני החודש וחצי האחרונים.

בגרף אנחנו רואים תרשים פיזור נפרד לכל מפלגה. בציר ה- X אנחנו רואים את תאריך ביצוע הסקר, ובציר ה- Y את מספר המנדטים שקיבלה המפלגה מהסקר. כל נקודה מציגה תחזית מנדטים למפלגה חברת סקרים שונה. הקו שמולבש על גבי הגרף הוא סוג של "קו מגמה" (לא נכנס לאיך שהוא מחושב, אבל אפשר לחשוב עליו כמו על ממוצע מקומי לטווח ערכים מסויים).

הגרף עוזר לנו לזהות את טווח הוודאות של הסוקרים השונים לגבי המפלגות השונות, והאם לאורך זמן אנחנו רואים התחזקות או היחלשות של "מרכז" תחזית המנדטים של המפלגות השונות. ברשותכם, אציע פרשנות למגמת מספר המנדטים שמקבלים המפלגות השונות, על סמך מה שהגרף מראה לנו:

  • הליכוד – הייתה מגמת היחלשות של המפלגה במהלך פברואר. אבל בשבועיים האחרנים המצב די יציב.
  • המחנה הציוני – המפלגה איבדה קצת מכוחה בסוף ינואר, אבל מאז היא שומרת באופן יחסית יציב על אותו מספר מנדטים.
  • יש עתיד – מצליחה באופן עיקבי (ודי מרשים, אני מוכרח להודות) להתחזק בסקרים. בשבועיים האחרונים נראה שיש התייצבות בעליה.
  • הבית היהודי – נראה שהם רק נחלשו בחודש וחצי האחרונים, ובשבועיים האחרונים נראה שהם התייצבו.
  • יחד – בהתחלה הם התנדנדו על אי-מעבר של אחוז החסימה, אבל בשבועות האחרונים הם הצליחו לשמור על ה-4 מנדטים שלהם בסקרים באופן יחסית עיקבי.
  • שאר המפלגות נראות ללא מגמה – כולנו, ישראל ביתנו, שס, יהדות התורה, מרצ, רשימה משותפת ערבית – כולם שומרים על יחסית יציבות בתחזיות המנדטים.

הדבר שלא מופיע בסקרים, והוא בעל חשיבות עצומה, היא השאלה של אחוז ההצבעה במגזרים השונים. ייתכן והסקרים שיש לנו לא מצליחים לתפוס את ההשפעה של איחוד המפלגות הערביות, ושביום הבחירות נגלה שהמפלגה שלהם תקבל הרבה יותר קולות ממה שהופיע בכל הסקרים. באופן דומה, מפלגת יחד נמצאת על 4 מנדטים באופן די עיקבי, מה שאומר שעליה אפילו קטנה של אחוז ההצבעה, ומעט היסוס מצד המצביעים שלה – עשוי להותיר אותם מחוץ לכנסת.

וכמובן, יכול להיות שכל הסוקרים מפספסים תתי אוכלוסיות או תופעות, אשר יפתיעו אותנו ביום הבחירות עצמו (כמו שהיה עם ההצלחה המדהימה של יש עתיד בבחירות הקודמות) – מה שהסברתי בעבר במאמר על שגיאות שאפשר ושאי אפשר להציג.

הבחירות האלה חשובות ומעניינות – צאו עם המשפחה והחברים ולכו להצביע!

(חלק 2 של הפוסט יגיעו בעוד שבוע אחרי שתוצאות התחזיות של משתתפים בתחרות החיזוי יגיעו)

מפלגת עלה ירוק עותרת כנגד מכוני הסקרים וערוצי החדשות – זה מעניין

הפוסט הבא הוא פחות מהסוג של "אי תראו, שגיאה!", ועוסק בנושא עמוק. תביאו כוס קפה, ותקראו בהנאה.

בסוף פברואר, מפלגת עלה ירוק (עם עורכי הדין חגי קלעי ואוהד רוזן) הגישו עתירה כנגד עיתון "הארץ", ידיעות אחרונות, ישראל היום, NRG, וואלה!, רשות השידור, חברת החדשות, ערוץ הכנסת, ערוץ 10, ומכוני הסקרים. בעתירה ביקשו שערוצי החדשות יפסיקו לפרסם תוצאות סקרים מעובדות למנדטים, ויעברו לפרסום תוצאות הסקרים הגולמיות באחוזים.

לצערי לא הצלחתי למצוא את קובץ העתירה המקורית (למישהו יש קישור?), ולכן אני מסתמך על

עידכון: שלחו אלי את העתירה המקורית, אתם מוזמנים להוריד אותה מכאן: Document (158)

ואף הופיעו דיווחים שלה באתרי החדשות. לדוגמא כאן (וגם כאן וכאן).

בעתירה הועלו שלל טענות, בין השאר נכתב כי:

"המצג שיוצרים המשיבים אינו משקף את המציאות אלא מתערב בה, ומעודד את הבוחרים שלא להצביע למפלגות העומדות על סף אחוז החסימה. העדר הדיווח על העליה המתמדת במצביעים הפוטנציאליים של אותן מפלגות, והצגתן כמי שזוכות ל חמישה אחוזים מהקולות, מעביר מסר שגוי לציבור כי אין כל סיכוי לכניסת מפלגות אלו לכנסת. התנהלות זו, בין אם במחדל ובין אם בכוונת מכוון עומדת בניגוד לדין, פוגעת פגיעה קשה בעיקרון החוקתי של שיוויון הבחירות, ומשפיעה השפעה לא ראויה ומוטה על ציבור הבוחרים והבוחרות".

ובכן מסתבר שיו"ר ועדת הבחירות המרכזית, השופט סלימן ג'ובראן, השיב אתמול (04/03/2015) לעתירה. הנה מה שנכתב:

החלטת ביניים -סלים ג'ובראן

הסיכום שלי של תגובת השופט:

  1. השופט דחה את הטענה שאי הכללה של "עלה ירוק" בסקרים שמעבירים הופכים אותם לפסולים. זאת משום שהעותרים לא הביאו חוות דעת סטטיסטית מקצועית בנושא, ואי לכך אין השופט יכול לקבל את דעת העותרים בנושא, והוא דוחה את טענתם.
  2. העתירה חשובה, אך לא תספיק להשפיע על הבחירות הקרובות. המשך הדיון יהיה ב- 11/03/2015
  3. השופט חושב (אך "מבלי להכריע בדבר"!) שיש מקום להתייחס למידת קירבתן של מפלגות שלא עברו את אחוז החסימה בסקר בתוצאות שמוצגות.

הסיקור של הכלכלה האמיתית – ודעתי

בדיווח שהופיע היום באתר "הכלכלה האמיתית" נכתבו כמה דברים בנושא. אפשר להגיב להרבה דברים שנאמרו שם, אני אתמקד ואתייחס למשפט המסכם שאיני מסכים איתו. הם כתבו:

אתמול החליט יו"ר ועדת הבחירות המרכזית,סלימן ג'ובראן, לקבל את עיקרי הטענות בעתירה.ערוצי התקשורת יחויבו לפיכך לפרסם את תוצאות הסקרים האמיתיות באחוזים במקום בעיבוד למנדטים.

זו לחלוטין לא הפרשנות שלי למה שכבוד השופט כתב. לפי הבנתי, השופט דחה כמה טענות בעתירה, ולגביהטענה המרכזית על החשיבות של הצגת קירבת המפלגות לאחוז החסימה – הוא חושב שראוי לקבל חוות דעת מומחית (ולכך הוא מזמין את מכוני הסקרים להגיב).

כך או אחרת, אני מסופק שהתוצאה של העתירה הזו תהיה הצגה של תוצאות הסקרים באחוזים ולא במנדטים. היות ותוצאות הבחירות ימדדו במנדטים, סביר מאד להציג לציבור את תוצאות הסקרים במנדטים ולא באחוזים.

עם זאת, לגבי הביטוי "עיבוד למנדטים", כוונת הכותבים בכלכלה האמיתית (אני משער) היא לא רק להמרה של אחוזים ל- 120 מנדטים, אלא השינויים הדרושים בתוצאות הסקר כדי לתת משקל שונה לנתונים על מנת שאלו ישקפו נאמנה יותר את אוכלוסיית ישראל ואת תוצאות הבחירות (הסברתי על הנושא של הטייה יותר בהרחבה כאן). לדעתי – אני חושב שזה יהיה פסול מאד להציג בתקשורת את תוצאות הנתונים הגולמיים ללא עיבוד מתאים. אני מסכים שהתהליך הזה כולל שיקול דעת אישי, ולכן עלול לכלול טעויות והטיות. עם זאת, לצערי, אני לא יודע על דרך טובה יותר לקבל תחזית "סבירה" לתוצאות הבחירות (היות והתוצאות הגולמיות צפויות להיות מאד מאד לא מייצגות לתוצאות האמת).

מצד שני, יכול להיות מעניין לראות האם השופט יחייב את מכוני הסקרים להציג את הנתונים הגולמיים ואת שיטות הסקירה. מצד אחד, אני משוכנע שמכוני הסקרים ילחמו לגבי זה היות ודרכי העיבוד מהווים סודות מקצועיים עבורם. אני לא יודע איזה שיקול ינצח "זכות הציבור לדעת" או "חופש העיסוק" הכולל שמירה על סודות מסחריים.

אני לא יודע איך העתירה הזו תסתיים – אבל כבר עכשיו היא מעלה סוגיות מעניינות מאד לבחינה משפטית – שכשלעצמו זה דבר טוב.

129% מהציבור רוצים שר אוצר…

הפוסט הזה הגיע מהגולש שובל צורן אשר דיווח במסגרת תחרות הסקר המוזר (אתם גם מוזמנים להגיש דיווח כאן, והמדווח על הסקר ה"מוזר" ביותר יזכה ב- 500 ש"ח. אין עלות להשתתפות).

 

הגרף הבא פורסם בדף הפייסבוק של המחנה הציוני, ומגלה שסך הכל 127% מהציבור רוצים בשר אוצר:

2015-03-04 12_11_24-Clipboard

 

"הצעירים בישראל בחרו – מהפך" – אך ללא קשר בין מספרים לעמודות

הפוסט הזה הגיע מהגולש שובל צורן אשר דיווח במסגרת תחרות הסקר המוזר (אתם גם מוזמנים להגיש דיווח כאן, והמדווח על הסקר ה"מוזר" ביותר יזכה ב- 500 ש"ח. אין עלות להשתתפות).

הגרף הבא פורסם בדף הפייסבוק של יצחק הרצוג:

2015-03-04 08_57_12-Clipboard

על הסקר כתב שובל (בצדק):

אין כל פרופורציה בין המספרים והעמודות; למרות שההפרשים בין המפלגות למטה קבועים(1) המרחקים בין עמודותיהן שונים, וההפרש בין 9% ל-20% לחלוטין לא פרופורציונלי. בנוסף, כמובן שההצגה המגמתית ממשיכה כשהם מציגים את עצמם – כש30% הרבה יותר גדול ממה שאמור להיות. אפשר גם לשים לב שעמודת ה30% *רחבה* יותר.

ואני אוסיף שהעמודה של המחנה הציוני מופיעה בצבע אחר (ניחא), אבל יותר חשוב מזה, שהיו כמה סקרי תיכונים שונים, וכל אחד החליט לשקלל אותם אחרת (לדוגמא, יש תוצאות אחרות שבהם יש עתיד זוכה כמנצחת המועדפת).

 

תחרות לחיזוי תוצאות הבחירות – ההשתתפות בחינם – הפרס הוא 1250 ש"ח

האיגוד הישראלי לסטטיסטיקה, בחסות חברת איסתרא מחקר, הכריז על תחרות לניבוי תוצאות הבחירות לכנסת ה-20, כאשר הזוכה בתחזית הטובה ביותר יקבל 1,250 ש"ח. אם אתם מעוניינים להצטרף כנתוני חסות לתחרות הזו (אשר צפויה לזכות להד תקשורתי רב כאשר נפרסם את תוצאות התחזיות לפני הבחירות), אנא שילחו לי אימייל ([email protected]).

אני מעודד אתכם להפיץ את המידע על התחרות במוסדותיכם ובמקומות העבודה שלכם.

כדי להשתתף, כל שעליכם לעשות הוא לרשום כמה מנדטים תקבל כל מפלגה, לתת את פרטיכם האישיים (שם/אימייל/וכו'), ולהסביר כיצד להגיע לתחזיות המנדטים הללו (כולל פירוט ברור של המודלים הסטטיסטיים וההנחות לבחירתם). התאריך האחרון להגשה הוא 14 במרס, שלושה ימים לפני הבחירות (ומן הסתם, זה יהיה הזמן עם הכי הרבה מידע עדכני בשביל ביצוע התחזיות). את הפרטים עליכם למלא בטופס שכאן:

http://www.statistics.org.il/elections2015

בשביל נתוני סקרים עדכניים, אני מציע לכם להסתכל על הרשימה שמנהל נחמיה גרשוני, בכתובת:
https://docs.google.com/spreadsheets/d/13XIAgbVk_c2Zxxa5xsR0EJFb6W9HMQpAjBImtFxZdxo/edit#gid=0

מטרת התחרות היא לעודד חשיבה כמותית ושימוש בכלים סטטיסטים בבעיה אקטואלית, וכמובן להפיץ את החשיבות של סטטיסטיקה בקרב הציבור בישראל.

כתבה על התחרות גם פורסמה ב-ynet.

(גילוי נאות: אני חבר וועד באיגוד הסטטיסטיקאים הישראלי)