כיצד (אי) חשיבה סטטיסטית שולחת אישה לכלא – סיפורה של סאלי קלארק

סיפורה של סאלי קלארק הופיע לאחרונה בהרצאתו המצויינת של פרופסור פיטר דונולי מאוניברסיטת אוקספורד (ההרצאה מופיע בסוף הפוסט). פרופ' דונולי מספר כיצד חוסר הנסיון של אנשים בחשיבה הסתברותית הוביל לכך שאישה חפה מפשע נשלחה לכלא.

לפני שנדבר על סאלי קלארק, בואו נקח דוגמא הסתברותית קטנה.
נניח שיש לנו בדיקה שיכול לאתר מחלה ב- 99% מהנבדקים. ונניח שמישהו שאנו מכירים ניגש לבדיקה, והבדיקה קבעה שאותו אדם נגוע במחלה. מה הסיכוי שהוא חולה? לכאורה התשובה תהיה 99%. אבל זו אינה התשובה הנכונה.

מדוע? כי…

כי כדי לדעת את התשובה הנכונה היה עלינו גם לדעת האם המחלה נפוצה או נדירה. נאמר שהמחלה שאנו בודקים נדירה ומופיעה אחת ל-10,000 איש. אזי עבור אוכלוסיה של מליון איש יהיו לנו 100 אנשים חולים וכל השאר בריאים. אילו היינו בודקים את כל האנשים החולים אז (בקירוב), הבדיקה הייתה מאתרת 99 מהם כחולים. אך אם עכשיו היינו בודקים את כלל האוכלוסיה הבריאה, אז ב-99% מהמקרים הבדיקה הייתה מגלה שהאנשים בריאים, אבל באחוז אחד של אוכלוסית הבריאים, הבדיקה הייתה מכריזה על אותם אנשים שהם חולים. מה שאומר שמתוך אוכלוסיה של מליון אנשים, מתוכם רק 100 חולים, יהיו עוד 9990 אנשים שהבדיקה שלנו תאמר עליהם שהם חולים למרות שהם למעשה בריאים.
כלומר מכל 100 איש שבדקנו ומצאנו שהם חולים במחלה, סביר שפחות מ- 1 מהם הוא באמת חולה. זאת מפני שמדובר במחלה כל כך נדירה – ושהבדיקה שלנו מצליחה להיות צודקת "רק" ב-99% מהמקרים.

הדוגמא מראה כיצד השאלה "האם בדיקה שאומרת שאני חולה במחלה באמת נכונה?" תלויה עד כמה הבדיקה מדוייקת מול תפוצת המחלה באוכלוסיה (ולצורך הדוגמא, הנחנו שאין גורמים מחשידים אחרים למחלה בזמן הבדיקה).

(מידע נוסף על הדוגמא הזו אפשר לקרוא בפוסט: רגישות, סגוליות וערכי ניבוי – למה כדאי שכולכם תדעו את זה (וגם איך מחשבים))

כעת נספר איך חשיבה סטטיסטית דומה הייתה יכולה לסייע בזמן המשפט של סאלי קלארק.

סאלי, אשה בריטית, הואשמה בהריגת שני ילדיה. ילדיה מתו בזה אחר זה ממוות בעריסה. אחד הגורמים שהובילו להרשעתה היתה עדותו של רופא ילדים שהסביר שהסיכוי למוות של שני ילדים למות מוות עריסה באותו הבית הוא 1 לכ- 73 מליון. סאלי הורשעה ורק אחרי שני עירעורים שהגישו פרקליטיה היא זוכתה.
ניתן לדמיין כמה נורא זה היה עבורה, גם לאבד שני ילדים, וגם להיות מואשמת בהרג ילדיה ולרצות עונש בכלא עם אסירות המשוכנעות שהיא רצחה אותם.

העירעור שהוביל לשיחרורה התייחס לכך שרופא הילדים שגה בחשיבתו הסטטיסטית.

הרופא טען בעדותו שהסיכון למוות עריסה (בבית כמו זה שבו גדלו ילדיה של סאלי , מבחינת הרגלי עישון מצב סוציואקונומי וכן הלאה), הוא ילד אחד מ- 8,500 ילדים. לכן, טען הרופא, הסיכון ששני ילדים ימותו באותו הבית ממוות עריסה הוא אחד ל-8,500X8,500 = 72.25 מליון. אך כדי שיוכל לטעון זאת, המומחה הניח שאם יש מוות אחד בעריסה, אז אין שינוי בסיכון שעוד ילד ימות מוות עריסה. סטטיסטיקאי יכנה הנחה כזו כ"הנחת אי-תלות". הנחת אי תלות היא שמרשה לנו לומר שהסיכוי ששני אירועים יקרו שווה למכפלת הסיכוי שכל אחד מהאירועים יקרה בניפרד (לדוגמא, שאם מטילים מטבע מאוזן פעמיים, אז הסיכוי לקבל שני עצים הוא חצי כפול חצי שווה לרבע. כי אין קשר בין תוצאת הטלת מטבע אחת לשניה). אך האם כך הוא המקרה בסיכון למוות עריסה?!

לא בטוח שהרופא הבין שטענתו נסמכת על הנחת אי התלות. אך במקרה שלפנינו מדובר בהנחה שהיא מופרכת בעליל. זאת משום ששני מקרי מוות רצפים בעריסה אינם דומים להטלת מטבע פעמיים. במקרה של שני מקרי מוות כאלו, ניתן להניח שקיימים גורמים רבים אשר עשויים היו להשפיע על מותם של שני בניה של סאלי, גורמים ההופכים שני ארועים לתלויים זה בזה. דוגמאות לגורמים כאלו יכולים להיות גורמים סביבתיים או גורמים גנטיים, אשר מעלים את הסיכון למוות בעריסה. לכן, אם משפחה כלשהי סבלה ממוות אחד בעריסה, אז סביר שלאותה משפחה יש את אותם גורמי סיכון, ולכן לאמר שהסיכוי למוות עריסה נוסף במשפחה הוא כאילו לא ידענו שהיה מוות עריסה ראשון במשפחה, יהיה די מגוחך. ואפילו יותר גרוע ממגוחך, זו תפיסה לא מדעית. אף על פי כן, כך זה הוצג במשפט ואף אחד מהנוכחים לא מחה על כך.

דבר נוסף: עיתונאי אחד כתב שהסיכוי שסאלי היא חפה מפשע הוא 1 לכ- 73 מליון. וזה איננו נכון, כי זה כמו לומר שהסיכון שאנו חולים במחלה, אם מצאו אותה אצלנו בבדיקה הוא 99%. כדי לדעת מה הסיכון שסאלי אכן רצחה את ילדיה, היה עלינו לשקול את הסיכון של שני מיתות עריסה (שזה פחות מ- 1 לכ- 73 מליון, אבל עדיין לא סביר במיוחד), למול הסיכון (תחת הראיות שהיו במשפט) שאמא תהרוג לעצמה שני ילדים (או אפילו אחד מהם, לצורך העניין) – כאשר גם זה לא מאד סביר. אך כך או אחרת, ה"סיכוי" שסאלי היא חפה מפשע תהיה בפירוש מספר אחר (וגדול) מ- 1 לכ- 73 מליון.

עוד שתי נשים הואשמו בנסיבות דומות בשל העדות של רופא הילדים וזוכו לאחר שהליקוי בעדות נחשף. ואילו רופא הילדים צפוי לביטול רישיון הרופא שלו.

אילו רופא הילדים היה מעיד לגבי תיכנונו של גשר מסויים, היו אומרים "הוא רופא ילדים, באיזה סמכות הוא מדבר על בניית גשרים ?!", אבל כשהוא דיבר על סטטיסטיקה – אף אחד לא ערער על עדותו.

מסקנה אחת שאפשר להסיק מכל הסיפור הזה, הוא שבני האדם שאינם מיומנים בחשיבה סטטיסטית, עלולים להוביל לשגיאות הרות גורל.

מספר קישורים:

1) סיפורה המלא והמפורט של סאלי ניתן למצוא באתר הבית שהוקם לכבודה ב: http://www.sallyclark.org.uk/

2) אבי, זאב גלילי, עשה שימוש בסיפורה של קלארק במאמרו המצויין "האם חזרנו לימי 'האחרון שיוצא בלוד'",

שמתחיל בכך ש- "בערב יום העצמאות פרסם “ידיעות אחרונות” בכותרת ראשית: “יותר יורדים מעולים”. ומעליה כותרת גג “לראשונה זה עשרים שנה נרשמה בישראל הגירה שלילית”." . בשביל זאב,"הידיעה הזו היא הזדמנות לדון מחדש בנושא השימוש המניפולטיבי שנעשה בסטטיסטיקה בשיח הציבורי. " וזאת בדיוק הוא עושה עם סיפורה של סאלי קלארק.

3) סיפור דומה לזה של סאלי קלארק אפשר למצוא בסיפורו של קולינז, כפי שסיפר לי פרופסור משה פולק.
פרופסור פולק הפנה אותנו לקישורים הבאים על הסיפור (נעקוב אחריהם בהזדמנות )
תיאור יפה של המקרה נמצא ב-
STATISTICS AND PUBLIC POLICY
FAIRLEY AND MOSTELLER, EDITORS
ADDISON-WESLEY 1977
PAGES 370-379

תיאור נוסף יש ב- ( ALR3d (AMERICAN LAW REVIEW עמודים 1176-1197

4) הרצאתו של פיטר דונולוי בטד:

7 תגובות בנושא “כיצד (אי) חשיבה סטטיסטית שולחת אישה לכלא – סיפורה של סאלי קלארק”

  1. זו הטעות הביסייאנית והיא מאוד נפוצה בשל העובדה שמבחינה מילולית אנחנו הרבה פעמים מנסחים שאלות שמנקודת מבט סטטיסטית הן שונות לחלוטין בצורה שכמעט לא מבחינה ביניהן. כמו הדוגמה שנתת (הסיכוי לכך שאדם חף מפשע יזוהה כאשם מול הסיכוי שאדם שזוהה כאשם הוא חף מפשע).

    יש מאמר של מרדכי הלפרט ומשה פרדס שמזכיר קצת את הסיפור שסיפרת אבל על פרשה שקרתה בארץ (מוראד אבו חאמד). אמור להתפרסם בעיוני משפט ל2, (אם עדיין לא התפרסם).

    אבל לא רק אנשים רגילים טועים בסטטיסטיקה. גם חוקרים. לא מעט חוקרים בתחומי מדעי הרוח, החברה
    ואפילו רפואה וכלכלה, לא ממש מבינים את המשמעויות של המבחנים והבדיקות שהם עושים. ראיתי כל כך הרבה טעויות במאמרים כאלו שנובעות מחוסר הבנה אמיתית בסטטיסטיקה ובכללים של מחקר מדעי בלתי מוטה.

    כאשר סיפרתי את זה למישהי שעוסקת במחקרים בתחומי סוציולוגיה שונים, היא הודתה שעל אף שמחקרים רבים שלה הם סטטיסטיים היא אכן לא ממש מבינה בסטטיסטיקה. יש להם סטטיסטיקאי שעושה להם את העבודה "הקשה", אבל עצם העובדה שהסטטיסטיקאי נכנס רק בשלב עיבוד התוצאות זו כבר בעיה.

    בקיצור – לדעתי יש עוד הרבה מאוד דרך עד שאנשים ידעו לחשוב בצורה נכונה סטטיסטית.

השאר תגובה