|
הוא אכן טרח והעמיק, והניתוח שלו מזכיר לי הטייה סטטיסטית נפוצה שכהנמן קורא לה1 'חוק המספרים הקטנים'. ההטייה מתבטאת בזה שכשיש לנו מרחב מדגם קטן מדי (כמו כאן, 6 מקרי רצח, חלקם לא רלוונטיים), אנחנו עדיין נוטים להתייחס אליהם כאילו הם נתונים אמינים שנלקחו ממדגם גדול ועם שולי טעות קטנים הרבה יותר.
הוא מביא דוגמה שאותי הפתיעה3 לענין הזה. הוא מצטט נתון על פיו "הערכים הנמוכים ביותר של אחוז החולים בסרטן2 התקבלו ביישובים דלי אוכלוסייה, מבודדים, במערב התיכון של ארצות הברית". המסקנה שרבים מאיתנו היו קופצים אליה, היא שבטח יש משהו במגורים המבודדים, הכפריים, מעבר ללחצים וזיהום האוויר העירוניים, שגור להפחתת גורמי הסיכון למחלת הסרטן. אלא שאז הוא מוסיף נתון שני מאותו מחקר: "הערכים הגבוהים ביותר של אחוז החולים בסרטן2 התקבלו ביישובים דלי אוכלוסייה, מבודדים, במערב התיכון של ארצות הברית". אופס. איך זה יכול להיות? ומה קרה לתושבים הרגועים שלא נתונים ללחצי העיר?
אז בעצם כלום לא קרה, כי הסיבה לשני הנתונים האלה היא סטטיסטיקה גרידא: כשאתה דוגם מספר קטן של דגימות, הסיכוי לקבל ערכי קיצון גדול הרבה יותר מאשר כשאתה דוגם מספר גדול של דגימות. בהקצנה, מספיק שביישוב של 10 אנשים אחד ילקה בסרטן נדיר, וכבר קיבלנו 10% שלמים מהאוכלוסיה שלוקים בו. לעומת זאת בעיר של מיליון אנשים, צריכים 100,000 ללקות באותו סרטן כדי שנכריז על אותה תוצאה, והסיכוי לזה קטן הרבה (הרבה (הרבה)) יותר.
1 על פי ספרו המומלץ מאד 'לחשוב לאט, לחשוב מהר' 3 טוב, אחרי ההסבר היא פחות הפתיעה, כמובן. 2 מסוים, אבל אני לא זוכר איזה.
|
|