בתשובה לירדן ניר-בוכבינדר, 19/04/25 7:13
שלח לי שקט סטטיסטי 778207
בדיוק קראתי את הכתבה הזאת הבוקר, ותוך כדי הקריאה חשבתי "רגע, אבל האם בדקו אולי זאת סתם מקריות?", ואז הגעתי ל"אולי, כפי שאמר ג'פרי רותסטיין, נוירולוג מבית הספר לרפואה באוניברסיטת ג'ונס הופקינס, ההתפרצויות כלל אינן משמעותיות, הן פשוט סטיות סטטיסטיות נדירות. 'חולים תמיד מחפשים סיבה למחלה הנוראה שלהם', אמר. 'היו כבר הרבה 'מוקדים' כאלה של ALS לאורך השנים. לכל מומחה היה הסבר משלו, ואף אחד מהם לא הוביל לשום מקום'."

אני לא יודע אם ואיך בדקו את העניין במקרה הספציפי הזה ("התפרצויות" ALS), אבל תחת הנחות שנראות לי סבירות, הבדיקה לא אמורה להיות קשה. שכיחות המחלה, ע"פ הכתבה, היא כ-‏3 ל-‏100,000 בני אדם. אם חושבים על אוכלוסיית המדינה כמורכבת מ-K קהילות קטנות, כל אחת עם n תושבים, ומגדירים "התפרצות" כהופעה של 5 מקרי ALS או יותר, אז קל לחשב את ההסתברות להתפרצות בקהילה בודדת, ואז את ההסתברות שמבין K הקהילות תהיה לפחות קהילה אחת עם התפרצות. למשל, עבור K = 7,000 ו- n = 10,000 (כך שבמדינה יש 70 מיליון תושבים, בדומה לאוכלוסיית צרפת) מקבלים שההסתברות להתפרצות בקהילה בודדת היא 0.0000157, אבל ההסתברות לקהילה אחת לפחות עם התפרצות היא יותר מ-‏0.1, כלומר זה לא מאורע עם הסתברות זעירה.

אבל לא ברור לי מהם ה-n וה-K ה"נכונים". בכתבה נאמר "... ההתפרצות באלפים, שצמחה בסופו של דבר ל–16 חולים — מספר הגדול פי עשרה ממה שניתן היה לצפות באוכלוסייה כה קטנה." בחישוב נאיבי יוצא שהאוכלוסייה הזו היא בת כ-‏53,000 תושבים (n), ואז אפשר לחלק את צרפת לכ-‏1320 קהילות כאלה (K). ההסתברות שתהיה לפחות קהילה אחת עם התפרצות היא עכשיו תכל'ס 1. אבל אם משנים את ההגדרה של התפרצות ל-‏10 מקרים או יותר, ההסתברות למציאת לפחות קהילה אחת עם התפרצות יורדת לקצת פחות מ-‏1%, וכשמעלים עוד את סף ההתפרצות, מ-‏10 ל-‏16, ההסתברות נהיית כמעט 0.
שלח לי שקט סטטיסטי 778208
תודה. אבל כשם שאתה לא בודק את ההסתברות להתפרצות דווקא במונשבאן אלא בקהילה כלשהי בצרפת, נדמה לי שראוי לבדוק את ההסתברות לקהילה כלשהי בעולם, וזה מן הסתם מעלה את ההסתברות.
שלח לי שקט סטטיסטי 778211
כמובן, אבל בכתבה נאמר: "שיעורים גבוהים של ALS נצפו סביב לגונה בצרפת, ליד אגם בניו המפשייר, בבניין מגורים בודד במונטריאול ובמדרון המזרחי — אך לא המערבי — של הר אטנה באיטליה." כלומר יש יותר מ"התפרצות" אחת בעולם.
שלח לי שקט סטטיסטי 778221
נכון - ולכן חשבתי שהדבר הנכון לבדוק הוא כמה "מקומות" או "קהילות" יש בעולם ומה הסיכוי ל"התפרצות" בכל אחד מהם. למה מעניין לבדוק מדינה אחת (אחת מהמעטות שהיתה בהן התפרצות (אמיתית או מדומה))?
שלח לי שקט סטטיסטי 778232
זה סתם יותר קל לבדוק מדינה אחת (או אזור מאד גדול אחד) עם התפרצות אחת, אחרת נוסף הסיבוך של גדלי ''קהילות'' שונים - למשל כפר באלפים לצד בניין מגורים בודד וכו'.
שלח לי שקט סטטיסטי 778256
לא קראתי את הכתבה, אך האם שכיחות המחלה נמדדה בצורה הכוללת את ההתפרצויות (או את צירופי המקרים)?
אם כן, האם אחוז החולים בהתפרציות מכלל החולים גדול מספיק להשפיע על אומדן הסיכוי לחלות בצורה ״ספונטנית״ בצורה משמעותית?
שלח לי שקט סטטיסטי 778258
בכתבה לא מפרטים, אבל אני משוכנע בכמעט 100% שגם אם השכיחות נאמדה כולל ה"התפרצויות", ההשפעה של נתוני ההתפרצויות על התוצאה היא זניחה.
שלח לי שקט סטטיסטי 778233
שאלה מהדיוט:

איך עבור K/N 7000/10000 קיבלת הסתברות של 0.1, אבל עבור 1320/53000 קיבלת כמעט 1?
לי זה לא הסתדר באינטואיציה, אבל אני בטח טועה.
שלח לי שקט סטטיסטי 778235
ההסתברות שאדם נתון יהיה חולה היא p = 0.00003. ההתפלגות של מספר החולים בקהילה בת n = 10,000 חברים היא בינומית עם פרמטרים n, p, ויוצא שההסתברות להתפרצות בקהילה (5 חולים או יותר) היא 0.0000157 (קיבלתי מהפקודה pbinom(4, n, p, lower.tail = F) ב-R). נקרא להסתברות האחרונה a, ואז ההסתברות לקהילה אחת לפחות עם התפרצות היא 1 פחות [(1 פחות a) בחזקת 7000], וזה יוצא 0.1045. תחזור על זה עם זוג הפרמטרים האחרים, ותקבל כמעט 1.
שלח לי שקט סטטיסטי 778246
נהדר.
החזקה עושה את זה לא אינטואיטיבי, ולכן הכשל לחשוב שהתפרצות היא לא מקרית.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים