בחירות 2020: התוצאות (עודכן)

בתשובה לשוטה הכפר הגלובלי, 29/07/20 14:15

מענטש טראַכט און גאָט לאַכט

722771

האלמון האיילי • בתשובה לשוטה הכפר הגלובלי

יום ד', 29/7/2020, 16:38

אתה מדבר על מודל רגרסיה או נירמול של ממש (ציון תקן)?
בשני המקרים זה בלתי אפשרי, אבל ההסבר קצת שונה.
המשותף לשני ההסברים הוא שהקריטריונים לבדיקה משתנים על פני זמן.

מענטש טראַכט און גאָט לאַכט

722772

שוטה הכפר הגלובלי • בתשובה להאלמון האיילי

יום ד', 29/7/2020, 17:13

לא ברור לי ההבדל. אני מחפש דרך להשוות בין מספר הנשאים שהתגלו בימים שונים, והשינוי בקריטריון אמור להיות חלק מהפרמטרים שמאפשרים את הנירמול. הדרך הכי פשוטה שעולה בדעתי: קח ממוצע של כמה ימים וקבע לפיו את התפלגות הבדיקות בין אוכלוסיות שונות. בכל יום אח"כ קח בחשבון רק מדגם מהבדיקות שעונה על אותה התפלגות. אני משער שלא קל להגדיר את המחלקות השונות (גיל? מגדר? בדיקה ראשונה? גודל משפחה של הנבדק? וכו') אבל בשביל זה משלמים לסטטיסטיקאים לא? יש כבר המון נתונים על החודשים שעברו כך שניתן לגבש את החלוקה הזאת במבט לאחור, כלומר לנסות כל מיני חלוקות כאלה ולראות איזו חלוקה נותנת (רטרואקטיבית) את הניבוי הטוב ביותר למס' החולים הקשים של שבועיים אחריה. נשמע לי כמו מטלה שאפשר להטיל על AI אולי לא נדע בכלל על אילו מחלקות בעצם אנחנו מדברים, אבל כן נדע כמה חולים קשים צפויים בעוד שבועיים, בין אם ערכנו ביום מסויים 10000 בדיקות ובין אם ערכנו 30000, או לפחות נדע האם יחסית לאתמול היום המצב טוב יותר או לא). גם רזולוציה ברמה של כמה ימים יכולה להספיק, למרות שכמובן כדאי לנסות לדעת מה קורה הכי מהר שאפשר.

מענטש טראַכט און גאָט לאַכט

722778

האלמון האיילי • בתשובה לשוטה הכפר הגלובלי

יום ד', 29/7/2020, 18:23

מודל סטטיסטי אומר לבנות רגרסיה עם משתנים מסבירים ומשתנה מוסבר‏¹, ונירמול אומר להתעלם מהערך המספרי של משתנה מסויים, ובמקום זה למדוד אותו במונחים של מרחק מהממוצע במונחי סטיות תקן‏². נראה שאתה מדבר על מודל סטטיסטי.
ה"מחלקות" שאתה מדבר עליהן הן משתנים מסבירים. הבעיה היא שהמחלקות הן רק חלק מכל המשתנים המסבירים. יש גם הגבלות, מוקדי התפרצות, קריטריונים לבדיקה וכו'.
נניח שבנינו מודל בתחילת המגפה וראינו שאם לוקחים 500 נבדקים חרדים ומכפילים ב-‏600 פלוס 100 נבדקים חילונים ומכפילים ב-‏300 אפשר לחזות לא רע את סך החולים. רק שבתחילת המגפה בתי הכנסת היו פתוחים וחרדים בקושי הקפידו על ריחוק חברתי, ואם היינו בונים את המודל עכשיו הוא היה 400 חרדים כפול 350 פלוס 200 חילונים כפול 300.
דיברתי על קירטריונים לבדיקה מכיוון שגם הם משחקים תפקיד דומה - אם כשבנית את המודל בדקו את כל מי שנחשף לחולה מאומת ועכשיו בודקים את מי שיש לו סימפטומים זה משנה את האוכלוסיה שמגיעה להיבדק באופן שלא ניתן לחלק למחלקות.

אם כבר, אני לא מבין למה לא אומרים לשק"מיסט לבנות מודלים סטטיסטיים במטרה להחליט על הגבלות. למשל, כמשנסים לקבוע אם לפתוח או לסגור חדרי כושר במקום לקשקש על זיעה אפשר לבנות מודל שבודק אם אנשים שהולכים לחדר כושר נוטים יותר להידבק בקורונה. גם פה יש בעיות מתדולוגיות, אבל זה עדיף על ניחוש אקראי או קירבה משפחתית לחברי כנסת. במחשבה שניה, נראה שעניתי לעצמי על התהייה.
______________
‏¹ מודל (סטטיסטיקה) [ויקיפדיה]
‏² ציון תקן [ויקיפדיה]

חזרה לעמוד הראשי

המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים
RSS מאמרים \| כתבו למערכת \| אודות האתר \| טרם התעדכנת \| ארכיון \| חיפוש \| עזרה \| תנאי שימוש והצהרת נגישות	© כל הזכויות שמורות