|
||||
|
||||
מצד שני, עיתונים מדעיים נחשבים מעבירים את המחקרים שלהם ביקורת סטטיסטית קפדנית יחסית, ובמקומות רבים (קרי - מקומות המעוניינים לפרסם בעיתונים אלו) מתייעצים עם ססטיסטיקאי ו/או משתמשים בשירותיו לצורך החישובים. |
|
||||
|
||||
קשה לצפות מרופאים, שכאמור הכשרתם הסטטיסטית אינה חזקה (יש מלה בעברית ל-rigourous?) ובכל מקרה התבצעה במשך סמסטר אחד לפני שנים רבות, שיהיו בקיאים בסטטיסטיקה. הכרתי פעם מפעל היי טק מסוים; כשמהנדס שם היה רוצה לשנות משהו בתהליך הייצור הוא היה צריך לבנות ניסוי ולהוכיח את השיפור. למרות העובדה שקל הרבה יותר לשלוט בפרמטרים של מנות ומכונות ייצור מאשר בניסוי רפואי ושעורכי הניסויים היו מהנדסים, רבים מהם בעלי תארים גבוהים, הם לא הורשו להעביר אף שינוי כזה לאישור בלי לתכנן אותו יחד עם אחד מהסטטיסטיקאים שהועסקו שם למטרה הזו ולהחתים אותו על התוצאות. ברפואה אני לא בטוח שזה המצב - מה גם שאם איני טועה, הקריטריון המקובל לקבלת מחקר רפואי ככזה המוכיח נקודה מסוימת (שיפור או העדרו) הוא וודאות של 95%, שמשמעותה שאחד מכל עשרים מחקרים עלול "להוכיח" דבר מה רק כתוצאה מאקראיות פשוטה. |
|
||||
|
||||
מהניסיון המקצועי שלי, יש טווח מאד רחב של איכות סטטיסטית במחקרים רפואיים/ביולוגיים. לפעמים היא מחפירה ולפעמים היא מצוינת, ושיתוף של סטטיסטיקאי או מתמטיקאי בצוות החוקרים לא בהכרח מוביל לאפשרות השניה. בדיוק אתמול בערב הגשתי ביקורת עמיתים (סיבוב שני) למאמר מהסוג הזה. בגירסה הראשונה של המאמר נפלה טעות הסתברותית גסה ביותר1, מהסוג שאני מזהיר מפניה בפני תלמידי שנה א', שגרמה לכך שכמעט כל התוצאות המתמטיות שלו היו שגויות, וששרת האינטרט הייעודי שהמחברים הקימו עבורו, מן הסתם במאמץ ובממון רב, נתן פלטים שגויים לחלוטין. שניים מבין ארבעת מחברי המאמר באים ממחלקה מכובדת לסטטיסטיקה בארה"ב (השניים האחרים רופאים), ואחד משני הסטטיסטיקאים הוא חבר סגל בכיר שם (ניחוש שלי: הפאשלה היתה של השני, שהוא תלמיד מסטר או דוקטורט שזוכה להנחיה גרועה). בנוגע למשפט האחרון שלך: הוא לא לגמרי מדויק, אבל הרוח שלו נכונה. כצפוי, דיברנו כבר על העניין. ______________ 1. התוחלת של X בריבוע זה לא אותו דבר כמו ריבוע התוחלת של X. |
|
||||
|
||||
תודה על ההסברים שלך בקישור, יש לי שאלה על משהו שעוד לא הבנתי, אם ניקח לדוגמה את המחקר ששכ"ג קישר, כתוב שם: In women, higher rates were observed for death from all causes (adjusted hazard ratio 1.15, 95% confidence interval 1.13 to 1.17, for each glass of milk), אולי אתה יכול להסביר מה אומר הטווח 1.13 עד 1.17, ואיך מחשבים אותו?
|
|
||||
|
||||
את יודעת כמה זמן אני מחכה לראות את יובל כותב שוב "רווח סמך"? אני מחכך את כפות ידי בהנאה, ממש כאילו אני או'סאליבן לפני השחור האחרון שמשלים מכסימום. |
|
||||
|
||||
(אני מגרד בראשי בנסיון להבין למה לשחורים קשה להשלים מקסימום, ומגחך לאור הפוטנציאל האי-פוליטיקלי קורקט של זה). |
|
||||
|
||||
(שלא להזכיר בדיחה ידועה על מקסימומים ומינימומים) |
|
||||
|
||||
בדיוק קראתי בספר ("מעולם ועד עתה", שון קרול, ותודה לע.ו.) את הצרוף "שחורים שחורים" (ה "ש" הראשון הוא "ש" השימוש), וחשבתי על המשפט האפשרי "לאחרונה גילו אסטרופיזיקאים שחורים שחורים שחורים ..." אבל כמה אסטרופיזיקאים שחורים כבר יש? סלח לי, ניל. |
|
||||
|
||||
אתה ממליץ? |
|
||||
|
||||
אני רק באמצע כך שאשמור את השיפוט לסוף. בינתיים אני די נהנה, כן (אח, אח, האנטרופיה המשונה הזאת!). |
|
||||
|
||||
אתה בחור רציני. משום מה האסוציאציה הראשונה שעלתה לי לגבי התגובה שלך, זה שהיא עונה לא רע גם על השאלה 'האם הנך ממליץ על החיים האלה', לפחות לטעמי1. 1עד כדי הסוגריים2. 2 אולי גם איתם? הממ. |
|
||||
|
||||
רבים טוענים שבמשפט הראשון שלך יש ''ר'' אחת מיותרת. |
|
||||
|
||||
כל עוד אלה שרבים וטוענים לא דורכים ויורים, דיינו. |
|
||||
|
||||
אתה טוען שאתה לא בחור1 רציני? למה? נראה לי שזה אחד החורים הרציניים ביותר בסביבה (חורים שחורים הם תמיד רציניים, חורים לא רציניים מתלבשים בצבעים עליזים2). --------------------- 1. מעניין כמה שנים עברו מאז כינו אותך "בחור" בפעם האחרונה. 2. האם יש קשר בין המונח "צבעים עליזים" לצבעי הקשת של דגל הגאווה? |
|
||||
|
||||
תודה לשניכם על ההסבר הבהיר והממצה (וגם ליובל). מזל שיש אינטרנט. מה שלא היה ברור לי הוא אם הטווח תלוי גם בשיפוט סובייקטיבי של החוקרים. לפי מה שהבנתי, לא. |
|
||||
|
||||
כך מרימים מנופים לבנים לבנים לבנים חסונים, בוני בניינים. |
|
||||
|
||||
או כמו המדורים השונים שהיו בחנות לבגדים תחתונים בדרום אפריקה של תקופת האפרטהייד: - לבנים לבנים לבנים לבנים - לבנים לבנים לבנים שחורים - לבנים לבנים לבנות לבנות - לבנים לבנים לבנות שחורות - לבנים צבעוניים לבנים לבנים - לבנים צבעוניים לבנים שחורים - לבנים צבעוניים לבנות לבנות - לבנים צבעוניים לבנות לבנות |
|
||||
|
||||
מה פשעו הבנות השחורות שמנעת מהן ללבוש לבנים צבעוניים? ______ כן, ברור שזה טייפו, אבל זה היה מתבקש. |
|
||||
|
||||
בדרום אפריקה של האפרטהייד היה גם מעמד נפרד ל''צבעוניים'' שהיו לא לבנים ולא שחורים (בעיקר הודים). |
|
||||
|
||||
אז להוסיף על אותו עיקרון גם "לבנים צבעוניים לבנות צבעוניות"? |
|
||||
|
||||
נו, אפשר כבר לקבל הסבר לסוף המשפט האחרון שלך? אני במתח כבר שבוע. |
|
||||
|
||||
אל תצפה לגדולות ונצורות http://en.wikipedia.org/wiki/Ronnie_O%27Sullivan |
|
||||
|
||||
יש גם בעברית1 1 רוני אוסליבן [ויקיפדיה]2 2 וערך ארוך ושלם יותר מהערך על לואי ה-133, כריסטיאן התשיעי4 וטום צ'יימברס5 ביחד. 3 לואי השלושה עשר, מלך צרפת [ויקיפדיה] 4 כריסטיאן התשיעי, מלך דנמרק [ויקיפדיה] 5 טום צ'יימברס [ויקיפדיה] |
|
||||
|
||||
שמע, עם כל הכבוד לצ'יימברס שהצליח פעם אחת בקריירה להגיע לחמישיה השניה של ה-NBA, שחקן שהגיע חמש פעמים למקום הראשון בעולם ראוי קצת יותר לערך על שמו (בדוק בכמה שפות יש בכלל ערך על צ'יימברס - גם בעברית לא היה לולא העונה הקטסטרופלית שלו במכבי). זה לא ד"ר J, נניח, שכאן המקום לציין שהשבוע הוא חגג 65 שנה (וגם שלפני שבע שנים זכיתי לראות אותו מטווח אפס כאן בירושלים!). |
|
||||
|
||||
"להגיע למקום הראשן בעולם" בספורט פאבים זניח. נראה לי שמספר הצופים (כולל טלוויזיה) במשחק אליפות נמוך ממספר קוני הכרטיסים במשחק ממוצע של הפיניקס. אבל, לצורך העניין, תחליף את צ'יימברס בריקי מקקאו1, בויראט קוהלי23 שניהם קפטנים של נבחרות לאומיות בספורט הלאומי של מדינתם, בפיל טיילור4, אלוף עולם 14 פעמים(!) בספורט פאבים מגוחך לא פחות, או בדייויד בריאנט5, עם שלוש אליפויות בשתי "מקצועות" שונים (מעניין שאפילו בויקיפדיה האנגלית אין ערך על בארי ריגבי, שמחזיק שתי אליפויות עולם בבליסת פאי). 3 ואני ממש לא מתחייב על האיות. |
|
||||
|
||||
ספורט פאבים זניח? פחות צופים מבמשחק של הפיניקס? ה-BBC קנה את זכויות השידור של הספורט הזניח הזה בבריטניה ומשדר למעלה מ-260 שעות שלו בשנה, כאשר הזכיה של או'סאליבן משכה קהל ממוצע של 2.1 מיליון צופים בבריטניה (ולטענת ראשי הספורט, סך כולל של 28.5 מיליון צופים). נראה לי שזה קצת יותר ממשחק של פיניקס, אפילו בתקופתו של סטיב נאש. אף אחד מהדברים שהזכרת לא מתקרב אפילו לפופולריות של הסנוקר - להוציא הקריקט בהודו, שאכן עשוי לגמד מבחינת מספר המתעניינים בו כמה וכמה מסוגי הספורט המובילים בעולם. הבעיה של הקריקט היא שאף אחד מחוץ להודו (ואולי מדינות סמוכות) לא מתעניין בו. בישראל מתעניינים יותר באו'סאליבן. בשנת 2000 ה-BBC נהג לקיים באתר שלו מדי שבוע משאל על "עשרת הגדולים של המאה בתחום...". הזדמנתי לשם כשהמשאל עסק בתחום הספורט. מי הייתם מצפים שיהיו בין עשרת המובילים באותו זמן? פלה? קרל לואיס? מארק ספיץ? ג'סי אוונס? מייקל ג'ורדן? ג'ים תורפ? אני לא זוכר מי מאלה כן הצליח להשתחל, אבל בין עשרת הגדולים במשאל שבעה היו שחקני קריקט הודים - מה שמלמד כנראה על הדמוגרפיה של גולשי אתר ה-BBC יותר מאשר על הספורט העולמי. |
|
||||
|
||||
2.1 זה מספר הצופים הממוצע במקבילית המוחות או שירי הודיה לאל1 - באותו ערוץ, ספרינגווצ', סידרה על האביב (בחיי) קיבלה כמעט שלוש מליון צופים1. למשחקי רוגבי2 וקריקט3 יש הרבה יותר צופים בעולם בכלל (ובבריטניה בפרט). 1 מקור. 2 מספר 7 ו-8 בארועים הכי נצפים בעולם בטלויזיה (http://en.wikipedia.org/wiki/List_of_most_watched_te...) 3 מספר 10 ברשימה מלמעלה. ממש לא רק בהודו ופקיסטאן, גם בבריטניה ובאוסטרליה. |
|
||||
|
||||
קריקט הוא הספורט השני הכי פופולרי בעולם, אחרי כדורגל. והנה בימים אלה מתקיימת באוסטרליה וניו זילנד אליפות גביע העולם בקריקט, למי שמתעניין ב"גוּגלִי" או "דוּסרה". |
|
||||
|
||||
השתכנעתי, יש מקום בויקיפדיה העברית גם לערכים על שחקני הרוגבי והקריקט הגדולים בעבר ובהווה. מעל במה זו אני מפנה קריאה נרגשת להמוני חובבי הרוגבי והקריקט דוברי העברית: מהרו ומלאו את החסר! הרוגבי והקריקט, כמו הבייסבול, הם משחקים פופולריים מאד בחלק מהמדינות שבהן שלטה מעצמה מסוימת - ובעלי נוכחות קרובה לאפס בשאר העולם. ויקיפדיה בשפות השונות משקפת את העובדה הזו. לגבי או'סאליבן, הוא שחקן שבמשך שנים רבות היה השחקן הבולט או אחד משניים-שלושה הבולטים בספורט יחידים מסוים - כמו, למשל, רפאל נדאל, מיכאל שומאכר, פלויד מייוות'ר או טייגר וודס. בעיני, זה עושה אותו ראוי בהחלט לערך על שמו - הרבה יותר מאשר צ'יימברס, שהיום רק חולי היסטוריה של ה-NBA ואוהדים ותיקים מאד של הקבוצות שבהן הוא שיחק זוכרים שהוא היה שם אי פעם. |
|
||||
|
||||
מה עם פיל טיילור (גם על הפלויד הזה לא כתוב יותר מידי בוויקיפדיה)? אגב בייסבול, גם על בייב רות יש ערך כמעט מעליב בויקיפדיה העברית, אמנם יותר ממרק מקגייור ווילי מייז, אבל עדיין, מעליב יחסית לאוסליבן. זה לא שאני רוצה לקרוא ערכים על שחקני רוגבי, קריקט, דוקים, בייסבול או פוטבול, פשוט האורך והעומק של הערך על שחקן בספורט חסר חשיבות הפתיעה אותי. לא נראה לי שיש חובב ספורט בישראל שלא יודע מי היה צ'יימבז, לא נראה לי שיש בישראל חובב היסטוריה (או ספרות) שלא יודע מי היה לואי ה-13... |
|
||||
|
||||
אני סבור שסנוקר הוא פחות אזוטרי מדארטס; אני מכיר כמה וכמה ישראלים שעוקבים בענין אחרי או'סאליבן ומעלליו, ולא מכיר כאלה שעוקבים אחרי טיילור. ואל תדאג, אחרי הקרב מול פקיאו יהיה קצת יותר גם על מייוות'ר. מה שיפה בויקיפדיה הוא שבניגוד לאנציקלופדיה מסורתית, היא מאפשרת להביא לידי בטוי גם את מדת הענין של אנשים בנושא ולא רק את מדת החשיבות שלו בעיני עורך כלשהו. בייב רות' הוא דמות חשובה יותר בהיסטוריה של הספורט העולמי, אבל אין לו בארץ מעריצים שיטרחו להקדיש לו את הזמן ולכתוב ערך מושקע - לאו'סאליבן יש. לכך כיוונתי גם ביחס לקריקטאים ושחקני הרוגבי: אין להם ערכים בעברית כשם שאין לשחקני בוליווד ערכים - כי יש להם המון מעריצים, אבל רק במדינות מסוימות. חשבתי להעיר שצ'יימברס אולי מוכר, אבל כדי שיהיה ערך רציני אתה צריך בדרך כלל שיהיה מישהו שלא רק יכיר אותך אלא גם יעריץ אותך - וצ'יימברס לא השאיר אחריו מעריץ אחד בישראל (אלא אולי מבין אוהדי הפועל). אבל מסתבר שלא די בכך; גם שחקנים שזכו להערצה מוצדקת לא זכו לערכים משמעותיים יותר - כך לגבי מגי וג'ונסון וגם ארל וויליאמס. למעשה, שלושת אלה זכו לערכים שאינם שונים בהרבה מזה שזכה לו קונסטנטין פופה. הייתי מצפה ממכבי שתשלם כמה פרוטות לשעה למישהו ממועדון האוהדים כדי שידאג לבנות עליהם ערכים מושקעים יותר, אבל היא לא עשתה זאת - אז לצ'יימברס אין מה להרגיש רע. באותה הזדמנות הסתבר לי שוויליאמס הוא היום מורה לחנוך מיוחד(!) וגם, למרבה הצער, שמגי נהרג בתאונת דרכים לפני 12 שנה - לא ידעתי זאת. עצוב. |
|
||||
|
||||
ועל כך - על זה שהוא נחשב בישראל לספורט פחות אזוטרי מבאולינג, דארטס או בליסת עוגות; על זה שיש ישראלים שעוקבים אחריו עד כדי לרצות לכתוב עליו ערך שלם בויקיפדיה - הפליאה. |
|
||||
|
||||
את זה אפשר לומר על סוגי ספורט רבים - יש שיאמרו על כולם. אני סבור שסנוקר (ובאולינג) לא פחות מעניינים מגולף, למשל, ויתכן שהישראלי הממוצע יכול להתחבר אליהם יותר משום שיש לו יותר הזדמנויות להתנסות בהם בעצמו; וכל אלה מעניינים הרבה יותר משחיה צורנית או מהרמת משקולות, אף ששני אלו נכללים באולימפיאדות. נראה שיש בעולם רבים שמסכימים אתי - לפחות עד כמה שהדבר מתבטא בשעות שידור, ספונסורים וחוזי פרסום. |
|
||||
|
||||
העובדה שגולף הוא ספורט פופולרי (או שהוא בכלל ספורט) היא עובדה מפתיעה בפני עצמה. אבל בכל זאת יש הבדל בכמה סדרי גודל כמות הכסף בין גולף לסנוקר. ברשימת עשרת השחקנים המרוויחים בעולם נמצאים שני שחקני גולף, אין אף שחקן סנוקר במאיה הראשונה. אגב, לאדם סקוט, מספר 95 ברשימה, או אפילו לפיל מייקלסון, מספר 8, אין בכלל ערך בויקידפיה העברית. |
|
||||
|
||||
אפרופו כסף וקריקט, 80% מהכנסות באליפות העולם מגיעות מהודו. אלא שב-2007 ארע אסון כשאירלנד העיפה מהתחרות את פקיסטן ובנגלדש את הודו וכך לא התקיים מפגש בין שני היריבות הודו ופקיסטן. כדי למנוע אסון פיננסי נוסף מועצת הקריקט העולמי שינתה את החוקים כדי להבטיח שתמיד יתקיים משחק בין הודו לפקיסטן ע"י הקטנת מספר הקבוצות ושיטת משחקים בה כל קבוצה משחקת נגד כל שאר הקבוצות בשלב הראשון. |
|
||||
|
||||
הכל ענין של גאוגרפיה. גולף פופולרי במיוחד בארה"ב, ולגמרי במקרה שם מסתובב גם הכסף הגדול של המפרסמים ושל הטלביזיה ושל הפרסים בטורנירים. הסנוקר פחות תפס שם, והוא חזק יותר דווקא בשווקים אירופיים קטנים יותר ומפוזרים יותר. למרות זאת, או'סאליבן הרוויח בחייו למעלה משמונה מיליון ליש"ט כפרסים בטורנירים - לא בליגה של הטניס, אבל בכל זאת סכום נאה. אגב, שמת לב שאותו "הפלויד הזה" תופס את המקום הראשון ברשימה? |
|
||||
|
||||
כן, שמתי לב, שמת לב שהוא קיבל הכי מעט מפרסומות... |
|
||||
|
||||
באגרוף המודל העסקי שונה מבענפים אחרים בגלל אופי הספורט. קשה להרוויח מפרסומות כיוון שחברות לא מעונינות להשתמש במתאגרפים כפרזנטורים. לכל מתאגרף בכיר יש קרבות בודדים בשנה והם לא במסגרת של טורניר קבוע. לכן המודל מתבסס על שידור ישיר של הקרבות בערוצי צפיה בתשלום, ועל תשלום ישיר של סכומי עתק למתאגרפים עצמם. |
|
||||
|
||||
כפי ששכ"ג אמר, מדובר ברווח סמך. אבל לדעתי המונח שיותר דורש הסבר בציטוט הנ"ל הוא hazard ratio, אז אגיד קודם משהו עליו. בסטטיסטיקה צריך לעתים קרובות לנתח את התפלגות הזמן עד שמשהו ספציפי קורה. למשל: הזמן מרגע אבחון מחלה כלשהי עד שמתים ממנה (או במקרים אחרים, עד שמחלימים ממנה), זמן הפעולה של מכשיר אלקטרוני עד שהוא מתקלקל, או הזמן שחבר פרלמנט מכהן עד שהוא פורש או לא נבחר יותר. תת-התחום הסטטיסטי הרלוונטי נקרא "ניתוח שרידות" (survival analysis). מסתבר שנוח יותר למדל ולנתח מתמטית זמנים שכאלה לא דרך פונקציית ההתפלגות שלהם, אלא דרך פונקציה שנובעת ממנה במובן מסוים, ונקראת "פונקציית סיכון" (hazard function). יהיה לי קשה להסביר כאן מה הפונקציה הזאת בדיוק אומרת, אבל אינטואיטיבית, לדברים שקורים בד"כ תוך זמן קצר יש פונקציית סיכון עם ערכים גבוהים, ולהיפך. למשל, אם נסתכל על הזמן עד להתפתחות סרטן אצל עכברים רגילים ואצל עכברים שנחשפו לקרינה רדיואקטיבית מסיבית, פונקציית הסיכון בקבוצה השניה תהיה עם ערכים גבוהים יותר. המודל הנפוץ ביותר בניתוח שרידות נקרא המודל של קוקס (Cox), או proportional hazard. ההנחה הבסיסית שלו היא שלפונקציית הסיכון של הזמן שבו אנחנו מתעניינים (למשל הזמן עד התפתחות סרטן) בקבוצה אחת (עכברים רגילים) יש בדיוק אותה הצורה כמו לפונקציית הסיכון בקבוצה השניה (עכברים שנחשפו לקרינה), רק שערכי הפונקציה כולם בקבוצה השניה מוכפלים בקבוע כלשהו. הקבוע הזה נקרא "יחס הסיכון", וזה ה-hazard ratio שמופיע בציטוט. כשהקבוע הזה גדול מ-1, זה אומר (באופן גס) שבקבוצה השניה הדברים קורים בד"כ תוך זמן קצר יותר, וכשהוא קטן מ-1, תוך זמן ארוך יותר. בציטוט שהבאת אומרים (פחות או יותר) שאצל נשים, כל כוס חלב נוספת ביום גורמת לפונקציית הסיכון של הזמן עד המוות לגדול פי 1.15, כלומר חלב מקצר לנשים את החיים (אבל שימו לב - זה לא נכון לפרש את הממצא הזה שכל כוס חלב מקצרת את החיים של נשים ב-15%, או משהו בסגנון). ועכשיו סוף סוף לרווחי סמך. המספר 1.15 שנקבתי בו בפיסקה הקודמת הוא מה שנקרא "אמד נקודתי" - כלומר מספר בודד, ולא טווח של מספרים. הבעייה עם אמדים נקודתיים היא שהם לא משקפים את הווריאביליות של הגודל שניסינו לאמוד, ולכן נותנים תחושה כוזבת של דיוק. הרי ברור שאילו היינו בוחרים מדגם מקרי אחר של נשים למחקר, היינו מקבלים תוצאות קצת אחרות, פשוט כי בכל מדגם יש מידה מסוימת של אקראיות טהורה. דוגמא אחרת, ברוח הימים הנוכחיים: שני סקרים מצאו שלמועמד X יש 63% תמיכה בציבור, אבל סקר א' התבסס על 100 נסקרים, וסקר ב' על 5000 נסקרים. האמד הנקודתי של שני הסקרים (63%) הוא זהה, אבל ברור שסקר ב' יותר אמין. רווח סמך הוא דרך לכמת את אי הוודאות הזו, והוא טווח של מספרים (שבד"כ במרכזו נמצא האמד הנקודתי) שבהם אנחנו מעריכים, בדרגת ביטחון גבוהה למדי, נמצא הגודל שבו אנחנו מתעניינים (אחוז התמיכה האמיתית באוכלוסייה במועמד X, או היחס האמיתי בין שתי פונקציות הסיכון). בציטוט שהבאת כתוב בעצם: במחקר שלנו מצאנו שיחס הסיכון הוא 1.15, אבל אל תתפסו אותנו במילה - הוא כנראה איפשהו בין 1.13 ל-1.17. שאלת גם איך מחשבים את רווח הסמך הזה. התשובה שלי היא שאני לא יודע, כי לא קראתי את המאמר - יש הרבה וריאנטים על המודל של קוקס, ולא ברור לי במה השתמשו כאן (ואני גם לא מומחה בניתוח שרידות). בכל אופן, אני מקווה שעזרתי להבין את רוח הדברים. |
|
||||
|
||||
תודה! אבל אתה עוד לא משוחרר. כתבת שאם כל כוס חלב נוספת ביום גורמת לפונקציית הסיכון של הזמן עד המוות לגדול פי 1.15, זה לא אומר שהכוס הזו מקצרת את החיים ב-15%. אבל אתה יכול לומר משהו שזה כן אומר, במונחים נגישים להדיוטות, אפילו רק בערך או עם הנחות נוספות? |
|
||||
|
||||
כן, אני יכול. אנסה בכל זאת להסביר מה זה פונקציית סיכון. כזכור, אנחנו מתעסקים בניתוח הזמן עד שמשהו ספציפי קורה (באנגלית התחום נקרא גם time-to-event analysis). לשם הקונטקרטיות ולמרות המורבידיות, נחשוב על "מוות" בתור המשהו הספציפי. בניסוח לא מדויק, הערך של פונקציית הסיכון בנקודת הזמן t היא ההסתברות שאדם שזכה להגיע לגיל t ימות תוך זמן קצר אחרי t. כתבתי "היא ההסתברות" אבל זה שקר גס, כי סיכון זה גודל שיכול להיות גדול מ-1. הסיבוך הזה קורה בגלל ש"זמן" זה גודל רציף, אז כדי להקל על עצמנו בהסבר, בוא נעבור לדבר על זמן בדיד - נמדוד גיל של אנשים רק בשנים שלמות. נניח שזמן החיים של אדם מתפלג באופן אחיד (בדיד) בין שנה אחת ל-80 שנה. כלומר, כשאדם נולד, יודעים שיש לו הסתברות של 1/80 למות בגיל שנה, הסתברות של 1/80 למות בגיל שנתיים, וכך עד הסתברות של 1/80 למות בגיל 80. אלה הסתברויות לא מותנות. אבל אם ידוע שאדם שרד את השנה הראשונה של חייו, מהי ההסתברות שימות בגיל שנתיים? אם הוא שרד את השנה הראשונה, נותרו לו רק 79 אפשרויות, והיות שהן שוות הסתברות (אמרנו התפלגות אחידה), ההסתברות המותנית שימות בגיל שנתיים, בהינתן ששרד עד גיל שנה, היא 1/79. ההסתברות המותנית הזאת, 1/79, היא בדיוק הסיכון שלו בשנה השניה. באופן דומה, ההסתברות המותנית שמישהו ששרד את גיל שנתיים ימות בגיל 3 היא 1/78 - כלומר פונקציית הסיכון בגיל 3 היא 1/78 - וכך הלאה, עד שהסיכון בגיל 80 הוא 1: מי ששרד את גיל 79, ימות בוודאות בגיל 80. בזמן רציף, כאמור, העניינים קצת מסתבכים טכנית, כי צריך לקחת גבולות על dt ששואף ל-0, והסיכון יכול לצאת (ואכן הרבה פעמים יוצא) גדול מ-1, כך שאי אפשר לתת לו אינטרפרטציה של הסתברות. אבל העיקרון לא משתנה: ערך פונקציית הסיכון בנקודה t משקף את הנטייה למות "עכשיו" עבור אלו שהגיעו לגיל t. עד עכשיו דיברנו רק על מצב עניינים אחד: אנשים באשר הם. במחקרים בד"כ משווים בין קבוצות שונות של אנשים, למשל אנשים שלא שותים חלב בכלל, אנשים ששותים כוס חלב אחת ביום, אנשים ששותים שתיים, וכו'. בכל קבוצה שכזו תיתכן עקרונית התפלגות זמן חיים אחרת (למשל אם מאמינים שצריכת חלב משפיעה על הבריאות), ואז תהיה לקבוצה גם פונקציית סיכון אחרת. ההנחה של המודל של קוקס היא שאם ניקח שתי קבוצות כלשהן, פונקציות הסיכון שלהן יהיו שונות זו מזו רק בכפל בקבוע, שהוא בדיוק יחס הסיכון ביניהן. במאמר שג'וד שאלה עליו אומרים שיחס הסיכון בין כל שתי קבוצות נשים "סמוכות" (למשל הנשים ששותות 3 כוסות ואלה ששותות 4 כוסות) הוא 1.15. עכשיו סוף סוף אני יכול לתת אינטרפרטציה למספר הזה: אם ניקח קבוצה גדולה של נשים בנות אותו הגיל, חלקן שותות 3 כוסות חלב ליום וחלקן שותות 4, ונעקוב אחריהן במשך זמן יחסית קצר (נניח, חודש), אזי אחוז הנשים שימותו במהלך הזמן הנ"ל בקבוצה השניה צפוי להיות גדול בערך פי 1.15 מאחוז הנשים שימותו בקבוצה הראשונה. הכל תחת ההנחה של המודל של קוקס. יצא לי ארוך, אז אני שומר לפעם אחרת את דעתי לגבי הריאליות של המודל של קוקס. |
|
||||
|
||||
תודה רבה, יובל. תענוג לקרוא את ההסברים שלך. |
|
||||
|
||||
כן, תודה! |
|
||||
|
||||
תודה רבה יובל! מאד עזרת להבין את רוח הדברים. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |