|
||||
|
||||
ראשית, ברכות לרגל תוספת הקידומת (החד-פעמית!) לשמי תתקבלנה בברכה בדוא"ל :-) ועכשיו לעסק. אחת המשימות הניצבות בפני הסטטיסטיקאי היא לבחור את "המודל הנכון" לבעייתו. כשהמודל הוא "לא נכון", מתחילות לפעמים צרות. הנה דוגמא, באוירה האולימפית של ימים אלה. מודל סטטיסטי נפוץ ביותר נקרא "רגרסיה לינארית", והוא מניח קשר מסוים בין שני משתנים: ערכו של משתנה אחד (למשל, גובהו של אדם בוגר) הוא "פחות או יותר" פונקציה לינארית של משתנה אחר (למשל, גובהו של אביו). למה הכוונה? אם נאסוף נתוני גובה אודות 50 זוגות בן/אבא, ונשרטט על גרף שצירו האופקי הוא "גובה האב" והאנכי הוא "גובה הבן" 50 נקודות על פי הנתונים הנ"ל, אז הנקודות תסתדרנה, פחות או יותר, על קו ישר (דוגמא: http://www.statslab.cam.ac.uk/~rrw1/stats/regress1.g...). ברגרסיה ניתן להשתמש, למשל, לצרכי חיזוי: אם אספנו מספיק נתונים, נוכל לחזות (במידה צנועה של דיוק) את גובהו של אדם בהנתן גובהו של אביו. ומתי *לא* כדאי להשתמש במודל של רגרסיה לינארית? בהרבה מקרים. למשל, כשהנקודות בעליל לא מסתדרות באופן סביר על קו ישר, או לצורך חיזוי "גובהה" של נקודה הממוקמת על הציר האופקי הרחק מעבר לנקודות שהגדירו את הקו הישר. מאמר שנידון בעבר באייל (תגובה 168058 והלאה) נכשל בכשל האחרון. המאמר, בין השאר, מציג את הזמנים שקבעו זוכי מדליות הזהב האולימפיות בריצת 200 מ' בין 1948 ל- 1992, גברים ונשים: על גרף שצירו האופקי הוא "שנים" והאנכי הוא "זמן הריצה" מופיעות נקודות המייצגות את הזמנים שנקבעו באולימפיאדות הנ"ל. הנקודות של הנשים הן גבוהות יותר (הן רצות לאט יותר), אבל גם משתפרות (דהיינו, יורדות) בקצב מהיר יותר. שני קוי רגרסיה שהועברו - אחד לגברים ואחד לנשים - הובילו את מחברות המאמר לכתוב: Linear models suggest that women could overtake men in the 2032 Olympics. הבעייה היא שמודל רגרסיה לינארית הוא לחלוטין לא מתאים בסיטואציה שלנו לחיזוי כל כך ארוך טווח. התוצאה החזויה ל- 2032 היא בערך 18.5 שניות - והיא אבסורדית בעליל. למעשה, אם ממשיכים באותו הגיון, ניתן גם לצפות שבאולימפיאדת 2312 זוכת הזהב תרוץ 200 מ' בזמן של מינוס שנייה אחת.
|
|
||||
|
||||
לא ראיתי את הגרפים המדוברים אבל אני מתקשה להאמין שהקו [שנים] מול [זמן ריצה] נראה ישר על טווח של 40 שנה. אני מתאר לעצמי שבעשור הראשון השיפור הוא בשניות, בעשור אחרי זה עשיריות שניה וכולי. לכל היותר יהיה בליפ קטן של כמה עשיריות בעשור האחרות בעקבות חומרים משפרי ביצועים. [ ומזל טוב, כמובן.עכשיו תוכל להיות מפעיל עגורן.] |
|
||||
|
||||
שני הגרפים הם באמת קצת קמורים, אבל דווקא פחות משציפיתי. בכל מקרה, צריך לזכור שאוליפיאדות נערכות רק פעמיים וחצי בעשור, כך שקשה לזהות הבדלים מובהקים בין עשור לעשור. (ותודה מקרב לב על הברכות.) |
|
||||
|
||||
ועכשיו תחשוף כבר את הבדיחה על העגורנאים? בבקשה? (כבר הזכרת אותה פעם, אבל אני עייף מכדי לחפש). וליובל - מזל טוב! |
|
||||
|
||||
נכון, באמת לא בסדר. אני מקווה שלאחר כל הבילד אפ לא תתאכזבו: בחור אחד הלך ללמוד פיסיקה ( נניח) וכשגמר תואר ראשון לא הצליח למצוא עבודה, אז הוא המשיך לתואר שני. לאחר התואר השני, שוב לא הצליח למצוא עבודה וכך המשיך לדוקטורט ולפוסט. בסוף לא היתה לא ברירה והתחיל לחפש ברצינות, אבל בכל מקום נבהלו מההשכלה שלו וזרקו אותו. בסוף, חבר שלו ראה מודעה בעיתון "דרושים מפעילי עגורנים" והציע לו לנסות. "אבל בחיאת" אמר החבר " אל תגלה להם ברמז שאתה ד"ר, שוב יעיפו אותך, ואז מה יהיה?" הלך לנמל באשדוד ופגש שם עוד כמה עשרות מועמדים. "אין לי סיכוי להתבלט ביניהם" חשב לעצמו. הראיון התחיל בסיור שמנהל העגורניסטים עשה לכולם. " זאת ברטה הגדולה, העגורן הכי גבוה אצלינו. משקולת הנגד מאפשרת שיווי משקל גם במכולות של 4 טון!" התלהב המנהל. כאן מבצע גיבורינו חישוב קטן בליבו על בסיס חוק המנוף, אבל מתאפק שלא להכריז שהוא חישב את משקל המשקולת. ממשיכים בסיור ובכל נקודה מגלה גיבורינו שיש תופעה פיסיקלית חשובה שמשליכה אור על ביצועים שונים של העגורנים, אבל בכל פעם הוא שותק, כדי שלא יגלו את ההשכלה שלו. בסוף אומר המנהל, " וזוהי סוזי, העגורן עם הזרוע הארוכה ביותר, 50 מטר. אולי מישהו מכם יכול לאמוד את השטח שמכוסה כאשר סוזי מסתובבת סביב צירה?". כאן הוא לא יכול להתאפק יותר וצועק: -מינוס פאי אר בריבוע, כאשר אר הוא 50 מטר, זה בסביבות-7854 מ"ר !!! נדהם המנהל, " ואללה, אתה צודק, אבל למה מינוס?" עונים לו כל שאר המועמדים במקהלה: "הוא החליף גבולות אינטגרציה " |
|
||||
|
||||
ג'סטין גטלין, שהוכתר לפני כמה שבועות כשיאן העולמי החדש בריצת 100 מטר, נאלץ לוותר על התואר כמה ימים לאחר מכן. התברר ש-9.766 השניות בהן עבר את המרחק עוגלו בטעות על ידי מארגני התחרות ל-9.76, במקום ל-9.77, שהוא השיא הקודם (של מייק פאוול). הימור: עוד בחיי יתחילו למדוד זמנים בריצת 100 מטר ברזולוציה של אלפיות השנייה. |
|
||||
|
||||
הימור: עוד בחייך יתחילו לרוץ לכל מיני מרחקים כמו 300 מ', 50 מ' וכאלה, כדי שיהיו קצת שיאים חדשים לשבור. |
|
||||
|
||||
אופס - אספה פאוול, ולא מייק פאוול (שהוא אלוף העולם בקפיצה לרוחק). |
|
||||
|
||||
מייק פאוול הוא *שיאן* העולם בקפיצה לרוחק. אלוף העולם הנכחי בקפיצה לרוחק הוא דוויט פיליפס מארה"ב |
|
||||
|
||||
צודק כמובן, תודה. |
|
||||
|
||||
אז צדקתי בהימור? בגמר ה-100 מטר באולימפיאדה לפני כמה ימים, זוכה הזהב הקדים בחמש אלפיות השנייה את זוכה הכסף. בכתבה מצוינים הזמנים 9.784 ו-9.789, אבל על לוח התוצאות באיצטדיון, וגם במה שאני רואה בוויקיפדיה, מופיע לשניהם 9.79. |
|
||||
|
||||
בספרינט אופני מסלול מיכאל יעקבלב הישראלי הפסיד בשמינית הגמר על אלפית שניה. יש ספורט שנכנס באולימפיאדה הקודמת, ובזו הוא מדליה בפני עצמו, טיפוס ספרינט (15 מטר קיר אנכי עם זיזים). הזמנים של הטובים שם הם כרגע מתחת שש שניות1, וזה עוד ספורט חדש. אני חושב שזה לא מבשר לו טובות, הם צריכים לעשות משהו. להתחיל לבנות קירות גבוהים יותר זה קשה כלכלית, ורק ידחוק את הקץ. הרעיון הפשוט שעלה בדעתי הוא שהם יעלו וירדו כמה פעמים, אבל אולי יש כאן בעיות שאני לא מודע להן. בתחרויות הם לא יורדים בידיים וברגליים אלא באופן לא מעניין בעזרת חבל. אולי יש בעיה בירידה בידיים וברגלים; אם כן, אני מנחש שאת הירידה בחבל אפשר לעשות בצורה אחידה לכולם כך שהיא תנוטרל מהתחרות, אבל אולי זה קשה. 1 שווה לצפות לפחות בכמה מקצים, קשה להאמין שהגוף האנושי מסוגל לזה. |
|
||||
|
||||
בזכות התגובה שלך צפיתי עכשיו בזה. באמת מדהים. ואני שותף לחששות שלך בנוגע לצפיפות התוצאות על ציר המספרים. לפני שהמטפסים זינקו, הושמעו שלושה צפצופים שהיוו מעין ספירה לאחור. לא זכור לי אף ענף ספורט אחר עם ספירה לאחור כזו. אני הצעתי את הרעיון הזה פעם אצלנו באייל, אבל שכ"ג, אחרי תמיכה ראשונית, התחיל עם הברבורים שלו על "המצב הטבעי" ואבולוציה שמבולוציה. So sad. _________ (זה הכל מאהבה, שכ"ג יקר, כן?) |
|
||||
|
||||
________ כמובן |
|
||||
|
||||
למה צריך קיר גבוה יותר? פשוט שיעשו מה שעושים בהרבה מאד מקצועות אחרים.. שיעשו כמה סבבים ואז יעשו סכום (או מינימום?) של הזמנים. |
|
||||
|
||||
סבבים וסכימת זמנים מוציא הרבה מהכיף של התחרות, בהשוואה לתחרות שבה שניים מתחילים יחד, מתחרים זה מול זה בזמן אמת, ומי שמגיע ראשון (או מי שעושה יותר) מנצח. |
|
||||
|
||||
אגב, התחרויות השנייה בטיפוס לצד ספרינט - בולדר והובלה - פעם שנייה במשחקים האולימפייים - היא בעיני הספורט האולימפי הכי יפה שיש. יכולות גופניות לא אנושיות, בכל מיני פרמטרים, חשופות במלוא תפארתן למצלמה, פיתרון חידות ביומכניות בזמן אמת, כשכל מתחרה פותר אותן אחרת, ובהכרח כך בגלל גוף שונה, שילוב כוח הרוח עם כוח החוח, ודרמות על הקשקש (כאילו cliffhangers, הא). היום ב-11 גמר הנשים. |
|
||||
|
||||
מה לגבי רגרסיה מרובה? איך מבצעים במידה וידוע על 3 גורמים אופציונאליים שמשפיעים? איך מוצאים את קו הרגרסיה ואת המובהקות של האינטראקציה בין כל 3 הפרמטרים?ובין כל אחד לשני?ואיך יודעים מי אכן וכמה משפיע? תודה |
|
||||
|
||||
אלה שאלות טובות, אבל חוששני ש"האייל הקורא" הוא אינו המסגרת המתאימה לענות עליהן בפירוט. (או לפחות, לי אין עכשיו זמן לכתוב תשובה מספקת.) בקיצור נמרץ: יש תיאוריה עשירה ויפה (הנשענת על ה- projection theorem מאנליזה פונקציונלית) עבור רגרסיה מרובה, וגם במסגרתה אפשר לדון במובהקות וכו'. פרטים נוספים מופיעים על מסך המחשב אחרי שמגגלים multiple regression. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |