|
||||
|
||||
בקצת מאמץ אפשר למצוא ביקורות יותר רציניות מ "They do not believe except that which they calculate. They think that nothing can be which is not supported by their little numbers". אבל הלינק שלך מפנה ללינק אחר, http://www.rawbw.com/~deano/articles/aa121896.htm שם אפשר להשתעשע מעט עם הטלות מטבע מדומות. אני נכשלתי בכל הנסיונות לזהות הטיה. |
|
||||
|
||||
צודק! הקישור שלך הוא העדיף. |
|
||||
|
||||
בהתחשב בכך שיש בארץ בערך 6 מליון מאמני כדורסל לאומיים/של מכבי תל-אביב, הנקודה הספציפית הזאת היא בעלת חשיבות ממעלה ראשונה. |
|
||||
|
||||
אין זריקה לסל דומה להטלת מטבע מהסיבה הפשוטה שאין כאן התפלגות יוניפורמית. שאלה לי אליכם : בין שני שחקני שחמט זהים (שכפול מושלם), איזה שחקן שחמט ישחק טוב יותר : כזה הישן הרבה שעות לילה לפני המשחק, אכל היטב ונמצא ברמת ריכוז גבוהה. או שכפולו שחולה בשחפת ולא ישן כבר שתי לילות? ובכן, הדוגמה הציורית הזאת היא לווא דווקא מדוייקת כי אכן ישנו פקטור של מזל בזריקה לסל, אבל תסכימו איתי ששחקן כדורסל מאומן קולע הרבה יותר טוב מאלמוני פלוני. ולכן שחקן כדורסל, שנמצא בריכוז גבוה יותר בעל בטחון עצמי גבוה יותר יוכל לקלוע בערב נתון טוב יותר. אחת התופעות לכך שהוא קולע בערב נתון טוב יותר הינה אותה תופעת "היד החמה", כלומר כבר בזריקות הראשונות שלו ישנה יכולת טובה יותר בקליעה. |
|
||||
|
||||
שלילת תופעת היד החמה לא אומרת שבכל ערב השחקן יקלע בדיוק את ממוצע הנקודות שלו. היא רק אומרת שאחרי כמה סלים רצופים הנטיה של הקהל והמאמן היא לחשוב שהשחקן ב"zone" ושהסיכוי לקליעה נוספת גבוה. ניתוח סטטיסטי מראה שאותן קליעות רצופות אינן חריגות ממה שצפוי גם בהטלת מטבע, ולכן אין בהן שום אינדיקציה לגבי מה שיקרה בזריקה הבאה. כמובן שזה מנוגד לאינטואיציה שלנו. זאת הסיבה שזה מעניין. |
|
||||
|
||||
האם אמדן נראות מקסימלית (maximum likelihood) משחק פה תפקיד? למשל: אם הממוצע "האמיתי" של שחקן גבוה מאחוזי הקליעה הרשומים, ההסתברות ליד חמה בתחילת המשחק גדולה יותר. מצד שני, המחקר קבע שזה לא קורה. (לא שקראתי או בדקתי אותו, אבל אני בטוח שמישהו אחר עשה את זה) |
|
||||
|
||||
לא הבנתי. |
|
||||
|
||||
אלגוריתם MLE בוחר בהסבר שממקסם את ההסתברות לקבל את התצפית שקיבלנו. דוגמא: שוטה הולך למשרד הפנים בבאר-שבע, ומנסה להעריך את מספר האנשים בתור. הוא תופס את אחד השחורים בחדר ההמתנה ושואל את השאלה הקלאסית "איזה מספר אתה?". הנשאל הראשון אומר שבע. בהנחה שהמספרים החלו באחת, מה ההסתברות לקבל את התצפית שקיבלנו? x<7 => 0 כלומר האומדן שבע ממקסם את ההסתברות שהנשאל הראשון יענה שבע.x=7 => 1/7 x=8 => 1/8 x=9 => 1/9 ... אם הנשאל השני יענה חמש, האומדן ישאר שבע. אם הנשאל השלישי יענה עשר, האומדן יהיה עשר (כי ההסתברות ל-X=7 תרד לאפס) MLE הוא מוטה אך עקבי (ככל שיעלה מספר התצפיות, האמדן יהיה מדויק יותר). קיימת הוכחה (גאוס מרקוב, אאל"ט) שסטית התקן של MLE היא הקטנה ביותר בין כל האומדנים העקביים. ועכשיו לכדורסל: נניח שלכל שחקן יש ממוצע אמיתי מבוסס יכולת, וממוצע רשום שהוא אמדן המבוסס על ביצועים קודמים. קיימת האפשרות שהממוצע האמיתי גבוה מהאומדן (אם בגלל שיפור יכולת או סתם חוסר מזל בעבר). האפשרות הנ"ל יכולה להסביר רצף קליעות בהסתברות גבוהה יותר מאקראיות, ומחקר רשלני יראה הטיה ברורה (לא בדקתי את המחקר, ואני לא טוען שהוא רשלני או מדויק או משהו אחר) |
|
||||
|
||||
אולי זו סתם חוסר הבנה מצידי, אבל בדוגמה שלך הערכים יורדים כמו בטור ההרמוני, ומכאן שסכום ההסתברויות הוא אינסופי ובלתי ניתן לנרמול. זו לא בעיה? |
|
||||
|
||||
את/ה מחבר/ת בכיוון הלא נכון. צריך עבור x=7 לחבר את ההסתברות שהנשאל הראשון יגיד 1, 2, ... (7 פעמים 1/7 דרך אגב). מעבר לזאת, אני שותף לתמיהתך, מה התובנה שנותנת כאן ה-MLE מלבד העובדה הטריביאלית שככל שמספר הממתינים בתור גדול יותר הסיכוי שתיפול דוקא על מס' 7 הוא קטן יותר? |
|
||||
|
||||
אני הבנתי את ההסבר אחרת. אם הנשאל הראשון ענה 7, אז הסיכוי שיש n ממתינים בתור הוא n^-1 עבור n>7 ואפס אחרת. ככל שאנחנו ממשיכים לשאול הערכים מקבלים ערכים בהתאם כאשר תמיד הערך המקסימלי אותו שמענו הוא הערך הסביר ביותר של מספר הממתינים, ומשם ומעלה זה יורד הרמונית. |
|
||||
|
||||
זה לא נכון. n^-1 הוא ההסתברות שבקהל שגודלו n הראשון שתשאל יהיה 7. לגבי ההסתברות ל-n ממתינים תשובת ה-7 היא רק אילוץ (n אינו יכול להיות קטן מ-7) אבל לא מעבר לכך. לתנאים כאלו יש שם בפיזיקה non-Holonomic constraints אני חושב, שאחת המשמעויות היא שלא ניתן לסכם אותן (non-integrable). |
|
||||
|
||||
אין פה שום תובנה, זה בסך הכל אומדן. |
|
||||
|
||||
הבעיה אינה להסביר "רצף קליעות בהסתברות גבוהה יותר מאקראיות" אלא להיפך: להסביר למה נראה לנו שיש רצפים כאלה במקום שהם אינם. |
|
||||
|
||||
אוקי. מה בנוגע ל"כי בני אדם הם לא חיות הגיוניות"? |
|
||||
|
||||
זה הסבר קצת כללי מדי לטעמי. ישנם תחומים בהם אנחנו מקבלים את ''חוסר ההגיון'' האנושי (לכאורה) בגלל שאנחנו מבינים משהו על הסיבות שלו. ענייני רגש, למשל, או בעיות נפשיות כמו פוביות למיניהן, או עקרונות כלליים בעלי הגיון שמשתבש בהחלטות נקודתיות (אם המוסר ככלל הוא ''הגיוני'' לחיה חברתית ואינטליגנטית, אפשר להבין למה אני לא הורג את בעלת הבית הזקנה שלי למרות היתרון הכלכלי שבמעשה). הסיבות האלה עצמן הן בעלות הגיון כללי כלשהו, וניתן בהרבה מקרים להבין אותו כשחושבים על התהליכים שהובילו ליצירתו - מה שקרוי ''להמציא סיפור'' שמסביר אותן ומעצבן את י. אורן, וכך להרוג שתי ציפורים באבן אחת. לא כל-כך ברור למה בתחום של קבלת החלטות כלכליות במקרים די ניטרליים האדם אינו חיה הגיונית. מה שהיה עוזר לו לשרוד בימים בהם היה עליו להחליט אם ללכת לחפש אגוזים בקניון הצפוני או לשוב אל מטע הדובדבנים מאחרי גבעת הדוב המשוגע, אמור לעזור לו גם בהחלטה אם לקנות כרטיס לסרט במקום זה שאבד. |
|
||||
|
||||
זה לא כמו לומר שהאינסטינקט לאכילה לא מובן, מאחר שיש כל כך הרבה אנשים שמנים? המציאות, הסביבה האנושית השתנתה, למה מה שהתאים פעם יתאים גם עכשיו? |
|
||||
|
||||
זה בדיוק מה שאנחנו מנסים לברר. קל לנו להבין איך התפתחה משיכה למאכלים מתוקים ולשומן בסביבה שקלוריות היו מצרך נדרש, וקל לנו לראות איך הנטיה הטבעית הזאת גורמת קשיים בעולם המודרני. קצת יותר קשה לראות למה אינטואיציה הסתברותית לא הועילה לאבותנו, או למה התפתחו כל מיני ההטיות שכהנמן ואחרים זיהו. אותו כשל שגורם למאמן לשים את הכדור בידי השחקן הלא מתאים היה עלול לגרום לראש השבט לשלוח את הצייד הפחות מוכשר להלחם בדב המערות כי אתמול היתה לו "יד חמה", אמונות טפלות מזיקות לא רק לממלאי הלוטו בתאריכי ההולדת של ילדיהם אלא גם למי שהחליט לפשוט על השבט השכן אחרי שפגש שלושה קופים שחורים, וכך הלאה. קוסמיידס וטובי עושים, למשל, הרבה מאמצים להסביר את ההתעלמות האינטואיטיבית שלנו מ"שעור הבסיס" בדיוק באופן הזה: הם מסבירים למה זאת היתה איסטרטגיה סבירה בימים בהם "הבסיס" לא היה אמין. בצורה דומה הם מנסים להסביר למה הסתברויות שמנוסחות כסיכויים להתרחשותו של ארוע בודד לא מתאימות לתפיסת העולם הטבעית של ציידים-לקטים בסוואנה של אפריקה. הנה סיפור קטן: מישהו (דומני כהנמן עצמו) שרצה להדגים כשל הסתברותי סיפר על אדם שעמד לקנות מכונית מדגם מסויים, אבל שינה את דעתו אחרי ששכן שלו נתקע עם מכונית כזאת באמצע האוטוסטרדה, למרות שהסטטיסטיקה מראה שזאת מכונית אמינה מאד; ללא ספק, התנהגות לא רציונלית בעולם שלנו. מישהו אחר (לא זוכר מי, אולי פינקר) העיר על כך שבתרגום לעולם קצת יותר ארכאי וכאוטי, הסיפור יכול היה להשמע כך: הנהר הזה הוא בעל היסטוריה בטיחותית מצויינת, אבל אם אתמול תנין טרף שם את הילד של השכן שלי, אני לא ארשה לילד שלי להתרחץ שם היום. נשמע די רציונלי. |
|
||||
|
||||
אני חושב שאתה קצת מגזים. זה אורח חיים אחר לגמרי. כשאתה בסוונה, אין לך לא "היסטוריה בטיחותית לנהרות" ולא כלום. כל מה שיש לך זה שכן עם בן חי או מת. אם לצייד הפחות-מוכשר יש "יד חמה" עם החנית, אז מאוד מאוד סביר שהוא לא הצייד _הכי_ פחות מוכשר; אם הוא לא הכי טוב, כנראה שהוא מספר שתיים. כשאין לך יכולת לאסוף סטטיסטיקות מדוייקות באמצעות כלים מודרניים (שלא פותחו, להזכירך, עד העת החדשה), וכשמדובר בחיים או מוות, עדיף ללכת על בטוח. "עדויות אנקדוטליות" נשמע היום לא אמין, אבל אם הן מהיום בבוקר, יש מצב שהן הרבה אמינות יותר מכל עדות אחרת. |
|
||||
|
||||
ראשית, הבאתי דברים בשם אומרם כך שההגזמה, אם קיימת, היא לא שלי. שנית, אני לא לגמרי מבין. כשאתה חי בסוואנה אתה בטח מכיר את הנהרות שבסביבה מבחינת הבטיחות היחסית שלהם: בזה יש מערבולות מסוכנות בעונת ההפשרה, ההוא זוכה לביקורים תכופים מדי של דובי גריזלי1, השלישי משכנם של היפו'ס עצבניים2 והרביעי הוא בעל היסטוריית בטיחות טובה. הפרא אולי לא היה אציל, אבל ודאי שהוא לא היה טמבל גמור. שלישית, אם נתת לצייד הלא-הכי-מוכשר לעשות את מה שהצייד הכן-הכי-מוכשר עושה טוב יותר מתוך שיקולי "יד חמה", הרי שיקוליך מוטעים (ייתכן שנתת לו מסיבות אחרות, למשל כדי שירכוש נסיון או כדי שישאיר את אישתו לבד בבקתה, מוכנה לביקור נימוסין של הצ'יף - ואז אין לי כל טענות כלפיך. תיהנה). לא ברור לי גם למה החלטת שאם למאן דהו היתה "יד חמה" הרי הוא מהמוכשרים בחבורה. כפי שכדורגלנים מסויימים אוהבים להגיד, גם תרנגול עיור תופס תולעת מדי פעם (ביחוד אם התרנגול הזה משחק בקבוצה היריבה). ורביעית, עם שני משפטי הסיום שלך אני מסכים לחלוטין: על "וכשמדובר בחיים או מוות, עדיף ללכת על בטוח" דיברתי בגוף המאמר, ו ""עדויות אנקדוטליות" נשמע היום לא אמין, אבל אם הן מהיום בבוקר, יש מצב שהן הרבה אמינות יותר מכל עדות אחרת" הוא בדיוק מה שסיפור התנינים בא להמחיש. __________ 1- כן, כן, אני יודע. סתאאאם. 2- היפופוטמים הם חיה טריטוריאלית מסוכנת באמת. |
|
||||
|
||||
שני דברים לא ברורים לי עדיין בעניין "היד החמה" הזאת. א. האם אין שחקנים שהם יותר מוצלחים ושחקנים שפחות? האם אין מצבים ששחקן מסוים הוא בכושר טוב יותר ביום מסוים מאשר ביום אחר? ב. האם נבדקה השאלה איזה מאמן מצליח יותר - זה המאמין ב"יד חמה" או זה שנוטה להחליף שחקן כשהוא בשיא "הטרנס"? |
|
||||
|
||||
א. 1. כמובן שיש. 2. כמובן שיש. הטענה היא רק שההחלטה ששחקן שנמצא ב"כושר טוב יותר ביום מסוים" מתקבלת על-סמך אינפורמציה לא מספקת, מדגם קטן מדי, חוסר מובהקות, מה שכהנמן וטברסקי כינו בצחוק "חוק המספרים הקטנים" (אבל רק מי שמכיר את "חוק המספרים הגדולים" מבין את ההלצה). ב. מסופקני אם אפשר לבודד משתנים (ואפילו להגדיר את המשתנים שמשפיעים על כך שמאמן הוא מוצלח) במידה מספקת כדי לענות על השאלה הזאת. אולי סטטיסטיקנים או מומחים לשיטות-מחקר ירצו להרחיב כאן. |
|
||||
|
||||
א. http://he.wikipedia.org/wiki/%D7%97%D7%95%D7%A7_%D7%... ב. אם לא ניתן לבודד את המשתנים במידה מספקת כדי לענות על השאלה, לא נראה לי שהטיעון שלהם תקף במיוחד. |
|
||||
|
||||
א. מעניין, אני כמעט בטוח שכהנמן מזכיר את החוק הזה כמטבע לשון שהוא וטברסקי טבעו, הרבה לפי 1990. אבדוק בספר. ב. תלוי על איזו שאלה מנסים לענות. תופעת "היד החמה" היא טענה ספציפית שקל יחסית לבדוק אותה מבחינה סטטיסטית. מי הוא "מאמן מצליח"? מי שמאמן את הפועל עפולה ב' ובכל זאת משאיר אותה בליגה ד' כנגד כל הסיכויים (ניצח משחק אחד בכל העונה, אבל זה הספיק. בקבוצה שלו משחקים רק שחקנים שעברו את גיל שבעים כך שגם נצחון בודד הוא לא משהו קל), או מי שמאמן את מכבי תל-אביב ומנצח את הפועל ירושלים בשתי נקודות? גם אם הצלחנו איכשהו להגדיר הצלחה של מאמן, אנחנו בסימן שאלה גדול לגבי הגורמים לה. |
|
||||
|
||||
|
||||
|
||||
תודה. |
|
||||
|
||||
כהנמן לא פה. אני סומך עליך שתייצג אותו בכבוד. אני חושד שהסביבה הסוואנית (ואולי גם זו שלנו) היתה קצת יותר כאוטית ממה שאתה מתאר1. "תנין בנהר" זה לא ארוע שקורה כשהיום הקוביות מראות 1:1, זה ארוע שקורה כשאשכרה יש תנין בנהר. יכול להיות שהוא כבר יצא משם, אבל סביר גם שלא. ואין לך מספיק חברים למערה כך שיש להם ביחד מספיק ילדים למדגם מייצג בנושא הזה. זה שהנהר היה בטוח עד עכשיו, לא אומר שהוא עדיין בטוח. יכול להיות שהסביבה השתנתה. אין לך עדויות, אין לך מדגם, כל מה שיש לך זה פרוות דוב קרועה מוכתמת בדם. גם תרנגול עיוור תופס תולעת מדי פעם, אבל לא חמש תולעים ברציפות. אם לספורטאי או לצייד יש יד חמה, תהיה בטוח שהוא בטופ של הטופ2. נכון, יש סטייה סטטיסטית, אבל היא זניחה. במחשקי ספורט מודרניים יש הרבה מאוד סטטיסטיקות להרבה מאוד שחקנים, ולכן יש כלים לחשב ויש חשיבות לסטייה הקטנה הזו. 1 דוגמה: משתמשים באלגוריתם LRU לזכרון מטמון (http://en.wikipedia.org/wiki/Least_recently_used). זה בדיוק יד חמה, לא פרימיטיבי? ומדובר בתחום מודרני, עתיר-ידע, עתיר-מחשבה וסטטיסטיקה! כי זה פשוט, זה עובד, פרקטי, ועדיף על תאוריות לגבי איך עובד העולם שיכול להיות שאין להן שום קשר עם המציאות. ככה זה כשאתה חי בעולם האמיתי ולא בעולם המומצא של הספורט. 2 ג'יי גולד כתב על זה משהו באחד הספרים שלו, לא זוכר איזה. |
|
||||
|
||||
לגבי הפיסקה הראשונה: אנחנו מסכימים בעניין הזה. אני חוזר: מסכימים. לא שזה צריך למנוע אותנו מויכוח סוער, אבל כדאי לזכור את זה ברקע. הלאה: התרנגול העיור, אומר כהנמן, יתפוס גם חמש תולעים ברצף מדי פעם. ההתעקשות שלך כאן לא תועיל כיון שהעניין נבדק סטטיסטית, והשחקן העיור שלנו מתנהג כמו מטבע. ולהערות שלך: 1 LRU יכול להיות איסטרטגיה יעילה בהעדר יכולת לחשב טוב יותר את הסיכוי שבלוק מסויים יידרש שוב (ובלי שהחישוב הזה עצמו יהרוג את הביצועים שלך), אם כי דומני שאלגוריתמים שלוקחים בחשבון גם את הגיל של הבלוק (הזמן מאז הגישה האחרונה) נפוצים יותר. טברסקי וחבריו הראו שהתנאים האלה לא נכונים למשחקי כדורסל (נדמה לי שמישהו הראה את זה גם לבייסבול, ומישהו כאן טען שההיפך נכון לטניס. אין לי מושג), דהיינו שם *יש* דרך טובה יותר להחליט, והיא להסתמך על ממוצע הביצועים של השחקן במדגם קצת יותר גדול משלוש הקליעות האחרונות שלו. 2 אם אתה מתכוון להנמקה שלו שממוצע החבטות 0.400 לא יחזור בשנים הקרובות (ואל תשאל אותי מה זה) אני מתקשה לראות את הקשר. "יד חמה" מתייחס לתקופות קצרות - קצרות מדי - וזה הכל. אף אחד לא טוען שמייקל ג'ורדן ואני מחזיקים באותו סיכוי לקלוע את הסל המכריע (אני מנצח אותו בשתי ידיים1 קשורות מאחרי הגב. ____________ 1- שלו. |
|
||||
|
||||
1 - אופס. מחק את מה שאמרתי על הגיל של הבלוק, זה בדיוק LRU. |
|
||||
|
||||
הסיכוי שתרנגול שתפס תולעת הוא עיוור גדול בהרבה מאוד מהסיכוי שתרנגול שתפס חמש תולעים ברצף הוא עיוור. נזכרתי בדוגמא של גולד - הסטריק של Joe DiMaggio, אידך זיל חפש בוויקפדיה וכו'. בכל מקרה, הנקודה שלי היא שללהק לתפקיד ראשי תרנגול שתפס אפילו תולעת אחת זה כבר אלגוריתם לא רע בכלל; אני מציע שעולם הספורט (והימורים) הוא יוצא-דופן בכמות, באיכות ובחד-משמעותיות של הסטטיסטיקה שהוא מספק, ושיכול להיות שאפקט "היד החמה" רלבנטי כמעט רק לו. זה עונה על השאלה "למה אשליות סטטיסטיות התפתחו": האשליות הסטטיסטיות הן תוצאה של שימוש בהאוריסטיקות המיועדות למידע חסר הרבה יותר מזה שזמין לנו בתחומים (מלאכותיים?) בחברה מערבית מודרנית. |
|
||||
|
||||
זה מתחבר לתופעה ידועה בפסיכולוגיה (של אנשים ושל חיות) שנקראת The Matching Law: "The matching law ... views choice not as a single event or an internal process of the organism but as a rate of observable events over time. It states that instead of maximizing utility, the organism allocates its behavior over various activities in exact proportion to the value derived from each activity. It differs subtly but significantly from rational choice theory in its predictions of how people exert self-control, for example, how they decide whether to forgo immediate pleasures for larger but delayed rewards. It provides, through the primrose path hypothesis, a powerful explanation of alcohol and narcotic addiction. It can also be used to explain biological phenomena, such as genetic selection and foraging behavior, as well as economic decision making." (מתוך: http://www.hup.harvard.edu/catalog/HERMAT.html)התנהגות של matching נצפית, למשל, כשחיה יכולה לבחור בין שני מקורות של מיץ זהה, כשבאחד השתיה מתקבלת בהסתברות של 70% אחרי הלחיצה על דוושה, ובשני בהסתברות של 30%. בניסויים כאלו רואים הבדלים בין התנהגות של חולדות לעומת קופים. אאז"נ, חולדות לומדות לפנות תמיד למקור הראשון, בעוד קופים ממשיכים לנסות את שני המקורות, אם כי לא בהסתברויות שוות. מצב של matching מדויק ("לפי הספר") קורה כששיעור הפניה למקור הראשון הוא 70%. למרות שהעדות הנסיונית לחוק הזה שנויה מאד במחלוקת, התיאוריה מסבירה את התוצאות במונחים של בחירה חוזרת מאותו מאגר של אפשרויות (בדומה למשחקים החוזרים שפרופ' אומן מתמחה בהם). במצב כזה יש שיקולים נוספים פרט לבחירה האופטימלית לרגע מסוים אחד, כי זה תלוי במודל העולם שלך - למשל בהשפעת הפעולות שלך על מקור המיץ, בדינמיקת ההתמלאות של מאגר השתיה, וכו'. במחקרים סוציולוגיים רואים לעתים קרובות שאנשים מתייחסים לחיים במונחים של "בחירות חוזרות", גם כשהסיטואציה היא לחלוטין חד פעמית. כשיהיה לי זמן אני אגגל על זה קצת כדי להביא לינק ("evolutionary game theory" או "repeated games" הם התחלה טובה). |
|
||||
|
||||
מעניין מאד, תודה. כהנמן מצביע בספרו על ההיפך הגמור: התייחסות לכל הימור קטן בחיים כאילו הוא מאורע יחיד, במקום להסתכל על התמונה הכללית של הימורים חוזרים. |
|
||||
|
||||
זה משונה לי מה שאתה אומר כי כשלמדנו על כהנמן, בהחלט דובר על אפקט ההיתכנות כלומר שאנשים יהיו מכונים להמר הימורים עבור קיום סיכוי כלשהו, לדוגמה מכונים להמר בטוטו עבור סיכוי מזערי למרות שעבור שיפור מזערי בסיכוי שכבר קיים לא היו מוכנים להשקיע אותו סכום |
|
||||
|
||||
זה מעניין. בניתוח מתמטי קר, לפנות לשני המקורות זאת התנהגות די טיפשית, כי הדבר הטוב ביותר לעשות הוא ללכת תמיד למקור שמוציא מיץ 70% מהפעמים. אבל בטבע, כשמדובר במאגרים שמתמלאים ומתרוקנים (למשל מעיין, או עשב) אז באמת הגיוני שאם הכמות במקור השני היא 30% ובראשון 70%, אז 30% מהאוכלוסיה צריכה ללכת למקור השני, ו-70%לראשון. |
|
||||
|
||||
אם אתה הולך תמיד למקור השופע יותר, לא תוכל להגיב על שינויים בשפע היחסי של המקורות. |
|
||||
|
||||
אבל מה הבעיה ללכת למקור השופע יותר, ואם הוא מדולדל - לפנות למקור השני? |
|
||||
|
||||
גם אם הוא עדיין שופע, אולי השני כבר נותן 100%? |
|
||||
|
||||
הזכרתם לי שרציתי גם לשאול שאלה דומה בקשר לזרזירים- מאיפה הם ידעו שיש מקור אוכל עם הסתברות של 50%? האם (למשל) בדקו שהם יודעים להבחין בי 50% ל 30%? ( דיסקליימר- לא קראתי את המקור שצירפת, אני מבקש מחילה מראש אם התשובה שם). |
|
||||
|
||||
מתוך המאמר: "The birds were presented with a choice between a constant foraging option that always provided three seeds and a variable option that provided either no seeds or six seeds with equal probability." הציפורים ניסו את המקורות כמה פעמים, וגיבשו להן את האיסטרטגיה בתהליך שנקרא "למידה".אני לא יודע על ניסויים לגבי הרזולוציה החשבונית של הציפורים. |
|
||||
|
||||
זו בעיה. אבל יכול להיות שעדיף בהרבה ללכת למקור של 70% מאשר לזה של 100%: בשני אתה עלול לשתות יותר מדי. |
|
||||
|
||||
אכן כך הגיוני, והשאלה שצריכה להשאל היא איך יפעל המנגנון המווסת את האוכלוסיה לשני המקורות, בהיעדרה של "המועצה להסדרת השתיה מטעם איגוד צרכני הצוף, התשכ"ג". זאת דוגמא מצוינת לשיווי משקל אופטימלי ויציב שיכול להיות מושג בלי שצריך גוף מתכנן או מפקח. בוא נניח שכל ציפור מטילה קוביה דמיונית1 שנותנת הסתברות של 70% לפנות למקור העשיר יותר. כל ציפור בלהקה תזכה לאותה כמות של צוף בקירוב (נקרא לה יחידה אחת), וכל ציפור שתסטה מהנוהל תעניש לא רק את חברותיה לאותו אתר, אלא גם את עצמה: היא תקבל רק 30/31 יחידה אם ההטיה שלה היא למקור הדל, ו 70/71 אם היא נמשכת לעשיר יותר, מכל מקום פחות מיחידה. מכאן שהאיסטרטגיה שתיארתי יציבה. איך אפשר להגיע לשיווי המשקל הזה מלכתחילה בלי להעביר לשם כך חוק בכנסת? בקלות. אם האוכלוסיה מתחילה ממצב בו כל הציפורים מעדיפות את המקור העשיר, מוטנט שמעדיף את המקור הדליל (נניח שיש לו חרדה חברתית והוא אוהב לשתות לבד) יזכה ל- 30 יחידות צוף במקום ה 70/100 של חבריו ללהקה, ולכן הוא יהיה חון מחבריו, יעמיד יותר צאצאים, והמוטציה תתפשט עד ששכיחותה באוכלוסיה תביא לחלוקה אופטימלית של המשאב. האם אוכלוסיות בע"ח בטבע מתנהגות כך? אני לא יודע, אבל מוכן להתערב שבהרבה מקרים התשובה חיובית. אני גם מוכן לנחש שאם יש סטיות, הן יותר לכיוון של העדפת המקור העשיר, שכן מחיר השגיאה (1/71 בדוגמא שלנו) קטן יותר מהשגיאה בכיוון השני (1/31). (פישטתי קצת את הניתוח הזה כדי לא להכנס לכל מיני פרטים שנראים לי לא חשובים. יש לי הרגשה שראובן יחלוב ממני את כל הפרטים שחסכתי ממך) _____________ 1- חידה: אם יש לך רק מטבע - או נוירון - בעל שני מצבים שווי הסתברות, תכנן ניסוי שייתן תוצאה אחת בסבירות 70% ואת השניה בסבירות 30%. בין הפותרים יוגרלו מאזני נאש. ההשתתפות אסורה על מתמטיקאים ומתכנתים. |
|
||||
|
||||
טוב, מכיוון ששמי הוזכר: 1) ההנחה שמקורות שומרים על התפוקה היחסית שלהם במהלך הדורות נראית לי מופרכת לגמרי. 2) החוק המקורי כפי שהביא אותו LG היה שכל אורגניזם בנפרד מבלה *חלק* מהזמן בכל אחד משני המקורות, לא שזה משנה הרבה ( אפשר לתאר שלכל אחד מאיתנו יש בראש שני יצרים, אחד מעדיף מקור א והשני מעדיף את מקור ב). 3) יש לזכור, שבמצב שיווי משקל, כל ציפור תקבל בדיוק את אותה כמות, ולכן מבחינת הציפורים אין משמעות אמיתית ל "מקור עשיר" או "מקור דל". למעשה ההעדפות יעשו על סמך קריטריון שהוא לכאורה משני ( נניח- צבע הפרח או צורתו). ובעניין החידה שלך, יש כל מיני דרכים. שיטה אחת שלחתי לך בדוא"ל. |
|
||||
|
||||
1. נכון בהחלט. אבל אם יש לך כבר מנגנון הטלת קוביות כזה את הכיוונון שלו קל לשנות (זה באמת אחד הפרטים שהשמטתי). 2. שוב, נכון, ושוב השמטתי בכוונה. חשוב רק שההעדפה לא תהיה מוחלטת אלא שלפחות חלק מהיצורים יהיו מוכנים לבדוק מדי פעם את המקור האחר. 3. גם בזה אתה צודק, חוץ מההסתייגות שהעליתי בעניין מחיר השגיאה האפשרית. קיבלתי, ואפילו עניתי על הדואל. זכית במאזן אחד. |
|
||||
|
||||
זה מזכיר לי מחקר חלוצי שנעשה על שוק הדגים של מרסיי. עוזר מחקר מסכן השכים מדי בוקר והגיע עם שחר לשוק הדגים הסיטונאי של מרסיי, שבו בעלי מסעדות וקצבים קונים מהדייגים את שללם. בשוק הזה כל הסחורה חייבת להמכר מהר, לפני שתתקלקל, ולא היה מקובל לעשות shopping around (אין לי מושג למה). בכל מקרה, הקונה היה צריך לבחור לו מוכר, לגשת אליו, ולסכם איתו על הכמות והמחיר. מי שרצה לבדוק את המחירים אצל המתחרים, היה יכול לעשות זאת למחרת עם שחר, אבל לא באותו יום. עוזר המחקר המסכן רשם את פרטי כל העסקאות שבוצעו בשוק במהלך שנתיים, והעביר את הנתונים לחוקרים שניתחו את התנהגות הקונים והמוכרים. מהמחקר הזה יצא מאמר מאד ידוע, ויש בו ממצא אחד שהתקשר לי לדיון: נמצא שיש שני סוגים עיקריים של לקוחות: כאלו שיש להם תמיד את אותו מוכר קבוע שאליו הם באים, וכאלו שפוקדים באופן סדיר לפחות ארבעה מוכרים (ומעלה). היו מעט מאד קונים שבדקו רק שניים או שלושה מוכרים לאורך התקופה. החוקרים בנו מודל של התנהגות הצרכנים שנתן תוצאות דומות, אבל בלי קשר למידת הדיוק של המודל זה מצביע, אולי, על דפוסי התנהגות של אנשים בסיטואציות של בחירה (חוזרת) בין מספר מקורות אפשריים: נאמנות חזקה אצל חלק, גיוון מקורות (מכוון?) אצל אחרים. וייתכן שהכל תלוי בדינמיקה של מקור המזון, או אולי זה בכלל ספציפי לאופי הצרפתי... |
|
||||
|
||||
מעניין מאד. אם אני מבין נכון, ההתנהגות שאתה מתאר היא שהקונים "שפוקדים באופן סדיר לפחות ארבעה מוכרים (ומעלה)" עושים זאת בימים שונים, אחרת ההערה שלך על כך שלא נהוג לעשות shopping around לא מובנת. אני מניח שמספיקה כמות מסוימת של קונים מהסוג הזה כדי לשמור על שוק משוכלל יחסית, בדיוק כפי שכמה ציפורים עם קבעון על מקור אחד לא תהרוסנה את שיווי המשקל כל עוד יש מספיק אחרות שמשנות את ההעדפות שלהן לפי הצורך. אתה יכול לספר משהו על נסיונות להסביר את התופעה? אולי הקונים מתחלקים באופן גס לשתי קבוצות: באחת אלה שמרוצים מהסוחר איתו הם עובדים לאורך זמן (איתו כבר נוצרו יחסי אמון על סמך הרבה עסקאות קודמות, והוא מצידו נותן להם יחס של לקוח מועדף ולא דוחף להם סחורה מפוקפקת), ובשניה אלה שאינם מרוצים ולכן הם בתהליך של חיפוש הסוחר האופטימלי עבורם. בשלב החיפוש סביר לא להסתפק רק בשני סוחרים, ומצד שני אינך יכול לבדוק את הסוחרים כולם, אחרת הנתונים שתאסוף על כל סוחר יהיו מועטים מכדי לתת תמונה מהימנה של איכותו האמיתית. |
|
||||
|
||||
כנראה שעל בסיס הנתונים האלו פורסמו מספר מחקרים. אפשר לגגל לפי marseille fish market Kirman (לפי שמו של אחד מעורכי המחקר). שני לינקים מהירים: http://www.res.org.uk/society/mediabriefings/pdfs/20... אפשר גם להיעזר בעמוד הבית של Alan Kirman:http://www.qmw.ac.uk/~ugte173/abs/abs.spring1.html עדיין לא הספקתי לקרוא מהן התכונות הספציפיות של המודל שהחוקרים בנו (אחד היה כלכלן, השני פיזיקאי). |
|
||||
|
||||
מהלינק הראשון שלך: "Buyers in almost any market fall into one of two groups - those who are extremely loyal to their supplier and those who systematically 'search' for good bargains." וגם:"In particular, the most frequent buyers (those who visit the market more than once a week), with very few exceptions, visit only one seller, while less frequent buyers visit several sellers." בניגוד למה שאמרת, נדמה לי שהציטוט השני מראה שכן מדובר על בדיקה של כמה סוחרים באותו ביקור בשוק, אבל לא נראה לי שזה משנה הרבה.(לא מצאתי יותר מדי אינפורמציה בלינקים, שכן הם מכילים את התקציר בלבד. מזל. למי יש כוח למאמרים ארוכים בכלכלה?) |
|
||||
|
||||
מה- link השני: In a coevolutionary process, buyers learn to become loyal as sellers learn to offer higher utility to loyal buyers, while these sellers, in turn, learn to offer higher utility to loyal buyers as they happen to realize higher gross revenues from loyal buyers. התראה: הקטע הבא איננו מיועד לילדים שאינם אוהבים פיזיקה.מה שאני זוכר מהמחקר המקורי (לא זה שמצוטט למעלה) היה מודל שקיבל השראה מפיזיקה סטטיסטית. הרעיון היה, אאז"נ, שכל לקוח מנהל מין "תרשומת פנימית" של מה שנתן לו בעבר כל סוחר, ובנוסף יש לו מין "רמת נאמנות" פנימית שאנלוגית לטמפרטורה במודלים תרמודינמיים. כשהטמפ' גבוהה, הקונה ממשיך לבדוק את כל המוכרים בהסתברות לא זניחה, גם אם יש הבדלים גדולים במחיר הממוצע שקיבל בעבר מכל אחד מהם. אל"פ, אבל זה אולי אנלוגי לנטיה של מערכת בטמפ' גבוהה לדגום חלק גדול ממרחב המצבים האפשריים שלה, כאילו הטמפ' מייצגת "חוסר שקט". ככל שהטמפ' יורדת, הקונה מתייצב על המוכר שיש לו את ה- record הטוב היותר עד כה וכמעט לא מבקר אצל האחרים, ואם הטמפ' יורדת ל- 0, הוא דוגם מכאן והלאה רק את המוכר הזה. אם מריצים את הסימולציה לזמן ממושך, תחת איזושהי הנחה (שאני לא זוכר) על הדרך שבה כל קונה משנה את הטמפ' שלו לפי המחירים שראה עד היום, אזי כל קונה מתכנס לאחד משני מצבים: טמפ' אפס או טמפ' גבוהה, ואין כמעט מצבי ביניים. |
|
||||
|
||||
אולי אפשר להכליל התנהגות כזו לתחומים אחרים? למשל - יש אנשים שמעדיפים להשקיע בבן זוג יחיד לאורך זמן, לעומת אחרים שמעדיפים להישאר ב-"תהליך של חיפוש הסוחר האופטימלי עבורם". |
|
||||
|
||||
עוד הערה קטנה, אם כבר מדברים על מצבי שיווי משקל וכולי. יכול להיות מעניין להשוות בין הציווי הקטגורי של קאנט לבין ''הציווי הקטגורי'' של נאש. |
|
||||
|
||||
ג'ון רולס. |
|
||||
|
||||
אתה רומז שמסך הבערות זאת סינתזה בין שתי הגישות? |
|
||||
|
||||
א-הא. נדמה לי שהניסוח של רולס הוא משהו כמו יישום של רעיונות מתורת המשחקים כדי ליצור את ממלכת התכליות הקאנטיאנית. |
|
||||
|
||||
TFT הוא המקום בו הם נפגשים, לא? (אלא ששם מדובר על משחקים חוזרים, ואני לא יודע אם זה נכלל בתיאוריה של נאש). |
|
||||
|
||||
אני חושב שמדובר על עניין מורכב יותר. בשני המקרים ההתייחסות לאדם היא כאל פועל רציונאלי, יש ''הפשטה'' של האדם ממאפיינים מקריים שלו, ''המשחק'' נערך בתחום התבונה לבדה (קאנטיאני) ולא בפועל - האדם צריך לחשוב על עצמו ''כאילו'' הוא היה כל אחד מהשחקנים האחרים. אפשר לחשוב על כל מני קווים משותפים. אני לא מתמצא בנושא, אבל אני יודע שהוא מפרנס מספיק עבודות מאסטר ודוקטור. |
|
||||
|
||||
נא הסבר TFT. הלחרדים היינו, לחיילים דמינו שהכל ר"ת ר"ל? |
|
||||
|
||||
tit for tat. חפש "דילמת האסיר" כאן באתר או אצל הדוד ג., ואני בטוח שהמיסתורין יתבהר בב"א אי"ה. |
|
||||
|
||||
אוף, בפעם הבאה תחכה עוד ארבע דקות. |
|
||||
|
||||
זה מה שכולן אומרות לי. |
|
||||
|
||||
ת"ר.:) |
|
||||
|
||||
|
||||
|
||||
תודה.:) את הדילמה היכרתי, אבל מר"ת יל"פ. |
|
||||
|
||||
מה זה מר"ת יל"פ? |
|
||||
|
||||
מראשי תיבות יש לי פטור. |
|
||||
|
||||
ואם אתמול עבר לידי חתול שחור, ובערב נפלתי על שיח דוקרני במיוחד, אז אף אחד בשבט לא ירצה יותר להיתקל בחתול שחור. |
|
||||
|
||||
בתחילת שנת 2000 הסטטיסטיקות הראו שצמיגי Firestone אמינים למדי. האם ההחלטה של אנשים בארה"ב לבחור בחלופות, לאחר שראו בטלוויזיה דיווח על הארוע השני, נראית לך כבלתי רציונאלית? |
|
||||
|
||||
איזה אירוע שני? (ואגב, מה עם אנשים שנמנעים מלקנות תוצרת רמדיה לתינוקותיהם)? |
|
||||
|
||||
בדיוק חשבתי על רמדיה. מיד אחרי שהתפוצצה הפרשה, אני חושב שרמדיה היה המזון הבטוח ביותר לקנות לתינוק שלך. כמובן ייתכן שאתה מכניס לחישוב גם אלמנטים אחרים כמו רצון ללמד את היצרנים השונים לקח, ואז חרם על רמדיה יכול להיות רציונלי - ביחוד אם אתה מאמין שכל האנשים רציונליים כמוך. |
|
||||
|
||||
''מיד אחרי שהתפוצצה הפרשה, אני חושב שרמדיה היה המזון הבטוח ביותר לקנות לתינוק שלך''. זה כשל לא פחות מזה של אדם שבאמצע האינתיפאדה, מיד אחרי פיגוע התאבדות בשוק, יגיד ''היום הוא היום הכי בטוח ללכת לשוק'' - ואז מגיע הפיגוע השני... |
|
||||
|
||||
זה לא כשל. הטענה היא לא סטטיסטית (''רמדיה היא מזון בטוח בגלל שאין סיכוי שדבר כזה יקרה פעמיים''), אלא מושכלת (''רמדיה היא מזון בטוח בגלל שהבעלים שלה עכשיו בודקים כל מוצר על עצמם לפני שהם מוציאים אותו החוצה''). |
|
||||
|
||||
בדיוק לזה כיוונתי. |
|
||||
|
||||
לא הבנתי. |
|
||||
|
||||
הבעלים טועמים. אם הם לא מתים, סימן שהמוצר מכיל את כל הויטמינים. |
|
||||
|
||||
אני בטוח ש*אחרי* האסון ההוא, בדיקות האיכות ברמדיה היו מעל ומעבר למה שמקובל בתעשיה. הנכווה ברותחין וכל זה. |
|
||||
|
||||
זהו, שאני לא לגמרי משוכנעת. זה נשמע מסבר את האוזן, כמובן, אבל כפי שאמר כאן ראובן - זה נראה גם לי ככשל מערכתי, כך שאין לדעת. בקיצור, גם כאן אין די נתונים. (אגב - לא בדיוק קשור - אבל זה מזכיר לי שאחרי רצח רבין אמר לי אחד משכניי שלפחות אפשר להיות בטוחים שבבחירות הבאות תעלה העבודה. הוא פסל את דבריי בבוז מוחלט כשטענתי שזה מאוד לא בטוח). |
|
||||
|
||||
(אגב - לא בדיוק קשור - אבל זה מזכיר לי שאחרי ההתנתקות אמר לי אחד שלפחות אפשר להיות בטוחים שבבחירות הבאות תעלה קדימה. הוא פסל את דבריי בבוז מוחלט כשטענתי שזה מאוד לא בטוח). |
|
||||
|
||||
אני מניחה שהוא אמר לך את זה די זמן אחרי ההתנתקות... |
|
||||
|
||||
אגב, ''הנכווה ברותחין'' זה גם כשל יד חמה (או ליתר דיוק, לשון חמה). |
|
||||
|
||||
היפה הוא - בטח אתה מודע לזה, אבל כדאי להדגיש - שהשיקול הזה עובד רק בזכות הכשל הסטטיסטי של רוב הציבור. |
|
||||
|
||||
אני מחכה שתסביר על איזה ארוע אתה מדבר. אם מדובר על איזו תאונה רבת נפגעים שצולמה היטב, הרי ההשפעה שלה על החלטתך באמת אינה רציונלית. (נכון, ייתכן שמדובר על תקלה בסדרת ייצור שלמה או על התדרדרות באיכות המוצרים באופן כללי, אבל להסיק מסקנות כאלה מתאונה אחת? ביררת כמה תאונות דומות אך מתוקשרות פחות היו לצמיגים של המתחרים?) |
|
||||
|
||||
יש כאן נימוק אחר, יותר פסיכולוגי. נניח שאתה צריך לקנות צמיג, או תחליף חלב אם מספר ימים לאחר האירוע הטרגי המדובר. בוא נניח שאתה גם יודע שכלתנית שמדובר באירוע נדיר ומקרי ( דווקא המקרה של רמדיה נראה בעיני כדוגמא לכשל מערכתי, אבל נניח לזאת). כלומר, אתה במצב הבא: כל המוצרים בשוק קיימים עם אותה דרגת סיכון. אבל, אם תבחר לקנות רמדיה, והאירוע הנדיר *דווקא* יקרה לך, לא רק שאתה תאכל את עצמך, אלא כל הסובבים אותך יתיחסו אליך כאוויל. אז נכון, לא נעים להודות שכאשר אנו חושבים על חיי ילדינו, אנו מוטרדים גם ממחשבות כסת"חיות כאלה, אבל אני חושב שזה מניע קיים ונפוץ. |
|
||||
|
||||
אפשר לדון בשאלה איך להכליל שיקולים כאלה בקבלת ההחלטות, אבל השאלה הבסיסית נשארת: איך זה קורה ש"כל הסובבים אותך" עושים אותה טעות? במלים אחרות, השיקול שלוקח בחשבון את העובדה שאנחנו חיים בחברה לא רציונלית הוא שיקול רציונלי, אבל השאלה למה החברה היא כזאת נשארת פתוחה. |
|
||||
|
||||
מספר הארועים שדובר בהם בזמנו הגיע למאות. לפי wikipedia, מתוך התביעות הרבות שהוגשו כנגד Firestone ו-Ford, רק בודדות זכו במשפט, ובמספר גדול יותר העניין נסגר באמצעות הסכמי פשרה ופיצויים. Firestone אספה מהשוק ומהציבור מיליוני צמיגים מהסדרות החשודות, ואחד ממפעליה הגדולים (באילינוי) נסגר. שתי החברות המשיכו להתווכח ולהאשים זו את זו במשך חודשים ארוכים אחרי שהבלגן שכך. מטבע הדברים, מסקנות הפוסט-מורטם אינן מצויות בידי מי שנדרש לקבל החלטות בזמן אמת. הידע שהיה לציבור הגיע מכמה תאונות מחרידות במיוחד שסוקרו בהדגשה בטלוויזיה, ומסטטיסטיקות מצטברות (ולאו דוקא אמינות) שדווח עליהן בעיתונים. מאיזה מספר של מקרים אמור אדם להתחיל לחשוד שאולי אין מדובר באקראיות גרידא? תלוי בדוגמא הספציפית. במקרה המדובר, כנראה שאין די בתאונות אחדות אם המדגם הוא כל ארה"ב. שני ארועים מאותו הסוג באותו שבוע בכפר ורבורג, זה כבר קצת יותר מוזר. להגנתה, אגב, הצביעה Ford על כך ששום צמיג של Goodyear לא היה מעורב בהתהפכויות הדגמים "הנאשמים". אם לסכם את מה שאני מנסה לומר: בעיני הטיעון של פינקר אינו סתם סרח אבולוציוני. גם לחברות שקנו את שמן הטוב לאורך עשרות שנים, עלולה לצאת סדרה בעייתית (או שמישהו מוכר זיופים באיכות ירודה אבל עם דמיון חזותי מדהים למקור, או ש...). אם אתה שוקל לרכוש מוצר מסוים בחנות מסוימת, ויש לך שני שכנים שכבר קנו אותו שם ומתלוננים על בעיות, החשד שאולי קיימת כאן איזו בעייה לוקאלית שעלולה להשפיע גם עליך, עובר את מבחן הרציונאליות הפשטנית שלי. ------------ גם אני חשבתי על הדוגמא של רמדיה, אבל המקרה של Firestone נראה לי כיותר קרוב לטענה שהזכרת. |
|
||||
|
||||
מסכים. אבל אני (טוב, כהנמן) דיבר[תי] על משהו הרבה יותר פשוט: אם הסוסיתא של השכן שלך התקלקלה בעליה של סדום, ובגלל זה אתה לא קונה סוסיתא למרות הדו"ח המצויין שלה ב"קונסיומר רפורט", אתה מסתמך על מדגם קטן מדי. זה מתקשר למה שכהנמן קורא "זמינות" או "יציגות" של האינפורמציה (אני לא זוכר בדיוק מה הוא מי), אותה תופעה שגורמת לאנשים לבטל טיסות מיד אחרי תאונה אוירית. |
|
||||
|
||||
אם עכשיו אתה מצפה לתקציר על פאניקת ה-DC10 בסוף שנות השבעים, שכח מזה. |
|
||||
|
||||
אני לא מצפה לתקציר אלא למאמר. הגיע הזמן שתאבד את בתוליך. |
|
||||
|
||||
בתולי הם המעוז האחרון. איש בל יחמוד את הדובדבן! |
|
||||
|
||||
ניסיתי, אבל לא הצלחתי לרסן את הסטטיסטיקאי שבי. כמה הערות: MLE הוא לא אלגוריתם, אלא פשוט ערך/ים שמביא/ים למקסימום פונקציה מסוימת. ה- MLE הוא לפעמים מוטה (למשל ה-MLE של השונות של התפלגות נורמלית) ולפעמים לא (למשל ה-MLE של התוחלת של התפלגות נורמלית). תחת תנאים חלשים יחסית, הוא חסר-הטייה אסימפטוטית. משפט גאוס מרקוב, שמדבר על אמד בעל סטיית תקן מינימלית מבין כל האמדים *חסרי ההטייה* (ולא העקביים), דן בכלל במודל הרגרסיה הלינארית, ולכן אינו קשור במישרין לענייננו. אפשר להראות שאמדי נראות מירבית הם יעילים (בעלי סטיית תקן מינימלית) אסימפטוטית, והדבר נובע ממשפט קרמר-ראו. |
|
||||
|
||||
טוב שלא הצלחת. תודה על הנטפוקים. |
|
||||
|
||||
בינתיים הסתדר לי בראש העניין של MLE. אני מבין שההנחה שיש 7 ממתינים "ממקסמת" את ההסתברות שהראשון שתשאל יהיה מס' 7. אבל עדיין יש לי הרגשה שמשהו פגום בדוגמה שהובאה ב-תגובה 354902 . הרגשתי היא שערכי ההסתברות שחושבו שם עבור ...,x=7,8,9 אינם ברי השוואה ולכן בדיקה סטטיסטית נכונה תראה שאין הבדל בנראות (likelihood) של 7 או 8 או ... ממתינים. |
|
||||
|
||||
הפעם אני לא ממש מבין, למה הם לא ברי השוואה? |
|
||||
|
||||
זו בעיקר הרגשה אי-נוחות לא מנומקת. אתה מעמיד אותי את בין 2 ברירות לא נוחות. אפשרות אחת היא להישאר בעמדת ספקנות בלתי מנומקת ו"מעליבה" ללא הצדקה. האפשרות השנייה היא להסתכן בכך שקלוני המתמטי (המתמטיקה שלי בסיסית והחלידה מחוסר שימוש)יחשף ע"י המתמטיקאים המקצועיים קוראי האייל (אולי יובל נוב הסטטיסטיקאי יגאל אותי ממצוקתי?). אסתכן ואנסה להסביר: א. בניגוד למה שסטודנטים מתחומים אחרים יכולים להתרשם, המתמטיקה אינה נסיון לבטא בצורה טכנית ולא-מובנת ללא-מתמטיקאים, עובדות טריביאליות. המתמטיקה היא נסיון להגיע בעזרת פורמליזם טכני ולא-מובן ללא-מתמטיקאים לתובנות חדשות ולא-טריביאליות. ב. כפי שהסברתי, החישוב שלך מבטא ע"י השימוש בפורמליזם הסטטיסטי של MLE את העובדה הטריביאלית שככל שמספר הדגימות האפשריות עולה, הסיכוי שהדגימה הראשונה היא 7 יורד. זה לא אומר שהחישוב שלך אינו תשובה מצויינת במבחן בסטטיסטיקה השואל אותך מהי האפשרות בעלת MLE מירבי מבין ...,N=7,8,9. ג. הבעיה היא שהחישוב שלך אומר משהו על ההסתברות עבור N=n שהדגימה הראשונה היא X1=7. הוא אינו נותן הערכה כמותית למה היא ההסתברות של N=n כאשר X1=7. כדי שתוכל להשוות בין המדגמים השונים אתה צריך לכמת בדרך כלשהי את ההסתברות הזו. נראה שבדוגמה שלך אין דרך לעשות זאת. ד. הביטוי הפורמלי של מה שניסיתי להגיד הוא שלסכום ההסתברויות שחישבת אין שום משמעות. |
|
||||
|
||||
בשמחה אנסה לעזור. שורש העניין הוא העובדה כי *פרמטר* של התפלגות, בשונה מ*תצפיות* הלקוחות מאותה התפלגות ומגדלים שאנחנו מחשבים מהן, הוא פשוט מספר קבוע, ואין בו שום דבר אקראי; נכון, אנחנו לא יודעים מהו המספר הזה (ולכן נאלצים לאמוד אותו מהתצפיות), אבל שוב - בפרמטר עצמו אין שום דבר אקראי 1. דוגמת הממתינים בתור היא קצת לא אינטואיטיבית, לטעמי, להמחשת הנקודה, אז נעבור לרגע לדוגמא אחרת. קיבלנו שק ענק מלא פיסטוקים, חלקם פתוחים וחלקם סגורים. אילו היה לנו זמן וסבלנות למיין את הפיסטוקים, היינו יכולים לדעת בדיוק את אחוז הפיסטוקים הסגורים; אבל אין לנו, ואנחנו עדיין מעוניינים לאמוד את האחוז הזה, שנקרא לו p. נניח שמותר לנו רק לקחת פיסטוק אקראי מהשק, לבחון אותו, להחזיר, לקחת אחד אחר, וכך הלאה עשר פעמים. עוד נניח שעשינו זאת, וקיבלנו פ-פ-פ-ס-פ-ס-פ-פ-ס-ס (להלן: המדגם). חשוב להבין שבנקודה הזו אין משמעות לשאלות נוסח "מהי ההסתברות ש- p > 0.2 לאור המדגם?"; המספר p, שהוא בדיוק הפרמטר של ההתפלגות "פתוח או סגור" בדגימת פיסטוק יחיד, הוא מספר קבוע, ואין לו התפלגות משל עצמו - אם נתאמץ ונמיין את כל השק, נמצא בדיוק מהו. מה עושים עכשיו? אפשר (אבל לא חייבים) לאמוד את p בשיטת הנראות המירבית. *אילו* היה ידוע ש- p = 0.2, למשל, אז ההסתברות לקבל את המדגם שקיבלנו היא L(0.2) = (0.2)^4*(0.8)^6 = 4.19*10^-4 אילו היה ידוע ש- p = 0.6, אז ההסתברות לקבל את המדגם שקיבלנו היאL(0.7) = (0.7)^4*(0.3)^6 = 1.75*10^-4 וכן הלאה. הפונקציה L נקראת "פונקצית הנראות", ואמד הנראות המירבית של p (הלא הוא ה-MLE) הוא המספר שמביא את L למקסימום, כלומר, המספר ש"תחתיו" מה שראינו הוא הכי סביר. במקרה שלנו, לא מסובך להראות שה-MLE הוא 0.4. לאמדי נראות מירבית יש תכונות סטטיסטיות "טובות", ולכן הם מאוד נפוצים.דוגמת הממתינים בתור שקולה לסיפור הבא: קיבלנו שק עם מספר לא ידוע N של פיסטוקים, אבל מישהו (מטורף מספיק, מן הסתם) טרח וכתב על כל אחד מהם מספר סידורי מ-1 עד N. שוב, בהינתן מספיק זמן, היינו יכולים גם אנחנו לדעת בדיוק מהו N (פשוט נספור את הפיסטוקים), אבל נניח שאין לנו, ואנחנו מוציאים שלושה פיסטוקים אקראיים מהשק ומסתכלים על המספרים הסידוריים שלהם, והם 1000, 1500 ו-3600. הפרמטר פה הוא N, ופונקציית הנראות שלו היא אפס עבור N < 3600, ואחד חלקי N עבור N >= 3600. ה-MLE יהיה לכן 3600. באופן יותר כללי: בהינתן k תצפיות מהתפלגות אחידה על פני 1,...,N, ה-MLE של N הוא התצפית המקסימלית. כש- k = 1, האמד הזה יהיה בדיוק המספר היחיד שדגמנו. אתה כתבת ב-ג' שהיית רוצה לדעת מהי ההסתברות ש- N = n בהינתן שהמספר (היחיד) שדגמנו הוא 7; מקווה שהצלחתי לשכנע אותך שלדבר בעצם אין משמעות. אנקדוטה היסטורית: במהלך מלחה"ע השנייה, בעלות הברית אמדו את המספר הכולל של הטנקים הנאצים על סמך המספרים הסידוריים של הטנקים שלהם שנלכדו בקרב, בדרך דומה למה שעשינו כאן. ועוד שלוש הערות: 1. האבחנה בין מה אקראי (ולכן יש טעם לדבר על ההתפלגות שלו) ומה לא בהסקה סטטיסטית היא לא אינטואיטיבית, ואני עצמי, למשל, הפנמתי אותה במלוא עומקה רק אחרי הקורס הראשון שלקחתי בססטיסטיקה. 2. האבחנה הנ"ל, על כל קשייה, בעצם לא קשורה לשיטת הנראות המירבית; גם כשמשתמשים בשיטות אחרות, היא קיימת. 3. לא תמיד זה "טוב" להשתמש באמדי נראות מרבית. למשל, כשמנסים לאמוד את N מהדוגמא השנייה כש-k (גודל המדגם) הוא נמוך, "כדאי" להכפיל את התצפית המקסימלית ב- (k+1)/k, מטעמים שלא אכנס אליהם כאן. ____________________ 1 יש ענף בסטטיסטיקה שנקרא "סטטיסטיקה ביסייאנית" בו מניחים שלפרמטרים יש התפלגות, אבל אז צריך לדבר על הפרמטרים של התפלגות הפרמטרים. בואו נעזוב את זה. |
|
||||
|
||||
טוב, אני נכנע לתורת האמידה. בהדגמה של חישוב MLE מחשבים זכיות במשחק של 20 הטלות בעלות התפלגות בינומיאלית עם 0.75 סיכויי זכייה. מקבלים 16 זכיות. חישוב ה-MLE "אומד" שסיכוי הזכייה היה 0.8. אבל הנתון הסטטיסטי המשעותי יותר הוא ה- percent confidence interval האומר שיש 90% הסתברות שסיכוי הזכייה היה בין 0.56 ל-0.94. האם ניתן לקבל הערכה דומה לדוגמת הממתינים? |
|
||||
|
||||
כן, אפשר לחשב רווח סמך (confidence interval בעברית) לפרמטר/ים של התפלגות אחידה. שתי הערות: 1. דומני שהתבלבלת, והתכוונת לכתוב 95% ולא 90%, אחרת המספרים לא מסתדרים לי. 2. הניסוח "יש 90% הסתברות שסיכוי הזכייה היה בין 0.56 ל-0.94" הוא בעצם חסר מובן. סיכוי הזכייה, שמסומן בד"כ ב-p, הוא קבוע שאין בו שום דבר אקראי, ולכן אין לו הסתברות של 90% (או 95%, או מה שזה לא יהיה) להיות בתחום זה או אחר. ניסוח מדויק יותר הוא "כשהפעלנו (פעם אחת) פרוצדורה המפיקה מרווחים אקראיים בעלי הסתברות של 95%, כל אחד, להכיל את p, קיבלנו את המרווח (0.56,0.94)". |
|
||||
|
||||
צודק. זה 95%. אני חושב על רווח הסמך כך: אם תשחק את המשחק שהוגדר למעלה הרבה מאוד פעמים עם p אקראי מתוך התפלגות אחידה ותתחשב רק במשחקי ה-16 זכיות, ואם תחזור על כך מספר מספיק של פעמים, ערך התצפית של מספר המשחקים שבהם p היה מחוץ לרווח הסמך הוא 5%. |
|
||||
|
||||
אם הבנתי אותך כהלכה, אז אין זה נכון לחשוב כך על רווחי סמך, והמשפט שרשמת הוא שגוי מתמטית. רווחי סמך "רגילים", מהסוג בו השתמשת בתגובה 355155, *לא* מדברים על מצב בו לפרמטר יש התפלגות (אחידה או אחרת). שוב - הפרמטר הוא מספר קבוע, אך לא ידוע לנו. בסטטיסטיקה בייסיאנית המצב שונה, אבל כאמור, בוא נעזוב את זה. הפרשנות שצריך לתת לרווחי סמך (במקרה הבינומי עם n = 20) היא כדלהלן: מישהו בחר, לא משנה איך, במספר p בין אפס לאחד; אתה צופה במספר רב של תצפיות בלתי תלויות מהתפלגות בינומית עם פרמטרים 20 ו-p, ועל בסיס כל תצפית, בונה רווח סמך של 95% ל-p ע"פ הנוסחה המתאימה (הרווחים יהיו שונים זה מזה, משום שהתצפיות הן שונות זו מזו). אז, בערך 95% מהרווחים שבנית יכילו את p, ובערך 5% לא. |
|
||||
|
||||
טוב, ברור שאנו חלוקים בנקודה זו. ברור שהפרמטר p אינו המשתנה האקראי, אבל אנו חלוקים אם יש משמעות ל"התפלגות" של בחירת הפרמטר. הדוגמה שהבאתי היא הדוגמה של מטלב לפונקציה mle. החישוב של ה-pci שם לא מסובך במיוחד, אבל אני כבר שכחתי את כל הסטטיסטיקה שלי. בכל אופן נראה לי שה"נוסחה המתאימה" שם היא בערך שימוש בהתפלגות F עבור הפרמטר (כאשר התפלגות F כמו התפלגות הסטודנט הידועה הן התפלגויות שבד"כ מייחסים לקומבינציות של פילוגים אקראיים עם פילוגים של הפרמטרים שלהם אאז"נ). אתה יכול להסתכל בקוד המקור ולבדוק אם החישוב מתיישב עם הפרשנות שלך (אני לא כל כך הבנתי אותה). אם תרצה אני יכול לשלוח לך את קוד החישוב. בכל אופן יהיה נחמד אם תרענן את זכרוני מהי התפלגות F, ואיך היא קשורה לפרמטרים של פילוג בינומי, אם בכלל. |
|
||||
|
||||
לפרמטר p אין התפלגות, וגם אין "התפלגות". שוב - הוא סתם מספר קבוע, ולא משנה איך הוא נבחר. אני אנסה להסביר טוב יותר למה התכוונתי בתגובה הקודמת, ואיך צריך לפרש רווחי סמך במקרה שלנו. ניקח לדוגמא את המספר 0.61 (סתם מספר שבחרתי). סיבוב ראשון: נגריל משתנה מקרי בינומי עם פרמטרים 20 ו- 0.61, ונניח שקיבלנו 9; נשלוף את הנוסחה (או פונקציית המטלב) המתאימה, ונחשב את רווח הסמך המתאים ל- p כאן, שהוא (0.23,0.68). סיבוב שני: נגריל משתנה מקרי בינומי נוסף עם פרמרטרים 20 ו- 0.61 (כן, שוב 0.61), ונניח שעכשיו קיבלנו 14; רווח הסמך השני יהיה (0.46,0.88). סיבוב שלישי: נגריל, נניח, 11, ונקבל ממנו רווח סמך (0.32,0.77). וכך הלאה וכך הלאה. תורת האמידה מוכיחה שאחרי מספר רב של סיבובים, בערך 95% מרווחי הסמך יכללו את המספר 0.61 ובערך 5% לא 1. אילו היינו חוזרים על כל הסיפור עם 0.289 במקום 0.61, אז שוב: בערך 95% מרווחי הסמך יכללו את המספר 0.289 ובערך 5% לא. וכן הלאה 2. פונקציית המטלב mle משתמשת בפונקציה binofit, והחישובים בזו האחרונה מתיישבים בדיוק עם הדברים שכתבתי לעיל. אפשר לקרוא על החישובים יותר בנוחות ב- http://www.statsresearch.co.nz/pdf/confint.pdf . תזכורת: לשיטת הנראות המירבית אין קשר לפרשנות של רווחי סמך. על התפלגות F אפשר לקרוא, למשל, ב- http://mathworld.wolfram.com/F-Distribution.html . הקשר היחיד שלה שאני מכיר להתפלגות הבינומית הוא דרך רווחי הסמך עליהם אנחנו מדברים, ואתה מוזמן לקרוא עליו בלינק הקודם שצירפתי. אם אני מבין נכון את מה שכתבת בתגובה 355401, אז אתה מציע את הנרטיב הבא: בכל סיבוב, אנחנו מגרילים p מתוך התפלגות אחידה על [0,1], ואז מגרילים משתנה מקרי בינומי עם פרמטרים 20 ו- p; אז, בטווח הארוך, ב-95% מהסיבובים בהם קיבלנו 16 (אנחנו מתעלמים מהסיבובים בהם לא קיבלנו 16), p היה בין 0.56 ל-0.94. זה פשוט לא נכון. חישבתי ומצאתי שבתנאים הנ"ל, פרופורציית הסיבובים בהם p היה בין 0.56 ל-0.94 (מתוך הסיבובים בהם קיבלנו 16) היא 98%, ולא 95% (מקווה שלא טעיתי בחישוב, יש שם כל מיני פונקציות בתא וכאלה). _______________ 1 ההתפלגות הבינומית היא התפלגות בדידה, דבר הגורר סיבוך טכני נוסף ב"פרשנות" של רווחי סמך, אבל בוא נעזוב את זה. העיקרון מאחורי מה שכתבתי הוא מדויק. 2 זה נכון שגם אם נבחר p חדש בכל סיבוב (לא משנה איך), אז בטווח הארוך, 95% מהרווחים יכללו את p של הסיבוב שלהם, אבל זה לא לב העניין. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |