בתשובה ליוסי השחור, 16/12/05 0:44
אני רק שאלה 354804
לא הבנתי.
אני רק שאלה 354902
אלגוריתם MLE בוחר בהסבר שממקסם את ההסתברות לקבל את התצפית שקיבלנו.
דוגמא:
שוטה הולך למשרד הפנים בבאר-שבע, ומנסה להעריך את מספר האנשים בתור. הוא תופס את אחד השחורים בחדר ההמתנה ושואל את השאלה הקלאסית "איזה מספר אתה?". הנשאל הראשון אומר שבע.
בהנחה שהמספרים החלו באחת, מה ההסתברות לקבל את התצפית שקיבלנו?

x<7 => 0
x=7 => 1/7
x=8 => 1/8
x=9 => 1/9
...
כלומר האומדן שבע ממקסם את ההסתברות שהנשאל הראשון יענה שבע.
אם הנשאל השני יענה חמש, האומדן ישאר שבע.
אם הנשאל השלישי יענה עשר, האומדן יהיה עשר (כי ההסתברות ל-X=7 תרד לאפס)
MLE הוא מוטה אך עקבי (ככל שיעלה מספר התצפיות, האמדן יהיה מדויק יותר). קיימת הוכחה (גאוס מרקוב, אאל"ט) שסטית התקן של MLE היא הקטנה ביותר בין כל האומדנים העקביים.

ועכשיו לכדורסל:
נניח שלכל שחקן יש ממוצע אמיתי מבוסס יכולת, וממוצע רשום שהוא אמדן המבוסס על ביצועים קודמים. קיימת האפשרות שהממוצע האמיתי גבוה מהאומדן (אם בגלל שיפור יכולת או סתם חוסר מזל בעבר). האפשרות הנ"ל יכולה להסביר רצף קליעות בהסתברות גבוהה יותר מאקראיות, ומחקר רשלני יראה הטיה ברורה (לא בדקתי את המחקר, ואני לא טוען שהוא רשלני או מדויק או משהו אחר)
אני רק שאלה (כה''ב) 354905
אולי זו סתם חוסר הבנה מצידי, אבל בדוגמה שלך הערכים יורדים כמו בטור ההרמוני, ומכאן שסכום ההסתברויות הוא אינסופי ובלתי ניתן לנרמול. זו לא בעיה?
אני רק שאלה (כה''ב) 354910
את/ה מחבר/ת בכיוון הלא נכון. צריך עבור x=7 לחבר את ההסתברות שהנשאל הראשון יגיד 1, 2, ... (7 פעמים 1/7 דרך אגב).
מעבר לזאת, אני שותף לתמיהתך, מה התובנה שנותנת כאן ה-MLE מלבד העובדה הטריביאלית שככל שמספר הממתינים בתור גדול יותר הסיכוי שתיפול דוקא על מס' 7 הוא קטן יותר?
אני רק שאלה (כה''ב) 354917
אני הבנתי את ההסבר אחרת. אם הנשאל הראשון ענה 7, אז הסיכוי שיש n ממתינים בתור הוא n^-1 עבור n>7 ואפס אחרת. ככל שאנחנו ממשיכים לשאול הערכים מקבלים ערכים בהתאם כאשר תמיד הערך המקסימלי אותו שמענו הוא הערך הסביר ביותר של מספר הממתינים, ומשם ומעלה זה יורד הרמונית.
אני רק שאלה (כה''ב) 354941
זה לא נכון. n^-1 הוא ההסתברות שבקהל שגודלו n הראשון שתשאל יהיה 7. לגבי ההסתברות ל-n ממתינים תשובת ה-‏7 היא רק אילוץ (n אינו יכול להיות קטן מ-‏7) אבל לא מעבר לכך. לתנאים כאלו יש שם בפיזיקה non-Holonomic constraints אני חושב, שאחת המשמעויות היא שלא ניתן לסכם אותן (non-integrable).
אני רק שאלה (כה''ב) 354967
אין פה שום תובנה, זה בסך הכל אומדן.
אני רק שאלה 354923
הבעיה אינה להסביר "רצף קליעות בהסתברות גבוהה יותר מאקראיות" אלא להיפך: להסביר למה נראה לנו שיש רצפים כאלה במקום שהם אינם.
אני רק שאלה 354968
אוקי.
מה בנוגע ל"כי בני אדם הם לא חיות הגיוניות"?
אני רק שאלה 355177
זה הסבר קצת כללי מדי לטעמי.

ישנם תחומים בהם אנחנו מקבלים את ''חוסר ההגיון'' האנושי (לכאורה) בגלל שאנחנו מבינים משהו על הסיבות שלו. ענייני רגש, למשל, או בעיות נפשיות כמו פוביות למיניהן, או עקרונות כלליים בעלי הגיון שמשתבש בהחלטות נקודתיות (אם המוסר ככלל הוא ''הגיוני'' לחיה חברתית ואינטליגנטית, אפשר להבין למה אני לא הורג את בעלת הבית הזקנה שלי למרות היתרון הכלכלי שבמעשה). הסיבות האלה עצמן הן בעלות הגיון כללי כלשהו, וניתן בהרבה מקרים להבין אותו כשחושבים על התהליכים שהובילו ליצירתו - מה שקרוי ''להמציא סיפור'' שמסביר אותן ומעצבן את י. אורן, וכך להרוג שתי ציפורים באבן אחת.

לא כל-כך ברור למה בתחום של קבלת החלטות כלכליות במקרים די ניטרליים האדם אינו חיה הגיונית. מה שהיה עוזר לו לשרוד בימים בהם היה עליו להחליט אם ללכת לחפש אגוזים בקניון הצפוני או לשוב אל מטע הדובדבנים מאחרי גבעת הדוב המשוגע, אמור לעזור לו גם בהחלטה אם לקנות כרטיס לסרט במקום זה שאבד.
אני רק שאלה 358164
זה לא כמו לומר שהאינסטינקט לאכילה לא מובן, מאחר שיש כל כך הרבה אנשים שמנים?
המציאות, הסביבה האנושית השתנתה, למה מה שהתאים פעם יתאים גם עכשיו?
אני רק שאלה 358171
זה בדיוק מה שאנחנו מנסים לברר. קל לנו להבין איך התפתחה משיכה למאכלים מתוקים ולשומן בסביבה שקלוריות היו מצרך נדרש, וקל לנו לראות איך הנטיה הטבעית הזאת גורמת קשיים בעולם המודרני. קצת יותר קשה לראות למה אינטואיציה הסתברותית לא הועילה לאבותנו, או למה התפתחו כל מיני ההטיות שכהנמן ואחרים זיהו. אותו כשל שגורם למאמן לשים את הכדור בידי השחקן הלא מתאים היה עלול לגרום לראש השבט לשלוח את הצייד הפחות מוכשר להלחם בדב המערות כי אתמול היתה לו "יד חמה", אמונות טפלות מזיקות לא רק לממלאי הלוטו בתאריכי ההולדת של ילדיהם אלא גם למי שהחליט לפשוט על השבט השכן אחרי שפגש שלושה קופים שחורים, וכך הלאה.

קוסמיידס וטובי עושים, למשל, הרבה מאמצים להסביר את ההתעלמות האינטואיטיבית שלנו מ"שעור הבסיס" בדיוק באופן הזה: הם מסבירים למה זאת היתה איסטרטגיה סבירה בימים בהם "הבסיס" לא היה אמין. בצורה דומה הם מנסים להסביר למה הסתברויות שמנוסחות כסיכויים להתרחשותו של ארוע בודד לא מתאימות לתפיסת העולם הטבעית של ציידים-לקטים בסוואנה של אפריקה.

הנה סיפור קטן: מישהו (דומני כהנמן עצמו) שרצה להדגים כשל הסתברותי סיפר על אדם שעמד לקנות מכונית מדגם מסויים, אבל שינה את דעתו אחרי ששכן שלו נתקע עם מכונית כזאת באמצע האוטוסטרדה, למרות שהסטטיסטיקה מראה שזאת מכונית אמינה מאד; ללא ספק, התנהגות לא רציונלית בעולם שלנו. מישהו אחר (לא זוכר מי, אולי פינקר) העיר על כך שבתרגום לעולם קצת יותר ארכאי וכאוטי, הסיפור יכול היה להשמע כך: הנהר הזה הוא בעל היסטוריה בטיחותית מצויינת, אבל אם אתמול תנין טרף שם את הילד של השכן שלי, אני לא ארשה לילד שלי להתרחץ שם היום. נשמע די רציונלי.
אני רק שאלה 358369
אני חושב שאתה קצת מגזים. זה אורח חיים אחר לגמרי. כשאתה בסוונה, אין לך לא "היסטוריה בטיחותית לנהרות" ולא כלום. כל מה שיש לך זה שכן עם בן חי או מת. אם לצייד הפחות-מוכשר יש "יד חמה" עם החנית, אז מאוד מאוד סביר שהוא לא הצייד _הכי_ פחות מוכשר; אם הוא לא הכי טוב, כנראה שהוא מספר שתיים. כשאין לך יכולת לאסוף סטטיסטיקות מדוייקות באמצעות כלים מודרניים (שלא פותחו, להזכירך, עד העת החדשה), וכשמדובר בחיים או מוות, עדיף ללכת על בטוח. "עדויות אנקדוטליות" נשמע היום לא אמין, אבל אם הן מהיום בבוקר, יש מצב שהן הרבה אמינות יותר מכל עדות אחרת.
אני רק שאלה 358380
ראשית, הבאתי דברים בשם אומרם כך שההגזמה, אם קיימת, היא לא שלי.

שנית, אני לא לגמרי מבין. כשאתה חי בסוואנה אתה בטח מכיר את הנהרות שבסביבה מבחינת הבטיחות היחסית שלהם: בזה יש מערבולות מסוכנות בעונת ההפשרה, ההוא זוכה לביקורים תכופים מדי של דובי גריזלי‏1, השלישי משכנם של היפו'ס עצבניים‏2 והרביעי הוא בעל היסטוריית בטיחות טובה. הפרא אולי לא היה אציל, אבל ודאי שהוא לא היה טמבל גמור.

שלישית, אם נתת לצייד הלא-הכי-מוכשר לעשות את מה שהצייד הכן-הכי-מוכשר עושה טוב יותר מתוך שיקולי "יד חמה", הרי שיקוליך מוטעים (ייתכן שנתת לו מסיבות אחרות, למשל כדי שירכוש נסיון או כדי שישאיר את אישתו לבד בבקתה, מוכנה לביקור נימוסין של הצ'יף - ואז אין לי כל טענות כלפיך. תיהנה). לא ברור לי גם למה החלטת שאם למאן דהו היתה "יד חמה" הרי הוא מהמוכשרים בחבורה. כפי שכדורגלנים מסויימים אוהבים להגיד, גם תרנגול עיור תופס תולעת מדי פעם (ביחוד אם התרנגול הזה משחק בקבוצה היריבה).

ורביעית, עם שני משפטי הסיום שלך אני מסכים לחלוטין: על "וכשמדובר בחיים או מוות, עדיף ללכת על בטוח" דיברתי בגוף המאמר, ו ""עדויות אנקדוטליות" נשמע היום לא אמין, אבל אם הן מהיום בבוקר, יש מצב שהן הרבה אמינות יותר מכל עדות אחרת" הוא בדיוק מה שסיפור התנינים בא להמחיש.

__________
1- כן, כן, אני יודע. סתאאאם.
2- היפופוטמים הם חיה טריטוריאלית מסוכנת באמת.
אני רק שאלה 358388
שני דברים לא ברורים לי עדיין בעניין "היד החמה" הזאת.

א. האם אין שחקנים שהם יותר מוצלחים ושחקנים שפחות? האם אין מצבים ששחקן מסוים הוא בכושר טוב יותר ביום מסוים מאשר ביום אחר?

ב. האם נבדקה השאלה איזה מאמן מצליח יותר - זה המאמין ב"יד חמה" או זה שנוטה להחליף שחקן כשהוא בשיא "הטרנס"?
אני רק שאלה 358397
א. 1. כמובן שיש. 2. כמובן שיש. הטענה היא רק שההחלטה ששחקן שנמצא ב"כושר טוב יותר ביום מסוים" מתקבלת על-סמך אינפורמציה לא מספקת, מדגם קטן מדי, חוסר מובהקות, מה שכהנמן וטברסקי כינו בצחוק "חוק המספרים הקטנים" (אבל רק מי שמכיר את "חוק המספרים הגדולים" מבין את ההלצה).

ב. מסופקני אם אפשר לבודד משתנים (ואפילו להגדיר את המשתנים שמשפיעים על כך שמאמן הוא מוצלח) במידה מספקת כדי לענות על השאלה הזאת. אולי סטטיסטיקנים או מומחים לשיטות-מחקר ירצו להרחיב כאן.
אני רק שאלה 358404
א. http://he.wikipedia.org/wiki/%D7%97%D7%95%D7%A7_%D7%...

ב. אם לא ניתן לבודד את המשתנים במידה מספקת כדי לענות על השאלה, לא נראה לי שהטיעון שלהם תקף במיוחד.
אני רק שאלה 358405
א. מעניין, אני כמעט בטוח שכהנמן מזכיר את החוק הזה כמטבע לשון שהוא וטברסקי טבעו, הרבה לפי 1990. אבדוק בספר.

ב. תלוי על איזו שאלה מנסים לענות. תופעת "היד החמה" היא טענה ספציפית שקל יחסית לבדוק אותה מבחינה סטטיסטית. מי הוא "מאמן מצליח"? מי שמאמן את הפועל עפולה ב' ובכל זאת משאיר אותה בליגה ד' כנגד כל הסיכויים (ניצח משחק אחד בכל העונה, אבל זה הספיק. בקבוצה שלו משחקים רק שחקנים שעברו את גיל שבעים כך שגם נצחון בודד הוא לא משהו קל), או מי שמאמן את מכבי תל-אביב ומנצח את הפועל ירושלים בשתי נקודות? גם אם הצלחנו איכשהו להגדיר הצלחה של מאמן, אנחנו בסימן שאלה גדול לגבי הגורמים לה.
אני רק שאלה 358411
אני רק שאלה 358428
תודה.
אני רק שאלה 358416
כהנמן לא פה. אני סומך עליך שתייצג אותו בכבוד.

אני חושד שהסביבה הסוואנית (ואולי גם זו שלנו) היתה קצת יותר כאוטית ממה שאתה מתאר‏1. "תנין בנהר" זה לא ארוע שקורה כשהיום הקוביות מראות 1:1, זה ארוע שקורה כשאשכרה יש תנין בנהר. יכול להיות שהוא כבר יצא משם, אבל סביר גם שלא. ואין לך מספיק חברים למערה כך שיש להם ביחד מספיק ילדים למדגם מייצג בנושא הזה. זה שהנהר היה בטוח עד עכשיו, לא אומר שהוא עדיין בטוח. יכול להיות שהסביבה השתנתה. אין לך עדויות, אין לך מדגם, כל מה שיש לך זה פרוות דוב קרועה מוכתמת בדם.

גם תרנגול עיוור תופס תולעת מדי פעם, אבל לא חמש תולעים ברציפות. אם לספורטאי או לצייד יש יד חמה, תהיה בטוח שהוא בטופ של הטופ‏2. נכון, יש סטייה סטטיסטית, אבל היא זניחה. במחשקי ספורט מודרניים יש הרבה מאוד סטטיסטיקות להרבה מאוד שחקנים, ולכן יש כלים לחשב ויש חשיבות לסטייה הקטנה הזו.

1 דוגמה: משתמשים באלגוריתם LRU לזכרון מטמון (http://en.wikipedia.org/wiki/Least_recently_used). זה בדיוק יד חמה, לא פרימיטיבי? ומדובר בתחום מודרני, עתיר-ידע, עתיר-מחשבה וסטטיסטיקה! כי זה פשוט, זה עובד, פרקטי, ועדיף על תאוריות לגבי איך עובד העולם שיכול להיות שאין להן שום קשר עם המציאות. ככה זה כשאתה חי בעולם האמיתי ולא בעולם המומצא של הספורט.

2 ג'יי גולד כתב על זה משהו באחד הספרים שלו, לא זוכר איזה.
החזק את סוסיך! 358433
לגבי הפיסקה הראשונה: אנחנו מסכימים בעניין הזה. אני חוזר: מסכימים. לא שזה צריך למנוע אותנו מויכוח סוער, אבל כדאי לזכור את זה ברקע.

הלאה: התרנגול העיור, אומר כהנמן, יתפוס גם חמש תולעים ברצף מדי פעם. ההתעקשות שלך כאן לא תועיל כיון שהעניין נבדק סטטיסטית, והשחקן העיור שלנו מתנהג כמו מטבע.

ולהערות שלך:

1 LRU יכול להיות איסטרטגיה יעילה בהעדר יכולת לחשב טוב יותר את הסיכוי שבלוק מסויים יידרש שוב (ובלי שהחישוב הזה עצמו יהרוג את הביצועים שלך), אם כי דומני שאלגוריתמים שלוקחים בחשבון גם את הגיל של הבלוק (הזמן מאז הגישה האחרונה) נפוצים יותר. טברסקי וחבריו הראו שהתנאים האלה לא נכונים למשחקי כדורסל (נדמה לי שמישהו הראה את זה גם לבייסבול, ומישהו כאן טען שההיפך נכון לטניס. אין לי מושג), דהיינו שם *יש* דרך טובה יותר להחליט, והיא להסתמך על ממוצע הביצועים של השחקן במדגם קצת יותר גדול משלוש הקליעות האחרונות שלו.

2 אם אתה מתכוון להנמקה שלו שממוצע החבטות 0.400 לא יחזור בשנים הקרובות (ואל תשאל אותי מה זה) אני מתקשה לראות את הקשר. "יד חמה" מתייחס לתקופות קצרות - קצרות מדי - וזה הכל. אף אחד לא טוען שמייקל ג'ורדן ואני מחזיקים באותו סיכוי לקלוע את הסל המכריע (אני מנצח אותו בשתי ידיים‏1 קשורות מאחרי הגב.
____________
1- שלו.
החזק את סוסיך! 358445
1 - אופס. מחק את מה שאמרתי על הגיל של הבלוק, זה בדיוק LRU.
החזק את סוסיך! 358480
הסיכוי שתרנגול שתפס תולעת הוא עיוור גדול בהרבה מאוד מהסיכוי שתרנגול שתפס חמש תולעים ברצף הוא עיוור. נזכרתי בדוגמא של גולד - הסטריק של Joe DiMaggio, אידך זיל חפש בוויקפדיה וכו'.

בכל מקרה, הנקודה שלי היא שללהק לתפקיד ראשי תרנגול שתפס אפילו תולעת אחת זה כבר אלגוריתם לא רע בכלל; אני מציע שעולם הספורט (והימורים) הוא יוצא-דופן בכמות, באיכות ובחד-משמעותיות של הסטטיסטיקה שהוא מספק, ושיכול להיות שאפקט "היד החמה" רלבנטי כמעט רק לו. זה עונה על השאלה "למה אשליות סטטיסטיות התפתחו": האשליות הסטטיסטיות הן תוצאה של שימוש בהאוריסטיקות המיועדות למידע חסר הרבה יותר מזה שזמין לנו בתחומים (מלאכותיים?) בחברה מערבית מודרנית.
אני רק שאלה 359969
זה מתחבר לתופעה ידועה בפסיכולוגיה (של אנשים ושל חיות) שנקראת The Matching Law:

"The matching law ... views choice not as a single event or an internal process of the organism but as a rate of observable events over time. It states that instead of maximizing utility, the organism allocates its behavior over various activities in exact proportion to the value derived from each activity. It differs subtly but significantly from rational choice theory in its predictions of how people exert self-control, for example, how they decide whether to forgo immediate pleasures for larger but delayed rewards. It provides, through the primrose path hypothesis, a powerful explanation of alcohol and narcotic addiction. It can also be used to explain biological phenomena, such as genetic selection and foraging behavior, as well as economic decision making."

(מתוך: http://www.hup.harvard.edu/catalog/HERMAT.html)

התנהגות של matching נצפית, למשל, כשחיה יכולה לבחור בין שני מקורות של מיץ זהה, כשבאחד השתיה מתקבלת בהסתברות של 70% אחרי הלחיצה על דוושה, ובשני בהסתברות של 30%. בניסויים כאלו רואים הבדלים בין התנהגות של חולדות לעומת קופים. אאז"נ, חולדות לומדות לפנות תמיד למקור הראשון, בעוד קופים ממשיכים לנסות את שני המקורות, אם כי לא בהסתברויות שוות. מצב של matching מדויק ("לפי הספר") קורה כששיעור הפניה למקור הראשון הוא 70%.

למרות שהעדות הנסיונית לחוק הזה שנויה מאד במחלוקת, התיאוריה מסבירה את התוצאות במונחים של בחירה חוזרת מאותו מאגר של אפשרויות (בדומה למשחקים החוזרים שפרופ' אומן מתמחה בהם). במצב כזה יש שיקולים נוספים פרט לבחירה האופטימלית לרגע מסוים אחד, כי זה תלוי במודל העולם שלך - למשל בהשפעת הפעולות שלך על מקור המיץ, בדינמיקת ההתמלאות של מאגר השתיה, וכו'.

במחקרים סוציולוגיים רואים לעתים קרובות שאנשים מתייחסים לחיים במונחים של "בחירות חוזרות", גם כשהסיטואציה היא לחלוטין חד פעמית. כשיהיה לי זמן אני אגגל על זה קצת כדי להביא לינק ("evolutionary game theory" או "repeated games" הם התחלה טובה).
אני רק שאלה 360010
מעניין מאד, תודה. כהנמן מצביע בספרו על ההיפך הגמור: התייחסות לכל הימור קטן בחיים כאילו הוא מאורע יחיד, במקום להסתכל על התמונה הכללית של הימורים חוזרים.
אני רק שאלה 363759
זה משונה לי מה שאתה אומר כי כשלמדנו על כהנמן, בהחלט דובר על אפקט ההיתכנות כלומר שאנשים יהיו מכונים להמר הימורים עבור קיום סיכוי כלשהו,
לדוגמה מכונים להמר בטוטו עבור סיכוי מזערי למרות שעבור שיפור מזערי בסיכוי שכבר קיים לא היו מוכנים להשקיע אותו סכום
אני רק שאלה 361683
זה מעניין. בניתוח מתמטי קר, לפנות לשני המקורות זאת התנהגות די טיפשית, כי הדבר הטוב ביותר לעשות הוא ללכת תמיד למקור שמוציא מיץ 70% מהפעמים.

אבל בטבע, כשמדובר במאגרים שמתמלאים ומתרוקנים (למשל מעיין, או עשב) אז באמת הגיוני שאם הכמות במקור השני היא 30% ובראשון 70%, אז 30% מהאוכלוסיה צריכה ללכת למקור השני, ו-‏70%לראשון.
אני רק שאלה 361687
אם אתה הולך תמיד למקור השופע יותר, לא תוכל להגיב על שינויים בשפע היחסי של המקורות.
אני רק שאלה 361695
אבל מה הבעיה ללכת למקור השופע יותר, ואם הוא מדולדל - לפנות למקור השני?
אני רק שאלה 361702
גם אם הוא עדיין שופע, אולי השני כבר נותן 100%?
אני רק שאלה 361705
הזכרתם לי שרציתי גם לשאול שאלה דומה בקשר לזרזירים- מאיפה הם ידעו שיש מקור אוכל עם הסתברות של 50%? האם (למשל) בדקו שהם יודעים להבחין בי 50% ל 30%? ( דיסקליימר- לא קראתי את המקור שצירפת, אני מבקש מחילה מראש אם התשובה שם).
אני רק שאלה 361708
מתוך המאמר:

"The birds were presented with a choice between a constant foraging option that always provided three seeds and a variable option that provided either no seeds or six seeds with equal probability."
הציפורים ניסו את המקורות כמה פעמים, וגיבשו להן את האיסטרטגיה בתהליך שנקרא "למידה".

אני לא יודע על ניסויים לגבי הרזולוציה החשבונית של הציפורים.
אני רק שאלה 361707
זו בעיה. אבל יכול להיות שעדיף בהרבה ללכת למקור של 70% מאשר לזה של 100%: בשני אתה עלול לשתות יותר מדי.
הכנף הנעלמה 361920
אכן כך הגיוני, והשאלה שצריכה להשאל היא איך יפעל המנגנון המווסת את האוכלוסיה לשני המקורות, בהיעדרה של "המועצה להסדרת השתיה מטעם איגוד צרכני הצוף, התשכ"ג".

זאת דוגמא מצוינת לשיווי משקל אופטימלי ויציב שיכול להיות מושג בלי שצריך גוף מתכנן או מפקח. בוא נניח שכל ציפור מטילה קוביה דמיונית‏1 שנותנת הסתברות של 70% לפנות למקור העשיר יותר. כל ציפור בלהקה תזכה לאותה כמות של צוף בקירוב (נקרא לה יחידה אחת), וכל ציפור שתסטה מהנוהל תעניש לא רק את חברותיה לאותו אתר, אלא גם את עצמה: היא תקבל רק 30/31 יחידה אם ההטיה שלה היא למקור הדל, ו 70/71 אם היא נמשכת לעשיר יותר, מכל מקום פחות מיחידה. מכאן שהאיסטרטגיה שתיארתי יציבה.

איך אפשר להגיע לשיווי המשקל הזה מלכתחילה בלי להעביר לשם כך חוק בכנסת? בקלות. אם האוכלוסיה מתחילה ממצב בו כל הציפורים מעדיפות את המקור העשיר, מוטנט שמעדיף את המקור הדליל (נניח שיש לו חרדה חברתית והוא אוהב לשתות לבד) יזכה ל- 30 יחידות צוף במקום ה 70/100 של חבריו ללהקה, ולכן הוא יהיה חון מחבריו, יעמיד יותר צאצאים, והמוטציה תתפשט עד ששכיחותה באוכלוסיה תביא לחלוקה אופטימלית של המשאב.

האם אוכלוסיות בע"ח בטבע מתנהגות כך? אני לא יודע, אבל מוכן להתערב שבהרבה מקרים התשובה חיובית. אני גם מוכן לנחש שאם יש סטיות, הן יותר לכיוון של העדפת המקור העשיר, שכן מחיר השגיאה (1/71 בדוגמא שלנו) קטן יותר מהשגיאה בכיוון השני (1/31).

(פישטתי קצת את הניתוח הזה כדי לא להכנס לכל מיני פרטים שנראים לי לא חשובים. יש לי הרגשה שראובן יחלוב ממני את כל הפרטים שחסכתי ממך)
_____________
1- חידה: אם יש לך רק מטבע - או נוירון - בעל שני מצבים שווי הסתברות, תכנן ניסוי שייתן תוצאה אחת בסבירות 70% ואת השניה בסבירות 30%. בין הפותרים יוגרלו מאזני נאש. ההשתתפות אסורה על מתמטיקאים ומתכנתים.
מקור הציפור שמטילה קוביה 361926
טוב, מכיוון ששמי הוזכר:
1) ההנחה שמקורות שומרים על התפוקה היחסית שלהם במהלך הדורות נראית לי מופרכת לגמרי.

2) החוק המקורי כפי שהביא אותו LG היה שכל אורגניזם בנפרד מבלה *חלק* מהזמן בכל אחד משני המקורות, לא שזה משנה הרבה ( אפשר לתאר שלכל אחד מאיתנו יש בראש שני יצרים, אחד מעדיף מקור א והשני מעדיף את מקור ב).

3) יש לזכור, שבמצב שיווי משקל, כל ציפור תקבל בדיוק את אותה כמות, ולכן מבחינת הציפורים אין משמעות אמיתית ל "מקור עשיר" או "מקור דל". למעשה ההעדפות יעשו על סמך קריטריון שהוא לכאורה משני ( נניח- צבע הפרח או צורתו).

ובעניין החידה שלך, יש כל מיני דרכים. שיטה אחת שלחתי לך בדוא"ל.
מקור הציפור שמטילה קוביה 361929
1. נכון בהחלט. אבל אם יש לך כבר מנגנון הטלת קוביות כזה את הכיוונון שלו קל לשנות (זה באמת אחד הפרטים שהשמטתי).

2. שוב, נכון, ושוב השמטתי בכוונה. חשוב רק שההעדפה לא תהיה מוחלטת אלא שלפחות חלק מהיצורים יהיו מוכנים לבדוק מדי פעם את המקור האחר.

3. גם בזה אתה צודק, חוץ מההסתייגות שהעליתי בעניין מחיר השגיאה האפשרית.

קיבלתי, ואפילו עניתי על הדואל. זכית במאזן אחד.
מקור הציפור שמטילה קוביה 361968
זה מזכיר לי מחקר חלוצי שנעשה על שוק הדגים של מרסיי. עוזר מחקר מסכן השכים מדי בוקר והגיע עם שחר לשוק הדגים הסיטונאי של מרסיי, שבו בעלי מסעדות וקצבים קונים מהדייגים את שללם. בשוק הזה כל הסחורה חייבת להמכר מהר, לפני שתתקלקל, ולא היה מקובל לעשות shopping around (אין לי מושג למה). בכל מקרה, הקונה היה צריך לבחור לו מוכר, לגשת אליו, ולסכם איתו על הכמות והמחיר. מי שרצה לבדוק את המחירים אצל המתחרים, היה יכול לעשות זאת למחרת עם שחר, אבל לא באותו יום.

עוזר המחקר המסכן רשם את פרטי כל העסקאות שבוצעו בשוק במהלך שנתיים, והעביר את הנתונים לחוקרים שניתחו את התנהגות הקונים והמוכרים.

מהמחקר הזה יצא מאמר מאד ידוע, ויש בו ממצא אחד שהתקשר לי לדיון: נמצא שיש שני סוגים עיקריים של לקוחות: כאלו שיש להם תמיד את אותו מוכר קבוע שאליו הם באים, וכאלו שפוקדים באופן סדיר לפחות ארבעה מוכרים (ומעלה). היו מעט מאד קונים שבדקו רק שניים או שלושה מוכרים לאורך התקופה. החוקרים בנו מודל של התנהגות הצרכנים שנתן תוצאות דומות, אבל בלי קשר למידת הדיוק של המודל זה מצביע, אולי, על דפוסי התנהגות של אנשים בסיטואציות של בחירה (חוזרת) בין מספר מקורות אפשריים: נאמנות חזקה אצל חלק, גיוון מקורות (מכוון?) אצל אחרים. וייתכן שהכל תלוי בדינמיקה של מקור המזון, או אולי זה בכלל ספציפי לאופי הצרפתי...
מקור הציפור שמטילה קוביה 362057
מעניין מאד. אם אני מבין נכון, ההתנהגות שאתה מתאר היא שהקונים "שפוקדים באופן סדיר לפחות ארבעה מוכרים (ומעלה)" עושים זאת בימים שונים, אחרת ההערה שלך על כך שלא נהוג לעשות shopping around לא מובנת. אני מניח שמספיקה כמות מסוימת של קונים מהסוג הזה כדי לשמור על שוק משוכלל יחסית, בדיוק כפי שכמה ציפורים עם קבעון על מקור אחד לא תהרוסנה את שיווי המשקל כל עוד יש מספיק אחרות שמשנות את ההעדפות שלהן לפי הצורך.

אתה יכול לספר משהו על נסיונות להסביר את התופעה? אולי הקונים מתחלקים באופן גס לשתי קבוצות: באחת אלה שמרוצים מהסוחר איתו הם עובדים לאורך זמן (איתו כבר נוצרו יחסי אמון על סמך הרבה עסקאות קודמות, והוא מצידו נותן להם יחס של לקוח מועדף ולא דוחף להם סחורה מפוקפקת), ובשניה אלה שאינם מרוצים ולכן הם בתהליך של חיפוש הסוחר האופטימלי עבורם. בשלב החיפוש סביר לא להסתפק רק בשני סוחרים, ומצד שני אינך יכול לבדוק את הסוחרים כולם, אחרת הנתונים שתאסוף על כל סוחר יהיו מועטים מכדי לתת תמונה מהימנה של איכותו האמיתית.
מקור הציפור שמטילה קוביה 362149
כנראה שעל בסיס הנתונים האלו פורסמו מספר מחקרים. אפשר לגגל לפי marseille fish market Kirman (לפי שמו של אחד מעורכי המחקר). שני לינקים מהירים:

אפשר גם להיעזר בעמוד הבית של Alan Kirman:
עדיין לא הספקתי לקרוא מהן התכונות הספציפיות של המודל שהחוקרים בנו (אחד היה כלכלן, השני פיזיקאי).
מקור הציפור שמטילה קוביה 362157
מהלינק הראשון שלך:

"Buyers in almost any market fall into one of two groups - those who are extremely loyal to their supplier and those who systematically 'search' for good bargains."

וגם:

"In particular, the most frequent buyers (those who visit the market more than once a week), with very few exceptions, visit only one seller, while less frequent buyers visit several sellers."

בניגוד למה שאמרת, נדמה לי שהציטוט השני מראה שכן מדובר על בדיקה של כמה סוחרים באותו ביקור בשוק, אבל לא נראה לי שזה משנה הרבה.

(לא מצאתי יותר מדי אינפורמציה בלינקים, שכן הם מכילים את התקציר בלבד. מזל. למי יש כוח למאמרים ארוכים בכלכלה?)
מקור הציפור שמטילה קוביה 362312
מה- link השני:

In a coevolutionary process, buyers learn to become loyal as sellers learn to offer higher utility to loyal buyers, while these sellers, in turn, learn to offer higher utility to loyal buyers as they happen to realize higher gross revenues from loyal buyers.

התראה: הקטע הבא איננו מיועד לילדים שאינם אוהבים פיזיקה.

מה שאני זוכר מהמחקר המקורי (לא זה שמצוטט למעלה) היה מודל שקיבל השראה מפיזיקה סטטיסטית. הרעיון היה, אאז"נ, שכל לקוח מנהל מין "תרשומת פנימית" של מה שנתן לו בעבר כל סוחר, ובנוסף יש לו מין "רמת נאמנות" פנימית שאנלוגית לטמפרטורה במודלים תרמודינמיים. כשהטמפ' גבוהה, הקונה ממשיך לבדוק את כל המוכרים בהסתברות לא זניחה, גם אם יש הבדלים גדולים במחיר הממוצע שקיבל בעבר מכל אחד מהם. אל"פ, אבל זה אולי אנלוגי לנטיה של מערכת בטמפ' גבוהה לדגום חלק גדול ממרחב המצבים האפשריים שלה, כאילו הטמפ' מייצגת "חוסר שקט". ככל שהטמפ' יורדת, הקונה מתייצב על המוכר שיש לו את ה- record הטוב היותר עד כה וכמעט לא מבקר אצל האחרים, ואם הטמפ' יורדת ל- 0, הוא דוגם מכאן והלאה רק את המוכר הזה. אם מריצים את הסימולציה לזמן ממושך, תחת איזושהי הנחה (שאני לא זוכר) על הדרך שבה כל קונה משנה את הטמפ' שלו לפי המחירים שראה עד היום, אזי כל קונה מתכנס לאחד משני מצבים: טמפ' אפס או טמפ' גבוהה, ואין כמעט מצבי ביניים.
מקור הציפור שמטילה קוביה 362216
אולי אפשר להכליל התנהגות כזו לתחומים אחרים? למשל - יש אנשים שמעדיפים להשקיע בבן זוג יחיד לאורך זמן, לעומת אחרים שמעדיפים להישאר ב-"תהליך של חיפוש הסוחר האופטימלי עבורם".
מקור הציפור שמטילה קוביה 362059
עוד הערה קטנה, אם כבר מדברים על מצבי שיווי משקל וכולי. יכול להיות מעניין להשוות בין הציווי הקטגורי של קאנט לבין ''הציווי הקטגורי'' של נאש.
מקור הציפור שמטילה קוביה 362061
ג'ון רולס.
מקור הציפור שמטילה קוביה 362062
אתה רומז שמסך הבערות זאת סינתזה בין שתי הגישות?
מקור הציפור שמטילה קוביה 362066
א-הא. נדמה לי שהניסוח של רולס הוא משהו כמו יישום של רעיונות מתורת המשחקים כדי ליצור את ממלכת התכליות הקאנטיאנית.
מקור הציפור שמטילה קוביה 362063
TFT הוא המקום בו הם נפגשים, לא? (אלא ששם מדובר על משחקים חוזרים, ואני לא יודע אם זה נכלל בתיאוריה של נאש).
מקור הציפור שמטילה קוביה 362068
אני חושב שמדובר על עניין מורכב יותר. בשני המקרים ההתייחסות לאדם היא כאל פועל רציונאלי, יש ''הפשטה'' של האדם ממאפיינים מקריים שלו, ''המשחק'' נערך בתחום התבונה לבדה (קאנטיאני) ולא בפועל - האדם צריך לחשוב על עצמו ''כאילו'' הוא היה כל אחד מהשחקנים האחרים. אפשר לחשוב על כל מני קווים משותפים. אני לא מתמצא בנושא, אבל אני יודע שהוא מפרנס מספיק עבודות מאסטר ודוקטור.
מקור הציפור שמטילה קוביה 362158
נא הסבר TFT. הלחרדים היינו, לחיילים דמינו שהכל ר"ת ר"ל?
מקור הציפור שמטילה קוביה 362160
tit for tat. חפש "דילמת האסיר" כאן באתר או אצל הדוד ג., ואני בטוח שהמיסתורין יתבהר בב"א אי"ה.
מקור הציפור שמטילה קוביה 362163
אוף, בפעם הבאה תחכה עוד ארבע דקות.
מקור הציפור שמטילה קוביה 362165
זה מה שכולן אומרות לי.
מקור הציפור שמטילה קוביה 362167
ת"ר.:)
מקור הציפור שמטילה קוביה 362161
מקור הציפור שמטילה קוביה 362166
תודה.:) את הדילמה היכרתי, אבל מר"ת יל"פ.
מקור הציפור שמטילה קוביה 362173
מה זה מר"ת יל"פ?
מקור הציפור שמטילה קוביה 362185
מראשי תיבות יש לי פטור.
אני רק שאלה 358383
ואם אתמול עבר לידי חתול שחור, ובערב נפלתי על שיח דוקרני במיוחד, אז אף אחד בשבט לא ירצה יותר להיתקל בחתול שחור.
אני רק שאלה 358394
בתחילת שנת 2000 הסטטיסטיקות הראו שצמיגי Firestone אמינים למדי. האם ההחלטה של אנשים בארה"ב לבחור בחלופות, לאחר שראו בטלוויזיה דיווח על הארוע השני, נראית לך כבלתי רציונאלית?
אני רק שאלה 358396
איזה אירוע שני?
(ואגב, מה עם אנשים שנמנעים מלקנות תוצרת רמדיה לתינוקותיהם)?
אני רק שאלה 358401
בדיוק חשבתי על רמדיה. מיד אחרי שהתפוצצה הפרשה, אני חושב שרמדיה היה המזון הבטוח ביותר לקנות לתינוק שלך. כמובן ייתכן שאתה מכניס לחישוב גם אלמנטים אחרים כמו רצון ללמד את היצרנים השונים לקח, ואז חרם על רמדיה יכול להיות רציונלי - ביחוד אם אתה מאמין שכל האנשים רציונליים כמוך.
אני רק שאלה 358418
''מיד אחרי שהתפוצצה הפרשה, אני חושב שרמדיה היה המזון הבטוח ביותר לקנות לתינוק שלך''.
זה כשל לא פחות מזה של אדם שבאמצע האינתיפאדה, מיד אחרי פיגוע התאבדות בשוק, יגיד ''היום הוא היום הכי בטוח ללכת לשוק'' - ואז מגיע הפיגוע השני...
אני רק שאלה 358420
זה לא כשל. הטענה היא לא סטטיסטית (''רמדיה היא מזון בטוח בגלל שאין סיכוי שדבר כזה יקרה פעמיים''), אלא מושכלת (''רמדיה היא מזון בטוח בגלל שהבעלים שלה עכשיו בודקים כל מוצר על עצמם לפני שהם מוציאים אותו החוצה'').
אני רק שאלה 358440
בדיוק לזה כיוונתי.
אני רק שאלה 358457
לא הבנתי.
אני רק שאלה 358461
הבעלים טועמים. אם הם לא מתים, סימן שהמוצר מכיל את כל הויטמינים.
אני רק שאלה 358463
אני בטוח ש*אחרי* האסון ההוא, בדיקות האיכות ברמדיה היו מעל ומעבר למה שמקובל בתעשיה. הנכווה ברותחין וכל זה.
אני רק שאלה 358473
זהו, שאני לא לגמרי משוכנעת. זה נשמע מסבר את האוזן, כמובן, אבל כפי שאמר כאן ראובן - זה נראה גם לי ככשל מערכתי, כך שאין לדעת. בקיצור, גם כאן אין די נתונים.
(אגב - לא בדיוק קשור - אבל זה מזכיר לי שאחרי רצח רבין אמר לי אחד משכניי שלפחות אפשר להיות בטוחים שבבחירות הבאות תעלה העבודה. הוא פסל את דבריי בבוז מוחלט כשטענתי שזה מאוד לא בטוח).
אני רק שאלה 358557
(אגב - לא בדיוק קשור - אבל זה מזכיר לי שאחרי ההתנתקות אמר לי אחד שלפחות אפשר להיות בטוחים שבבחירות הבאות תעלה קדימה. הוא פסל את דבריי בבוז מוחלט כשטענתי שזה מאוד לא בטוח).
אני רק שאלה 358561
אני מניחה שהוא אמר לך את זה די זמן אחרי ההתנתקות...
אני רק שאלה 358808
אגב, ''הנכווה ברותחין'' זה גם כשל יד חמה (או ליתר דיוק, לשון חמה).
אני רק שאלה 359020
היפה הוא - בטח אתה מודע לזה, אבל כדאי להדגיש - שהשיקול הזה עובד רק בזכות הכשל הסטטיסטי של רוב הציבור.
אני רק שאלה 358403
אני מחכה שתסביר על איזה ארוע אתה מדבר. אם מדובר על איזו תאונה רבת נפגעים שצולמה היטב, הרי ההשפעה שלה על החלטתך באמת אינה רציונלית.

(נכון, ייתכן שמדובר על תקלה בסדרת ייצור שלמה או על התדרדרות באיכות המוצרים באופן כללי, אבל להסיק מסקנות כאלה מתאונה אחת? ביררת כמה תאונות דומות אך מתוקשרות פחות היו לצמיגים של המתחרים?)
''אמרתי לכם'' 358410
יש כאן נימוק אחר, יותר פסיכולוגי. נניח שאתה צריך לקנות צמיג, או תחליף חלב אם מספר ימים לאחר האירוע הטרגי המדובר. בוא נניח שאתה גם יודע שכלתנית שמדובר באירוע נדיר ומקרי ( דווקא המקרה של רמדיה נראה בעיני כדוגמא לכשל מערכתי, אבל נניח לזאת). כלומר, אתה במצב הבא: כל המוצרים בשוק קיימים עם אותה דרגת סיכון. אבל, אם תבחר לקנות רמדיה, והאירוע הנדיר *דווקא* יקרה לך, לא רק שאתה תאכל את עצמך, אלא כל הסובבים אותך יתיחסו אליך כאוויל. אז נכון, לא נעים להודות שכאשר אנו חושבים על חיי ילדינו, אנו מוטרדים גם ממחשבות כסת"חיות כאלה, אבל אני חושב שזה מניע קיים ונפוץ.
''אמרתי לכם'' 358427
אפשר לדון בשאלה איך להכליל שיקולים כאלה בקבלת ההחלטות, אבל השאלה הבסיסית נשארת: איך זה קורה ש"כל הסובבים אותך" עושים אותה טעות? במלים אחרות, השיקול שלוקח בחשבון את העובדה שאנחנו חיים בחברה לא רציונלית הוא שיקול רציונלי, אבל השאלה למה החברה היא כזאת נשארת פתוחה.
אני רק שאלה 358438
מספר הארועים שדובר בהם בזמנו הגיע למאות. לפי wikipedia, מתוך התביעות הרבות שהוגשו כנגד Firestone ו-Ford, רק בודדות זכו במשפט, ובמספר גדול יותר העניין נסגר באמצעות הסכמי פשרה ופיצויים. Firestone אספה מהשוק ומהציבור מיליוני צמיגים מהסדרות החשודות, ואחד ממפעליה הגדולים (באילינוי) נסגר. שתי החברות המשיכו להתווכח ולהאשים זו את זו במשך חודשים ארוכים אחרי שהבלגן שכך.

מטבע הדברים, מסקנות הפוסט-מורטם אינן מצויות בידי מי שנדרש לקבל החלטות בזמן אמת. הידע שהיה לציבור הגיע מכמה תאונות מחרידות במיוחד שסוקרו בהדגשה בטלוויזיה, ומסטטיסטיקות מצטברות (ולאו דוקא אמינות) שדווח עליהן בעיתונים.

מאיזה מספר של מקרים אמור אדם להתחיל לחשוד שאולי אין מדובר באקראיות גרידא? תלוי בדוגמא הספציפית. במקרה המדובר, כנראה שאין די בתאונות אחדות אם המדגם הוא כל ארה"ב. שני ארועים מאותו הסוג באותו שבוע בכפר ורבורג, זה כבר קצת יותר מוזר. להגנתה, אגב, הצביעה Ford על כך ששום צמיג של Goodyear לא היה מעורב בהתהפכויות הדגמים "הנאשמים".

אם לסכם את מה שאני מנסה לומר: בעיני הטיעון של פינקר אינו סתם סרח אבולוציוני. גם לחברות שקנו את שמן הטוב לאורך עשרות שנים, עלולה לצאת סדרה בעייתית (או שמישהו מוכר זיופים באיכות ירודה אבל עם דמיון חזותי מדהים למקור, או ש...). אם אתה שוקל לרכוש מוצר מסוים בחנות מסוימת, ויש לך שני שכנים שכבר קנו אותו שם ומתלוננים על בעיות, החשד שאולי קיימת כאן איזו בעייה לוקאלית שעלולה להשפיע גם עליך, עובר את מבחן הרציונאליות הפשטנית שלי.

------------
גם אני חשבתי על הדוגמא של רמדיה, אבל המקרה של Firestone נראה לי כיותר קרוב לטענה שהזכרת.
אני רק שאלה 358444
מסכים. אבל אני (טוב, כהנמן) דיבר[תי] על משהו הרבה יותר פשוט: אם הסוסיתא של השכן שלך התקלקלה בעליה של סדום, ובגלל זה אתה לא קונה סוסיתא למרות הדו"ח המצויין שלה ב"קונסיומר רפורט", אתה מסתמך על מדגם קטן מדי. זה מתקשר למה שכהנמן קורא "זמינות" או "יציגות" של האינפורמציה (אני לא זוכר בדיוק מה הוא מי), אותה תופעה שגורמת לאנשים לבטל טיסות מיד אחרי תאונה אוירית.
אני רק שאלה 358447
אם עכשיו אתה מצפה לתקציר על פאניקת ה-DC10 בסוף שנות השבעים, שכח מזה.
אני רק שאלה 358449
אני לא מצפה לתקציר אלא למאמר. הגיע הזמן שתאבד את בתוליך.
וניה, הו וניה, בני היקר 358450
בתולי הם המעוז האחרון. איש בל יחמוד את הדובדבן!
אני רק ניטפוקים 354991
ניסיתי, אבל לא הצלחתי לרסן את הסטטיסטיקאי שבי. כמה הערות:

MLE הוא לא אלגוריתם, אלא פשוט ערך/ים שמביא/ים למקסימום פונקציה מסוימת.

ה- MLE הוא לפעמים מוטה (למשל ה-MLE של השונות של התפלגות נורמלית) ולפעמים לא (למשל ה-MLE של התוחלת של התפלגות נורמלית). תחת תנאים חלשים יחסית, הוא חסר-הטייה אסימפטוטית.

משפט גאוס מרקוב, שמדבר על אמד בעל סטיית תקן מינימלית מבין כל האמדים *חסרי ההטייה* (ולא העקביים), דן בכלל במודל הרגרסיה הלינארית, ולכן אינו קשור במישרין לענייננו.

אפשר להראות שאמדי נראות מירבית הם יעילים (בעלי סטיית תקן מינימלית) אסימפטוטית, והדבר נובע ממשפט קרמר-ראו.
אני רק ניטפוקים 354993
טוב שלא הצלחת. תודה על הנטפוקים.
אני רק ניטפוקים 355010
בינתיים הסתדר לי בראש העניין של MLE. אני מבין שההנחה שיש 7 ממתינים "ממקסמת" את ההסתברות שהראשון שתשאל יהיה מס' 7. אבל עדיין יש לי הרגשה שמשהו פגום בדוגמה שהובאה ב-תגובה 354902 . הרגשתי היא שערכי ההסתברות שחושבו שם עבור ...,x=7,8,9 אינם ברי השוואה ולכן בדיקה סטטיסטית נכונה תראה שאין הבדל בנראות (likelihood) של 7 או 8 או ... ממתינים.
אני רק ניטפוקים 355024
הפעם אני לא ממש מבין, למה הם לא ברי השוואה?
אני רק ניטפוקים 355042
זו בעיקר הרגשה אי-נוחות לא מנומקת. אתה מעמיד אותי את בין 2 ברירות לא נוחות. אפשרות אחת היא להישאר בעמדת ספקנות בלתי מנומקת ו"מעליבה" ללא הצדקה. האפשרות השנייה היא להסתכן בכך שקלוני המתמטי (המתמטיקה שלי בסיסית והחלידה מחוסר שימוש)יחשף ע"י המתמטיקאים המקצועיים קוראי האייל (אולי יובל נוב הסטטיסטיקאי יגאל אותי ממצוקתי?).
אסתכן ואנסה להסביר:
א. בניגוד למה שסטודנטים מתחומים אחרים יכולים להתרשם, המתמטיקה אינה נסיון לבטא בצורה טכנית ולא-מובנת ללא-מתמטיקאים, עובדות טריביאליות. המתמטיקה היא נסיון להגיע בעזרת פורמליזם טכני ולא-מובן ללא-מתמטיקאים לתובנות חדשות ולא-טריביאליות.
ב. כפי שהסברתי, החישוב שלך מבטא ע"י השימוש בפורמליזם הסטטיסטי של MLE את העובדה הטריביאלית שככל שמספר הדגימות האפשריות עולה, הסיכוי שהדגימה הראשונה היא 7 יורד. זה לא אומר שהחישוב שלך אינו תשובה מצויינת במבחן בסטטיסטיקה השואל אותך מהי האפשרות בעלת MLE מירבי מבין ...,N=7,8,9.
ג. הבעיה היא שהחישוב שלך אומר משהו על ההסתברות עבור N=n שהדגימה הראשונה היא X1=7. הוא אינו נותן הערכה כמותית למה היא ההסתברות של N=n כאשר X1=7. כדי שתוכל להשוות בין המדגמים השונים אתה צריך לכמת בדרך כלשהי את ההסתברות הזו. נראה שבדוגמה שלך אין דרך לעשות זאת.
ד. הביטוי הפורמלי של מה שניסיתי להגיד הוא שלסכום ההסתברויות שחישבת אין שום משמעות.
אני רק ניטפוקים 355147
בשמחה אנסה לעזור.

שורש העניין הוא העובדה כי *פרמטר* של התפלגות, בשונה מ*תצפיות* הלקוחות מאותה התפלגות ומגדלים שאנחנו מחשבים מהן, הוא פשוט מספר קבוע, ואין בו שום דבר אקראי; נכון, אנחנו לא יודעים מהו המספר הזה (ולכן נאלצים לאמוד אותו מהתצפיות), אבל שוב - בפרמטר עצמו אין שום דבר אקראי ‏1.

דוגמת הממתינים בתור היא קצת לא אינטואיטיבית, לטעמי, להמחשת הנקודה, אז נעבור לרגע לדוגמא אחרת. קיבלנו שק ענק מלא פיסטוקים, חלקם פתוחים וחלקם סגורים. אילו היה לנו זמן וסבלנות למיין את הפיסטוקים, היינו יכולים לדעת בדיוק את אחוז הפיסטוקים הסגורים; אבל אין לנו, ואנחנו עדיין מעוניינים לאמוד את האחוז הזה, שנקרא לו p. נניח שמותר לנו רק לקחת פיסטוק אקראי מהשק, לבחון אותו, להחזיר, לקחת אחד אחר, וכך הלאה עשר פעמים. עוד נניח שעשינו זאת, וקיבלנו פ-פ-פ-ס-פ-ס-פ-פ-ס-ס (להלן: המדגם). חשוב להבין שבנקודה הזו אין משמעות לשאלות נוסח "מהי ההסתברות ש- p > 0.2 לאור המדגם?"; המספר p, שהוא בדיוק הפרמטר של ההתפלגות "פתוח או סגור" בדגימת פיסטוק יחיד, הוא מספר קבוע, ואין לו התפלגות משל עצמו - אם נתאמץ ונמיין את כל השק, נמצא בדיוק מהו.

מה עושים עכשיו? אפשר (אבל לא חייבים) לאמוד את p בשיטת הנראות המירבית. *אילו* היה ידוע ש- p = 0.2, למשל, אז ההסתברות לקבל את המדגם שקיבלנו היא

L(0.2) = (0.2)^4*(0.8)^6 = 4.19*10^-4

אילו היה ידוע ש- p = 0.6, אז ההסתברות לקבל את המדגם שקיבלנו היא

L(0.7) = (0.7)^4*(0.3)^6 = 1.75*10^-4

וכן הלאה. הפונקציה L נקראת "פונקצית הנראות", ואמד הנראות המירבית של p (הלא הוא ה-MLE) הוא המספר שמביא את L למקסימום, כלומר, המספר ש"תחתיו" מה שראינו הוא הכי סביר. במקרה שלנו, לא מסובך להראות שה-MLE הוא 0.4. לאמדי נראות מירבית יש תכונות סטטיסטיות "טובות", ולכן הם מאוד נפוצים.

דוגמת הממתינים בתור שקולה לסיפור הבא: קיבלנו שק עם מספר לא ידוע N של פיסטוקים, אבל מישהו (מטורף מספיק, מן הסתם) טרח וכתב על כל אחד מהם מספר סידורי מ-‏1 עד N. שוב, בהינתן מספיק זמן, היינו יכולים גם אנחנו לדעת בדיוק מהו N (פשוט נספור את הפיסטוקים), אבל נניח שאין לנו, ואנחנו מוציאים שלושה פיסטוקים אקראיים מהשק ומסתכלים על המספרים הסידוריים שלהם, והם 1000, 1500 ו-‏3600. הפרמטר פה הוא N, ופונקציית הנראות שלו היא אפס עבור N < 3600, ואחד חלקי N עבור N >= 3600. ה-MLE יהיה לכן 3600. באופן יותר כללי: בהינתן k תצפיות מהתפלגות אחידה על פני 1,...,N, ה-MLE של N הוא התצפית המקסימלית. כש- k = 1, האמד הזה יהיה בדיוק המספר היחיד שדגמנו.

אתה כתבת ב-ג' שהיית רוצה לדעת מהי ההסתברות ש- N = n בהינתן שהמספר (היחיד) שדגמנו הוא 7; מקווה שהצלחתי לשכנע אותך שלדבר בעצם אין משמעות.

אנקדוטה היסטורית: במהלך מלחה"ע השנייה, בעלות הברית אמדו את המספר הכולל של הטנקים הנאצים על סמך המספרים הסידוריים של הטנקים שלהם שנלכדו בקרב, בדרך דומה למה שעשינו כאן.

ועוד שלוש הערות:

1. האבחנה בין מה אקראי (ולכן יש טעם לדבר על ההתפלגות שלו) ומה לא בהסקה סטטיסטית היא לא אינטואיטיבית, ואני עצמי, למשל, הפנמתי אותה במלוא עומקה רק אחרי הקורס הראשון שלקחתי בססטיסטיקה.

2. האבחנה הנ"ל, על כל קשייה, בעצם לא קשורה לשיטת הנראות המירבית; גם כשמשתמשים בשיטות אחרות, היא קיימת.

3. לא תמיד זה "טוב" להשתמש באמדי נראות מרבית. למשל, כשמנסים לאמוד את N מהדוגמא השנייה כש-k (גודל המדגם) הוא נמוך, "כדאי" להכפיל את התצפית המקסימלית ב- (k+1)/k, מטעמים שלא אכנס אליהם כאן.
____________________
1 יש ענף בסטטיסטיקה שנקרא "סטטיסטיקה ביסייאנית" בו מניחים שלפרמטרים יש התפלגות, אבל אז צריך לדבר על הפרמטרים של התפלגות הפרמטרים. בואו נעזוב את זה.
תורת האמידה 355154
אני רק ניטפוקים 355155
טוב, אני נכנע לתורת האמידה.
בהדגמה של חישוב MLE מחשבים זכיות במשחק של 20 הטלות בעלות התפלגות בינומיאלית עם 0.75 סיכויי זכייה. מקבלים 16 זכיות. חישוב ה-MLE "אומד" שסיכוי הזכייה היה 0.8. אבל הנתון הסטטיסטי המשעותי יותר הוא ה- percent confidence interval האומר שיש 90% הסתברות שסיכוי הזכייה היה בין 0.56 ל-‏0.94. האם ניתן לקבל הערכה דומה לדוגמת הממתינים?
אני רק ניטפוקים 355162
כן, אפשר לחשב רווח סמך (confidence interval בעברית) לפרמטר/ים של התפלגות אחידה.

שתי הערות:

1. דומני שהתבלבלת, והתכוונת לכתוב 95% ולא 90%, אחרת המספרים לא מסתדרים לי.

2. הניסוח "יש 90% הסתברות שסיכוי הזכייה היה בין 0.56 ל-‏0.94" הוא בעצם חסר מובן. סיכוי הזכייה, שמסומן בד"כ ב-p, הוא קבוע שאין בו שום דבר אקראי, ולכן אין לו הסתברות של 90% (או 95%, או מה שזה לא יהיה) להיות בתחום זה או אחר. ניסוח מדויק יותר הוא "כשהפעלנו (פעם אחת) פרוצדורה המפיקה מרווחים אקראיים בעלי הסתברות של 95%, כל אחד, להכיל את p, קיבלנו את המרווח (0.56,0.94)".
אני רק ניטפוקים 355401
צודק. זה 95%.
אני חושב על רווח הסמך כך: אם תשחק את המשחק שהוגדר למעלה הרבה מאוד פעמים עם p אקראי מתוך התפלגות אחידה ותתחשב רק במשחקי ה-‏16 זכיות, ואם תחזור על כך מספר מספיק של פעמים, ערך התצפית של מספר המשחקים שבהם p היה מחוץ לרווח הסמך הוא 5%.
אני רק ניטפוקים 355432
אם הבנתי אותך כהלכה, אז אין זה נכון לחשוב כך על רווחי סמך, והמשפט שרשמת הוא שגוי מתמטית.

רווחי סמך "רגילים", מהסוג בו השתמשת בתגובה 355155, *לא* מדברים על מצב בו לפרמטר יש התפלגות (אחידה או אחרת). שוב - הפרמטר הוא מספר קבוע, אך לא ידוע לנו. בסטטיסטיקה בייסיאנית המצב שונה, אבל כאמור, בוא נעזוב את זה.

הפרשנות שצריך לתת לרווחי סמך (במקרה הבינומי עם n = 20) היא כדלהלן: מישהו בחר, לא משנה איך, במספר p בין אפס לאחד; אתה צופה במספר רב של תצפיות בלתי תלויות מהתפלגות בינומית עם פרמטרים 20 ו-p, ועל בסיס כל תצפית, בונה רווח סמך של 95% ל-p ע"פ הנוסחה המתאימה (הרווחים יהיו שונים זה מזה, משום שהתצפיות הן שונות זו מזו). אז, בערך 95% מהרווחים שבנית יכילו את p, ובערך 5% לא.
אני רק ניטפוקים 355504
טוב, ברור שאנו חלוקים בנקודה זו. ברור שהפרמטר p אינו המשתנה האקראי, אבל אנו חלוקים אם יש משמעות ל"התפלגות" של בחירת הפרמטר. הדוגמה שהבאתי היא הדוגמה של מטלב לפונקציה mle. החישוב של ה-pci שם לא מסובך במיוחד, אבל אני כבר שכחתי את כל הסטטיסטיקה שלי. בכל אופן נראה לי שה"נוסחה המתאימה" שם היא בערך שימוש בהתפלגות F עבור הפרמטר (כאשר התפלגות F כמו התפלגות הסטודנט הידועה הן התפלגויות שבד"כ מייחסים לקומבינציות של פילוגים אקראיים עם פילוגים של הפרמטרים שלהם אאז"נ). אתה יכול להסתכל בקוד המקור ולבדוק אם החישוב מתיישב עם הפרשנות שלך (אני לא כל כך הבנתי אותה). אם תרצה אני יכול לשלוח לך את קוד החישוב. בכל אופן יהיה נחמד אם תרענן את זכרוני מהי התפלגות F, ואיך היא קשורה לפרמטרים של פילוג בינומי, אם בכלל.
אני רק ניטפוקים 355680
לפרמטר p אין התפלגות, וגם אין "התפלגות". שוב - הוא סתם מספר קבוע, ולא משנה איך הוא נבחר.

אני אנסה להסביר טוב יותר למה התכוונתי בתגובה הקודמת, ואיך צריך לפרש רווחי סמך במקרה שלנו.

ניקח לדוגמא את המספר 0.61 (סתם מספר שבחרתי). סיבוב ראשון: נגריל משתנה מקרי בינומי עם פרמטרים 20 ו- 0.61, ונניח שקיבלנו 9; נשלוף את הנוסחה (או פונקציית המטלב) המתאימה, ונחשב את רווח הסמך המתאים ל- p כאן, שהוא (0.23,0.68). סיבוב שני: נגריל משתנה מקרי בינומי נוסף עם פרמרטרים 20 ו- 0.61 (כן, שוב 0.61), ונניח שעכשיו קיבלנו 14; רווח הסמך השני יהיה (0.46,0.88). סיבוב שלישי: נגריל, נניח, 11, ונקבל ממנו רווח סמך (0.32,0.77). וכך הלאה וכך הלאה.

תורת האמידה מוכיחה שאחרי מספר רב של סיבובים, בערך 95% מרווחי הסמך יכללו את המספר 0.61 ובערך 5% לא ‏1. אילו היינו חוזרים על כל הסיפור עם 0.289 במקום 0.61, אז שוב: בערך 95% מרווחי הסמך יכללו את המספר 0.289 ובערך 5% לא. וכן הלאה ‏2.

פונקציית המטלב mle משתמשת בפונקציה binofit, והחישובים בזו האחרונה מתיישבים בדיוק עם הדברים שכתבתי לעיל. אפשר לקרוא על החישובים יותר בנוחות ב- http://www.statsresearch.co.nz/pdf/confint.pdf . תזכורת: לשיטת הנראות המירבית אין קשר לפרשנות של רווחי סמך.

על התפלגות F אפשר לקרוא, למשל, ב- http://mathworld.wolfram.com/F-Distribution.html . הקשר היחיד שלה שאני מכיר להתפלגות הבינומית הוא דרך רווחי הסמך עליהם אנחנו מדברים, ואתה מוזמן לקרוא עליו בלינק הקודם שצירפתי.

אם אני מבין נכון את מה שכתבת בתגובה 355401, אז אתה מציע את הנרטיב הבא: בכל סיבוב, אנחנו מגרילים p מתוך התפלגות אחידה על [0,1], ואז מגרילים משתנה מקרי בינומי עם פרמטרים 20 ו- p; אז, בטווח הארוך, ב-‏95% מהסיבובים בהם קיבלנו 16 (אנחנו מתעלמים מהסיבובים בהם לא קיבלנו 16), p היה בין 0.56 ל-‏0.94.

זה פשוט לא נכון. חישבתי ומצאתי שבתנאים הנ"ל, פרופורציית הסיבובים בהם p היה בין 0.56 ל-‏0.94 (מתוך הסיבובים בהם קיבלנו 16) היא 98%, ולא 95% (מקווה שלא טעיתי בחישוב, יש שם כל מיני פונקציות בתא וכאלה).

_______________
1 ההתפלגות הבינומית היא התפלגות בדידה, דבר הגורר סיבוך טכני נוסף ב"פרשנות" של רווחי סמך, אבל בוא נעזוב את זה. העיקרון מאחורי מה שכתבתי הוא מדויק.
2 זה נכון שגם אם נבחר p חדש בכל סיבוב (לא משנה איך), אז בטווח הארוך, 95% מהרווחים יכללו את p של הסיבוב שלהם, אבל זה לא לב העניין.
אני רק ניטפוקים 355743
יובל, היות והלינק שצרפת http://www.statsresearch.co.nz/pdf/confint.pdf ממש מפתח את הקשר בין רווחי הסמך של פילוג בינומי לפונקציית F (כלומר מפתח את מה שקראת "הנוסחה המתאימה"), אני חושב שמוטב ששנינו נקבל את ההגדרה שלו לרווח הסמך (נוסחאות 1 ו-‏2): עבור פילוג בינומי עם n משחקים ו-x הצלחות ונניח שהסמך שלנו הוא 95%. רווח סמך של (Φ,Ψ) אומר שההסתברות שהמשתנה האקראי X (מספר ההצלחות) בפילוג של n משחקים עם סיכוי הצלחה p=Φ, יהיה גדול מ-x הוא 2.5% (ומשהו מקביל עבור Ψ). אני חושב שזה תואם את ההגדרות שלך (אין פילוג על הפרמטרים).
לגבי ההגדרה שלי יש לי את האפשרות לחשב בעצמי או להאמין לך (98%). אני בוחר כמובן באפשרות הקלה ומרים ידיים (בפרט שאני חושב שהבנתי את ההגדרה שלמעלה).
וחוב אחרון: יוסי השחור ואתה צדקתם בעניין חוסר המשמעות של ההסתברות של מספר הממתינים להיות כזה או אחר. כל העיסוק פה הוא סביב ההסתברות שהנשאל הראשון שלך יהיה מספר כזה או אחר בתור.
גול עצמי? 355784
שאלה ליובל נוב
בדוגמת התור, או הפיסטוקים, או הטנקים: אם נאמוד את N כממוצע המדגם כפול שתיים, האם היעילות תקטן?
גול עצמי? 355788
לפני שאני עונה: למה אתה קורא "המדגם" (האם שואלים רק איש אחד בתור, או כמה?), ולמה בדיוק אתה מתכוון ב"יעילות"?
גול עצמי? 355847
אם שואלים רק איש אחד אז הוא המדגם, אבל נניח ששואלים מספר אנשים. וב'יעילות' אני מתכוון לשונות קטנה (ניסיתי להשתמש במונחים שלך).
גול עצמי? 355889
השונות (וכמובן גם סטיית התקן) של האמד "פעמיים הממוצע" היא גבוהה מזו של האמד "התצפית הגבוהה ביותר", ולכן במובן זה האמד השני עדיף. הנ"ל נכון גם אם המדגם הוא של ממתין/פיסטוק/טנק בודד, וגם אם "מתקנים" את האמד השני לאמד חסר הטייה על-ידי כפל ב- n+1 חלקי n (פה n זה גודל המדגם).

במונחים של יעילות, אומרים במקרה זה כי *היעילות היחסית* של האמד "התצפית הגבוהה ביותר" היא גדולה מ-‏1, יחסית לאמד "פעמיים הממוצע" (יעילות יחסית זה סתם יחס שונויות). כשאומרים על אמד שהוא "יעיל" - לא ביחס לאמד אחר, אלא סתם, יעיל - מתכוונים שהשונות שלו משיגה את החסם התחתון על שונות אמדים שמציב אי-שוויון קרמר-ראו. הנקודה היא שמשפט קרמר-ראו לא חל על המקרה שלנו, משום שפונקצית הצפיפות של ההתפלגות האחידה לא עומדת בתנאי המשפט (היא לא "חלקה" מספיק), ונוצר מצב מבורך בו השונות של שני האמדים דנן היא *עוד יותר* נמוכה מהחסם התחתון.
תודה על ההבהרה 355897
  אני רק ניטפוקים • יובל נוב
  אני רק ניטפוקים • האייל האלמוני
  סיכוי טוב יותר • אפופידס
  אני רק ניטפוקים • שוטה הכפר הגלובלי
  אני רק ניטפוקים • יובל נוב
  אני רק ניטפוקים • שוטה הכפר הגלובלי
  אני רק שאלה • ראובן

חזרה לעמוד הראשי

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים