|
||||
|
||||
נתחיל מהחלק הקל (שמשום מה אף אחד לא התייחס אליו, עד כמה שראיתי) לפחות לגבי 3 כדאי להחליף, לא? |
|
||||
|
||||
ודאי. לכן אם מישהו היה אומר "אני פותח את המעטפה, אם יש שם 3 אני מחליף ואחרת <אלגוריתם כלשהו שאינו "החלף בוודאות">" היה הגיון בשגעון. לעומת זאת מי שאומר "אני פותח את המעטפה, אם יש שם 3 אני מחליף ואחרת אני גם-כן מחליף" וגם אומר "ברור שעד שפתחתי את המעטפה אין טעם להחליף" צריך עדין להסביר מה קורה כאן. גם ברור לי למדי שהכנסת ה"תועלת" (לעומת התוחלת) עם התפוקה השולית הפוחתת, כמו שעשה תובל באחת מתגובותיו, עוזרת להיחלץ מהסבך, לפחות טנטטיבית. עדיין אני מחפש תשובה מניחה את הדעת בעולם בו התועלת ליניארית, וגם לקבל קצת מספרים אמיתיים על העולם שלנו. כמה כסף אתה מוכן לשלם תמורת השתתפות במשחק? (ההצעה הטובה ביותר עד כה: 99 אג'). 99 אג' פעם ראשונה... 99 אג' פעם שניה... הג'נטלמן בשורה האחרונה - כמה אמרת? |
|
||||
|
||||
מי נתן לך הצעה טובה מ-50 אג'? |
|
||||
|
||||
אני נותן 4-5 שקלים. אבל אם המשחק הוא חד פעמי ואין אפשרות להוראת קבע המשחק שלך מאוד מבאס (הסיכוי שלי להרוויח סכום שהוא יותר מעשרות שקלים הוא נמוך מאוד). |
|
||||
|
||||
זה באמת שמרני עד אימה. |
|
||||
|
||||
מכיוון שאתה כבר שואל אותי- מישהו שהיה מציע לי משחק כזה, הייתי מתעלם ממנו כי ברור לי שאין לו משאבים לעמוד בהתחיבויותיו. |
|
||||
|
||||
כמובן. הטענה היא שגם ל-9 כדאי להחליף. מה דעתך? אפשר אולי לערוך סיכום-ביניים של המצב. השאלה מציגה אתגר לאינטואיציה: לכאורה כדאי תמיד להחליף, ולכאורה אין שום טעם להחליף (יכולת מראש לחשוק במעטפה הדרומית, לפתוח את השנייה ולחזור בתרועה לזו שרצית). כיוון אחד לחידוד הבעייה הוא מתמטי. האם ניתן לנסח את הסתירה הזו כשני חישובים שונים של אותו ערך המובילים לתוצאות שונות? ניסינו, למשל, לחשב את תוחלת הרווח, שהיא כאילו חיובית וכאילו אפס. הגענו למסקנה שאין כזו תוחלת. מתמטית, אפשר להירגע; אינטואיטיבית, לא נראה שהתקדמנו. אפשר לפטור כלא מעניין את כל המצב הזה, פשוט כי הוא לא ייתכן: המוסד שמארגן את המשחק הזה זקוק לאינסוף משאבים כדי לעמוד בהבטחות שלו. זה נכון, ולכן אני לא בטוח שאפשר להסיק מסקנות מרחיקות לכת מהחידה; אם מדמיינים שמשהו בלתי-אפשרי קרה, אין מה להתפלא אם קורים עוד דברים מוזרים אחר-כך. עם זאת, אפשר לנסות לחשוב מה בכל-זאת צריך לעשות אם עומדים במצב הזה. תשובה אפשרית אחת הוא שנימוק ההחלפה עומד בעינו: אחרי שראית מה יש במעטפה, אכן כדי להחליף. ומה, שואל שכ"ג, הרווחנו מכך שבכלל פתחנו אותה? דב סאמט (אותו הזכרתי קודם) כתב לי בהקשר הזה כך: That is, it is possible that one wants to do something for ANY אני חושב שעוזי אמר דבר דומה.
information one gets, and yet one has no reason to do it without having the information. Obviously this cannot happen in a finite setup. So, here is yet another case where infinity is counter intuitive. |
|
||||
|
||||
אצתדק ואומר שכתבתי את התגובה שלי בלי לקרוא את זאת. |
|
||||
|
||||
אתה חי בשלום עם הטענה הזאת? |
|
||||
|
||||
אבל כתוב במפורש שאין עם זה שום בעיה, ועוד באנגלית. אתך במאבקך הצודק, (-) |
|
||||
|
||||
אני באמת סקרן - יש לך דרך ליישב את הבעיה? |
|
||||
|
||||
הדרך הקלה: להגיד שאני לא רואה שום בעיה (למרות שזה לא ממש נכון). במקום הבעיה של אלון, אני מעדיף לחשוב על הווריאנט של אורי, עם שתי מעטפות בלתי תלויות (שבכל אחת מחביאים 3-בחזקת-מספר-המטבעות-עד-עץ). כדי להגדיל את המוטיבציה לבחור במעטפה הראשונה, אני מציע *להכפיל* את הסכום במעטפה הזו. מבחינה מתמטית, כפי שאלון ציין, למשתנה המקרי שמודד את הרווח במקרה של החלפה *אין תוחלת* (הטור לא מתכנס) - אבל זה נכון רק *לפני* שדגמנו את המעטפה הראשונה. אחרי הדגימה, יש למשתנה הזה תוחלת - והיא תמיד אינסופית. לכן כדאי לעבור מן המעטפה הראשונה לשניה - וההחלטה הזו לא תלויה בערך שמצאנו שם. שרלוק הולמס אמר על מצבים כאלה שכאשר מסירים את הבלתי אפשרי, מה שנשאר - בלתי סביר ככל שיהיה - מוכרח להיות האמת. הוכחנו שאחרי שפותחים את המעטפה הראשונה, כדאי (מבחינת התוחלת) תמיד להחליף; אז ככה זה. |
|
||||
|
||||
אם כך אתה חי בשלום עם ה"הסבר" של דב סאמט. אתה מכיר עוד דוגמאות בהן ניתן להוכיח מתמטית שמשתלם לעשות משהו חסר כל טעם? למשל, אתה יכול לדמות מצב בו קטע הקידוד If A then func() עדיף עלelse func() func()
? |
|
||||
|
||||
(בלי שטויות כמו איזו תועלת שיכולה לנבוע מהעיכוב הקטן של ביצוע הקטע הראשון) |
|
||||
|
||||
הסיטואציה הבסיסית, שבה אתה מעניק לי מתנה בשווי אינסופי, כל-כך מופרכת, עד שזה לא מפתיע שהאינטואיציה שלנו לגבי קבלת החלטות מסתבכת. מבחינת התוחלת אין שום הבדל בין מעטפה עם 3-בחזקת-X (כאשר X הוא מספר המטבעות עד העץ הראשון) לבין 1000-בחזקת-X. |
|
||||
|
||||
כמו שנהוג לומר כאן לאחרונה: אני צריך לישון על זה (למרות שאני מעדיף מזרן וכרית). בניסוח עם המעטפות אני לא באמת מעניק לך מתנה בגודל אינסופי אלא בגודל סופי בהחלט (אותו 3-בחזקת-x, כשאת x קיבלתי אחרי מספר סופי של הטלות מטבע) אלא שהגודל הזה אינו ידוע לך. אתה יכול *לחשוד* בי שאם הוא יצא גדול מדי אני רימיתי, ואז עפ"י הסכום במעטפה אתה כבר יכול להחליט לא להחליף אותה אם הוא גדול ("שכ"ג בטח לא סיכן 3 מיליארד שקל בשביל הניסוי הטפשי הזה. אסתפק הפעם במיליארד") - אבל זה כבר סיפור אחר, וכאן באמת יש טעם לפתוח את המעטפה. |
|
||||
|
||||
אם נחזור רגע לסיפור עם המטבעות. גם אם מובטח לי שהטקטיקה שתבחר תהיה להמשיך עד שתפסיד את הכל, ז"א שאני לא אתן לך בסוף דבר בשום מקרה, גם אז אם אני אנסה לחשב את התוחלת אני אקבל שתוחלת ההפד שלי היא אין סופית (למרות שהרווח שלך הוא אפס). איפה פספסתי את התשובה? |
|
||||
|
||||
אני לא חושב שזה נכון (שתוחלת ההפסד שלך היא אינסופית). במקרה הזה תוחלת ההפסד שלך תלויה באסטרטגיה שלי (שיכולה להיות "עצור כשמציעים לך 3", "עצור כשמציעים לך 9", ... או "אל תעצור לעולם"), ולכל אסטרטגיה יש לי (ולך) תוחלת רווח אחרת. בסדרת האסרטגיות הזו, התוחלת שלך לא חסומה (כי אני עלול לחכות עד שיציעו לי 3-בחזקת-מאה, וזה יקרה בסיכוי חצי-בחזקת-מאה), אבל בכל מקרה אני לא חושב שאפשר לומר שהיא אינסופית. |
|
||||
|
||||
ואם האסטרטגיה של הבוחר היא "אל תעצור לעולם"? |
|
||||
|
||||
טענה יפה. הנה הלך המחשבה שלי בעניין ( אני מדבר על המשחק ללא המעטפות): למעשה עלינו להחליט על איסטרטגיה שאומרת: אני משחק לכל היותר K פעמים. זה נותן תוחלת סופית. רק נותר לקבוע מהו K. נשים לב שבכל נקודה במשחק, המשחק הבא הוא למעשה אותו משחק בדיוק, רק עם סכום התחלתי חדש, מכאן שאם משיקולים כל שהם אנו מחליטים על איסטרטגיה של K צעדים, אותם שיקולים ימשיכו להיות נכונים בכל צעד במשחק, ומכאן שאי אפשר למצוא K סופי כזה. בוא נקבל את ההנחה ש "אל תעצור עד שתפסיד" היא איסטרטגיה בלתי קבילה, ואז לכאורה אין לנו כלל איסטרטגיה "רציונלית". *אבל* - מה שבעצם הראינו היא שאם קיימת איסטרטגיה שאומרת לנו מתי להפסיק, היא צריכה להיות "אינווריאנטית" לנקודת התחלת המשחק. לכן אני מציע איסטרטגיה בזאת: לפני כל צעד, הטל מטבע עם הסתברויות p 1-p . אם מקבלים עץ- ממשיכים, אחרת מפסיקים. האיסטרטגיה הזאת מקיימת את הדרישה (שהמצאנו עכשיו) , שלא משנה באיזה שלב אתה במשחק, תמיד עושים אותו דבר. השאלה היחידה היא איזה ערך של p יש לבחור. ברור שכמה שהוא יותר קרוב ל1 כך התוחלת תגדל ולכן הפארדוקס הפסיכולוגי נותר כשהיה, אבל לפחות סילקנו את שאלת הפוקר היהודי ( בחרת K? שיחקת K ולא נכשלת? למה שלא תמשיך עוד K, הרי לפניך אותו מצב בדיוק). |
|
||||
|
||||
קל להיחלץ מהסבך עם איסטרטגיות מהסוג הזה. בשביל מה, אגב, אתה מטיל מטבע? למה לא איסטרטגיה "שחק X סיבובים"? אה, זה בעצם מה שעוזי אמר? חרמפפפ. הבעיה היא לא למצוא איסטרטגיה, אלא ל*הצדיק* אותה (בהנחת תועלת לינארית בתוחלת, אחרת כל העסק קל מדי). |
|
||||
|
||||
כי כמו שאמרתי, הלוגיקה שהביא אותך לשחק X סיבובים היא שיקול נכון בכל שלב במשחק. אני מנסה לפרמל את השאלה כך שלא יתקלו1 כל פעם במכשול הזה. אני מסכים עם סמיילי שהשאלה דבילית. על תרמיות פונצי כבר דיברנו פעם? דיברנו תגובה 278934. 1 על מי אני עובד. כדי ש*אני* לא אתקל כל פעם. חשבתי שזה עשוי גם לעניין אחרים. |
|
||||
|
||||
הבנתי. על שיטת פונצי (בנוסח טיפה שונה) דיברתי עם טובה עד לפני זמן מה. |
|
||||
|
||||
לא תמיד ברור איפה פונצי נגמר ו''כלכלה היא לא משחק סכום אפס'' מתחיל. |
|
||||
|
||||
זה רעיון יפה מאד - הוא מאפשר לממש את ה"הבטחה" לרווח אינסופי. נניח שהמשחק מתחיל בהצעה בגובה שקל אחד, ואתה צריך בכל שלב להחליט אם לממש את הפרס או להמר (ואז להפסיד לגמרי או לשלש את הפרס, בסיכויים שווים). באסטרטגיה ההסתברותית, אנחנו נותנים לקוביה להחליט בשבילנו: בסיכוי p מממשים, בסיכוי q=1-p מהמרים. תוחלת הרווח בשיטה הזו היא (2p/(3p-1 אם p גדול מ-1/3, ואינסוף אחרת! |
|
||||
|
||||
שים אותי co-author , אשמח להקטין את הארדוש שלי:) |
|
||||
|
||||
אם תעדן את זה עוד קצת, כך שאתה משנה את p בהתאם לגובה הפרס בשעת ההטלה כדי להכניס למשחק שיקולי תועלת (להבדיל מתוחלת), זה יהיה בכלל יופי. לא? |
|
||||
|
||||
קצת מסובך לטפל ב"תועלת" (שקלול של תוחלת ושונות?), כי התוחלת אינסופית כל הזמן. |
|
||||
|
||||
ה"תועלת" שאני מדבר עליה מבטאת את הערך השולי הפוחת של הכסף. אני רוצה ש p יהיה כמעט 1 כשהסכומים קטנים, ויקטן עם עלייתם כך שכאשר יש לי כבר מליון שקל מובטחים אני אפרוש בשמחה ולא אסכן אותם בסיבוב נוסף. |
|
||||
|
||||
הבעיה היא שההחלטה על הסכום "מליון" בתור נקודת הcut off היא שרירותית. ברגע שעשית את זה, בעצם הכרזת שאתה לא מאמין למשחק הזה מעבר לסכום נתון. |
|
||||
|
||||
האמת היא שאחרי ששלחתי את התגובה ההיא חשבתי שאם כבר מכניסים את שיקולי התועלת אין צורך בהטלת הקוביה שכן הבעיה נפתרת מאליה במקום בו הרווח השולי של זכיה נוספת קטן מההפסד של הסכום שיש בידי באותו רגע. אם פונקציית התועלת אינה ידועה לי לגמרי (ברנולי חשב שהיא לוגריתמית, אבל אפילו אם הוא צדק היא בטח שונה לאנשים שונים) הקוביה יכולה להכניס קצת ''פאזינס'' לעסק. |
|
||||
|
||||
להגיד שהתועלת היא לוגריתמית זאת רמאות. אז תשנה את סכום הזכיה ל שלוש בחזקת שלוש בחזקת N. העניין הוא לא לטשטש את הגבול, אלא לאפשר תוחלת אין סופית מבלי להכנס לפרדוקס של עומר: אל תפסיק עד שתפסיד. |
|
||||
|
||||
אני לא מבין, לכאורה למשחק תוחלת אינסופית אבל אם תשחק אותו אינסוף פעמים בטוח תפסיד. לכאורה אי אפשר לייצר אסטרטגיה מתמטית למשחק. מה הבעיה להשתמש באסטרטגיה כלכלית תוך שימוש בתועלת ? הרי המטרה היא להרוויח, לא? |
|
||||
|
||||
אם אתה רוצה להגדיר פונקציית תועלת בהתאם לתנאי הבעיה זה לא קשה, אבל אם הפונקציה הזאת קשורה לענייני כלכלה באופן כללי - כלומר לשאלה מה ערכו של הדולר ה- 1,000,001 יחסית לדולר הראשון ולדולר ה 1,000,000,001 עבורך (בלי שום קשר למשחק ספציפי), הרי אפשר להמציא משחק בו היא תמשיך לגדול לעד באופן שלא יאפשר לך לפרוש ולגשת לקופה, אם אתה טיפוס רציונלי ועקבי. למשל, כמו שראובן הראה, אם פונקציית התועלת שלך לוגריתמית, מתי תפרוש ממשחק בו הרווח גדל יותר מהר מאקספוננט? כדי להיחלץ מזה צריך פונקציית תועלת חסומה מלמעלה, וזאת קצת בעיה (אם כי אולי לא בעיה עצומה) כשמסתכלים על כל מיני ביל גייטסים שממשיכים לצבור הון כמיטב יכולתם במקום לעשות משהו אחר עם הזמן שמוקצב להם בעולם הזה. פונקציית התועלת שלי, אני חושב, אכן מוגבלת מלמעלה בסביבות 50 מליון דולר. |
|
||||
|
||||
>> הרי אפשר להמציא משחק בו היא תמשיך לגדול לעד באופן שלא יאפשר לך לפרוש ולגשת לקופה התועלת *תמיד* מוגבלת מלמעלה. אין ליצור אנוש תועלת אינסופית. >>כשמסתכלים על כל מיני ביל גייטסים שממשיכים לצבור הון כמיטב יכולתם אתה בוודאי מתכוון לסטיב באלמר ולא לגייטס, אשר חילק כבר בערך מחצית הונו הנוכחי לצדקה, והתחייב להוריש לכל יורשיו סכום "פעוט" של 10 או 100 מיליון דולר בלבד. |
|
||||
|
||||
נו, אנחנו מדברים פה על "אידאליזציות": 1) מדובר בשחקן רציונלי (קרי- יצור שמעוניין בהגדלת תוחלת התועלת שלו) 2) לתועלת הזאת אין גבול עליון 3) לבנק במשחק יש יכולת לספק כל תועלת שנרצה. אולי תטען שהפרדוקס האמור מראה ששלושת ההנחות סותרות זו את זו, אבל אם תקרא בעיון את הפתיל, תמצא דרך אחת לפחות לזכות בתועלת אינסופית (בממוצע). מצד שני, אם תטען שהפרדוקס הזה לא רלוונטי לחיי אנוש, אולי אתה צודק. |
|
||||
|
||||
אני לא בטוח בכלל שהתועלת תמיד חסומה למלמעלה. מיד אחרי שחישבתי את החמישים מליון ההם הבנתי שאני משקר. יש המון מטרות נעלות שהייתי בשמחה תורם להן כסף אם היה לי, החל מהקרן להצלת שבלול החוף הסיישלי ועד תשלומי פנסיה לכל אזרח ישראלי מעל גיל 22 (גם הקרן להגנת האייל היתה נהנית מכמה מליונים קטנים). בקיצור, הרצון לאסוף כסף כדי לתרום אותו לא חוסם את פונקציית התועלת. |
|
||||
|
||||
נדבר שוב כשתגיע ל-35 מיליון. האמת, לא נכון. רציתי לגבות את זה בטענת-השרוול שאנשים שאופק העושר שלהם מוגבל ב-50 מיליון הם לא הטיפוסים שיגיעו גם לחמישה מיליון. אבל נזכרתי במוסף ה"מרקר" מאחד החגים האחרונים, שהוקדש לעשירי הייטק שמקדישים עצמם ליוזמות למען הקהילה. כמעט כולם התעשרו מהנפקה מוצלחת בימי הבועה, וכמעט אצל כולם היה המוטו שכבר אין להם באמת מה לעשות למען עצמם עם הכסף. יכול להיות שטענת השרוול שלי לא מופרכת, אבל ברור לפחות שבועות הייטק יכולות לייצר יוצאים מן הכלל ברוכים. |
|
||||
|
||||
אם פונקצית התועלת שלך חסומה, הרי שהיא לא יכולה להיות אדטיבית בשום צורה ולפיכך ניתוח המשחק תלוי בכמה כסף יש לך כרגע ומה התחזית העתידית שלך. לא שזה לא הגיוני , אבל זה מסבך את הניתוח. |
|
||||
|
||||
למיטב הבנתי ברגע שמכניסים "תועלת" לא ליניארית ניתוח המשחק תלוי בכמה כסף יש לך כרגע, גם היא לא חסומה (אזהרה: אני לא מתמטיקאי כך שאם אני טועה אנא הסבר לי את זה במונחים שכל הדיוט יבין). |
|
||||
|
||||
מיטב הבנתך נכונה. בעצם רק ציינתי שחסומה גורר לא לינארית. |
|
||||
|
||||
או קבועה, כמובן, אלא שאז אין שום טעם למשחק שלנו ואפשר לעשות דברים טובים יותר עם הזמן. |
|
||||
|
||||
"ואפשר לעשות דברים טובים יותר עם הזמן." מה למשל? |
|
||||
|
||||
לענות על שאלות טרחניות של אלמונים. |
|
||||
|
||||
אני מדבר על המקרה בו הטקטיקה (שיהיה אסטרטגיה) שלך נתונה מראש, והיא אם המטבע נופל על פלי תמשיך (בסכום מושלש) ואם על עץ, תפסיק (ולא תקבל כלום). אני חושב שהתוחלת עבור אסטרטגיה כזו היא אין סופית (כשלוקחים אותה כגבול של תמשיך עד שהמטבע נופל על עץ או עד שנגמרים N משחקים, כש-N שואף לאינסוף), למרות שהרווח שלך יהיה בכל מקרה אפס. |
|
||||
|
||||
הנה חישוב אלטרנטיבי לתוחלת: אם בהסתברות 1 הרווח הוא 0, התוחלת צריכה להיות 1*0=0. איך מיישבים את הסתירה? |
|
||||
|
||||
(לשניכם) אין כאן סתירה. אם האסטרטגיה ה-N אומרת לעצור ברגע שמציעים לך 3-בחזקת-N, אז התוחלת שלה היא (3/2)-בחזקת-N, ולכן סדרת התוחלות שואפת לאינסוף. מאידך, אפשר להסכים שכאשר N שואף לאינסוף, סדרת ה*אסטרטגיות* "שואפת" לאסטרטגיה החמדנית שאומרת "אל תעצור לעולם". אבל באסטרטגיה הזו (בהסתברות 1) הרווח הוא 0, ולכן התוחלת שלה אפס. אם כך, הוכחנו שהתוחלת אינה פונקציה רציפה של האסטרטגיה. |
|
||||
|
||||
(אתה יכול להסתפק במשפט הראשון והאחרון, את השאר אני מאמין שהבנתי) |
|
||||
|
||||
אתה חושב שסתם ציטטתי את דוב סאמט במקום להגיד מה דעתי? אין לי ממש מושג. כזכור, תנאי-ההתחלה כאן הם אבסורדיים, ולכן העסק לא מדיר שינה מעיני; בפרט, לשאלתך על התוכנית - התשובה היא שמן הסתם אפשר לקצר כל if then כזה לפקודה האחת. מחשב הוא לא המקום לחפש בו תוחלות-רווח לא חסומות. |
|
||||
|
||||
המממ. אתה מנסה לרמוז שאנחנו לא מכונת טיורינג? |
|
||||
|
||||
שאני, מכונת טיורינג בלה שכמוני, ארמוז דבר כזה? אם לא הייתי מכונת טיורינג, הייתי נעלב :-) אני חושב שאתה מבין למה התכוונתי. אם לא, שוּט. |
|
||||
|
||||
נו, כך נפלה לה עוד אשליה... |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |