שאלה בתורת המשחקים 339609
לאלו שמבינים בזה קצת, זו בעיה שנתקלתי בה (כתובה בספר) לפני זמן מה ולא הצלחתי לחשוב על פתרון. קוראים לבעיה פרדוקס האינדוקציה לאחור. אם נסתכל על לדוגמה על דילמת אסיר חוזרת שמתרחשת עשר פעמים. ונתחיל מהניתוח של המשחק האחרון דווקא, נגלה שבמשחק העשירי כבר אין בעצם אופק עתידי לחשוב עליו כך שהאסטרטגיה ששולטת חזק היא כמובן בגידה. אבל אם במשחק העשירי אין אופק עתידי, גם במשחק התשיעי אין אופק עתידי (כי המשחק ה10 כבר מכור מראש) אבל למשחק התשיעי אין אופק עתידי, אז כך גם למשחק השמיני. וכך הלאה באינדוקציה...

ניתן להגיע בעצם למסקנה שהאסטרטגיה הכי טובה במקרה של דילמת אסיר חוזקת עם מספר ידוע של פעמים היא תמיד לבגוד, דבר שכפי שידוע לנו אינו ממקסם את פונקציית המטרה בהכרח. מה הפתרון?
שאלה בתורת המשחקים 339655
ככל הידוע לי אין פתרון מתמטי לפרדוקס.
אני מניח שבמונח פתרון אתה מתכון לכך שרוב בני האדם בהנתן דילמת האסיר חוזרת עם 100 שלבים יצליחו לשתף פעולה 90+ פעמים ויבגדו רק פעמים בודדות בסוף, מה שבברור מוצלח יותר לשני הצדדים מאשר בגידה תמידית. לדעתי זו פשוט דוגמא לכך שדרישת הרציונליות ממושג הפתרוןהיא חזקה מדי.
מתמטית, אם אנחנו מחפשים מודל קרוב שבו התופעה נעלמת, אפשר להסתכל על דילמת אסיר חוזרת שמסתיימת אחרי כל שלב בהסתברות קטנה, נאמר מאית. בתוחלת יהיו מאה שלבים אבל אין שלב אחרון (כלומר שידוע מראש שהוא אחרון) ותוחלת הרווח משיתוף פעולה עתידי עולה תמיד על הרווח מבגידה חד פעמית.
שאלה בתורת המשחקים 339683
תקן אותי אם אני טועה, אבל להגיד שכדאי להם לשתף פעולה במשחק חוזר זה כמו להגיד שכדאי להם לשתף פעולה במשחק יחיד: מצבם יהיה טוב יותר, אבל זו לא נקודת שיווי-משקל נאש.
שאלה בתורת המשחקים 339693
אתה לא טועה. ההבדל בין שני המשחקים הוא לא מתמטי אלא התנהגותי. במקרה של דילמת האסיר הרגילה, לרוב אנשים יבגדו.
במקרה ה-‏100 שלבי, לרוב ישתפו פעולה כמעט בכל השלבים. הסיבה היא כנראה הפער בין מה שאפסיד עם השני יתחיל לבגוד כבר בשלב ה-‏97 לבין מה שארויח משיתוף הפעולה ב-‏96 השלבים הקודמים.
שאלה בתורת המשחקים 339836
לא הצלחתי להבין איך מתנהל משחק חוזר של דילמת האסיר.
שאלה בתורת המשחקים 339856
פשוט משחקים את דילמת האסיר מאה פעמים. לצורך הענין התשלום לא יהיה שנים בכלא אלא כספי.
שאלה בתורת המשחקים 339867
זה בדיוק מה שאני לא מבינה. כלומר, הרעיון הוא שהאסירים משתחררים, נתפסים בפשע נוסף, ושוב עומדים בפני אותה ברירה? או שצמד פושעים אחר עומד בפני אותה ברירה? או מה?
שאלה בתורת המשחקים 339874
אותם פושעים.
שאלה בתורת המשחקים 339884
בגלל זה כתבתי תשלום כספי במקום שנים בכלא. תחשבי על שני עסקים שחותמים שנה אחרי שנה על חוזה לשיתוף פעולה. בכל שנה הם יכולים להרויח משהו אם ימכרו את הסודות המסחריים של השני, אבל אז השני כנראה יחליט לא לשתף פעולה בעתיד.
שאלה בתורת המשחקים 339886
אהמ... בגרסה הזאת זה יותר מובן, אבל גם הרבה יותר פשוט באיזה אופן. הדילמה הרבה פחות קיצונית: כלומר, הם לא מחויבים לחשוב עליה אפילו.
שאלה בתורת המשחקים 339916
לא?
שאלה בתורת המשחקים 339970
כן?
שאלה בתורת המשחקים 340089
דילמת אסיר היא קטע מתמטי גרידא, הסיפור מסביב הוא רק בשביל הפיקנטיות. אתה יכול להחליף את השנים בכלא בפרס כספי ואת שיתוף הפעולה והבגידה באסטרגיות א' וב'. ניסויים כאלה אגב נעשו באוניברסיטאות די הרבה פעמים.
שאלה בתורת המשחקים 340108
למה אתה מספר לי את זה?
שאלה בתורת המשחקים 339657
מה ההבדל בין הפרדוקס הזה לבעיית "מבחן הפתע"‏1 הידועה?

1 תגובה 63071
שאלה בתורת המשחקים 339670
מה הקשר?
שאלה בתורת המשחקים 339686
התיאור שניתן כאן לפרדוקס דילמת האסיר במשחקים חוזרים לאחור מתאים בדיוק לפרדוקס בוחן הפתע.
שאלה בתורת המשחקים 339736
קודם כל התיאור מזכיר את בוחן הפתע אך אינו זהה לו, ובנוסף לכך הפיתרון אינו תקף. במקרה הזה דילמת אסיר הינה מאורע המוגדר היטב. והפרדוקס הוא שהפתרון הרציונלי כביכול, אינו האופטימלי גם בהנחת רציונליות טהורה של המשתתפים.
שאלה בתורת המשחקים 339768
אני ניסיתי רק להסביר מדוע הזכיר מישהו בהקשר זה את בוחן הפתע. ודאי שאין כאן זהות.
ואישית נראה לי גם שדילמת האסיר (וגם שווי המשקל של נאש ודברים נוספים) מדגימים היטב מדוע תורת המשחקים, למעשה, איננה מספקת את הפתרונות הטובים ביותר לחיים.
שאלה בתורת המשחקים 339863
''ואישית נראה לי גם שדילמת האסיר (וגם שווי המשקל של נאש ודברים נוספים) מדגימים היטב מדוע תורת המשחקים, למעשה, איננה מספקת את הפתרונות הטובים ביותר לחיים.''

היא לא תמיד תואמת התנהגות של בני אדם, כי הם אינם ''שחקנים רציונליים''. אבל היא מתארת היטב מדוע חיות למשל מתנהגות כפי שהן מתנהגות. (כי הגנים שלהם הם כן שחקנים רציונליים).
שאלה בתורת המשחקים 339871
זאת לא הבעיה היחידה. כפי שרואים בדילמת האסיר, ההתנהגות ה"רציונלית" איננה מביאה את בעלי הדילמה לתוצאות יעילות במיוחד. ושווי המשקל של נאש גם הוא לא, למעשה. ולכאורה הרי מפתחים את התורה הזאת כדי לספק פתרונות לבני אדם, לא? הרי לפרופ' אומן נתנו את הנובל מפני שעבודתו לכאורה יכולה להועיל בקונפליקטים אנושיים.
שאלה בתורת המשחקים 339888
אבל היא כן מועילה בקונפליקטים אנושיים, המטרה בעצם היא למזער את המצב של ''דילמות אסיר'' מצב שנתפס כרע. ניתן לעשות זאת בגדול באמצעות שתי דרכים, הגדלת התשואה על שיתוף פעולה, או הקטנת הפרס על בגידה.
שאלה בתורת המשחקים 339893
לא הבנתי את הפתרונות המוצעים.
שאלה בתורת המשחקים 339895
לא מפתחים את התורה הזאת רק כדי לספק פתרונות. אחד הדברים שעולה מדילמת האסיר הוא שבאינטרקציה חוזרת יש דווקא יתרון לאיסטרטגיה של שיתוף פעולה הססני.
שאלה בתורת המשחקים 339681
הבעיה ב"בוחן הפתע", לדעתי, היא ש"בוחן פתע" לא מוגדר היטב.

אגב, מורה שלי מביה"ס היסודי הכריזה פעם: "בשיעור הבא בוחן פתע!".
שאלה בתורת המשחקים 339690
מכיוון שמעל 10% מהשיעורים מתבטלים, הרי שיש אלמנט של הפתעה בשאלה מתי השיעור הבא.
שאלה בתורת המשחקים 339719
למה "לא מוגדר היטב"?
שאלה בתורת המשחקים 339730
אם עד יום שישי לא היה בוחן, אז הוא כבר לא בוחן פתע, כי התלמידים יודעים *יום מראש* שיהיה בוחן, ולא חושבים שהם יודעים זאת באף יום אחר ‏1, נכון? אם כך, נניח שזו ההגדרה של "בוחן פתע": "בוחן שהתלמידים לא יודעים עליו יום מראש, או שיש יותר מיום אחד שהם יודעים-לכאורה יום לפניו שיש בוחן".

ע"פ הפרדוקס, אם עד יום חמישי לא היה בוחן פתע, אז התלמידים יודעים-לכאורה שמחר יהיה בוחן פתע, כי אחרת הם *ידעו באותו יום* שיש להם בוחן למחרת. אבל למעשה, מאחר שבמצב כזה זה *כן* בוחן פתע ע"פ ההגדרה (כי הם חשבו שגם ביום חמישי יש בוחן), ההיקש כאן שגוי.

אם כך, ההגדרה הזאת לא מתאימה. יש לך הגדרה סבירה אחרת שמתאימה לדרישות השאלה?

1 אחרת, מה הטעם ב"ידיעה" הזאת?
שאלה בתורת המשחקים 340275
בוחן פתע הוא ''בוחן שהתלמידים לא יכולים לדעת מתי הוא יתרחש לפני שהוא מתחיל''.

אן עד סוף יום חמישי לא היה בוחן, התלמידים יודעים ביום חמישי בערב שהבוחן יהיה ביום שישי. לכן, הבוחן לא יכול להיות ביום שישי.

אם עד סוף יום רביעי לא היה בוחן, התלמידים יודעים שהבוחן יהיה ביום חמישי או ביום שישי. בנוסף, התלמידים יודעים שהבוחן לא יהיה ביום שישי, לכן, הבוחן לא יכול להיות גם ביום חמישי.

אם עד סוף יום שלישי לא היה בוחן, התלמידים יודעים שהבוחן יהיה ביום רביעי, חמישי או שישי. בנוסף, התלמידים יודעים שהבוחן לא יהיה ביום שישי ולא ביום חמישי, לכן, הבוחן לא יכול להיות גם ביום רביעי.

אם עד סוף יום שני לא היה בוחן, התלמידים יודעים שהבוחן יהיה ביום שלישי, רביעי, חמישי או שישי. בנוסף, התלמידים יודעים שהבוחן לא יהיה ביום שישי ולא ביום חמישי ולא ביום רביעי, לכן, הבוחן לא יכול להיות גם ביום שלישי.

וכך הלאה...

ההתחכמות שלך היא התחכמות לשונית, לא ממש פתרון.
שאלה בתורת המשחקים 340312
אם התלמידים "יודעים" שהבוחן יהיה ביום מסוים, והוא לא מתקיים באותו יום, ואז הם שוב "יודעים" שהוא יתקיים למחרת, זאת לא באמת ידיעה, ולכן הבוחן הוא בוחן פתע.

אחרת, הם יכולים פשוט להחליט "לדעת" בכל רגע נתון ש"עכשיו יש בוחן". אמנם הם יטעו רוב הזמן, אבל הבוחן לא יוכל להפתיע אותם :-) .

אם אנחנו מקפידים על הדרישה הזאת לגבי המושג "ידיעה", נופל הטיעון עבור יום חמישי: התלמידים אומרים שאם גם ביום חמישי לא יהיה בוחן, אז הם ידעו שהוא יהיה ביום שישי. אבל מאחר שהם כבר "ידעו" שהוא יהיה ביום חמישי, זו ידיעה-כפולה, שהיא לא ידיעה בכלל.
שאלה בתורת המשחקים 340314
שאלה: המבחן יכול להיות ביום שישי?
שאלה בתורת המשחקים 340321
נראה לי שלא. אחרת הוא לא יהיה בוחן פתע.
שאלה בתורת המשחקים 340328
וגם התלמידים וגם המורה יודעים את זה?
שאלה בתורת המשחקים 340329
כן.
שאלה בתורת המשחקים 340331
אם הם הגיעו לסוף יום רביעי, והם יודעים מצד אחד שביום שישי המבחן לא יהיה, ומצד שני שהוא יהיה ביום חמישי או שישי, מתי יהיה המבחן?
שאלה בתורת המשחקים 340333
אם הם הגיעו לסוף יום רביעי, אז הם יודעים שאם המבחן לא יהיה ביום חמישי, הם "ידעו" מראש שהוא יהיה ביום שישי, נכון? כמעט. הטענה הזאת נכונה רק אם הם לא "ידעו" גם שהוא יהיה ביום חמישי. אם הם כן "ידעו", אז זו תהיה ידיעה כפולה, שהיא לא ידיעה בכלל.

בקיצור, לדעתי הקצ' בסיפור הזה הוא לא שהתלמידים לא-ידעו על הבוחן לפני הבוחן, אלא שהם בהכרח "ידעו" גם על מועדים שקריים של הבוחן.
שאלה בתורת המשחקים 340335
לא. הם הגיעו לסוף יום רביעי. האפשרות שהמבחן יהיה ביום שישי פשוט לא קיימת. לכן קיימת רק האפשרות שהוא יהיה ביום חמישי. אבל, מצד שני, בגלל שכל הצדדים יודעים את זה, גם האפשרות הזאת מתבטלת. לכן לא יכול להיות שהם הגיעו ליום רביעי מבלי לעשות את המבחן. ולכן יש כאן פרדוקס.
שאלה בתורת המשחקים 340341
טוב, קשה לי להתווכח עם הטיעון הזה. פרדוקס מעצבן.
שאלה בתורת המשחקים 340344
כל הפרדוקס הזה בנוי על אמון לא מעורער במורה. כלומר, האמונה התמה שאם היא אומרת ש''יהיה בוחן פתע'', אז ודאי שיהיה כזה. אם אין אמון כזה, כל הפרדוקס נופל...
שאלה בתורת המשחקים 340345
תגובה 340089 רלוונטית גם לכאן.
סליחה 340570
חשבתי על זה קצת. אתה צדקת. אני טעיתי והטעתי. סליחה.
סליחה 340705
אז יש לך טיעון טוב נגד תגובה 340335?

(למען האמת, אולי לי יש: רק בהנחה שהתלמידים לא יחשדו באף יום קודם, ביום שישי לא יוכל להיות בוחן פתע.)
סליחה 340987
הבעיה היא עוד בתגובה 340314. כן, המבחן כן יכול להיות ביום שישי. אם התלמידים חושבים שלא, אז הם ילמדו ביום אחר, ואז יצטרכו ללמוד שוב ביום שישי.
סליחה 341001
התלמידים הם עד כדי כך סניליים, שאם למדו ביום שלישי הם יצטרכו ללמוד שוב ביום שישי?
סליחה 341003
אחרת לא היה טעם לבוחן הפתע, לא?
סליחה 341004
וכך מה הטעם?
סליחה 341008
אם התלמידים לא ידעו בדיוק מתי המבחן, הם יהיו מוכנים למבחן בכל יום במהלך השבוע, ואז יפנימו את החומר טוב יותר מאשר אילו הם היו לומדים אותו רק ליום אחד.
סליחה 341012
אם כך, עדיף לקיים את המבחן ביום ששי. בעצם, עדיף לא לקיים את המבחן כלל.
סליחה 341014
אם לא תקיים את המבחן לא תקבל משוב. אם תקיים אותו ביום שישי, התלמידים יעלו על זה (אבל אני חושב שבאמת עדיף לדחות את המבחן).
סליחה 341016
נפשט את הבעיה: המורה מודיע על בוחן ביום מסויים ויכול לקיים את הבוחן או לא לקיים.

אם מורה לא מקיים את הבוחן עליו הודיע מראש, הוא מרוויח שהתלמידים למדו והוא לא צריך לבדוק.
אם מורה תמיד לא מקיים את הבוחן, התלמידים יפסיקו ללמוד.

וחזרנו לדילמת האסיר.
סליחה 341018
המורה יכול לפעמים לקיים את הבוחן ולפעמים לא. הוא גם יכול לומר בתחילת השנה שמדי פעם יהיו בוחני פתע.
סליחה 341027
כן, אבל אז הוא יאבד את האמינות בעיני התלמידים. לכן כדאי לו לקיים בוחן ביום אקראי בכל "שבוע-גיהנום" כזה, וכך התלמידים ילמדו בממוצע 3.5 ימים כל שבוע. כמה שבועות כאלה, והם ידעו את החומר.
סליחה 341149
ואולי שיחנך את הילדים ללמוד לא מפחד העונש ולא מתקוות הפרס אלא כדי לקיים את חובתם בעולמם?
או לפחות יחנך את התלמידים ללמוד למען מטרה קצת יותר רחוקה כמו הצלחה בחיים (שתאפשר להם לתת הרבה צדקה)? או סיפוק מהידע?
סליחה 341156
אני מסכים עם היעדים החינוכיים שהצגת, אבל הם לא ממש קשורים לדיון, כי הדיון לא ממש עוסק בעולם האמיתי.
שאלה בתורת המשחקים 339728
לא היית מופתע למשמע ההצהרה?
שאלה בתורת המשחקים 339733
כן, אבל ההפתעה הזאת לא הספיקה כדי לענות על ההגדרה לבוחן פתע בתגובה 339730. :-)
שאלה בתורת המשחקים 339837
אולי ההכרזה הזו דווקא הייתה הגיונית כי הרעיון פשוט הפתיע את המורה.
שאלה בתורת המשחקים 340483
לדעתי אין קשר בין שני הפרדוקסים, כי זה של בוחן הפתע הוא לשוני בעיקרו.

נראה לי שיש שתי אפשרויות למושג של "בוחן פתע". הראשונה היא של בוחן פתע "מושלם" - כזה שבכל יום שבו הוא ניתן הוא מפתיע. השיטה שבה נוקט הפרדוקס מראה שבוחן כזה הוא בלתי אפשרי. אני מסכים - בוחן כזה הוא באמת בלתי אפשרי. אז מה כאן הבעיה?

לרוב אומרים משהו בסגנון "הבעיה היא שביום שלישי בא המורה לכיתה ונתן בוחן וכולם הופתעו". זה טוב ויפה - במקרה הזה, "בוחן פתע" הוא בוחן שלא מפתיע ב*כל* יום, אלא בכל יום פרט ליום שישי, ואם הוא ניתן ביום שישי אינו מפתיע. אני לא רואה בעיה עם הגדרה כזו.

לכן אחת משתיים: או שאתה מגדיר "בוחן פתע" בצורה שמונעת ממנו להינתן (אלא אם המורה לא מגביל את פרק הזמן שבו הוא עשוי להינתן) ואז יש בו סתירה פנימית וברור שהוא לא ינתן ואין כאן בעיה, או שאתה מגדיר אותו בצורה "משופצרת" שבה בכלל אין בעיה. בכל מקרה לא ברור מה הבעיה.

האמת היא שגם עם פרדוקס האינדוקציה לאחור אני לא ממש רואה מה הבעיה - זה בסך הכל אומר שגם בדילמת אסיר איטרטיבית שמספר הסיבובים בה ידוע מראש, מבחינה מתמטית "טהורה" לא יהיה שיתוף פעולה.
שאלה בתורת המשחקים 340513
הבעיה היא כזו :

בוא נסכים על משחק עם 100 סיבובים עם סכומים כדלקמן

ב=בגידה. ש=שיתוף פעולה.

בב : 1 לכל אחד.

שש : 1000 לכל אחד.

בש : 1001 לבוגד, 0 למשת"פ.

ההבדל בין דילמת אסיר איטרטיבית לדילמת אסיר חד פעמית, היא שבדילמת אסיר חד פעמית כל צד מקבל את האופטימום לא משנה מה הצד השני עושה. ואילו בדילמת אסיר איטרטיבית, למשל במקרה שהצגתי אתה יכול *להשפיע* על הצד השני (למשל באסטרטגיית מידה נגד מידה) כלומר אם משחק מולך שחקן רציונלי יכול להיות שהוא יעבור לשיתוף פעולה במטרה למקסם את רווחיו.

אבל המתמטיקה אומרת, אלו הבלים - אין דבר כזה אופק עתידי תמיד כדאי לבגוד, ושזהו כביכול הפתרון האופטימלי. דבר שאינו מתקיים במציאות.

זאת סתירה רצינית, ומכאן הפרדוקס.
שאלה בתורת המשחקים 340517
אבל גם בדילמת האסיר המקורית כדאי תמיד לבגוד וזהו כביכול הפתרון האופטימלי ודבר זה אינו מתקיים במציאות (טוב, לא תמיד). זה שזה נראה לנו לא קשור למציאות עדיין לא הופך את זה לפרדוקס, אלא במשמעות הרחבה שלו (כמו ''הפרדוקס של גלילאו'' שפשוט מראה שהאינטואיציה שלנו לא תמיד מסתדרת עם המתמטיקה, מה שיודע גם כל סטודנט לטופולוגיה).

כדי להראות שיש כאן סתירה רצינית, אתה צריך להראות בעיה מתמטית כלשהי שיש כאן. אם כל הטענה שלך היא שנראה משונה שדרך הפתרון ה''רציונלית'' מניבה רווחים עלובים ועדיף בהרבה לנקוט בדרך ה''לא רציונלית'' אני מסכים שזה נראה משונה, ומספיק מבט אחד בדילמת האסיר המקורית כדי להיווכח בזה. זה אולי קורא להמצאת הגדרות נוספות ל''פתרון'' של משחקים שכאלו.
שאלה בתורת המשחקים 340519
אני לא מסכים איתך, כי בדילמת האסיר זה חד וחלק שבהנחה שמשחקים שני שחקנים רציונליים (לפי ההגדרה המתמטית) התוצאה תמיד תהיה ב.ב. לעומת זאת, לא בטוח בכלל ששתי שחקנים רציונליים לא ישתפו פעולה בדוגמה שציינתי, על אף שהמתמטיקה גורסת כך.
שאלה בתורת המשחקים 340520
חשבתי על כך עוד קצת, ונדמה לי ששני שחקנים רציונליים לפי הגדרה אכן ישחקו ב.ב כל הזמן.

עדיין מטריד אותי הפרדוקס הזה.
שאלה בתורת המשחקים 340609
מה הפרדוקס?
שאלה בתורת המשחקים 340522
נדמה לי שהבעיה היא בשימוש שלך במילה "שחקן רציונלי" בשתי משמעויות שונות - אחת מתמטית ("שחקן שעושה מה שמבחינה מתמטית ממקסם את הרווח שלו") ואחת יומיומית ("שחקן שעושה מה שנראה הגיוני לעשות כדי להרוויח"). אם המתמטיקה גורסת ששחקן רציונלי (מתמטי!) יפעל בצורה מסויימת, כך הוא יפעל, אם כי לא חשבתי עד הסוף על האינדוקציה לאחור ואני לא בטוח אם האסטרטגיה האופטימלית היא באמת לבגוד כל הזמן.

זה שזה לא מתאים להתנהגות הרציונלית הלא מתמטית זה ברור, ומציק - אבל זה, כאמור, קיים כבר בדילמת האסיר המקורית.
שאלה בתורת המשחקים 340536
כאן רואים בדיוק שהמתמטיקה לא מסוגלת לתאר את החיים בשום צורה הגיונית ביחס להתנהגויות של בני אדם.
שאלה בתורת המשחקים 340561
הייתי נזהר לפני שהייתי משליך אמירות גורפות שכאלו. כאן לכל היותר רואים בדיוק שמושג מסויים של פתרון מתמטי לא מתאר את התוצאה שאנחנו מצפים לה. זה לא אומר שלא ניתן להמציא מודלים נוספים, או שהמודל הנוכחי חסר ערך.
שאלה בתורת המשחקים 340605
ומה עם שיווי המשקל של נאש? באופן כללי, מה שתורת המשחקים קוראת "רציונלי", נקרא בשפה פשוטה "אגואיסט מגעיל".
שאלה בתורת המשחקים 340623
מה עם שיווי המשקל של נאש?

"אגואיסט מגעיל" זה ביטוי שלא ממש קשור לכלום. פונקצית התועלת של אדם יכולה להיות גבוהה כשהוא עוזר לחברה לחברה ושלילית כשהוא עוזר לעצמו. אם תתן לי כמה דקות (אני טיפה ממהר עכשיו) אני אנסח את דילמת האסיר עם אלטרואיסטים במקום אגואיסטים. כדאי להיזהר כשנותנים פרשנות סוציולוגית/פסיכולוגית למודלים מתמטיים.
שאלה בתורת המשחקים 340632
"כדאי להיזהר כשנותנים פרשנות סוציולוגית/פסיכולוגית למודלים מתמטיים".
בדיוק.
שאלה בתורת המשחקים 340643
להבדיל מלהשתמש במודל בסיטואציה סוציולוגית/פסיכולוגית.
שאלה בתורת המשחקים 340650
לדעתי, אין כאן שום ''להבדיל''.
שאלה בתורת המשחקים 340638
להיזהר כדאי תמיד, אבל דווקא בזכות ה''פרדוקס'' הזה התחדדה השאלה איך זה שלא כולנו (והמון חיות אחרות) יצאנו ''אגואיסטים מגעילים'', וזה דוקא הביא תועלת.
שאלה בתורת המשחקים 340580
אוי באמת. מאיפה זה בא?! המודל המתמטי שחשבת עליו לא מתאר את שיתוף הפעולה הרווח בחיים. אבל במודל אחר, כגון דילמת אסיר עם מספר סיבובים אקראי, שיתוף פעולה חשדני הוא באמת האסטרטגיה המנצחת.
זהו גם המודל המתאים יותר לחיים - לא כדאי לנו לבגוד בחברנו (מעבר לענייני נקיפות מצפון וכו') כי איננו יודעים מתי נזדקק לו שוב.
שאלה בתורת המשחקים 340526
[צ] "בכלל ששתי שחקנים רציונליים לא ישתפו פעולה בדוגמה שציינתי" [/צ]

במקרה שאליו אתה מתייחס יש הנחה חשובה - כל אחד מהשחקנים חושב שהשחקן השני הוא כמוהו. אם למשל שניהם היו "רציונליים", אבל היו סבורים שהשני הוא tit-for-tat (יחקה בכל תור את מה שעשה היריב בתור הקודם), עם הפרסים הנכונים (למשל 5 לשיתוף-שיתוף, 6 לבגידה), שניהם היו משתפים פעולה עד למהלך האחרון, שבו שניהם היו בוגדים. אני אומר "עם הפרסים הנכונים" כי לא קשה לדמיין חלוקת פרסים שבה האסטרטגיה הטובה ביותר נגד tit-for-tat היא בגידה-שיתוף-בגידה-שיתוף (למשל אם הפרס על שש הוא 5, והפרס על בב הוא 11 לבוגד).

[צ] "על אף שהמתמטיקה גורסת כך" [/צ]

מתמטיקאים שמתעסקים במקרה שציינת מגיעים למסקנה הזאת, ובמקרים אחרים מגיעים למסקנות אחרות. אף אחד מהם לא מצפה למצוא בעולמנו יותר מדי מקרים שעונים על ההגדרה הקלאסית - שני שחקנים רציונליים למהדרין, שיודעים שהשני בדיוק כמוהם, שנעולים במשחק הזה ולא מסוגלים לתקשר ביניהם בכדי לצאת ביחד מהבוץ אליו נקלעו.
שאלה בתורת המשחקים 340533
אבל זה פחות או יותר ה"פרדוקס", לא? אם שניהם בוגדים במהלך האחרון, ולפי הגדרה שניהם יודעים שזה הולך לקרות, למה למי מהם לשתף פעולה במהלך הלפני אחרון כאשר ממילא זה חסר השפעה על המהלך האחרון? אדם הגיוני היה בוגד במהלך הלפני אחרון.
בכל אופן, אולי איזה מישהו שמתעסק בנושא יכול להוסיף קצת. האם באמת אין אסטרטגיות רציונליות שמשחקות את דילמת האסיר מאה פעמים ולא בוגדות לכל אורך הדרך? מה עם אסטרטגיות שנותנות התפלגות מסוימת להסתברות שהן יתחילו לבגוד החל מהצעד ה K ?
שאלה בתורת המשחקים 340542
לטעמי לדיונים "מתמטיים" באייל יש ערך מוגבל מאוד. אם רוצים להבין ולפתור בעיה צריך לרדת לפרטי הפרטים של הבעיה. דיונים של "באופן כללי", "מבלי לפרט/להוכיח" ו"בערך", בד"כ יותר מבלבלים מאשר מבהירים. אחרי ההבהרה הזאת ואחרי שאבהיר שאיני מתעסק בנושא רציתי להעיר:
א. אם הבנתי נכון, דילמת האסיר נוסחה כדי להציג סתירה למשפט המינמקס של פון נוימן ולהרחבה שלו לשיוויי המשקל של נאש. הבעיה היא באמת במושג הרציונליות. דילמת האסיר מוכיחה שבני אדם אינם פועלים ע"פ הרציונליות כפי שהוגדרה ע"י פון-נוימן ונאש. בתנאי המשחק יש כנראה רציונליות מסוג אחר. בגידה של כולם אינה האיסטרטגיה האולטימטיבית.
ב. יש הרבה איסטרטגיות "רציונליות" לדילמת אסיר איטרטיבית (כלומר עם משחקונים שאינם בלתי תלויים). הנה אחת "מידה כנגד מידה (TIT FOR TAT)": שתף פעולה בסיבוב הראשון, אח"כ עשה כל מה שעשה השחקן האחר בסיבוב הקודם. זוהי איסטרטגיה הרבה יותר טובה מן האיסטרטגיות הפשוטות (אבל לא כאשר יריבך מתעקש לבגוד תמיד או לשתף פעולה תמיד).
שאלה בתורת המשחקים 340562
א. דילמת האסיר עוסקת במשחק שאינו סכום אפס ומשפט המינימקס של פון נוימן, למיטב ידיעתי, נוסח על משחקים סכום אפס (שיווי המשקל של נאש אכן מרחיב אותו למשחקים כלליים כמו זה של דילמת האסיר, אבל כדאי לזכור שבדילמת האסיר שיווי המשקל הוא דווקא המצב ה''גרוע'' שבו שני האסירים בוגדים).
שאלה בתורת המשחקים 340615
אם יריבך מתעקש לשתף פעולה תמיד, האיסטרטגיה TFT טובה והופכת ל "שיתוף פעולה".

ההרחבות המעניינות הן לאוכלוסיה של יותר משני פרטים שמשתתפת במשחק חוזר. קבוצה גדולה מספיק של TFT's מביסה את ה"אגואיסטים המגעילים".
שאלה בתורת המשחקים 342662
קצת הסתרבלתי בניסוח, אבל אני חושב שדובר שם גם במשחקי זוגות. הטענה היתה שאם אתה משחק הרבה מערכות משחקים (כ"א מהם שרשרת משחקונים חוזרים ותלויים) מול מבחר אקראי של איסטרטגיות, תוצאה טובה (כוללת) הושגה ע"י TFT (לפחות טובה יותר מאשר אם תנקוט באיסטרטגיה פשוטה).
אם יריבך משחק איסטרטגיה פשוטה ("שת"פ תמיד" או "בגוד תמיד") האיסטרטגיה שלך הופכת לזהה לשלו והתוצאות בהתאם (לא טובות).
במחשבה שנייה, מה שתארתי כאן הוא כנראה שקול למשחקים חוזרים רבי משתתפים (שאתה הבאת).
שאלה בתורת המשחקים 342731
1. בניסוי המפורסם של אקסלרוד והמילטון השחקנים היו תוכניות מחשב שונות (לא ממש "מבחר אקראי", אבל ללא ספק "מבחר"). TFT נתנה תוצאות טובות גם בניסויים חוזרים בהם כבר היה ידוע שהיא תהיה בין האיסטרטגיות הנפוצות באוכלוסיה, ונכתבו איסטרטגיות במטרה ברורה להכות אותה.

2. למה אתה אומר שהתוצאות של "שת"ף תמיד" גרועות אם היריב שלך משחק אף הוא באותה איסטרטגיה?
שאלה בתורת המשחקים 342763
2. הכל יחסי. בניסוי של אקסלרוד טבלת התשואות נבנתה כך שכאשר שני השחקנים שיתפו פעולה הם זכוב-‏3 נקודות כ"א. אם אחד בגד והשני לא, הבוגד קיבל 5 נקודות. לכן אם אתה בוגד מול "שת"פ תמיד", אתה מרויח יותר. למעשה זה המצב מול כל איסטרטגיה לא מגיבה (שאז בעצם המשחקונים הופכים בלתי תלויים). ש"מ של נאש ("בגוד תמיד") הוא הפתרון ה"רציונלי" שם.
שאלה בתורת המשחקים 342764
אתה כמובן צודק: מול איסטרטגיה לא מגיבה אנחנו באותו מצב כמו בדילמה החד-פעמית.
שאלה בתורת המשחקים 340611
יש די הרבה מאמרים ברשת על איסטרטגיות שונות (כולל זאת שהצעת) אבל למיטב זכרוני בכולם מדובר על מס' סיבובים לא ידוע מראש.
שאלה בתורת המשחקים 340661
המשפט שעליו אתה מדבר מתייחס למקרה שבו שני השחקנים רציונליים, אבל כששניהם ***לא יודעים*** שהשני רציונלי, אלא חושבים שהשני הוא שחקן מסוג tit-for-tat. קרא שוב את ההודעה שלי בבקשה.
שאלה בתורת המשחקים 340535
ובכל זאת, בחיים, שני שחקנים רציונליים בעלי אמון מלא זה בזה יכולים להיות די רציונליים כדי לשתף פעולה.
שאלה בתורת המשחקים 340537
אתה יכול להרחיב בבקשה על הפרדוקס של גליליאו?
שאלה בתורת המשחקים 340563
גלילאו שם לב לתופעה המעניינת הבאה: די בבירור יש יותר מספרים טבעיים (1,2,3,...) מאשר מספרים טבעיים שהם ריבוע של מספר טבעי אחר (1,4,9,...) - הרי בין כל שני ריבועים יש עוד מספרים טבעיים שאינם ריבוע (כלומר, קבוצת המספרים הטבעיים מכילה ממש את קבוצת הריבועים) ובכל זאת לכל מספר טבעי אפשר להתאים ריבוע אחד ויחיד - הריבוע שלו עצמו. לכן יש בדיוק אותה כמות של מספרים טבעיים כמו מספרים טבעיים שהם ריבוע, וזה כמובן לא הגיוני.

גלילאו פשוט הקדים את קנטור בכמה מאות שנים בגילוי שמושג ה"גודל" של קבוצה אינסופית הוא לא פשוט כמו מושג הגודל של קבוצה סופית. אצל גלילאו זה היה פרדוקס, אצל קנטור זו הייתה תורה מתמטית שלמה (ויפה מאוד). אצל קנטור יש דברים יותר "משוגעים" מאשר הפרדוקס של גלילאו - למשל, מספר הטבעיים שווה למספר הרציונליים.

שאלה בתורת המשחקים 340581
יש לך מושג למה גלילאו טרח להשוות בין הטבעיים לריבועים, במקום לזוגיים?
שאלה בתורת המשחקים 340583
לא, אבל מה שכן אפשר לשים לב אליו הוא שההבדל יותר חריף כשמסתכלים על הריבועים, כי ככל שהולכים ומתקדמים בסדרה כך ההפרש בין כל זוג ריבועים עוקבים הולך וגדל (בין 1 ו-‏4 יש שני איברים שאינם ריבועים. בין 81 ו-‏100 כבר יש 18, ובהמשך זה נהיה רק יותר גרוע). לעומת זאת עם זוגיים תמיד בין כל שני זוגיים יהיה מספר אחד בלבד שהוא לא זוגי.
שאלה בתורת המשחקים 340602
אני חייבת להודות שהפתעת אותי. אמנם אני יודעת שעדיין לא דיברו על עוצמות אז, חשבתי שבעיות כגון אלה נפתרו הרבה יותר מוקדם
שאלה בתורת המשחקים 340624
באיזה מובן, לדעתך, הבעיה "נפתרה"?
שאלה בתורת המשחקים 341488
לא רק ביום שלישי.
להפתעת התלמידים, ניתן הבוחן דווקא ביום שישי, (שגם הכירו את הפרדוקס מן הספר "חידות ושיגועים" שניתן לאחד מהם לבר-המצווה).
מה שקרה הוא שבסוף יום חמישי הבינו הם שגם ביום שישי לא ינתן בוחן, שכן מאחר וזהו היום היחידי שנשאר, קיום הבוחן בו לא יפתיע, והמורה היה ידוע כמי שעומד במילתו ולכן הם הלכו ביום ה' בערב לדפוק את הראש בפאב ואחריו לAfter Party במקום להתכונן על החומר שנלמד באותו השבוע.
שאלה בתורת המשחקים 341495
טוויסט נחמד, שדי הורס את הפרדוקס: אם מקבלים את ההנחה שהתלמידים יכולים להיות מופתעים גם בצורה הזו, הולכת לנו הנחת האינדוקציה (כלומר שאם המבחן ניתן ביום שישי הוא לא מפתיע).
שאלה בתורת המשחקים 341514
לא ממש.
נסה זאת כך:
המורה מודיע: מחר, בשעה השלישית, יהיה בוחן פתע.
התלמידים: איך זה ייתכן?
המורה: מכיוון שאמרתי משפט חסר משמעות ( איך אפשר להודיע מראש על קיום בוחן פתע?) אינכם יודעים אם יהיה בוחן או לא, ולכן, אם הוא יתקיים , הוא יהיה בוחן פתע.
שאלה בתורת המשחקים 341523
בצורה שאתה מציג זאת זה אכן לא כך, אבל בצורה שבה אפופידס הציג זאת זה דווקא כן עובד. זה כי הטיעון נוגע לפסיכולוגיה, לא למתמטיקה.
שאלה בתורת המשחקים 341528
מה ההבדל בין שתי ההצגות, מעבר ללשונו הציורית של אפופידס?
שאלה בתורת המשחקים 341537
זה לא עניין של לשון ציורית. אם התלמידים אכן משוכנעים שביום ששי לא ייתכן בוחן פתע, אז הבוחן ודאי יפתיע אותם.
שאלה בתורת המשחקים 342137
ננסה שוב:
למה התלמידים משוכנעים שלא יתקיים בוחן ביום שישי? הרי המורה אמר במפורש שהשבוע יתקיים בוחן? אם כל הדיון מתמקד סביב חוסר יכולת הניתוח של התלמידים, אז כל תשובה היא אפשרית.
שאלה בתורת המשחקים 342140
התלמידים למדו לוגיקה והם בטוחים שבגלל שהמורה אמר שהבוחן יהיה בוחן פתע והם "יודעים" שהוא יתן ביום שישי בוחן שכזה, הוא לא יכול לתת בוחן שכזה.

כמובן שיש כאן מעגליות בסגנון "אני יודע שאתה יודע שאני יודע". כמובן גם שעל בסיס אותה גישה אפשר לומר שמבחן שמורה אמר שיינתן ביום שלישי בשעה 14:00 הוא "בוחן פתע" אם התלמידים שתו לשוכרה ושכחו ממנו.
שאלה בתורת המשחקים 342141
גארדנר (?) מציע את הפישוט הבא: אישתך מודיעה לך שהיא עומדת לערוך מסיבת הפתעה ביום ההולדת הקרב שלך.

ברגע שהיא הודיעה את זה, ברור כביכול שההפתעה נעלמה, ומצד שני אם זה ברור הרי ההצהרה שלה מכילה סתירה עצמית, ולכן אתה יכול להתעלם ממנה ולהיות מופתע בהחלט כשהאיום יתממש.
  שאלה בתורת המשחקים • ראובן
  שאלה בתורת המשחקים • גדי אלכסנדרוביץ'

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים