בתשובה לגדי אלכסנדרוביץ', 23/10/05 23:05
שאלה בתורת המשחקים 340519
אני לא מסכים איתך, כי בדילמת האסיר זה חד וחלק שבהנחה שמשחקים שני שחקנים רציונליים (לפי ההגדרה המתמטית) התוצאה תמיד תהיה ב.ב. לעומת זאת, לא בטוח בכלל ששתי שחקנים רציונליים לא ישתפו פעולה בדוגמה שציינתי, על אף שהמתמטיקה גורסת כך.
שאלה בתורת המשחקים 340520
חשבתי על כך עוד קצת, ונדמה לי ששני שחקנים רציונליים לפי הגדרה אכן ישחקו ב.ב כל הזמן.

עדיין מטריד אותי הפרדוקס הזה.
שאלה בתורת המשחקים 340609
מה הפרדוקס?
שאלה בתורת המשחקים 340522
נדמה לי שהבעיה היא בשימוש שלך במילה "שחקן רציונלי" בשתי משמעויות שונות - אחת מתמטית ("שחקן שעושה מה שמבחינה מתמטית ממקסם את הרווח שלו") ואחת יומיומית ("שחקן שעושה מה שנראה הגיוני לעשות כדי להרוויח"). אם המתמטיקה גורסת ששחקן רציונלי (מתמטי!) יפעל בצורה מסויימת, כך הוא יפעל, אם כי לא חשבתי עד הסוף על האינדוקציה לאחור ואני לא בטוח אם האסטרטגיה האופטימלית היא באמת לבגוד כל הזמן.

זה שזה לא מתאים להתנהגות הרציונלית הלא מתמטית זה ברור, ומציק - אבל זה, כאמור, קיים כבר בדילמת האסיר המקורית.
שאלה בתורת המשחקים 340536
כאן רואים בדיוק שהמתמטיקה לא מסוגלת לתאר את החיים בשום צורה הגיונית ביחס להתנהגויות של בני אדם.
שאלה בתורת המשחקים 340561
הייתי נזהר לפני שהייתי משליך אמירות גורפות שכאלו. כאן לכל היותר רואים בדיוק שמושג מסויים של פתרון מתמטי לא מתאר את התוצאה שאנחנו מצפים לה. זה לא אומר שלא ניתן להמציא מודלים נוספים, או שהמודל הנוכחי חסר ערך.
שאלה בתורת המשחקים 340605
ומה עם שיווי המשקל של נאש? באופן כללי, מה שתורת המשחקים קוראת "רציונלי", נקרא בשפה פשוטה "אגואיסט מגעיל".
שאלה בתורת המשחקים 340623
מה עם שיווי המשקל של נאש?

"אגואיסט מגעיל" זה ביטוי שלא ממש קשור לכלום. פונקצית התועלת של אדם יכולה להיות גבוהה כשהוא עוזר לחברה לחברה ושלילית כשהוא עוזר לעצמו. אם תתן לי כמה דקות (אני טיפה ממהר עכשיו) אני אנסח את דילמת האסיר עם אלטרואיסטים במקום אגואיסטים. כדאי להיזהר כשנותנים פרשנות סוציולוגית/פסיכולוגית למודלים מתמטיים.
שאלה בתורת המשחקים 340632
"כדאי להיזהר כשנותנים פרשנות סוציולוגית/פסיכולוגית למודלים מתמטיים".
בדיוק.
שאלה בתורת המשחקים 340643
להבדיל מלהשתמש במודל בסיטואציה סוציולוגית/פסיכולוגית.
שאלה בתורת המשחקים 340650
לדעתי, אין כאן שום ''להבדיל''.
שאלה בתורת המשחקים 340638
להיזהר כדאי תמיד, אבל דווקא בזכות ה''פרדוקס'' הזה התחדדה השאלה איך זה שלא כולנו (והמון חיות אחרות) יצאנו ''אגואיסטים מגעילים'', וזה דוקא הביא תועלת.
שאלה בתורת המשחקים 340580
אוי באמת. מאיפה זה בא?! המודל המתמטי שחשבת עליו לא מתאר את שיתוף הפעולה הרווח בחיים. אבל במודל אחר, כגון דילמת אסיר עם מספר סיבובים אקראי, שיתוף פעולה חשדני הוא באמת האסטרטגיה המנצחת.
זהו גם המודל המתאים יותר לחיים - לא כדאי לנו לבגוד בחברנו (מעבר לענייני נקיפות מצפון וכו') כי איננו יודעים מתי נזדקק לו שוב.
שאלה בתורת המשחקים 340526
[צ] "בכלל ששתי שחקנים רציונליים לא ישתפו פעולה בדוגמה שציינתי" [/צ]

במקרה שאליו אתה מתייחס יש הנחה חשובה - כל אחד מהשחקנים חושב שהשחקן השני הוא כמוהו. אם למשל שניהם היו "רציונליים", אבל היו סבורים שהשני הוא tit-for-tat (יחקה בכל תור את מה שעשה היריב בתור הקודם), עם הפרסים הנכונים (למשל 5 לשיתוף-שיתוף, 6 לבגידה), שניהם היו משתפים פעולה עד למהלך האחרון, שבו שניהם היו בוגדים. אני אומר "עם הפרסים הנכונים" כי לא קשה לדמיין חלוקת פרסים שבה האסטרטגיה הטובה ביותר נגד tit-for-tat היא בגידה-שיתוף-בגידה-שיתוף (למשל אם הפרס על שש הוא 5, והפרס על בב הוא 11 לבוגד).

[צ] "על אף שהמתמטיקה גורסת כך" [/צ]

מתמטיקאים שמתעסקים במקרה שציינת מגיעים למסקנה הזאת, ובמקרים אחרים מגיעים למסקנות אחרות. אף אחד מהם לא מצפה למצוא בעולמנו יותר מדי מקרים שעונים על ההגדרה הקלאסית - שני שחקנים רציונליים למהדרין, שיודעים שהשני בדיוק כמוהם, שנעולים במשחק הזה ולא מסוגלים לתקשר ביניהם בכדי לצאת ביחד מהבוץ אליו נקלעו.
שאלה בתורת המשחקים 340533
אבל זה פחות או יותר ה"פרדוקס", לא? אם שניהם בוגדים במהלך האחרון, ולפי הגדרה שניהם יודעים שזה הולך לקרות, למה למי מהם לשתף פעולה במהלך הלפני אחרון כאשר ממילא זה חסר השפעה על המהלך האחרון? אדם הגיוני היה בוגד במהלך הלפני אחרון.
בכל אופן, אולי איזה מישהו שמתעסק בנושא יכול להוסיף קצת. האם באמת אין אסטרטגיות רציונליות שמשחקות את דילמת האסיר מאה פעמים ולא בוגדות לכל אורך הדרך? מה עם אסטרטגיות שנותנות התפלגות מסוימת להסתברות שהן יתחילו לבגוד החל מהצעד ה K ?
שאלה בתורת המשחקים 340542
לטעמי לדיונים "מתמטיים" באייל יש ערך מוגבל מאוד. אם רוצים להבין ולפתור בעיה צריך לרדת לפרטי הפרטים של הבעיה. דיונים של "באופן כללי", "מבלי לפרט/להוכיח" ו"בערך", בד"כ יותר מבלבלים מאשר מבהירים. אחרי ההבהרה הזאת ואחרי שאבהיר שאיני מתעסק בנושא רציתי להעיר:
א. אם הבנתי נכון, דילמת האסיר נוסחה כדי להציג סתירה למשפט המינמקס של פון נוימן ולהרחבה שלו לשיוויי המשקל של נאש. הבעיה היא באמת במושג הרציונליות. דילמת האסיר מוכיחה שבני אדם אינם פועלים ע"פ הרציונליות כפי שהוגדרה ע"י פון-נוימן ונאש. בתנאי המשחק יש כנראה רציונליות מסוג אחר. בגידה של כולם אינה האיסטרטגיה האולטימטיבית.
ב. יש הרבה איסטרטגיות "רציונליות" לדילמת אסיר איטרטיבית (כלומר עם משחקונים שאינם בלתי תלויים). הנה אחת "מידה כנגד מידה (TIT FOR TAT)": שתף פעולה בסיבוב הראשון, אח"כ עשה כל מה שעשה השחקן האחר בסיבוב הקודם. זוהי איסטרטגיה הרבה יותר טובה מן האיסטרטגיות הפשוטות (אבל לא כאשר יריבך מתעקש לבגוד תמיד או לשתף פעולה תמיד).
שאלה בתורת המשחקים 340562
א. דילמת האסיר עוסקת במשחק שאינו סכום אפס ומשפט המינימקס של פון נוימן, למיטב ידיעתי, נוסח על משחקים סכום אפס (שיווי המשקל של נאש אכן מרחיב אותו למשחקים כלליים כמו זה של דילמת האסיר, אבל כדאי לזכור שבדילמת האסיר שיווי המשקל הוא דווקא המצב ה''גרוע'' שבו שני האסירים בוגדים).
שאלה בתורת המשחקים 340615
אם יריבך מתעקש לשתף פעולה תמיד, האיסטרטגיה TFT טובה והופכת ל "שיתוף פעולה".

ההרחבות המעניינות הן לאוכלוסיה של יותר משני פרטים שמשתתפת במשחק חוזר. קבוצה גדולה מספיק של TFT's מביסה את ה"אגואיסטים המגעילים".
שאלה בתורת המשחקים 342662
קצת הסתרבלתי בניסוח, אבל אני חושב שדובר שם גם במשחקי זוגות. הטענה היתה שאם אתה משחק הרבה מערכות משחקים (כ"א מהם שרשרת משחקונים חוזרים ותלויים) מול מבחר אקראי של איסטרטגיות, תוצאה טובה (כוללת) הושגה ע"י TFT (לפחות טובה יותר מאשר אם תנקוט באיסטרטגיה פשוטה).
אם יריבך משחק איסטרטגיה פשוטה ("שת"פ תמיד" או "בגוד תמיד") האיסטרטגיה שלך הופכת לזהה לשלו והתוצאות בהתאם (לא טובות).
במחשבה שנייה, מה שתארתי כאן הוא כנראה שקול למשחקים חוזרים רבי משתתפים (שאתה הבאת).
שאלה בתורת המשחקים 342731
1. בניסוי המפורסם של אקסלרוד והמילטון השחקנים היו תוכניות מחשב שונות (לא ממש "מבחר אקראי", אבל ללא ספק "מבחר"). TFT נתנה תוצאות טובות גם בניסויים חוזרים בהם כבר היה ידוע שהיא תהיה בין האיסטרטגיות הנפוצות באוכלוסיה, ונכתבו איסטרטגיות במטרה ברורה להכות אותה.

2. למה אתה אומר שהתוצאות של "שת"ף תמיד" גרועות אם היריב שלך משחק אף הוא באותה איסטרטגיה?
שאלה בתורת המשחקים 342763
2. הכל יחסי. בניסוי של אקסלרוד טבלת התשואות נבנתה כך שכאשר שני השחקנים שיתפו פעולה הם זכוב-‏3 נקודות כ"א. אם אחד בגד והשני לא, הבוגד קיבל 5 נקודות. לכן אם אתה בוגד מול "שת"פ תמיד", אתה מרויח יותר. למעשה זה המצב מול כל איסטרטגיה לא מגיבה (שאז בעצם המשחקונים הופכים בלתי תלויים). ש"מ של נאש ("בגוד תמיד") הוא הפתרון ה"רציונלי" שם.
שאלה בתורת המשחקים 342764
אתה כמובן צודק: מול איסטרטגיה לא מגיבה אנחנו באותו מצב כמו בדילמה החד-פעמית.
שאלה בתורת המשחקים 340611
יש די הרבה מאמרים ברשת על איסטרטגיות שונות (כולל זאת שהצעת) אבל למיטב זכרוני בכולם מדובר על מס' סיבובים לא ידוע מראש.
שאלה בתורת המשחקים 340661
המשפט שעליו אתה מדבר מתייחס למקרה שבו שני השחקנים רציונליים, אבל כששניהם ***לא יודעים*** שהשני רציונלי, אלא חושבים שהשני הוא שחקן מסוג tit-for-tat. קרא שוב את ההודעה שלי בבקשה.
שאלה בתורת המשחקים 340535
ובכל זאת, בחיים, שני שחקנים רציונליים בעלי אמון מלא זה בזה יכולים להיות די רציונליים כדי לשתף פעולה.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים