|
||||
|
||||
לטעמי לדיונים "מתמטיים" באייל יש ערך מוגבל מאוד. אם רוצים להבין ולפתור בעיה צריך לרדת לפרטי הפרטים של הבעיה. דיונים של "באופן כללי", "מבלי לפרט/להוכיח" ו"בערך", בד"כ יותר מבלבלים מאשר מבהירים. אחרי ההבהרה הזאת ואחרי שאבהיר שאיני מתעסק בנושא רציתי להעיר: א. אם הבנתי נכון, דילמת האסיר נוסחה כדי להציג סתירה למשפט המינמקס של פון נוימן ולהרחבה שלו לשיוויי המשקל של נאש. הבעיה היא באמת במושג הרציונליות. דילמת האסיר מוכיחה שבני אדם אינם פועלים ע"פ הרציונליות כפי שהוגדרה ע"י פון-נוימן ונאש. בתנאי המשחק יש כנראה רציונליות מסוג אחר. בגידה של כולם אינה האיסטרטגיה האולטימטיבית. ב. יש הרבה איסטרטגיות "רציונליות" לדילמת אסיר איטרטיבית (כלומר עם משחקונים שאינם בלתי תלויים). הנה אחת "מידה כנגד מידה (TIT FOR TAT)": שתף פעולה בסיבוב הראשון, אח"כ עשה כל מה שעשה השחקן האחר בסיבוב הקודם. זוהי איסטרטגיה הרבה יותר טובה מן האיסטרטגיות הפשוטות (אבל לא כאשר יריבך מתעקש לבגוד תמיד או לשתף פעולה תמיד). |
|
||||
|
||||
א. דילמת האסיר עוסקת במשחק שאינו סכום אפס ומשפט המינימקס של פון נוימן, למיטב ידיעתי, נוסח על משחקים סכום אפס (שיווי המשקל של נאש אכן מרחיב אותו למשחקים כלליים כמו זה של דילמת האסיר, אבל כדאי לזכור שבדילמת האסיר שיווי המשקל הוא דווקא המצב ה''גרוע'' שבו שני האסירים בוגדים). |
|
||||
|
||||
אם יריבך מתעקש לשתף פעולה תמיד, האיסטרטגיה TFT טובה והופכת ל "שיתוף פעולה". ההרחבות המעניינות הן לאוכלוסיה של יותר משני פרטים שמשתתפת במשחק חוזר. קבוצה גדולה מספיק של TFT's מביסה את ה"אגואיסטים המגעילים". |
|
||||
|
||||
קצת הסתרבלתי בניסוח, אבל אני חושב שדובר שם גם במשחקי זוגות. הטענה היתה שאם אתה משחק הרבה מערכות משחקים (כ"א מהם שרשרת משחקונים חוזרים ותלויים) מול מבחר אקראי של איסטרטגיות, תוצאה טובה (כוללת) הושגה ע"י TFT (לפחות טובה יותר מאשר אם תנקוט באיסטרטגיה פשוטה). אם יריבך משחק איסטרטגיה פשוטה ("שת"פ תמיד" או "בגוד תמיד") האיסטרטגיה שלך הופכת לזהה לשלו והתוצאות בהתאם (לא טובות). במחשבה שנייה, מה שתארתי כאן הוא כנראה שקול למשחקים חוזרים רבי משתתפים (שאתה הבאת). |
|
||||
|
||||
1. בניסוי המפורסם של אקסלרוד והמילטון השחקנים היו תוכניות מחשב שונות (לא ממש "מבחר אקראי", אבל ללא ספק "מבחר"). TFT נתנה תוצאות טובות גם בניסויים חוזרים בהם כבר היה ידוע שהיא תהיה בין האיסטרטגיות הנפוצות באוכלוסיה, ונכתבו איסטרטגיות במטרה ברורה להכות אותה. 2. למה אתה אומר שהתוצאות של "שת"ף תמיד" גרועות אם היריב שלך משחק אף הוא באותה איסטרטגיה? |
|
||||
|
||||
2. הכל יחסי. בניסוי של אקסלרוד טבלת התשואות נבנתה כך שכאשר שני השחקנים שיתפו פעולה הם זכוב-3 נקודות כ"א. אם אחד בגד והשני לא, הבוגד קיבל 5 נקודות. לכן אם אתה בוגד מול "שת"פ תמיד", אתה מרויח יותר. למעשה זה המצב מול כל איסטרטגיה לא מגיבה (שאז בעצם המשחקונים הופכים בלתי תלויים). ש"מ של נאש ("בגוד תמיד") הוא הפתרון ה"רציונלי" שם. |
|
||||
|
||||
אתה כמובן צודק: מול איסטרטגיה לא מגיבה אנחנו באותו מצב כמו בדילמה החד-פעמית. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |