|
||||
|
||||
לדעתי אין קשר בין שני הפרדוקסים, כי זה של בוחן הפתע הוא לשוני בעיקרו. נראה לי שיש שתי אפשרויות למושג של "בוחן פתע". הראשונה היא של בוחן פתע "מושלם" - כזה שבכל יום שבו הוא ניתן הוא מפתיע. השיטה שבה נוקט הפרדוקס מראה שבוחן כזה הוא בלתי אפשרי. אני מסכים - בוחן כזה הוא באמת בלתי אפשרי. אז מה כאן הבעיה? לרוב אומרים משהו בסגנון "הבעיה היא שביום שלישי בא המורה לכיתה ונתן בוחן וכולם הופתעו". זה טוב ויפה - במקרה הזה, "בוחן פתע" הוא בוחן שלא מפתיע ב*כל* יום, אלא בכל יום פרט ליום שישי, ואם הוא ניתן ביום שישי אינו מפתיע. אני לא רואה בעיה עם הגדרה כזו. לכן אחת משתיים: או שאתה מגדיר "בוחן פתע" בצורה שמונעת ממנו להינתן (אלא אם המורה לא מגביל את פרק הזמן שבו הוא עשוי להינתן) ואז יש בו סתירה פנימית וברור שהוא לא ינתן ואין כאן בעיה, או שאתה מגדיר אותו בצורה "משופצרת" שבה בכלל אין בעיה. בכל מקרה לא ברור מה הבעיה. האמת היא שגם עם פרדוקס האינדוקציה לאחור אני לא ממש רואה מה הבעיה - זה בסך הכל אומר שגם בדילמת אסיר איטרטיבית שמספר הסיבובים בה ידוע מראש, מבחינה מתמטית "טהורה" לא יהיה שיתוף פעולה. |
|
||||
|
||||
הבעיה היא כזו : בוא נסכים על משחק עם 100 סיבובים עם סכומים כדלקמן ב=בגידה. ש=שיתוף פעולה. בב : 1 לכל אחד. שש : 1000 לכל אחד. בש : 1001 לבוגד, 0 למשת"פ. ההבדל בין דילמת אסיר איטרטיבית לדילמת אסיר חד פעמית, היא שבדילמת אסיר חד פעמית כל צד מקבל את האופטימום לא משנה מה הצד השני עושה. ואילו בדילמת אסיר איטרטיבית, למשל במקרה שהצגתי אתה יכול *להשפיע* על הצד השני (למשל באסטרטגיית מידה נגד מידה) כלומר אם משחק מולך שחקן רציונלי יכול להיות שהוא יעבור לשיתוף פעולה במטרה למקסם את רווחיו. אבל המתמטיקה אומרת, אלו הבלים - אין דבר כזה אופק עתידי תמיד כדאי לבגוד, ושזהו כביכול הפתרון האופטימלי. דבר שאינו מתקיים במציאות. זאת סתירה רצינית, ומכאן הפרדוקס. |
|
||||
|
||||
אבל גם בדילמת האסיר המקורית כדאי תמיד לבגוד וזהו כביכול הפתרון האופטימלי ודבר זה אינו מתקיים במציאות (טוב, לא תמיד). זה שזה נראה לנו לא קשור למציאות עדיין לא הופך את זה לפרדוקס, אלא במשמעות הרחבה שלו (כמו ''הפרדוקס של גלילאו'' שפשוט מראה שהאינטואיציה שלנו לא תמיד מסתדרת עם המתמטיקה, מה שיודע גם כל סטודנט לטופולוגיה). כדי להראות שיש כאן סתירה רצינית, אתה צריך להראות בעיה מתמטית כלשהי שיש כאן. אם כל הטענה שלך היא שנראה משונה שדרך הפתרון ה''רציונלית'' מניבה רווחים עלובים ועדיף בהרבה לנקוט בדרך ה''לא רציונלית'' אני מסכים שזה נראה משונה, ומספיק מבט אחד בדילמת האסיר המקורית כדי להיווכח בזה. זה אולי קורא להמצאת הגדרות נוספות ל''פתרון'' של משחקים שכאלו. |
|
||||
|
||||
אני לא מסכים איתך, כי בדילמת האסיר זה חד וחלק שבהנחה שמשחקים שני שחקנים רציונליים (לפי ההגדרה המתמטית) התוצאה תמיד תהיה ב.ב. לעומת זאת, לא בטוח בכלל ששתי שחקנים רציונליים לא ישתפו פעולה בדוגמה שציינתי, על אף שהמתמטיקה גורסת כך. |
|
||||
|
||||
חשבתי על כך עוד קצת, ונדמה לי ששני שחקנים רציונליים לפי הגדרה אכן ישחקו ב.ב כל הזמן. עדיין מטריד אותי הפרדוקס הזה. |
|
||||
|
||||
מה הפרדוקס? |
|
||||
|
||||
נדמה לי שהבעיה היא בשימוש שלך במילה "שחקן רציונלי" בשתי משמעויות שונות - אחת מתמטית ("שחקן שעושה מה שמבחינה מתמטית ממקסם את הרווח שלו") ואחת יומיומית ("שחקן שעושה מה שנראה הגיוני לעשות כדי להרוויח"). אם המתמטיקה גורסת ששחקן רציונלי (מתמטי!) יפעל בצורה מסויימת, כך הוא יפעל, אם כי לא חשבתי עד הסוף על האינדוקציה לאחור ואני לא בטוח אם האסטרטגיה האופטימלית היא באמת לבגוד כל הזמן. זה שזה לא מתאים להתנהגות הרציונלית הלא מתמטית זה ברור, ומציק - אבל זה, כאמור, קיים כבר בדילמת האסיר המקורית. |
|
||||
|
||||
כאן רואים בדיוק שהמתמטיקה לא מסוגלת לתאר את החיים בשום צורה הגיונית ביחס להתנהגויות של בני אדם. |
|
||||
|
||||
הייתי נזהר לפני שהייתי משליך אמירות גורפות שכאלו. כאן לכל היותר רואים בדיוק שמושג מסויים של פתרון מתמטי לא מתאר את התוצאה שאנחנו מצפים לה. זה לא אומר שלא ניתן להמציא מודלים נוספים, או שהמודל הנוכחי חסר ערך. |
|
||||
|
||||
ומה עם שיווי המשקל של נאש? באופן כללי, מה שתורת המשחקים קוראת "רציונלי", נקרא בשפה פשוטה "אגואיסט מגעיל". |
|
||||
|
||||
מה עם שיווי המשקל של נאש? "אגואיסט מגעיל" זה ביטוי שלא ממש קשור לכלום. פונקצית התועלת של אדם יכולה להיות גבוהה כשהוא עוזר לחברה לחברה ושלילית כשהוא עוזר לעצמו. אם תתן לי כמה דקות (אני טיפה ממהר עכשיו) אני אנסח את דילמת האסיר עם אלטרואיסטים במקום אגואיסטים. כדאי להיזהר כשנותנים פרשנות סוציולוגית/פסיכולוגית למודלים מתמטיים. |
|
||||
|
||||
"כדאי להיזהר כשנותנים פרשנות סוציולוגית/פסיכולוגית למודלים מתמטיים". בדיוק. |
|
||||
|
||||
להבדיל מלהשתמש במודל בסיטואציה סוציולוגית/פסיכולוגית. |
|
||||
|
||||
לדעתי, אין כאן שום ''להבדיל''. |
|
||||
|
||||
להיזהר כדאי תמיד, אבל דווקא בזכות ה''פרדוקס'' הזה התחדדה השאלה איך זה שלא כולנו (והמון חיות אחרות) יצאנו ''אגואיסטים מגעילים'', וזה דוקא הביא תועלת. |
|
||||
|
||||
אוי באמת. מאיפה זה בא?! המודל המתמטי שחשבת עליו לא מתאר את שיתוף הפעולה הרווח בחיים. אבל במודל אחר, כגון דילמת אסיר עם מספר סיבובים אקראי, שיתוף פעולה חשדני הוא באמת האסטרטגיה המנצחת. זהו גם המודל המתאים יותר לחיים - לא כדאי לנו לבגוד בחברנו (מעבר לענייני נקיפות מצפון וכו') כי איננו יודעים מתי נזדקק לו שוב. |
|
||||
|
||||
[צ] "בכלל ששתי שחקנים רציונליים לא ישתפו פעולה בדוגמה שציינתי" [/צ] במקרה שאליו אתה מתייחס יש הנחה חשובה - כל אחד מהשחקנים חושב שהשחקן השני הוא כמוהו. אם למשל שניהם היו "רציונליים", אבל היו סבורים שהשני הוא tit-for-tat (יחקה בכל תור את מה שעשה היריב בתור הקודם), עם הפרסים הנכונים (למשל 5 לשיתוף-שיתוף, 6 לבגידה), שניהם היו משתפים פעולה עד למהלך האחרון, שבו שניהם היו בוגדים. אני אומר "עם הפרסים הנכונים" כי לא קשה לדמיין חלוקת פרסים שבה האסטרטגיה הטובה ביותר נגד tit-for-tat היא בגידה-שיתוף-בגידה-שיתוף (למשל אם הפרס על שש הוא 5, והפרס על בב הוא 11 לבוגד). [צ] "על אף שהמתמטיקה גורסת כך" [/צ] מתמטיקאים שמתעסקים במקרה שציינת מגיעים למסקנה הזאת, ובמקרים אחרים מגיעים למסקנות אחרות. אף אחד מהם לא מצפה למצוא בעולמנו יותר מדי מקרים שעונים על ההגדרה הקלאסית - שני שחקנים רציונליים למהדרין, שיודעים שהשני בדיוק כמוהם, שנעולים במשחק הזה ולא מסוגלים לתקשר ביניהם בכדי לצאת ביחד מהבוץ אליו נקלעו. |
|
||||
|
||||
אבל זה פחות או יותר ה"פרדוקס", לא? אם שניהם בוגדים במהלך האחרון, ולפי הגדרה שניהם יודעים שזה הולך לקרות, למה למי מהם לשתף פעולה במהלך הלפני אחרון כאשר ממילא זה חסר השפעה על המהלך האחרון? אדם הגיוני היה בוגד במהלך הלפני אחרון. בכל אופן, אולי איזה מישהו שמתעסק בנושא יכול להוסיף קצת. האם באמת אין אסטרטגיות רציונליות שמשחקות את דילמת האסיר מאה פעמים ולא בוגדות לכל אורך הדרך? מה עם אסטרטגיות שנותנות התפלגות מסוימת להסתברות שהן יתחילו לבגוד החל מהצעד ה K ? |
|
||||
|
||||
לטעמי לדיונים "מתמטיים" באייל יש ערך מוגבל מאוד. אם רוצים להבין ולפתור בעיה צריך לרדת לפרטי הפרטים של הבעיה. דיונים של "באופן כללי", "מבלי לפרט/להוכיח" ו"בערך", בד"כ יותר מבלבלים מאשר מבהירים. אחרי ההבהרה הזאת ואחרי שאבהיר שאיני מתעסק בנושא רציתי להעיר: א. אם הבנתי נכון, דילמת האסיר נוסחה כדי להציג סתירה למשפט המינמקס של פון נוימן ולהרחבה שלו לשיוויי המשקל של נאש. הבעיה היא באמת במושג הרציונליות. דילמת האסיר מוכיחה שבני אדם אינם פועלים ע"פ הרציונליות כפי שהוגדרה ע"י פון-נוימן ונאש. בתנאי המשחק יש כנראה רציונליות מסוג אחר. בגידה של כולם אינה האיסטרטגיה האולטימטיבית. ב. יש הרבה איסטרטגיות "רציונליות" לדילמת אסיר איטרטיבית (כלומר עם משחקונים שאינם בלתי תלויים). הנה אחת "מידה כנגד מידה (TIT FOR TAT)": שתף פעולה בסיבוב הראשון, אח"כ עשה כל מה שעשה השחקן האחר בסיבוב הקודם. זוהי איסטרטגיה הרבה יותר טובה מן האיסטרטגיות הפשוטות (אבל לא כאשר יריבך מתעקש לבגוד תמיד או לשתף פעולה תמיד). |
|
||||
|
||||
א. דילמת האסיר עוסקת במשחק שאינו סכום אפס ומשפט המינימקס של פון נוימן, למיטב ידיעתי, נוסח על משחקים סכום אפס (שיווי המשקל של נאש אכן מרחיב אותו למשחקים כלליים כמו זה של דילמת האסיר, אבל כדאי לזכור שבדילמת האסיר שיווי המשקל הוא דווקא המצב ה''גרוע'' שבו שני האסירים בוגדים). |
|
||||
|
||||
אם יריבך מתעקש לשתף פעולה תמיד, האיסטרטגיה TFT טובה והופכת ל "שיתוף פעולה". ההרחבות המעניינות הן לאוכלוסיה של יותר משני פרטים שמשתתפת במשחק חוזר. קבוצה גדולה מספיק של TFT's מביסה את ה"אגואיסטים המגעילים". |
|
||||
|
||||
קצת הסתרבלתי בניסוח, אבל אני חושב שדובר שם גם במשחקי זוגות. הטענה היתה שאם אתה משחק הרבה מערכות משחקים (כ"א מהם שרשרת משחקונים חוזרים ותלויים) מול מבחר אקראי של איסטרטגיות, תוצאה טובה (כוללת) הושגה ע"י TFT (לפחות טובה יותר מאשר אם תנקוט באיסטרטגיה פשוטה). אם יריבך משחק איסטרטגיה פשוטה ("שת"פ תמיד" או "בגוד תמיד") האיסטרטגיה שלך הופכת לזהה לשלו והתוצאות בהתאם (לא טובות). במחשבה שנייה, מה שתארתי כאן הוא כנראה שקול למשחקים חוזרים רבי משתתפים (שאתה הבאת). |
|
||||
|
||||
1. בניסוי המפורסם של אקסלרוד והמילטון השחקנים היו תוכניות מחשב שונות (לא ממש "מבחר אקראי", אבל ללא ספק "מבחר"). TFT נתנה תוצאות טובות גם בניסויים חוזרים בהם כבר היה ידוע שהיא תהיה בין האיסטרטגיות הנפוצות באוכלוסיה, ונכתבו איסטרטגיות במטרה ברורה להכות אותה. 2. למה אתה אומר שהתוצאות של "שת"ף תמיד" גרועות אם היריב שלך משחק אף הוא באותה איסטרטגיה? |
|
||||
|
||||
2. הכל יחסי. בניסוי של אקסלרוד טבלת התשואות נבנתה כך שכאשר שני השחקנים שיתפו פעולה הם זכוב-3 נקודות כ"א. אם אחד בגד והשני לא, הבוגד קיבל 5 נקודות. לכן אם אתה בוגד מול "שת"פ תמיד", אתה מרויח יותר. למעשה זה המצב מול כל איסטרטגיה לא מגיבה (שאז בעצם המשחקונים הופכים בלתי תלויים). ש"מ של נאש ("בגוד תמיד") הוא הפתרון ה"רציונלי" שם. |
|
||||
|
||||
אתה כמובן צודק: מול איסטרטגיה לא מגיבה אנחנו באותו מצב כמו בדילמה החד-פעמית. |
|
||||
|
||||
יש די הרבה מאמרים ברשת על איסטרטגיות שונות (כולל זאת שהצעת) אבל למיטב זכרוני בכולם מדובר על מס' סיבובים לא ידוע מראש. |
|
||||
|
||||
המשפט שעליו אתה מדבר מתייחס למקרה שבו שני השחקנים רציונליים, אבל כששניהם ***לא יודעים*** שהשני רציונלי, אלא חושבים שהשני הוא שחקן מסוג tit-for-tat. קרא שוב את ההודעה שלי בבקשה. |
|
||||
|
||||
ובכל זאת, בחיים, שני שחקנים רציונליים בעלי אמון מלא זה בזה יכולים להיות די רציונליים כדי לשתף פעולה. |
|
||||
|
||||
אתה יכול להרחיב בבקשה על הפרדוקס של גליליאו? |
|
||||
|
||||
גלילאו שם לב לתופעה המעניינת הבאה: די בבירור יש יותר מספרים טבעיים (1,2,3,...) מאשר מספרים טבעיים שהם ריבוע של מספר טבעי אחר (1,4,9,...) - הרי בין כל שני ריבועים יש עוד מספרים טבעיים שאינם ריבוע (כלומר, קבוצת המספרים הטבעיים מכילה ממש את קבוצת הריבועים) ובכל זאת לכל מספר טבעי אפשר להתאים ריבוע אחד ויחיד - הריבוע שלו עצמו. לכן יש בדיוק אותה כמות של מספרים טבעיים כמו מספרים טבעיים שהם ריבוע, וזה כמובן לא הגיוני. גלילאו פשוט הקדים את קנטור בכמה מאות שנים בגילוי שמושג ה"גודל" של קבוצה אינסופית הוא לא פשוט כמו מושג הגודל של קבוצה סופית. אצל גלילאו זה היה פרדוקס, אצל קנטור זו הייתה תורה מתמטית שלמה (ויפה מאוד). אצל קנטור יש דברים יותר "משוגעים" מאשר הפרדוקס של גלילאו - למשל, מספר הטבעיים שווה למספר הרציונליים. |
|
||||
|
||||
יש לך מושג למה גלילאו טרח להשוות בין הטבעיים לריבועים, במקום לזוגיים? |
|
||||
|
||||
לא, אבל מה שכן אפשר לשים לב אליו הוא שההבדל יותר חריף כשמסתכלים על הריבועים, כי ככל שהולכים ומתקדמים בסדרה כך ההפרש בין כל זוג ריבועים עוקבים הולך וגדל (בין 1 ו-4 יש שני איברים שאינם ריבועים. בין 81 ו-100 כבר יש 18, ובהמשך זה נהיה רק יותר גרוע). לעומת זאת עם זוגיים תמיד בין כל שני זוגיים יהיה מספר אחד בלבד שהוא לא זוגי. |
|
||||
|
||||
אני חייבת להודות שהפתעת אותי. אמנם אני יודעת שעדיין לא דיברו על עוצמות אז, חשבתי שבעיות כגון אלה נפתרו הרבה יותר מוקדם |
|
||||
|
||||
באיזה מובן, לדעתך, הבעיה "נפתרה"? |
|
||||
|
||||
לא רק ביום שלישי. להפתעת התלמידים, ניתן הבוחן דווקא ביום שישי, (שגם הכירו את הפרדוקס מן הספר "חידות ושיגועים" שניתן לאחד מהם לבר-המצווה). מה שקרה הוא שבסוף יום חמישי הבינו הם שגם ביום שישי לא ינתן בוחן, שכן מאחר וזהו היום היחידי שנשאר, קיום הבוחן בו לא יפתיע, והמורה היה ידוע כמי שעומד במילתו ולכן הם הלכו ביום ה' בערב לדפוק את הראש בפאב ואחריו לAfter Party במקום להתכונן על החומר שנלמד באותו השבוע. |
|
||||
|
||||
טוויסט נחמד, שדי הורס את הפרדוקס: אם מקבלים את ההנחה שהתלמידים יכולים להיות מופתעים גם בצורה הזו, הולכת לנו הנחת האינדוקציה (כלומר שאם המבחן ניתן ביום שישי הוא לא מפתיע). |
|
||||
|
||||
לא ממש. נסה זאת כך: המורה מודיע: מחר, בשעה השלישית, יהיה בוחן פתע. התלמידים: איך זה ייתכן? המורה: מכיוון שאמרתי משפט חסר משמעות ( איך אפשר להודיע מראש על קיום בוחן פתע?) אינכם יודעים אם יהיה בוחן או לא, ולכן, אם הוא יתקיים , הוא יהיה בוחן פתע. |
|
||||
|
||||
בצורה שאתה מציג זאת זה אכן לא כך, אבל בצורה שבה אפופידס הציג זאת זה דווקא כן עובד. זה כי הטיעון נוגע לפסיכולוגיה, לא למתמטיקה. |
|
||||
|
||||
מה ההבדל בין שתי ההצגות, מעבר ללשונו הציורית של אפופידס? |
|
||||
|
||||
זה לא עניין של לשון ציורית. אם התלמידים אכן משוכנעים שביום ששי לא ייתכן בוחן פתע, אז הבוחן ודאי יפתיע אותם. |
|
||||
|
||||
ננסה שוב: למה התלמידים משוכנעים שלא יתקיים בוחן ביום שישי? הרי המורה אמר במפורש שהשבוע יתקיים בוחן? אם כל הדיון מתמקד סביב חוסר יכולת הניתוח של התלמידים, אז כל תשובה היא אפשרית. |
|
||||
|
||||
התלמידים למדו לוגיקה והם בטוחים שבגלל שהמורה אמר שהבוחן יהיה בוחן פתע והם "יודעים" שהוא יתן ביום שישי בוחן שכזה, הוא לא יכול לתת בוחן שכזה. כמובן שיש כאן מעגליות בסגנון "אני יודע שאתה יודע שאני יודע". כמובן גם שעל בסיס אותה גישה אפשר לומר שמבחן שמורה אמר שיינתן ביום שלישי בשעה 14:00 הוא "בוחן פתע" אם התלמידים שתו לשוכרה ושכחו ממנו. |
|
||||
|
||||
גארדנר (?) מציע את הפישוט הבא: אישתך מודיעה לך שהיא עומדת לערוך מסיבת הפתעה ביום ההולדת הקרב שלך. ברגע שהיא הודיעה את זה, ברור כביכול שההפתעה נעלמה, ומצד שני אם זה ברור הרי ההצהרה שלה מכילה סתירה עצמית, ולכן אתה יכול להתעלם ממנה ולהיות מופתע בהחלט כשהאיום יתממש. |
|
||||
|
||||
גארדנר הוא פלגיאט מסריח תגובה 341514. |
|
||||
|
||||
מה שהאלמוני אמר. המתמטיקה נכנסת לעניין רק כשיש לנו את ההנחה ש-X מפתיע את Y כאשר Z. אם המורה אומר לתלמידים שהם יופתעו, זה לא אומר שהם מקשיבים לקשקושים שלו. לעומת זאת, אם הם חשבו והגיעו למסקנה כלשהי והיא לא מתרחשת בפועל, הם כן יופתעו. השאלה איזו מין הפתעה זו והאם הם מקשיבים לקשקושים של המורה שמאיים מחר בבוחן פתע היא פסיכולוגית. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |