|
||||
|
||||
התופעה שאתה מתאר היא (פחות או יותר) מה שנקרא "רגרסיה לממוצע" (לא להתבלבל עם "סתם" רגרסיה, אם כי יש קשר). מגיבים אחרים בפתיל כבר הרחיבו עליה את הדיבור, אבל המעוניינים להעמיק מוזמנים לבקר ב- http://en.wikipedia.org/wiki/Regression_toward_the_m... |
|
||||
|
||||
ואת הסיפור על כהנמן-טברסקי ופרחי הטיס אתה מכיר? זה קשור גם לנסיגה לממוצע (הנה, נפטרתי מהרגרסיה לשלב האוראלי) וגם לבלבול בין קורלציה וסיבתיות. אין לי חשק לספר אותו רק בשביל לשמוע את האנחות "שוב הנודניק הזה מספר את מה שידוע לכולם?" עולות מכל קצווי האתר. |
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
מצאתי את מה שכהנמן עצמו מספר על זה (מסתבר שאת טברסקי הוספתי לחגיגה על לא עוול בכפו, השותף של כהנמן באותה הרפתקה היה עוזר שילד). כהנמן ושילד ניסו לשפר את שיטות ההדרכה של פרחי טיס בחיל האויר, וזה מה שכהנמן מספר: "I had the most satisfying Eureka experience of my career while attempting to teach flight instructors that praise is more effective than punishment for promoting skill-learning. When I had finished my enthusiastic speech, one of the most seasoned instructors in the audience raised his hand and made his own short speech, which began by conceding that positive reinforcement might be good for the birds, but went on to deny that it was optimal for flight cadets. He said, "On many occasions I have praised flight cadets for clean execution of some aerobatic maneuver, and in general when they try it again, they do worse. On the other hand, I have often screamed at cadets for bad execution, and in general they do better the next time. So please don't tell us that reinforcement works and punishment does not, because the opposite is the case." This was a joyous moment, in which I understood an important truth about the world: because we tend to reward others when they do well and punish them when they do badly, and because there is regression to the mean, it is part of the human condition that we are statistically punished for rewarding others and rewarded for punishing them. I immediately arranged a demonstration in which each participant tossed two coins at a target behind his back, without any feedback. We measured the distances from the target and could see that those who had done best the first time had mostly deteriorated on their second try, and vice versa. But I knew that this demonstration would not undo the effects of lifelong exposure to a perverse contingency." (מתוך: http://www.nobel.se/economics/laureates/2002/kahnema... - קצת ארוך אבל שווה כל רגע.)
|
|
||||
|
||||
סיפור משונה משהו. השלכת מטבעות עיוורת היא הרי משהו אקראי לחלוטין, שאין צורך בשום כישורים כדי להצליח בו, בעוד טיסה היא פעולה הדורשת כישורים רבים ויכולות שונות. הרי לא ניתן לטעון כי הנסיגה לעבר הממוצע תקפה בשניהם באותו המידה, הלא כן? |
|
||||
|
||||
למה לא? עבור חניך מסויים, שרמת הביצועים הממוצעת שלו ידועה, אם הוא תפס יום טוב במיוחד1 גבוהים הסיכויים שלמחרת הוא יתפקד פחות טוב. זה נכון, כמובן, להמון תחומים אחרים, כולל הטלת מטבע עיורת (אגב, גם הטלה כזאת דורשת כישורים והיא אינה אקראית לחלוטין). ___________ 1- שילוב של מזל ושל כמה משתנים שאין לנו מושג לגביהם. |
|
||||
|
||||
חניך, מטבע הגדרתו, מתחנך. ברור שהממוצע זז במהלך הזמן. אין פה אירועים בלתי-תלויים, אלא להיפך - הביצועים שלך ביום שני מושפעים ממה שקרה ביום ראשון. הרי פרח טיס מתחיל את הקורס כשהוא לא יודע לטוס, ומסיים אותו כשהוא כן יודע. ואם לשפוט מאילוף חיות, פידבקים חיוביים הם דרך אפקטיבית ללמד כלב לתת יד, אבל פידבקים שליליים ילמדו את הדוב שלך לרקוד - וזה כבר משהו לכתוב עליו הביתה. |
|
||||
|
||||
ראית פעם איך נראה גרף של, נגיד, שער הדולר? באופן כללי הוא עולה כל הזמן: מזמן מזמן הוא היה שני שקלים לדולר, אחר כך שלושה, ארבעה, וכיום ארבעה וחצי, פחות או יותר. לפעמים הוא עולה קצת יותר - היה זמן שדולר היה שווה חמישה שקלים, אבל בסך הכל העלייה שלו די ברורה. אותו דבר, סביר להניח, יראה גרף הביצועים של חניך טיס: בסך הכל, תהיה מגמת עלייה, אבל זה לא אומר שלא יכולות להיות נקודות מקסימום מקומיות (או אפילו גלובליות) שאינן ממוקמות בקצה הגרף. אם אתמול חרגתי בצורה מדהימה מהגרף הצפוי לי, אין זה אומר בהכרח שחל שיפור משמעותי ביכולת שלי להטיס מטוס. סביר יותר להניח שהיה לי יום טוב, ושמחר אני אחזור לרמות הסטנדרטיות שלי. סוג הפידבק שתבחר לתת לי לא ישנה את זה. |
|
||||
|
||||
נוסף לך עוד רובד של שליטה רק מעצם זה שאתמול חרגת בצורה מדהימה בפעם הבאה שתתפוס עוד יום כזה קיים גם סיכוי סביר יחול שיפור שולי נוסף בביצועי השיא שלך לגבי הההשפעה של סוג הפידבק יתכן שהיא תלוייה באישיות של הנותן, המקבל ובאופי האינטרקציה |
|
||||
|
||||
אחרי שקראתי את המאמר של דינה ואן-דייק מאונ' בן גוריון בו היא הראתה שסוג העבודה ואישיות האדם המקבל את המשוב משפיעים מאוד על התוצאה של המשוב (כתבתי איפשהו תגובה מלאה על זה), אני מאוד חושב אחרת ממך. במבוא למאמרה היא סוקרת אוסף (בעיני מכובד) של מאמרים שבדקו את השפעת המשוב על הביצועים של ניבדקים. אם מעניין אותך אתה מוזמן לבקר בעמוד הבית שלה ואפילו לשאול אותה שאלות על הנושא (לפחות בתמונה היא נראת שווה) http://medic.bgu.ac.il/healthman/staff/vandijk/ |
|
||||
|
||||
דובי (שוב) ענה במקומי, ומשאיר אותי עם הספק: האם להניח למה שהוא אמר או לתת תשובה משלי, דומה למדי אך עם הדגשים שונים קמעא. אם תשובתו אינה מניחה את דעתך, אמור. (אילוף חיות מבוסס בימינו כמעט רק על תגמולים חיוביים, למרות שאני מניח שפה ושם משתמשים גם בעונשים. קשה לי לראות איך מלמדים את האריה לא לסגור את פיו כשהראש של המאמן בפנים בלי איזו סנקציה על התנהגות בלתי הולמת. לימוד מיומנויות חדשות כמו טיס (בניגוד, אולי (אולי גדול), לחינוך) יעיל יותר כשמשתמשים בתגמולים חיוביים, ואם יש כאן אנשי חינוך הם בטח יוכלו להביא ראיות). |
|
||||
|
||||
אני מניח של(רוב) חניכי קורס הטיס של חיל האויר הישראלי, התגמול החיובי המשמעותי ביותר, הוא הזכות לענוד את כנפי הטיס על חזם, ואילו הסנקציה החמורה ביותר היא הדחה מהקורס. בסך הכל מדובר בזויות ראיה שונות של אותו תהליך. |
|
||||
|
||||
זה בטח נכון, אבל לא ממש שייך לעניין. אנחנו מדברים כרגע על תגמולים מידיים, כאלה שאמורים לעזור לחניך להגיע ליעד הנכסף. במלים אחרות: גם כשהמטרה שלי היא להגיע לאוצר באי המטמון לא יזיק לקבל קצת הוראות בדרך (ואת הבדיחה על הזרעונים אתה בטח מכיר - ואם לא, הרי שהרסתי אותה הרגע) |
|
||||
|
||||
לפני חודשים מספר נזמנה לידי חוברת של אונ' בן גוריון. אחת החוקרות שם, דינה ואן-משהו, הראתה שתוצאות המשוב תלויות בסוג העבודה ואופי העובד. משוב חיובי לעובדים במשימות שגרתיות הביא לירידה בביצועים, בעוד שמשוב שלילי הביא לעלייה בביצועים. כנראה בגלל שהמשוב החיובי גרם לכניסה לאופוריה וסיפוק עצמי. בעבודות הדורשות יצירתיות משוב חיובי שיפר את הביצועים ומשוב שלילי הרע אותם. אנשים יצירתיים הפיקו את המירב ממשוב חיובי ונפגעו משלילי, וההפך באנשים יותר שיטתיים וסגורים. אני מקווה שאני לא מסרס יותר מדי את מה שקראתי בזמנו. בקיצור השאלה איזה סוג משוב תלויה במטלה ובאדם. |
|
||||
|
||||
בהנחה שמחקרה של הגב' דינה ואן-משהו אמין, ברור שלימוד מיומנויות חדשות לא נופל במסגרת ''עבודות שגרתיות'', כך שהמסקנות של הגב' תואמות את הטענה לגבי השיטה היעילה ללמד. |
|
||||
|
||||
בעקבות החדשות העצובות החלטתי לצרף תרגום לעברית באדיבותו של Copilot. התרגום לא רע לטעמי, מלבד לכמה בעיות שהדגשתי: חוויתי את הרגע המרגש ביותר בקריירה שלי כשניסיתי ללמד מדריכי טיסה ששבח יעיל יותר מעונשין לקידום למידת מיומנויות. כשסיימתי את נאומי המלא בהתלהבות, אחד המדריכים המנוסים ביותר בקהל הרים את ידו ונשא נאום קצר משלו, שהתחיל בהודאה שחיזוק חיובי עשוי להיות טוב לציפורים, אך המשיך להכחיש שזה האופטימלי לקדטים. הוא אמר, “במקרים רבים שיבחתי קדטים על ביצוע נקי של תרגיל אקרובטי, ובדרך כלל כשהם מנסים שוב, הם עושים פחות טוב. מאידך, לעיתים קרובות צעקתי על קדטים על ביצוע לקוי, ובדרך כלל הם עושים טוב יותר בפעם הבאה. אז בבקשה אל תגידו לנו שחיזוק עובד ועונשין לא, כי ההפך הוא המציאות.” זה היה רגע שמח, שבו הבנתי אמיתה חשובה על העולם: מכיוון שאנו נוטים לשכר אחרים כשהם עושים טוב ולענוש אותם כשהם עושים רע, ומכיוון שיש רגרסיה לממוצע, זהו חלק מהמצב האנושי שאנו מוענשים סטטיסטית על שכר אחרים ומשוכרים על ענישתם. מיד סידרתי הדגמה שבה כל משתתף זרק שתי מטבעות למטרה מאחורי גבו, ללא כל משוב. מדדנו את המרחקים מהמטרה וראינו שאלה שעשו את הטוב ביותר בפעם הראשונה בדרך כלל הדרדרו בניסיונם השני, ולהפך. אבל ידעתי שההדגמה הזו לא תבטל את השפעות של חשיפה על פני כל החיים לקשר מופקר. |
|
||||
|
||||
לא מכיר, ומצטרף לבקשות. גיבורך לנצח, יובל |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |