|
בהמשך לתגובה הקודמת, משפטים כאלה מופיעים כאשר מעורבים בבעיה כמה גורמים מסבירים. כדי לאמוד את זמן התגובה Y לבדיחה (נחש של מי), אנחנו לא מסתפקים במבחני אכילת גזר (X1). עורכים גם מבחני המלטות מאולמות דחוסים (X2) וסיבולת (X3). שוב מניחים שהמודל ליניארי (כלומר, Y הוא קבוע, ועוד מקדם מסתורי כפול X1, ועוד מקדם כפול X2, ועוד מקדם כפול X3, ועוד גורם שגיאה פרטי; כל ארבעת המקדמים משותפים לכל האוכלוסיה).
אחרי שנאסוף נתונים מאלף פתאים-מתנדבים, אנחנו יכולים לאמוד את מקדמי המתאם ובכך להציג מודל לא-רע להערכת Y; המודל ליניארי (כי כך הנחנו), ועכשיו אפשר להציב בו מקדמים מפורשים - ארבעת המספרים שממזערים את סכום ריבועי השגיאות.
כמקודם, הצבה במודל היא צד אחד של הסיפור (הצד הפרקטי, של הערכת Y פרטנית). כדי לפרסם מאמר ב"הארץ שלנו", צריך לנרמל את מקדמי המתאם ולהעלות אותם בריבוע (ככה.) אם ריבוע המקדם של X1 שווה ל- 0.30, ריבוע המקדם של X2 שווה ל- 0.40 (אני מרמה כאן; נניח שיצא 0.40 אחרי שזרקנו מ- X2 את המרכיב ש"מקביל" ל- X1 ונשארנו עם המרכיב ה"מאונך"), וריבוע המקדם האחרון הוא 0.1, נדווח לעיתונות ש"זמן התגובה מושפע ב- 30% מיכולת אכילת הגזר, ב- 40% מיכולת ההמלטות וב- 10% מן הסיבולת".
בעיתונות המקצועית ננסח זה אחרת לגמרי: "30% מן השונות בזמן התגובה מוסברים על-ידי השונות ביכולת אכילת הגזר, 40% על-ידי השונות ביכולת ההמלטות, ועוד 10% על-ידי השונות בסיבולת". הנחת היסוד היא שהשונות בין בני-אדם היא דבר מזיק (למודלים שלנו), וצריך להסביר איך השונות הזו התגנבה לשם. ככל שנצליח להסביר חלק גדול יותר ממנה בכך שנתוני הרקע (X1, X2, X3) שונים, מצבנו טוב יותר.
(גם זו תשובה חלקית, בעיקר מאותה סיבה - חסר הקשר למובהקות).
|
|