|
||||
|
||||
תיקון מינוח: שגיאות אקראיות מתקזזות (בהסתברות לא רעה) כאשר משתמשים במדגם מספיק גדול. אבל לא כל השגיאות הן אקראיות. אם הדיווח מוטה מסיבה זו או אחרת (והשימוש במילה "מוטה" לא מיועד לרמוז על הטיה פעילה), ההטיות הללו יבואו לידי ביטוי בתוצאות. ליתר דיוק, גם המתאם שאותו אנחנו מחפשים הוא איזושהי הטיה של המדגם במובן מסוים (כלומר: לעומת מדגם שבו אין קשר בין שני המשתנים). מעבר לכך, בגלל הניחושים הללו שאלתי האם נעשו מחקרים על הטיות הדיווח של אנשים. יש לנו כאן כל מיני אינטואיציות שונות, אבל הרבה יותר טוב להיעזר בנתונים אמתיים כדי לנסות להעריך את השגיאה. |
|
||||
|
||||
על הטיות הדיווח של סה"כ הצריכה הקלורית: (המאמר המלא לא נגיש לי, כיאה לדיון בו אנחנו נמצאים). מתוך המסקנות: "We observed a large downward bias in reporting food intake related to social desirability score." אם להאמין לתקציר יש להם גם הצעות לטיפול בבעיה. הדיווח בנוגע לאכילת פירות וירקות נגוע בבעיה די דומה (בלי להכנס לפרטים, אם הודיעו לנחקרים שהמחקר נועד לבדוק צריכת פירות וירקות הם הגזימו בדיווח בכיוון הזה), הנה. מהמסקנות: "Self-reports of fruit and vegetable intake using either a food frequency questionnaire or a limited 24-hour recall are both susceptible to substantial social approval bias." יש, כמובן, עוד די הרבה, וגוגל ישמח להפנות אותך. כשתיבת החיפוש היתה "self reporting food consumption bias" הוא מצא יותר משני מליון תוצאות. ממבט חטוף נראה לי שכאן יש סיכום לא רע של המצב. ג'וד - יכול להיות שחלק מהשאלות שהפנית ליובל נענות שם, כאמור אני רק הצצתי. |
|
||||
|
||||
ראיתי לפני כמה חדשים כתבה מתורגמת (בגלובס, אני חושב) על הטיה כלפי מטה באומדן הקלוריות שיש במאכלים. הנבדקים העריכו בממוצע את כמות הקלוריות באוכל "לא בריא" גבוה יותר מאשר בארוחה שכוללת את אותו אוכל "לא בריא" בתוספת אוכל "בריא". לדוגמה הנבדקים העריכו את כמות הקלוריות בארוחה הכוללת צ'יזבורגר וצ'יפס לבד ביותר מאשר בארוחה הכוללת את אותם צ'יזבורגר וצ'יפס וגם מקלות סלרי. |
|
||||
|
||||
מה, לא ידעת שלחסה (וגם לסלרי באותה מידה של בטחון ורצינות) יש כמות שלילית של קלוריות, כי אתה מוציא יותר אנרגיה כדי לעכל אותם מהאנרגיה שאתה מפיק מהם? |
|
||||
|
||||
בדיוק להיפך, אנטי-חומר שיגע בחלק כלשהוא של מערכת העיכול שלך ישחרר את הכמות ה*מקסימלית* של אנרגיה שניתן להפיק מחומר כלשהוא. |
|
||||
|
||||
אה. אז שעועית זה אנטי חומר? (וחייב למחזר:האם אנטי פסטה מנטרלת פסטה?) |
|
||||
|
||||
(בטח, בייחוד כשהם מלווים באיזה קיאנטי טוב) |
|
||||
|
||||
נכון, זה מחקר מעניין על הנטייה לתת תשובות רצויות והוא דן בחלק מהשאלות שמטרידות אותי. העליתי אותו לדרופבוקס. גם אני קראתי רק ברפרוף, למשל ככל שאנשים אכלו יותר שומן הם דיווחו על פחות. |
|
||||
|
||||
אם במציאות יש מתאם, שגיאות יגדילו את הפיזור סביב קו הרגרסיה. אז מקדם הרגרסיה יישאר אותו דבר אבל המדד של הפיזור (שכחתי איך קוראים לו) יהיה גדול. אז איך שגיאות מקזזות זו את זו? |
|
||||
|
||||
מקדם הרגרסיה נשאר אותו דבר בדיוק בגלל שהשגיאות מקזזות זו את זו. |
|
||||
|
||||
אכן, וזה מה שכתוב בחלק הראשון של המשפט שלי, אבל מה שחשוב זה החלק השני. מקדם הרגרסיה, כלומר השיפוע של הקו, יישאר, אבל הנקודות לא יהיו מסודרות לאורך הקו אלא מרוחות בפיזור, ופירוש הדבר שחלק גדול מהאוכלוסיה אינה מתנהגת בהתאם למתאם. יובל יסביר את זה. |
|
||||
|
||||
ברור שחלק מהאוכלוסיה לא מתנהגת (וחמור מזה - מודדת את עצמה ומדווחת) *בדיוק* על פי המתאם. הרי אחרת אפשר היה לשאול שלושה אנשים ולקבל תוצאה אמינה. בגלל שיש שגיאה ב*מדידה* של האפקט הנמדד, יש את הפיזור הזה. אבל כשלעצמה זו לא "בעייה" כל עוד המדגם מספיק גדול ושיפוע הקו לא נפגע. כדאי אולי להזכיר שכל מה שמעניין אותנו זה השיפוע של הקו הזה, וכל השאר זה המכשולים בדרך ללמדוד אותו. אם השיפוע לא נפגע, אפשר להכריז שקיבלנו מדידה מוצלחת ולהסיק מסקנות1. גם כשמודדים את מחירי הדיור הממוצעים, נגלה שחלק (אולי אפילו ניכר) מהדירות, ערכן לא עלה בדיוק כמו הממוצע. חלק עלו פחות, וחלק עלו יותר. ועדיין העלייה הממוצעת היא נתון מעניין וחשוב, שלא כדאי להתעלם ממנו בגלל הפיזור של הדגימות שלנו. 1 כמובן שבמקרים קיצוניים עם שגיאות עצומות, זה שם איזה סימן שאלה על התוצאה, זה טריויאלי. |
|
||||
|
||||
שיפוע זה יפה מאד אבל אנחנו שואלים את עצמנו עד כמה הוא באמת מסביר את ההתנהגות, זאת אומרת בדוגמה שלנו כמה מתוך עליית הכולסטרול בדם מוסברת על ידי עליי הכולסטרול במזון. אם הנקודות מפוזרות במרחקים גדולים מקו הרגרסיה זה אומר שקו הרגרסיה אף שהוא יפה ותלול הוא מסביר מעט מאד, ושיש סיבות אחרות שמשפיעות על הכולסטרול בדם. אני מדברת בשפת בני אדם ולא בשפת סטטיסטיקאים כדי לא לטעות בשמות, נדמה לי שזה נקרא R. יובל יסביר לנו איך זה משפיע על מסקנות המחקר. |
|
||||
|
||||
המשפט השני שלך לא נכון. אבל בואי נחכה ליובל. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |