|
||||
|
||||
0.2 מלמדת על התאמה חלשה ביותר בין המשתנים, ונסיונאים יאמרו אפילו - אי-תלות סטטיסטית בין המשתנים. נאמר שרוצים לעמוד על התלות הסטטיסטית בין X לY. לצורך פשטות נאמר שהתוחלת של X ושל Y היא אפס, כלומר שממוצע הערכים שהם מקבלים הוא אפס. אז השונות של X תהיה פשוט תוחלת הריבוע של X, כלומר הערך הממוצע של X בריבוע, וכנ"ל לגבי Y. פרמטר המתאם (קורלציה) יוגדר במקרה זה כתוחלת המכפלה X*Y, חלקי השורש של מכפלת השונות של X בשונות של Y. במקרה הפשוט ביותר בו Y הוא פונקציה לינארית של X, Y=kX אזEY^2 = E(k^2X^2) = k^2 * EX^2 ואז המתאם יהיה בדיוק 1, כלומר מתאם מלא בין Y לבין X. לעומת זאת אם המדידות שלנו יתפזרו בצורה אחידה למדי במישור (X,Y), למשל אם המישור הוא מטרה במטווח ואנו מודדים מקבץ יריות, אז הקורלציה בין Y ל-X אמורה להיות נמוכה למדי.EXY = E(kX^2) = k * EX^2 כל מי שעשה מעבדה או שתיים בפיסיקה בתיכון אמור לדעת שהקורלציה בין שני משתנים שאמורים להיות תלויים, תמיד יוצאת לפחות 0.9, ובמקרים האיומים ביותר בסביבות 0.5. 0.2 זה בערך מה שמקבלים אם מודדים את התלות של מספר הציפורים הנודדות מעל ארצנו במספר נשיכות הכלבים באיזור גוש דן. |
|
||||
|
||||
הכל תלוי, כמובן, בגודל המדגם. אם R הוא מקדם המתאם (המחושב מתוך דגימה של n נתונים), אז לסטטיסטי T=sqrt((n-2)*R^2/(1-R^2)) יש התפלגות "t" עם n-2 דרגות חופש. המתאם שיחשב מובהק1 תלוי לכן ב- n. למשל:במדגם בגודל n=10, רק מקדם מתאם R=54% ומעלה הוא מובהק. אם n=30, מספיק R=30%. אם n=100 מספיק R=16%, ואם n=2000 מספיק לקבל R=3.5%. 1 מובהק: לא סביר שיתקבל מספר כזה אם המשתנים באמת אינם תלויים. |
|
||||
|
||||
ליאור, אתה חי בעולם של פיזיקה, בעוד שאנחנו עוסקים במדעי החברה. להשיג 0.9 זו פנטזיה במצב כזה. אפילו 0.7 זה חלום רטוב. 0.5 זה מרשים מאוד, 0.4 זה נאה, 0.2 הוא בסדר כזה, לא משהו. הסיבה, כמובן, היא שאין שום דבר שמשפיע עליו רק דבר אחד, אלא יש סדרה של גורמים, רבים מהם כלל אינם ידועים לנו, שמשפיעים על השונות. |
|
||||
|
||||
למי שתהה איך נראה גרף עם מתאם 0.2, הנה אחד לדוגמה: התמונה התחתונה כמובן (ומתחת לה אחת הפסקאות המחורבנות ביותר שחיברתי מעולם) |
|
||||
|
||||
כמו שעוזי ו. אמר, המשמעות של מקדם המתאם תלויה בגודל הדגימה. הפיסקה שהבאת היא אכן מחורבנת למדי, בלי להעליב :-) בכל מקרה, אני מקווה שתסכים איתי שאם התוחלת של ביצועי הרופא בהנחה שממוצע הציונים שלו הוא 95 גבוהה מהתוחלת של ביצועיו בהנחה שממוצע הציונים שלו הוא 65 (ואם סטיית התקן ושאר המומנטים דומים בשני המקרים), כדאי יותר להעסיק את הרופא בעל ממוצע 95 גם אם סטיית התקן היא גדולה. |
|
||||
|
||||
לא נעלבתי, תודה (: במקרה של התאמה נמוכה בין ציוני הרופא לביצועיו, הייתי מעדיף להכניס לשיקולים מדדים מהימנים יותר. למשל, הערכה של ביצועיו בתקופת ההתמחות או פשוט הארכה של תקופת התמחותו. _______________ ליאור, ו45 כניסות חדשות ליצירתו 'גרף למאמר 'סיכון מחושב או טמטום לשמו". |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |