|
||||
|
||||
אני בעיקר יודע להשתמש בסטטיסטיקה, ופחות מבין את הצורה שבה מחשבים דברים - כשלמדתי את הנושא בפעם הראשונה, קיבלתי הסבר מספק לצורת החישוב, והרשיתי לעצמי לשכוח את זה, כי בכל מקרה אף אחד לא עושה את זה ביד. בשביל זה המציאו את SPSS. למעשה, מתאם לא נכתב באחוזים, בד"כ, אלא כמספר בין מינוס אחד לאחד. המשמעות היא זו: בוא נניח שאנחנו רוצים לראות מה מנבא (=משפיע על), נגיד, הכנסה. ההשערה שלנו היא שההכנסה מושפעת ע"י, נגיד, מספר שנות הלימוד שלו. מובן מאליו שזהו לא הגורם היחיד שמשפיע על השכר - גיל משפיע על השכר, תחום העיסוק משפיע, ציון הבגרות בתנ"ך משפיע (סתם, לא...) וכו'. אבל אנחנו רוצים לראות האם להשכלה יש תפקיד כלשהו בניבוי הכנסה. עכשיו ניצור גרף של כל המדגם שלנו, כאשר ציר האיקס הוא מספר שנות הלימוד, וציר ה-Y הוא ההכנסה באלפי שקלים. ברור לך שהגרף לא ייצור קו ישר - יהיה פיזור מסויים של הנקודות, אך ניתן להעריך שנוכל לראות מעין "ענן" שהכיוון שלו הוא חיובי - ככל שיש לך יותר שנות לימוד, ההכנסה שלך גבוהה יותר. עכשיו, נעשה מה שנקרא "רגרסיה"1 - ניצור קו שיתאר מעין ממוצע של ה"ענן" שלנו. הקו הדרוש לנו הוא כזה שסכום ריבועי מרחקי הנקודות על הגרף ממנו, יהיה מינימלי. תשאל את עוזי, הוא בטח ידע להסביר לך איך המחשב מגלה את זה, לי אין מושג. עכשיו שיש לנו את הגרף והרגרסיה, אנחנו רוצים לדעת עד כמה מוצלחת הרגרסיה שלנו בתיאור הענן. לשם כך אנחנו רוצים לגלות את ה*מתאם* בין שני המשתנים. המתאם מבוסס, בדרך כלשהי שאינני זוכר, על סכום ריבועי המרחקים של הנקודות מקו הרגרסיה, והוא נע בין מינוס אחד (כל הנקודות נמצאות על הקו, והקו יורד) לאחד (כל הנקודות נמצאות על הקו, והקו עולה), כשבתווך יש לנו את אפס, שמשמעותו היא קו מקביל לציר ה-X, ואין שום מגמה בכלל בנתונים שיש לנו. אפס מדוייק אנחנו לא נקבל, בד"כ, ולכן הקו יהיה בנטייה כלשהי, אבל אם המתאם מאוד קרוב לאפס, המשמעות היא פשוט שכוח הניבוי של המשתנה שלנו הוא מזערי - הסיכוי שלי לדעת מה ההכנסה של אדם לפי שנות הלימוד שלו הוא לא שונה בצורה מהותית מניחוש פשוט. אבל מתאם גבוה יותר כבר אומר שיש כאן מגמה, ואם הוא גם מובהק2, על אחת כמה וכמה. אם תיקח את המתאם ותעלה אותו בריבוע, תקבל את השונות המוסברת. כך, למשל, אם יש לנו מתאם של 0.4, השונות המוסברת תהיה 0.16. המשמעות של המספר הזה היא שהמשתנה היחיד שלנו מצליח להסביר 16 אחוז מהשוני בין המקרים השונים. במחקרים במדעי החברה, מספר כזה ממשתנה אחד - או אפילו יותר - הוא מצויין. הסיבה היא שתמיד יש אלף ואחת השפעות על מה שאנחנו מנסים לבדוק, חלקן בלתי מדידות בעליל. אה, אמרת טיפה. סליחה. 1 השם הזה הוא מסיבות היסטוריות. אין שום דבר רגרסיבי ברגרסיה. 2 מובהקות לוקחת בחשבון גם את מספר המקרים במדגם. השאלה שמדד המובהקות עונה עליה היא: מה הסיכוי שהמתאם שגיליתי במדגם הזה הוא שגוי, ונובע ממדגם שלא באמת מייצג את כלל האוכלוסיה. נהוג לקבל כמובהק מתאם שהמובהקות שלו נמוכה מ-5%, אבל יותר שווה אם היא נמוכה מאחוז אחד, או חצי אחוז. גם מתאם נמוך יכול להיות מובהק, בהנתן מדגם מספיק גדול. |
|
||||
|
||||
למען האמת, פעם ידעתי איך מחשבים את קו המגמה בעצמי, זה אפילו לא ממש מסובך, אבל שכחתי זה לא מכבר. בתקווה שהלימודים הנוכחיים יזכירו לי. מה שאתה מתאר הוא בדיוק מה שעושים גם בניסויים פיזיקליים, וכל תלמיד כיתה י"א עושה באקסל שלו, אלא ששם באמת מצפים לקו מגמה הרבה יותר מדוייק, סביבות 0.95 ומעלה. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |