|
||||
|
||||
להלן ריכוז הנתונים וניתוחם: שישה מגיבים דווחו על סוג דם שאינו O, מתוכם שני צמחונים (נועה ואני) וארבעה אוכלי בשר (דורון, קליסון, שכ"ג ואריק). שלושה מגיבים דווחו על סוג דם O, מתוכם צמחונית אחת (רנני) ושני אוכלי בשר (הפונז ואיזי). שני מגיבים נוספים, ברקת ויוסי (להלן - "הבעייתיים") דווחו על סוג דם שאינו O, אבל אפשר להתווכח צריך האם לקטלג אותם כצמחונים או כאוכלי בשר (ברקת צמחונית "רק" מזה כשנתיים, ויוסי "אוכל מעט מאוד בשר"). ההשערה היתה "O לסוגיו - עם צורך לאכול בשר, כל השאר - ללא נטייה לאכול בשר", ואני אפילו מרכך אותה ל-"O לסוגיו - נטייה גבוהה יותר לאכול בשר מאשר כל השאר". אם מתעלמים מהשניים הבעייתיים, מקבלים שאחוז אוכלי הבשר זהה בקרב שתי קבוצות הדם - בדיוק שני שליש. לא צריך מבחן סטטיסטי כדי לראות שאין כאן תימוכין להשערה. אם מקטלגים את שני הבעייתיים כאוכלי בשר, אז אחוז אוכלי הבשר בקרב בעלי סוג דם שאינו O עולה ל-3/4, אז על אחת כמה וכמה שאין תימוכין להשערה. אם מקטלגים את הבעייתיים כצמחונים, אחוז אוכלי הבשר בקרב בעלי דם שאינו O יורד לחצי; זאת סוף סוף תוצאה בכיוון של ההשערה, אבל היא לא מובהקת סטטיסטית (p = 0.5758 במבחן פישר חד-צדדי). הפונז ביקש לא לכלול את הדיווח של רנני בנתונים. מבחינת אתיקה סטטיסטית, עדיף היה לבקש את זה לפני שראינו את הדיווח שלה, אבל התוצאות לא משתנות גם כשמשמיטים אותה: אפילו כשמקטלגים את הבעייתיים כצמחונים, עדיין לא מתקבלת תוצאה מובהקת (p = 0.333). |
|
||||
|
||||
קונה בשתי ידיים ורגליים וזנב כמה אנשים לדעתך יש כאן בכלל? לפי הכניסות לקליפ של שי גולדשטיין שנתתי, יש אולי 50, ואני מניחה שלקליפ הזה הרוב נכנסו בגלל השם. |
|
||||
|
||||
רגע, אבל בקרב מי שהוא O יש 100% אוכלי בשר, לא? וברקת מוגדרת כצמחונית, זה מה שהיא עכשיו ומה שהיא מייצגת לאורך כל הדיון, להיכנס להיסטוריה זה קצת לא הוגן. איך זה נראה אז? (כנראה שאנחנו מוכיחים כאן כמה קל לקבל כמעט מה שרוצים במספרים כל כך קטנים, אבל תתעלם מההערה לפני שאתה עונה למה שאמרתי בבקשה.) |
|
||||
|
||||
כשמחשיבים את ברקת ואת יוסי בתור צמחונים ומשמיטים את רנני, מקבלים שבקרב בעלי סוג דם O אחוז אוכלי הבשר הוא 100 (2 מתוך 2), ובקרב האחרים אחוז אוכלי הבשר הוא 50 (4 מ-8). לכאורה, זה תומך בהשערה שלך, אבל זה לא ממצא מובהק סטטיסטית: יש ההסתברות לא מבוטלת לקבל תוצאה כזו (או אפילו יותר קיצונית, לטובת ההשערה שלך) סתם במקרה, גם כשאין תלות בין סוג הדם לבין העדפות האכילה. ההסתברות הזו היא בדיוק ה-p-value שדיווחתי, 0.333. אני לא מבין למה כתבת ש"קל לקבל כמעט מה שרוצים במספרים כל כך קטנים". אכן יש הבדל גדול בין 100% לבין 50% (זה האמד ל"גודל האפקט"), אבל בדיוק בגלל שהמספרים הגולמיים קטנים, ה-p-value שהתקבל מלמד אותנו שאי אפשר להתעלם מהאפשרות שההבדל הזה התקבל סתם במקרה. לכן לא קיבלנו מה שרצינו. אילו המספרים היו יותר גדולים, אותו גודל אפקט יכול היה להיות מובהק: למשל, אם מכפילים את הנתונים הגולמיים ב-10 (20 אוכלי בשר בקרב 20 בעלי סוג דם O, ו-40 אוכלי בשר בקרב 80 בעלי סוג דם שאינו O), אז שוב יהיה מדובר ב-100% לעומת 50%, אבל הפעם ה-p-value הוא פחות מ-1 חלקי מאה אלף (למתעניינים: p = 7.821e-06), כלומר הממצא מובהק ביותר. |
|
||||
|
||||
השתעשעתי לי כמנהג כתבי סיינטיפיק הארץ. והרי בשום כתבה בעברית שנתקלת בה לא צוין ה-p-value של ה'מחקר חדש שטוען ש...'. בקיצור, בגלל זה נתתי לך לדווח נתונים מדויקים ואמינים ולא הסתמכתי על נפנופי הידים שלי. תודה על הניתוח הנאה. |
|
||||
|
||||
על לא דבר, העונג היה שלי. אכן לא נתקלתי אף פעם ב"הארץ" ב-p-value, וגם לא באף עיתון אחר מסוגו. כשזה קורה במסגרת כתבה מהז'אנר "מחקר מדעי חדש טוען ש..." אז ניחא, כי אותו מחקר מן הסתם התפרסם בכתב עת מדעי רק בגלל שהממצאים שלו כן היו מובהקים סטטיסטית. אבל כשמדובר ב"מחקר" שערך העיתון עצמו, אני אכן הרבה פעמים מפקפק בתקפות הממצאים: למשל, אם כתב חרוץ הלך ובדק את הניקיון בשירותים בכמה קניונים (עם ציונים מספריים והכל), ואז פרסם את הכתבה "האסלות המבהיקות ביותר והמטונפות ביותר בגוש דן - הדירוג המלא!", לא ברור לי עד כמה אפשר לסמוך על התוצאה. הצעד הבא: בוא נחשוב על ביקורת מסעדות ... |
|
||||
|
||||
אבל למה להשמיט את רנני? |
|
||||
|
||||
את זה תשאלי את הפונז. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |