בתשובה לירון, 02/03/16 13:21
שאלה בהסתברות 674739
אני מגדיר "התפלגות אורקל" באופן שתתמזג עם התפלגות היפרגאומטרית עבור P=0.5.

function oProb = oHyper(N, K, P)
%OHYPER

oProb = zeros(K,1);
for k = 1:K
oProb(k) = nchoosek(K,k)*P^k * nchoosek(N-K,K-k)*(1-P)^(K-k);
end
oProb = oProb / sum(oProb);

end

ואחר כך מריץ את הסקריפט הבא:

%%
clear;clc
format LONG

%%
oProb = oHyper(30, 15, 0.5);
hProb = hygepdf(1:15,30,15,15)';
disp([oProb hProb]);

%%
oProb = oHyper(30, 15, 2/3);
fprintf('\\nOracle distribution for P = 2/3\\n')
disp(oProb);
fprintf('\\nOracle prob for 8 or less successes %5f\\n', sum(oProb(1:8)));

אני מקבל

0.000001450513143 0.000001450513134
0.000071075144001 0.000071075143543
0.001334633259574 0.001334633250970
0.012011699336166 0.012011699258730
0.058136624787043 0.058136624412252
0.161490624408453 0.161490623367367
0.266953889328258 0.266953887607280
0.266953889328258 0.266953887607280
0.161490624408453 0.161490623367367
0.058136624787043 0.058136624412252
0.012011699336166 0.012011699258730
0.001334633259574 0.001334633250970
0.000071075144001 0.000071075143543
0.000001450513143 0.000001450513134
0.000000006446725 0.000000006446725

Oracle distribution for P = 2/3
0.000000010080107
0.000000987850518
0.000037099275003
0.000667786950053
0.006464177676510
0.035912098202832
0.118729794058344
0.237459588116687
0.287296785622658
0.206853685648314
0.085476729606741
0.018994828801498
0.002023117860515
0.000082576239205
0.000000734011015

Oracle prob for 8 or less successes 0.399272

תוצאה שלא פוסלת את טענת ה- 2/3.
שאלה בהסתברות 674741
מבלי להתעמק במספרים: הניסוי בא לבדוק השערה מסויימת. אתה מעלה השערה אחרת. כדי לאושש אותה צריכים ניסוי נוסף.

אבל בנוסף, מהי ביוק המשמעות של רמת הדיוק הזו? כשלון בגילוי מטרות קיימות או גילוי שגוי של מטרות שגויות? כמוכן: האם כשאהרוני חופר בריכה ומחפש צינורות, יש לו הסתברות של שליש לפספס כל צינור שעובר שם? ואם כן, מהי ההסתברות שלו לפספס צינור כלשהו שעובר שם?
שאלה בהסתברות 674751
הניסוי נערך ותוצאותיו נתונות. הפרשנות תלויה במודל המתמטי, ומותר לבדוק השערות שונות.

ביחס לרמת הדיוק - רציתי לוודא שאין לי באג ע"י השוואה נומרית של התוצאות עבור P=0.5 להתפלגות ההיפרגיאומטרית. הכל נעשה בחופזה וזה נשאר כך כשהעתקתי. אין לדיוק חשיבות מיוחדת.

אם היה מדובר בהתפלגות בינומית הייתי מיחס לטענת ה-‏2/3 משמעות כמו בניסוי ברנולי. אבל כאן המשתנים לא בלתי תלויים. אני לא יודע איך לתרגם טענת ה-‏2/3 למודל הסתברותי. מאחר שזו בסה"כ בעיה נאיבית, ורוב המגיבים מגיעים מרקע של מתמטיקה-מדעי המחשב-פיזיקה, הייתי בטוח שמישהו יקפוץ מייד ויתן את התשובה שאמורה להיות ידועה היטב, ואני במקרה לא יודע אותה.

הפונקציה oHyper היא פנקצית הסתברות מפני שנירמלתי את הטווח שלה. היא מבוססת על שיקולים אינטואיטיביים ולא הוכחה של ממש. בכל אופן צריכה להיות פונקציה כזאת, וצריך לבדוק מה ההסתברות שאהרוני יקבל תוצאה כפי שקיבל או גרועה יותר בהנחה של פונקציית ההתפלגות שמיצגת את הטענה שלו (בעצם את הטענה שאני מיחס לו).
שאלה בהסתברות 674784
"הניסוי נערך ותוצאותיו נתונות. הפרשנות תלויה במודל המתמטי, ומותר לבדוק השערות שונות."

מה זאת אומרת? תמיד אפשר "לתפור" תיאוריה שתתאים לתוצאות הניסוי. כידוע אפילו לחזור על הניסוי מההתחלה לכל תיאוריה זה לא מספיק.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים