|
||||
|
||||
נראה לי שבהודעות האחרונות "ניתן לקרטריון ההפרכה של פופר מעמד של מבחן-עליון-מוסכם-לענייני-מדעיות" בדיוק כפי שההודעה האחרונה שלך אמרה שפופר "שווה לתחת" - כלומר, אולי זה הרושם השטחי שהתקבל, אבל אין לזה קשר של ממש לתוכן ההודעה. זה גם מפיל את טיעון א' שלך: אף אחד לא טוען שהתיחום הוא *מספיק*, אלא רק שהוא מסנן תיאוריות "לא מדעיות" (ולכן, אם למשל הפסיכואנליזה אינה עומדת בו, היא לא מדע). ב' הוא כבר טיעון יותר מעניין, וחשבתי שתביא בתור דוגמה דווקא את תורת המיתרים שנידונה במאמר כאן באייל, ואני לא מבין בה כלום; בכל הנוגע לזמן מחצית החיים נראה לי שאפשר לארגן מבחנים לא רעים לאישוש (לא ודאי, כמובן) של הטענה: קח כמות מוסכמת של החומרים, שים אותם במיכל ובדוק כמה זמן לוקח למחצית מהם להתפרק. חזור על הניסוי מספר פעמים ובדוק האם הזמן שחלף קרוב (לא שווה בדיוק של אלפית השניה) לזמן מחצית החיים הנטען. אם זה בכלל לא קרוב, הטענה מופרכת. בקשר לג', שוב מעניין בעיקר ה*איך* - למשל, מה קון עשה. אגב, עד כמה שהבנתי, פופר ניסה בעיקר להבהיר לעצמו "למה אני מרגיש שתורת היחסות היא מדע אבל פסיכואנליזה לא". כל תוכנית מחשב שמתחייבת לאיכות ביצועים כלשהי ניתן לבדוק אמפירית, כמו גם טענות בסגנון "אלגוריתם הסימפלקס עובד מצויין בד"כ". |
|
||||
|
||||
ב' - מה פתאום אישוש? פופר מדבר על הפרכה. ג' - מה קון עשה? בין השאר הוא כתב ספר מאד קריא ונגיש, ובו הרבה דוגמאות היסטוריות לכך שמדעי הטבע לא פועלים באופן שפופר דימה. דוגמא שאני מצליח להעלות בזכרוני עכשיו גרסה מפושטת שלה היא גילוי נפטון. המסלול של אורנוס לא התיישב עם המכניקה הניוטונית. לפי פופר, מה שצריך לעשות עכשיו הוא לזרוק את המכניקה הניוטונית. במקום זאת הניחו קיומו של כוכב-לכת חדש (נפטון, כאמור) שמיקומו ומסתו מיישבים את המסלול של אורנוס. מעניין שסיפור דומה התרחש מאוחר יותר עם כוכב חמה, אלא שאז כן בחרו לזרוק את המכניקה הניוטונית, ולקבל במקומה את היחסות הכללית (שחזתה נכון את תנועתו). קון מדגים כמה וכמה "שינויי פרדיגמה"[*] ומראה שקרטיריון ההפרכה אף פעם לא שיחק תפקיד מרכזי, אם בכלל, בברירת תיאוריות חלופיות (הוא גם מציע תיאוריה משלו, אבל לא חייבים לקבל אותה בשביל לדחות את פופר). בכלל, כאשר התיאוריה לא מתיישבת עם התצפיות אפשר: להוסיף הנחות לגבי "מצב הטבע" שיישבו בין התיאוריה לתצפיות (למשל כוכב לכת חדש), אפשר לפקפק בתצפיות עצמן (שגיאות, בעיות במכשירים), אפשר לפקפק בפרשנות של התצפיות ולבסוף: אפשר לדחות את התיאוריה. רק לעיתים רחוקות ונדירות דוחים את התיאוריה. כמעט תמיד המדענים יבחרו באחת האפשרויות האחרות. [*] זכור לי ניתוח היסטורי של המושג "יסוד כימי", המעבר מאסטרונומיה גיאוצנטרית להליוצנטרית, התיאוריה של הפלוגיסטון, והתיאוריה הפיזיקלית של האתר. ומן הסתם יש עוד דוגמאות ששכחתי. ------ מדמ"ח: מה שתיארת הוא חלק ממדמ"ח? זה חדש לי. חשבתי שהמחקר בביצועים של תוכנית-מחשב מתמקד בסיבוכיות ובאופטימזציה, ושטענה כמו שניסחת על הסימפלקס לא מעניינת מדעני מחשב (שעשויים אמנם להתעניין בתנאים על הקלט תחתיהם הוא עובד מצויין, או בניתוח היעילות שלו עבור קלט אקראי). |
|
||||
|
||||
בב' דיברתי בפירוש על הפרכה. בשביל ג' נראה לי שכדאי שאקרא את קון קודם, אבל למיטב זכרוני גם פופר מתייחס למתווה של "מה אפשר לעשות אם התיאוריה והתצפיות לא מתיישבות זו עם זו" - בפרט, הוא לא אומר ישר לדחות על הסף, אלא שכדי שמשהו יהיה "מדעי", צריכה להיות קיימת עבורו *האפשרות* של הפרכה. ניסוי אחד שלא מצליח - מילא. אם כל ניסוי לא מצליח ובכל פעם ממציאים פרמטרים חבויים חדשים - יש כאן בעיה. גם ההיטפלות לכך שקריטריון ההפרכה לא היה בשימוש *לפני פופר* לא נראית לי ברורה במיוחד. ----- סיבוכיות ואופטימיזציה הן לא חלק ממדמ"ח ולא מעניינות מדעני מחשב? וזה ממש לא הכל - במעט הדברים שנתקלתי בהם בלמידה-ממוחשבת שהזכרת קודם, שאלת הדיוק של אלגוריתמים היא כמעט תמיד אמפירית וללא הוכחות תיאורטיות מוצקות מספיק (אגב, אני חושב שגם התחום התיאורטי ראוי להיקרא "מדע" לפחות על פי הקריטריון של פופר, אבל לא ניכנס לזה). |
|
||||
|
||||
ב-ב' דיברת גם בפירוש על אישוש ("נראה לי שאפשר לארגן מבחנים לא רעים לאישוש"), וכך גם הבנתי את הדוגמא שלך. אם התכוונת שהיא מסוגלת להפריך את הטענה - אז אני לא מבין איך היא עושה את זה. הרי ההגדרה של "בכלל לא קרוב" היא עניין של החלטה שרירותית, ואפילו אם התוצאה מאד-מאד-מאד רחוקה מהתיאוריה, עדיין ייתכן שזו תוצאה מקרית בשל מדגם מוזר, והתאוריה לא מופרכת (האם אפשר "לתקן" את זה? אולי, ורבים וטובים ניסו לעשות זאת. הקריטריון של פופר, בכל אופן, לא מחזיק מים). פופר דיבר על יותר מדבר אחד. בין השאר, הוא התייחס לבעיית התיחום (בניסוח שלך "כדי שמשהו יהיה מדעי, צריכה להיות קיימת עבורו *האפשרות* של הפרכה"), אבל הוא גם ניסה להסביר מדוע המדע בכלל מצליח לעשות את מה שהוא עושה, וההסבר שלו נסמך על מתודה-מדעית-אידיאלית (שכוללת דחיית תיאוריות שלא מתיישבות עם התצפיות). בהודעה הקודמת התייחסתי לבעיית התיחום של המדע, וטענתי שלפי פופר - גם הפיזיקה והכימיה, למשל, אינן מדעיות, ולכן קרטריון התיחום שלו אינו מוצלח. זה לא שלפני פופר קריטריון ההפרכה לא היה בשימוש (ולכן לא היו מדעים) ואחריו הוא כן בשימוש (וכך פתאום נוצרו המדעים). המדעים היו שם קודם, וההצלחה שלהם סיפקה את המוטיבציה העיקרית לפילוסופים שהתעניינו במדע (עוד מדאקרט). אם המתודה המדעית עליה הוא מדבר אינה רלוונטית לעשייה המדעית, אז ראשית - התיחום שלו אינו מוצלח, ושנית - ההסבר שלו להצלחת המדע ("התקרבות אסימפטוטית לאמת", האנלוגיה עם פסל השיש, וכל זה) כנראה גם כן לא מדוייק, לכל הפחות. ----- ברור שסיבוכיות ואופטימיזציה הן כן חלק ממדעי המחשב, אבל אין בהן שום ממד אמפירי. |
|
||||
|
||||
השאלה של "מה זה קרוב" היא חלק מהטענה. הרי אף טענה לא טוענת "זמן מחצית החיים הוא *בדיוק* שלוש שניות", אלא בערך - כלומר, מגדיר רמת קרבה מסויימת שניתן לצפות לה לפחות באחוז מסויים מהדגימות. *זו* טענה שאפשר להפריך. אם רמת הדיוק של הטענה תהיה נמוכה מאוד, הטענה אולי תישאר מדעית אבל בכל מקרה כבר לא תהיה מעניינת. גם עם ההמשך אני לא מסכים, אבל בוא נשאיר את זה כך. (מכיוון שבשבוע האחרון אני עובד על פתרון אמפירי של בעיית אופטימיזציה מסויימת, בוא נסכים לא להסכים גם על מה שאחרי הקו). |
|
||||
|
||||
אבל הטענה לא טוענת שזו התוצאה שתקבל בכל מדגם. טוב, לא משנה. לא נראה שנותר עניין רב בדיון הזה. (מה שהיה שאחרי הקו היה תמיהה שלי, מתוך הנחה שאתה יודע על מה אתה מדבר, כך שעניין ההסכמה לא קשור. אכפת לך לפרט מעט? איך נראה פיתרון אמפירי לבעיית אופטימיזציה?) |
|
||||
|
||||
מה שאני מנסה לממש עכשיו (ולא ממש הולך) נקרא "שיטת ה-Cross Entropy". הרעיון הוא לדגום ערכים שונים של הפונקציה באופן הסתברותי, ולנסות "לתקן" את ההתפלגות על פי התוצאות שהתקבלו, עד אשר מתכנסים אל פתרון אופטימלי (כלומר, שעובר סף כלשהו). לפחות במאמרים הראשונים על הנושא, כל התוצאות הן אמפיריות לגמרי; אין להם שום משפטים שמבטיחים התכנסות או אפילו חסמים על התוצאות. בעזרת וריאציה על השיטה הם גם מציעים לפתור בעיות כמו "כמה מסלולים המילטוניים יש בערך בגרף הזה והזה" (גרף זו רשת של ערים וכבישים שמחברים ביניהם, מסלול המילטוני זה מסלול שעובר בכל הערים על ידי מסע בכבישים, ולא מגיע לאף עיר יותר מפעם אחת. בעיית הספירה הכללית של "כמה מסלולים המילטוניים יש *בדיוק* בגרף הזה והזה היא קשה לחישוב). |
|
||||
|
||||
מעניין, תודה. (ורק אוסיף, בהקשר הדיון הכללי, שעד כמה שאני מבין, אין בזה שום דבר אמפירי. חישוב ערכי פונקציה עבור ערכים שונים זו פעולה דדוקטיבית לגמרי, והפעלת האלגוריתם שתיארת על התוצאות - גם היא דדוקטיבית. אמנם בפועל אתה עושה זאת באמצעות מחשב, ולכן צריך ''למדוד'' את התוצאות, אבל לא נראה שזה מהותי לרציונאל מאחורי המתודה). |
|
||||
|
||||
טוב, אולי אני סתם לא מבין את ההבדל הסמנטי המקובל בין דדוקטיבי ואמפירי. |
|
||||
|
||||
אתן לך דוגמה לסוג אחר של מחקר במדמ"ח, נפוץ מאין כמוהו בכנסים וכתבי עת, שלדעתי דומה למה שגדי תיאר, אבל הוא יותר קיצוני לכיוון האמפירי: מוצע אלגוריתם או דרך מסוימת לבנות מערכת, שמשערים שהיא משפרת ביצועים לעומת שיטות קיימות. כדי לאשש זאת מריצים את השיטה המוצעת ואת השיטה המקובלת על קבוצה נתונה של בעיות (benchmark). על הקבוצה הזו מראים באופן סטטיסטי שיש שיפור (הריצה מסתיימת מהר יותר). מכאן טוענים שהשיטה המוצעת טובה יותר באופן כללי. לא אמפירי מובהק? שאלה שעד כמה שהבנתי התחילה להישאל לאחרונה, בשקט, כמעט בסוד, היא האם רוב המחקרים האלה תקפים מבחינה מתודולוגית. כי כידוע יש המון דרכים לשגות באופן ביצוע מחקר כמותי, וההכשרה של מדעני מחשב לא מתאימה לכך: לרובם יש הכשרה מסודרת במתמטיקה "לוגית", "מדעי המחשב הקשים", ואין הכשרה מסודרת - או יש הכשרה שטחית בלבד - בשיטות מחקר כמותיות. |
|
||||
|
||||
אני חושב שהבעיה עליה מצביע עומר היא אחרת - עד כמה ניתן לומר שהבעיות במדעי המחשב הן בעולם "האמיתי"? בסופו של דבר מדובר בפונקציות מתמטיות ובנתונים מתמטיים. אין כאן שום דבר שהוא "חיצוני" למערכת המחקר. בפיזיקה ובכימיה, לדוגמה, כאשר נותנים ניבוי לגבי תוצאה מסוימת של ניסוי, הניסוי הוא שונה מהותית מהתיאוריה. בעוד התיאוריה היא סמלים על הדף, הניסוי הוא בחומרים אמיתיים והוא כולל "סוד" כלשהו שאנחנו מנסים לפצח (כיצד בנוי החומר, לדוגמה) ושהוא חיצוני למערכת. הוא "אמיתי" במובן הזה שיש לו קיום גם בלי התיאוריה (כמובן שניתן להתקטנן ולומר שעצם השאלה נובעת מהתיאוריה, אבל הטיעון כאן הוא אחר, אני חושב). לכן חקירה במדעי המחשב היא לא "אמפירית" במובן שאליו עומר מתכוון. אני חושב. |
|
||||
|
||||
זה אכן ויכוח די סמנטי ואני מבין את הטענה הנגדית, אבל חישוב במחשב הוא בכל זאת "ניסוי בחומרים אמיתיים" - גם אם אלו שבבי מחשב וזרמים חשמליים שעליהם אנחנו שולטים. ה"סוד" יכולה להיות הבעיה המתמטית שאנו מנסים לפתור, או השאלה "כמה זמן זה יקח", והוא "אמיתי" במובן זה שהוא קיים גם בלי הרעיונות התיאורטיים. אגב, הקריפטוגרפיה נראית לי כמו דוגמה מעניינת נוספת בהקשר הזה. האם ה"סוד" שאותו מנסים מפצחי הצפנים לגלות הוא חיצוני למערכת או פנימי? אבל כן, ברור שיש הבדל כלשהו. לכן מדעי המחשב נחשבים חלק מהמדעים המדוייקים ולא ממדעי הטבע. |
|
||||
|
||||
"שבבי מחשב וזרמים חשמליים" הם בסך הכל הדרך הפיזית שבחרת לפתור את הבעיה. הבעיה היא מתמטית ובסופו של דבר אתה יכול להגיע לאותו הפתרון עם נייר ועט. מכונת טיורינג או לא מכונת טיורינג? |
|
||||
|
||||
שוב, השאלה היא מה זה "הבעיה היא מתמטית". אם מודדים זמני ריצה, אז יש חשיבות לדרך המימוש הפיזית. אם מתעניינים בשאלה "כמה התוצאות שהאלגוריתם מחזיר מדוייקות" אז אכן אין חשיבות לשאלה "איך בחרנו לממש", אבל אז אפשר לחשוב על אמצעי המימוש כעל "כלי הניסוי" - והניסוי הוא עדיין אמפירי. אנסה להדגים את זה עם קריפטוגרפיה: נניח שהמצאת אלגוריתם קסום שאמור לפענח כל כתב סתר שהוצפן בשיטה מסויימת. ניסוי אמפירי להפרכת הטענה הזו מתבסס על כך שיריב ערמומי יתן לך אוסף של כתבי סתר שהוצפנו במטרה לעבוד על האלגוריתם. השאלה מי יפעיל את האלגוריתם כדי לפצח את כתבי הסתר - אתה עם נייר ועפרון או מחשב - היא טכנית, אבל השאלה הסופית שאותה בוחנים תזכה רק לתשובה אמפירית (כי לא נוכל לבדוק את האלגוריתם על כל כתבי הסתר הקיימים, ואין לנו הוכחה מתמטית לטענה שהוא עובד תמיד). |
|
||||
|
||||
אבל למיטב ידיעתי, כאשר מודדים זמני ריצה, מה שחשוב זה אופן מימוש התוכנה, לא? אחרת הבעיה כבר קשורה להנדסת חשמל, ולא למדעי המחשב. כי על קריי ועל מחשב XT אותו פתרון ירוץ בזמנים שונים, ואנחנו רוצים להכריע בין _פתרונות_, לא בין חומרות. או שאני טועה כאן לחלוטין? אם אני לא טועה, את קריטריון זמן הריצה ניתן לתרגם לקריטריון "מספר צעדים" לפתרון והם שקולים. קריטריון "מספר צעדים" הוא זהה ולא תלוי במכונת הטיורינג הספציפית שעושה אותו - בין אם מדובר באדם או בקומודור 64. ושוב - זו בעיה מתמטית, ולא "אמפירית". כל זאת בהנחה שאני צודק. לא הבנתי לחלוטין את הדוגמה עם הקריפטוגרפיה. גם כאן מדובר בבעיה _מתמטית_, לא? אבל מכיוון שלא הבנתי עדיף שתסביר, אם אתה מוכן. באסה שליברפול הפסידו. אין צדק. |
|
||||
|
||||
זה לא בהכרח נכון, כי מספר הצעדים כן תלוי במעבד - יש מעבדים שמממשים בתור פרימיטיבים פקודות שבמעבדים אחרים היו לוקחות כמה פקודות מכונה, וכדאי גם לזכור שבימינו יש מחשבים עם מספר מעבדים שרצים בו זמנית. לכן לשאלות של זמן ריצה יכול להיות עניין - לא עניין תיאורטי, חס ושלום, אבל עניין. כדאי לשים לב שלא מדובר כאן על הבדלים מסדרי הגודל שבהם עוסקת תורת הסיבוכיות (למשל, ההבדל בין P ו-NP), אבל זו אכן אחת הסיבות שבגללה תורת הסיבוכיות מגדירה "חישוב יעיל" בתור P למרות מהומת האלוהים שיש בפנים - זה מבטיח לנו אי תלות גדולה יחסית במודל. ובכל זאת, מתחת לכסות ה"תיאורטית" הזו רוחשים חיים "אמפיריים". הנה דוגמה למשהו שתורת הסיבוכיות בכלל לא רלוונטית אליו: בעיית השחמט. יש משפט של צרמלו שאומר שכל משחק דמוי-שחמט (לא ניכנס למה זה - העיקר ששחמט הוא כזה) מקיים אחת משלוש אפשרויות: או שללבן יש דרך להבטיח ניצחון בכל משחק, בלי תלות במה עושה השחור; או שלשחור יש דרך כזו, או שלכל אחד מהשחקנים יש דרך להבטיח תיקו. אם נדע ולו על אחת מהדרכים הללו, המשחק יאבד הרבה מהטעם שבו, ובפרט אם נגלה שללבן, למשל, יש דרך להבטיח תמיד ניצחון. באופן תיאורטי, לא קשה לבדוק את זה - פשוט עוברים על "עץ המשחק" (תיאור כל הצעדים האפשריים במשחק) וסורקים אותו עד סופו. מכיוון שגודל עץ המשחק הוא מספר קבוע, ואילו תורת הסיבוכיות מתעניינת בקצב גדילה, הבעייה "לא מעניינת" מבחינתה - אבל זו הרי בכל זאת בעיה מעניינת, והתשובה לה תלוייה בגורמים "מעשיים" בלבד - המימוש היעיל של החיפוש, ואולי גם היוריסטיקות שיסייעו במציאת הפתרון וצמצום מרחב החיפוש. באשר לקריפטוגרפיה - ייתכן מאוד שאתה צודק וזו בעיה "מתמטית", אבל לא ברורה לי ההפרדה החדה שעושים בינה ובין בעיה פיזיקלית, מבחינת ה"אמפיריות" של הפתרונות. |
|
||||
|
||||
יש בזה משהו: שכנעת אותי שהשאלה ששאולים במחקר היא אכן שאלה אבסטרקטית, מתמטית. אבל בדוגמאות שעליהן דיברתי היא מעניינת לרוב בעיקר בגלל ההשלכות האמפיריות שלה, ונחקרת באמצעות ההשלכות האמפיריות. גדי חושב שזו שאלה סמנטית בלבד, אבל לי נראה שזה דווקא מקרה ביניים מסקרן מאוד בין המתמטי לאמפירי. |
|
||||
|
||||
רק הערה לגבי המסלול של מרקורי - אחד מההסברים (השגויים) למסלול הלא-ניוטוני שלו היה קיומו של כוכב לכת נוסף פנימי יותר (שזכה לשם וולקן) שבשל קרבתו הרבה לשמש, קשה לצפות בו. מסלולו המשוער חושב אך הוא לא נמצא במקום המשוער, גם לא בזמן ליקוי חמה. |
חזרה לעמוד הראשי |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |