|
||||
|
||||
טיעון שמתארת Sabine Hossenfelder בוידאו הבא. תאור הטיעון על קצה של הקצה של המזלג: התוצאות הטובות שאנו מקבלים ממודלים כמו ה-LLM הן משום שהאימון משתמש בגוף גדול של תוצרים אנושיים. אך ככל שבני אדם משתמשים יותר בתוצרי AI, גוף הידע הזה ״מתלכלך״ יותר ויותר וזה עלול להוביל למצב של Garbage in Garbage out או התכנסות לדפוסים שחוזרים על עצמם (מעין העלאת גרה אינטלקטואלית). |
|
||||
|
||||
ולכן סגירת החור הצורם היחידי כמעט בסרט 'המטריקס' - שהמכונות מחזיקות את בני האדם בקפסולות בשביל האנרגיה התרמית (פרות היו מספיקות, שלא לומר מקורות אחרים מהטבע) - היא שהסיבה עבור המכונות להחזיק את בני האדם בקפסולות זה בשביל הפקת אינפוטים של אינטליגנציה 'טבעית' עבור אימון המודלים שלהם. בזה אנחנו יותר טובים מפרות. |
|
||||
|
||||
רוב בני האדם הם יצרני תוכן מאוד גרועים. גוף התוכן האנושי האיכותי הוא גדול, אבל הוא נוצר על ידי מיעוט. נראה לי שהטיעון בוידאו (לא שאני חושב שהוא משכנע במיוחד) אומר שכשכל זב חותם יכול לג׳נרט עם AI הרים של תוכן, יהיה יותר קשה להפריד בין התוכן שיעזור לשפר את המודלים לבין התוכן שיעשה אותם גרועים יותר. |
|
||||
|
||||
אולי אחד הכיוונים בהם עוד צפויות התפתחויות משמעותיות הוא שילוב קריטריונים של איכות הקלט (משהו באזור של ה rank הגוגליאני). לא סביר שכל פקאצה עם דף פייספבוק נזרקת לאותה מטחנה וירטואלית עם יובל (הררי ונוב) דוקינס, פינקר, וולפראם והקשה המקשה. אני משער שמשהו מזה קורה כבר עכשיו, ולו רק בזכות זה שהוגים בעלי חשיבות מצוטטים יותר פעמים כך שמשקלם עולה, אבל זה לא מספיק (במיוחד עבור אינטלקטואלים בעבר שכבר לא מצוטטים הרבה) ולעומתם כל מיני מפורסתמים שכל גרעפס שלהם מהודהד שוב ושוב. |
|
||||
|
||||
אני מסכים. גם אותי הטיעון לא שכנע. |
|
||||
|
||||
תינוק ממוצע מבין שפה משמיעה יותר טוב ממחשב על. בתור ground truth, זה נראה לי רחוק מאד מ"תוכן גרוע". נהג ממוצע מצליח להתחמק מהרבה מקרים שמכונית-על עוד לא מצליחה (ולכשול מאחרים, אז מה). אז הנה יש לך שני מיליארד כאלה. המוח האנושי הממוצע - הוא מקור מצוין להמון משימות שהוא עושה לא רע. תתחבר אליו ותקבל הרבה תוכן איכותי ללימוד. |
|
||||
|
||||
הכל נכון ולא סותר שום דבר שנטען בפתיל (כולל בוידאו המקושר). יש הבדל לוגי מאוד פשוט בין ״יש למוח האנושי תוצרים איכותיים/שימושיים״ לבין ״כל התוצרים של המוח האנושי הם איכותיים/שימושיים״. ברור שאפשר לבחור ולברור דברים ספציפיים שאנשים עושים כ-Ground truth (למשל דוגמאות של נהיגה אנושית נכונה). זה הרי בדיוק מה שעושים היום. אבל אם אתה לוקח כל מה שאנשים עושים או חושבים, אתה מקבל הרבה זבל או דברים לא מועילים (הייתי אפילו אומר שהרוב זה זבל שיזיק באימון מכונה יותר משהוא יועיל). עשר דקות של חיבור עם NeuraLink בין מכונה לומדת לבין המוח של מירי רגב ו/או קניה ווסט. I dare you! |
|
||||
|
||||
90 אחוז או יותר ממה שהמוח עושה אלה פעולות כמעט אוטומטיות כמו עיבוד תמונה ושמע, בקרת תנועה וקליטת סנסורים חושיים, ובנייה מסובכת לעייפה של מסקנות ותמונת עולם מהקלט הזה. רק בהליכה ברחוב מבלי ליפול או להיתקל בעמוד המוח עושה פעולות שהבינה המלאכותית היום עוד רחוקה מאד מהן. ובזה כל אדם, גם כזה שלא קרא את צ'כוב, הוא מומחה גדול. לזה התייחסתי ברעיון הראשוני שלי. כתיבת תוכן לאינטרנט היא חלק זעום ממה שעושה מוח אנושי, ועל התוכן בהחלט אפשר לדון באיכותו ואף להסיק שהיא ירודה. אבל זו בכלל לא היתה הנקודה שלי. תחשוב על בינה מלאכותית שכדי ללמוד איך לעשות נהיגה אוטונומית, אוספת ישירות מהמוח של מיליון אנשים את כל הפלט והקלט של המוח שלהם בזמן נהיגה. |
|
||||
|
||||
תחשוב על קינה מלאכותית.. |
|
||||
|
||||
משעשע (: קינה אחרת על כך שרצינו בינה של צווארון כחול וקיבלנו לבן. |
|
||||
|
||||
כמו שרמז הוד מעלתו המלך דוד, הבעיה בבינה זה הגליצ'ים. |
|
||||
|
||||
נדמה לי שכבר הגגתי באייל על זה שבניגוד למה שהיינו מנחשים לפני עשר שנים, היתרון שלנו על המכונות מתגלה כפחות המוח ויותר הידיים (גם זה זמני, מן הסתם). השיפוצניקים ישרדו אחרינו המתכנתים בשוק העבודה. |
|
||||
|
||||
בארץ יש שיפוצניק אחד על כל 10 מתכנתים.. אז עדיף לעשות הסבה לדאטא סיינס מאשר לשיפוצניק. --- I interviewed a data-scientist once, and at the end, he asked for a feedback. I told him he was very average. He answered: well thats just mean!
|
|
||||
|
||||
בדיחה מעולה, הרבה מעל לממוצע! |
|
||||
|
||||
זה היה די ברור כבר כאשר דיפ בלו ניצח את קספרוב בשחמט (עוד לפני עידן רשתות הנוירונים ושטויות דומות) הרבה לפני שרובוט ניצח את אוסאליבן בסנוקר (טרם קרה, משום מה, למרות שהטכנולוגיה בטח קיימת.). |
|
||||
|
||||
א. סביר שמתישהו יקרה. ב. במקרה כזה, בניגוש לשחמט, "הטכנולוגיה" היא יישות הרבה יותר מורכבת - מאחר והיא צריכה לתפקד בדיוקים מאד גבוהים בעולם הפיזיקלי. סתם לחשוב על תכנון רובוט שבכלל יידע להחזיק מקל סנוקר ולהכות בכדור, נשמע כמו כאב ראש מאד מאד גדול - מכנית, חיישנית, מוטורית וחשמלית והלאה והלאה. בשחמט ה-API הוא הכי פשוט שיש. |
|
||||
|
||||
זה, בכפית תה, ההסבר לכך ש HAL [Wikipedia] נמצא כמה צעדים (עולם הפוך :-)) לפני R._Daneel_Olivaw [Wikipedia] בלי קשר לחסרונו של המוח הפוזיטרוני - וזה נושא הפתילון הזה. אגב, לגבי טניס שולחן הבעיה פתורה (עם קצת עזרה מ deep fake, כמובן). |
|
||||
|
||||
נראה לי שהרובוט הזה ישחק סנוקר לא פחות טוב מפינג פונג :-) |
|
||||
|
||||
כבר היה מזמן |
|
||||
|
||||
וזה אפילו יותר מרשים, כי זה נעשה בלי דיפ פייק. |
|
||||
|
||||
חביב בהחלט. |
|
||||
|
||||
אני נותן לזה לא יותר ממאה ועשרים שנים עד שרובוט ינצח את אוסאליבן. דווקא הספורט הזה נראה לי ספורט כל כך אידאלי לרובוטים שזה לא ירשים אותי. למרות שזה כמובן ידרוש לא מעט פיתוחים טכנולוגיים ועבודה שחורה. |
|
||||
|
||||
הימור קצת קל, הייתי אומר. לפני מאה ועשרים שנים היינו עם מכונות תפירה ומטוסי פרופלור, וקצב ההתקדמות רק גדל מאז. |
|
||||
|
||||
האמת: הגזמתי. אולי ארבעים שנים. בעוד 120 שנים הוא לא יוכל לנצח את אוסליבן. |
|
||||
|
||||
ביום טוב של אוסליבן, גם לא בעוד 40 שנה. ביום רע של אוסליבן, רק צריך להכניס בתוכנה מוד עיצבון, והוא יוכל לנצח את אוסליבן מחר בבוקר. |
|
||||
|
||||
דומני שצפריר מתלוצץ בעניין גילו המופלג של אוסאליבן בעוד 120 שנה. אני סבור שכבר היום אפשר לבנות רובוט שיהיה אלוף העולם בסנוקר (לא אתפלא בכלל אם הוא ישתמש בזרוע אחת בלבד), אלא שהמחיר די גבוה. כשהרובוטיקה תתקדם עוד כמה שלבים קשה לי לפקפק בכך שזה יקרה (בשביל מה זה טוב? בשביל לתת לשוטה אחד קצת נחת). |
|
||||
|
||||
אני חושב שמה שבאמת אפשר לבנות כבר היום, ובמחיר לא מאד גבוה, זה רובוט שחנצח בטניס. אבל זו משימה הרבה יותר קלה. מי יודע למה? |
|
||||
|
||||
לא רק כי רובוטניס יכול להיות הרבה יותר איטי מרובוטניס שולחן? |
|
||||
|
||||
לפי התיאוריה שלי - בגלל המרחקים והסרבים. לדעתי לא קשה לבנות רובוט (והוא ממש לא צריך להראות כמו בן אדם) שכל חבטת הגשה שלו מנצחת. זה ענין של מהירות חבטה ודיוק ממצב מאד סטטי, אז לא נראה לי שקשה לעשות מערכת מכנית שמהירות הסרף שלה תהיה כמו של השחקן הכי טוב בעולם (לפחות), ודיוק הכוונון שלה יהיה כזה שדה-פקטו בהנתן מיקום השחקן היריב (משימה קלה למצלמה היום) תמיד תהיה זוית ועוצמה של סרף שהוא לא יצליח לענות עליהן. נשאר רק הקטע של לענות על חלק מההגשות של הצד השני, וגם שם האתגר יהיה בעיקר קצת מכניקה מהירה - מעקב אחרי הכדור עם מצלמה מהירה נראה לי כמו משימה עם קושי בינוני. סרבים של פינג פונג הרבה יותר טריקיים, בגלל שהם חייבים לקפוץ פעמיים וזה מגביל את מהירות החבטה. |
|
||||
|
||||
בינתיים יש הרבה דיבורים אופטימיים, אבל הסרטון שבראשית הכתבה רחוק מלהרשים. לא רק שהרובוט התעשייתי לא היה מנצח בטניס שולחן, אפילו את הצב של אכילס הוא לא היה משיג. |
|
||||
|
||||
הנה סרטון רלוונטי: Why Don’t We Have Better Robots Yet? |
|
||||
|
||||
הסרטון קצת אכזב אותי: לא באמת מפתיע מה קשה לרובוטים לעשות, ועדיין יש פער באינטואיציה: היינו חושבים ששיחה ברמה גבוהה היא אתגר קשה יותר למכונות מלהרים כלי אוכל מהשולחן; והציוד שיש לנו - עיניים, ידיים ומערכת משוב ביניהם - לא נראה על פניו מאוד שונה ממה שזמין או יכול להיות זמין לרובוטים. לא קיבלתי מהסרטון איזו תובה שתגשר על הפער. |
|
||||
|
||||
משום שהנבואה ניתנה לשוטים, אני חושב שזה ראוי שגם אני אוסיף את הניבוי שלי. למרות שאני מעריך (עד סוגד) מאוד את אוסליבן, אני אשים פה את הפרדיקציה שלי: תוך 5 עד 10 שנים, הבינה המלאכותית עצמה תהיה כלי עיקרי / מוביל ב-Designs ברובוטיקה ונראה קפיצות ביכולות של מכונות שהיום קשה לדמיין. אני חושב שהאדם יאבד את מקומו, די בקרוב, גם במדרג המוטוריקה העדינה/מורכבת. לכן, ההערכה שלי שבעוד 10-12 שנים מהיום, אוסליבן לעומת מכונה יהיה ברמה דומה של מגנוס מול סטוקפיש היום. הניחוש שלי הוא שהרובוטים של עוד 10-15 שנה לא יהיו שונים ממה שאנו מכירים מסיפורי המד״ב עליהם גדלנו. |
|
||||
|
||||
החזון של אסימוב עם חוקי הרובוטיקה נראה לי תמים משהו. שדה הקרב העתידי כנראה יכלול נחילים של מכונות השמדה מתוחכמות וחושבות (הרבה יותר מהכלב צעצוע עם שלט רחוק מהוידאו). התאורים הדיסטופיים בסיפורי המד״ב של Frank Herbert או של Philip K. Dick1 נשמעים לי יותר קרובים למה שנראה במאה ה-21. אני אתחיל לאמן את הילדים שלי ל-Butlerian Jihad. _ |
|
||||
|
||||
לא ממש הפתיל הנכון אבל למי יש כוח לחפש... סקוט אהרונסון ממליץ על המאמר הזה של יוצא OpenAi, שעוסק בעתיד ה AI בכלל ולאו דווקא ברובוטיקה. רק התחלתי לקרוא אבל רצתי לספר לחבר'ה כי עד שאסיים את 165 העמודים של ה"מאמר" (בילדותי קראו לזה "ספר") הוא כבר יתממש או יוכח כשטות והבל. תקציר מנהלים באדיבותו של coPilot: Copilot
Certainly! Here’s a concise summary of Leopold Aschenbrenner’s report on Situational Awareness: OOMs Go Zoom: Leopold discusses the rapid evolution of AI capabilities, focusing on orders of magnitude (OOMs) of effective compute. Factors contributing to growth include increased computational power, algorithmic efficiency, and paradigm-shifting developments. Conclusion: AGI is approaching rapidly1. Factors in Effective Compute: Compute: Training language models has become 3,000-10,000 times more computationally intensive from GPT-2 to GPT-4. Algorithmic efficiency: Advances in machine learning science save compute, adding 1-2 OOMs. Unhobbling: Paradigm shifts unlock latent model capabilities, further enhancing effective compute1. In summary, AGI is on the horizon, driven by computational progress and algorithmic innovations. 😊🌟 |
|
||||
|
||||
ותקציר התקציר באדיבות השוטה הגלובלי המקומי שלכם: AGI by 2027 is strikingly plausible. |
|
||||
|
||||
לא יכולתי שלא להבחין בצירוף "Leopold Aschenbrenner" שנוגד את כל קונספט התקציר. |
|
||||
|
||||
אני תוהה מה אמין יותר? לשאול את ג'פטו לגבי העתיד של AI או לשאול את אדם נוימן לגבי העתיד של WeWork לפני עשר שנים, או לשאול את אילון מאסק לגבי העתיד של מכונית אוטונומית. |
|
||||
|
||||
שאלה טובה. אני תוהה אם זה אמין יותר או פחות מלשאול מפתח/ראש צוות/מתכנת/מהנדס תוכנה לגבי העתיד של AI או אם מכונות יוכלו (בקרוב?) להפוך את מקצועו לחסר ערך. |
|
||||
|
||||
קודם כל, השאלה השנייה שלך הרבה יותר ספציפית מה-AGI הגדול והנורא. בתור שכזו, הייתי מצפה ממי שינסה לענות לה ש-א. ידע מהן הדרישות מהמקצוע הזה ו-ב. תהיה לו יכולת שערוך לגבי יכולות ה-AI בקרוב. לגבי א. - נושאי התפקידים שציינת מצויידים בידע רלבנטי למדי כדי לענות על זה. לגבי ב. - לא יודע. סביר להניח שלמהנדס ממוצע קשה יהיה להעריך התפתחות טכנולוגית כזו שהוא לא מעורב בה. התשובה המתחכמת - אם הצ'אט ייתן תשובה נכונה יותר מהמפתח, זה רמז טוב לכך שיוכל להחליף אותו בקרוב :-) |
|
||||
|
||||
המאמר עצמו נכתב בידי אדם (human לא נוימן 😉). |
|
||||
|
||||
אופטימיות נאה, כשאפילו בקרב חובבי הייפ המכוניות האוטונומיות כבר הפנימו שזה ייקח הרבה יותר זמן ממה שהם חשבו. עשרות שנים יותר. |
|
||||
|
||||
אכן. אבל אין סתירה לוגית בין הכשלון בניבוי בקרב חובבי ההייפ של המכוניות האוטונומיות בעבר לבין כשלון אפשרי בניבוי אחרי האכזבה. אני אכן טוען שה״תיקון״ בניבוי החדש הוא תיקון יתר והוא יתברר די מהר כטעות. חוץ מזה, אני לא הייתי מכנה את מה שאני אומר כאופטימיות. |
|
||||
|
||||
אכן כך. מצד שני, מה שקרה עם מודלי השפה גדול לדעתי יותר מאשר המכוניות האוטונומיות. זה אירע בבת אחת והקדים את זמנו ביחס לציפיות העוסקים בתחום בלפחות עשור אם לא דור. |
|
||||
|
||||
כיוונת לדעת גדולים, וזה עובד! - Scientific American באשר למוח האנושי, יאן לקון אומר שלכאורה מנועי שפה עוברים על כמות לא פרופורציונית של מידע, כזו שאדם לא יקרא בכל ימי חייו, כדי לתת תוצאות מוגבלות. אבל ההשוואה הנכונה ללמידה אנושית, מבוססת לדעתו על ראייה שבה קצב המידע גבוה בשבעה סדרי גודל מאשר בשפה. כלומר כדי ליצור בינה מלאכותית טובה צריך לתת לה ללמוד ממידע סנסורי. מידע חזותי אומנם מכיל המון יתירות, אבל זו עוזרת ל-SSL. הוא מתייחס לכך שגם ללא מידע ויזואלי, וגם אודיטורי, יכול המוח האנושי לגבור את זה הדיגיטלי ומייחס זאת למידע המישושי. זה מחזיר אותי לשאלה עתיקה בתחום רכישת השפה - כיצד מצליח המוח האנושי ללמוד את השפה כה מהר ביחס לקלט אליו הוא נחשף. בעבר טענתי דברים דומים לשל קון והופניתי אליו ע"י חבר שזכר זאת. אלא שמאז דצמבר 2022 (ולא כפי שנכתב בתגובה 767353), אני פחות סומך על האינטואיציות שלי בתחום. עדיין, בניגוד לטענתו של קון אני חושד שלא כמות המידע ואפילו לא משוב הלמידה העצמית הם שאחראים לרוב ההבדל כאן, אלא, אם לא איבר שפה מיוחד, אז לפחות אלגוריתמי למידה יעילים יותר של המוח. גם בהינתן מידע זעום יחסית, מסוגלים אלו לסנן, לארגן ולעדכן באופן יעיל יותר (מבחינות מסויימות) מאשר אלגוריתמי הלמידה הפשוטים יחסית שהביאו למהפיכת 30 בנובמבר 2022. |
|
||||
|
||||
המאמר בסיינטיפיק מעניין מאד, ואם יאושש זאת תהיה התפתחות מעניינת - אולי "מהפכה" היא המילה הנכונה יותר (אשאל את ג'פטו) - בתחום למידת השפה עליו אתה מדבר (מה שקרוי: The poverty of the linguistic input). דומני שעד כה הקשר בין BI ל- AI הלך בכיוון של יישום חלקי של מה שנלמד מהמוח לגבי רשתות נוירונים מלאכותיות, וכאן אולי נראה השפעה בכיוון ההפוך. אישית, אם תוצא לוואי של כל זה יהיה עמעום קל של ההילה סביב ידידנו נועם חומסקי לא אזיל דמעה. |
|
||||
|
||||
עם ידידים כאלה... |
|
||||
|
||||
ושוב נגלה שהאייל הקדים את האנושות בכמה עשורים. |
|
||||
|
||||
הטיעון של הוסנפלדר הוא גרסת הצהובון ביחס למה שכתוב במאמרים (לפחות אלו שהובא אליהם קישור). בקצרה, יש מקום לעוד מחקרים אבל לא רציני לטעון שה ai בסכנת קריסה. המאמר הראשון קשור בצורה מאד קלושה. הוא מדבר על שיטת אימון רקורסיבית: מאמנים מודל 1 על בסיס מידע גולמי והוא מחולל דוגמאות סינתטיות עבור מודל 2 וכן הלאה. זוהי שיטת אימון מקובלת1 למודלים - זה לא באמת קשור לזיהום במידע המקורי. המאמר השני מנסה באמת לסמלץ מצב של מידע גולמי "מזוהם" (תמונת מקוריות + תמונות שיוצרו על ידי ai) ולהשתמש בו כדי לאמן מודלים. אז אכן יש ירידה בביצועים של מודלים שאומנו ע"י מידע מזוהם, אבל המאמר בעצמו מכיל כמה כוכביות גדולות שלטעמי מוציאות את העוקץ מהטענה של הוסנפלדר. א. כבר במסגרת המאמר הצליחו לפתור את רוב הירידה בביצועים בעזרת self supervised learning ב. מדובר בניסוי על תמונות בלבד וכאלו שיוצרו ע"י מודל אחד בלבד. ג. התמונות יוצרו בעזרת פרומפט סינטתי. זה שונה מאד ממצב מציאותי שבו בני אדם יכתבו פרומפט ואז (לפעמים?) יפרסמו את התוצר הזה במקום שיזהם את המידע הגולמי. --- 1 "מקובלת" זה ציטוט מהמאמר. אני לא מומחה ai והתגובה אינה מהווה המלצה לאף אחד. |
|
||||
|
||||
יאפ. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |