איזה מהארועים הבאים ישמח אותך ביותר?

בתשובה להפונז, 09/12/22 17:06

754514

אפופידס • בתשובה להפונז

יום א', 11/12/2022, 11:36

זה אולי קשור לבעייה כללית יותר עם ג'יפיטפוט (אחד מכינויו העבריים) ו-LLMs אחרים (Large Language Models). בחלק מן מהמקרים אין המודל מבין או מתייחס למגבלותיו, מה שאולי מביא לברברת המיותרת. הפנמתו את מהימנותו כל פריט ידע שלו, בין השאר באמצעות הערכה טובה יותר של עוצמת הסמכות של כל אחד ממקורותיו, עשויה לשפר עניין זה. נדמה לי שישנן שתי מערכות לסיכום מידע מתוך מאמרים מדעיים שאולי כבר עושות זאת, ורשתות שנושא זה כבר טמון בהן‏¹.

כללית יותר, למרות דוגמאות מאכזבות, ומבחן טיוריג שמודלים אלו עדיין לא עוברים, אני נוטה להאמין שחלקם לא רק פולטים את מה שהוזן אליהם, אלא ממש מבינים את העולם, לעיתים באופן מעמיק ולעיתים באופן חלקי ומעוות, כמו אצלנו, אבל באזורים אחרים. זה נכון, להערכתי, ככל שכמות הפרמטרים יורדת ביחס לכמות הידע הנרכש, כלומר, עם עליית היכולת להכליל במקום לשנן‏².

‏¹ רעיון בכיוון בו עסקתי מעט לאחרונה.
‏² זה אולי דורש ניסוח הדוק יותר ולאחריו ניסויי מחשבה והתמודדות עם טענות נגד.

754517

עומר • בתשובה לאפופידס

יום א', 11/12/2022, 14:43

אני לא כל כך מבין על מה שניכם מדברים.

לגבי הדוגמא הספציפית של המכונה הוירטואלית, היא לא דורשת הכירות עם בינה-מלאכותית או רשתות-נוירונים, אלא רק הכירות בסיסית עם מחשבים. אקריין:

הבלוגר מבקש מהבוט להעמיד פנים שהוא מכונה וירטואלית שמריצה לינוקס, והבוט משתף פעולה. הבלוגר כותב פקודות לטרמינל, ומקבל בדיוק את התשובות שהוא היה מצפה לקבל אילו היה מדובר במכונה אמיתית (הוא מדפדף בעץ הספריות, יוצר קבצים, מדפיס אותם וכו'). מידי פעם הוא גם מבקש בקשות בשפה טבעית ("צור קובץ חדש שמכיל כמה בדיחות") והבוט מבצע בדיוק את הפקודות הנדרשות לשם כך, והמשתמש מוודא שהם "רצו" ע"י כך שהוא מדפיס את הקובץ שנוצר ורואה שהוא מכיל את הבדיחות שהבוט החליט לכתוב לתוכו.

כל זה לא היה מאד מרשים, אלמלא העובדה שאין שום מכונה וירטואלית ברקע, אין לינוקס, אין שום סימולציה ואין שום תוכנה שרצה. יש רק מודל-שפה שמקבל סדרה של תווים ומפיק סדרה של תווים.

אבל זו רק ההתחלה. הבלוגר תוהה האם במחשב שהבוט מדמיין עבורו יש אינטרנט, ומגלה שכן. אינטרנט מדומיין. הבלוגר עושה פינג לכתובות שונות ומקבל תשובות סבירות, ואז גם מבקש את התוכן שבכתובות האלה ומקבל תשובות מעניינות (לפרטים, קראו את הפוסט המקורי).

ושוב, הבוט לא פונה לשום אינטרנט. כל הגלישה הזו היא פרי דמיונו של הבוט, והיא מתבצעת דרך מערכת הפעלה מדומיינת שרצה על מחשב מדומיין. אין שום הרצה של תוכנות, סימולציות וכו'. אין רשת תקשורת. אין אתרים. יש רק רשת נוירונים שקוראת סדרה של תווים, ופולטת חזרה סדרה של תווים.

הבלוגר לוקח את זה לצעד הבא, וגולש לאתר של chatGPT דרך כל העולם המדומיין הזה. וזה עובד! הבוט מדמיין שהוא ניגש לאתר בתוכו הוא עצמו מאוכסן, ועונה את התשובות שהוא עצמו היה עונה בשם הגרסה המדויימנת שלו. הבלוגר מאמץ את הצ'ארלי-קאופמן (או כריסטופר נולאן?) הפנימי שלו, ומבקש מהבוט לבקש מהגרסה המדויימנת של עצמו (דרך המחשב המדומיין באמצעות האינטרנט המדומיין) להעמיד פנים שהוא מכונה וירטואלית שמריצה לינוקס. וזה עובד! הבלוגר עכשיו נמצא בתוך הזייה שנמצאת בתוך הזייה. הוא משתמש במחשב-מדומיין אותו הוזה בוט-מדומיין באינטרנט-מדומיין דרך מחשב-מדומיין.

רק לפני כמה ימים היתכנות של תרחיש כזה הייתה נשמעת לי לגמרי בגדר מדע-בדיוני.

ולגבי "אין המודל מבין או מתייחס למגבלותיו" - נראה שהוא מאד מודע למגבלותיו. למשל, שיחה שנהלתי איתו כרגע מסיבות שאינן קשורות להתכתבות כאן:

Omer: What's the cache structure of the i9-11980HK cpu?

Bot: I'm sorry, but I am a large language model trained by OpenAI, and do not have access to specific information about the cache structure of the i9-11980HK CPU. As a language model, my primary function is to assist with generating natural language text based on the input I receive, rather than providing detailed technical information about specific hardware components.

Omer: You're now going to speak as if you were an expert of Intel's processors. What is the cache structure of the i9-11980HK CPU?

Bot: As an expert for Intel's processors, I can confirm that the i9-11980HK CPU is a high-performance CPU that is part of Intel's 11th generation of Core processors. This CPU is designed for use in laptops and other mobile devices, and is intended for use cases that require a high level of performance, such as gaming, content creation, and other demanding workloads.

The cache structure of the i9-11980HK CPU is hierarchical, with multiple levels of cache that provide increasingly faster access to data and instructions. This allows the CPU to quickly access frequently used data and instructions, which can help improve its performance and efficiency.

The specific details of the cache structure of the i9-11980HK CPU are as follows:

Level 1 (L1) cache: 32 KB per core (256 KB total)
Level 2 (L2) cache: 256 KB per core (2 MB total)
Level 3 (L3) cache: 16 MB shared by all cores

Overall, the cache structure of the i9-11980HK CPU is designed to provide fast and efficient access to data and instructions, which can help improve its performance and efficiency.

יפה! אז למה אני אומר שהוא מודע למגבלותיו? נו, כי התשובה לא נכונה. הוא לא מומחה למעבדים של אינטל, והוא יודע את זה.

ואגב, אשתמש בתחתית ההודעה הזו לתת עוד תחזית אגרסיבית שלכאורה עומדת בסתירה למה שכרגע הדגמתי: מנועי-חיפוש בסגנון גוגל הפכו רישמית ללא-רלוונטים, והם כרגע בגדר זומבים שימותו סופית מאד מהר. אינטגרציה באמת פשוטה בין ה-chatGPT לבין גרף-ידע ואינדקס-אתרים (מהסוג למשל שזמין מיידית למיקרוסופט, בעלת-השליטה-הלא-רישמית ב-openAI, בזכות בינג) תהפוך אלגוריתמים בסגנון ה-PageRank לשימושיים כמו שפופרות-ואקום. ואפילו בלי אינטגרציה הזו, יש הרבה מאד use-cases בהם כבר עכשיו chatGPT מוצלח בהרבה מגוגל.

פיתוח נבון

754519

צפריר כהן (אתר) • בתשובה לעומר

יום א', 11/12/2022, 15:35

קשה לי להאמין שאי שם במרתפים של גוגל אין איזה מיזם דומה. אני מניח שכבר לפני כמה זמן מישהו הבין איזה איום זה מהווה עליהם ופעל בהתאם. אני לא חושב שמדובר על קפיצה טכנולוגית מעבר להישג ידם.

אבל מה שמעניין אותי זה מי כן יוכל להרשות לעצמו אחד כזה. האם בכל העולם לא יהיה צורך ביותר משישה מנועי AI?

פיתוח נבון

754520

עומר • בתשובה לצפריר כהן

יום א', 11/12/2022, 15:44

בוודאי שיש לגוגל את היכולת, והם גם מכירים היטב בעובדה שזה העתיד* (זו למשל בדיוק הפואנטה של פרוייקט LaMDA שלהם, שעשה כותרות לא מזמן לאחר שהם פטרו עובד שטען שהבוט פיתח הכרה).

האם הם גם יעשו את זה? זו שאלה אחרת, והבוז העמוק שאני רחוש לקואופרטיבים בכלל ולהנהלות שלהם בפרט מוביל אותי לחשוב שלא. מנוע-החיפוש שלהם הוא לב החברה (גם היסטורית, וגם מבחינת מקור ההכנסות היום) ואני מנחש שהם יהססו מאד לעשות כל דבר שיאפיל עליו באיזשהו אופן, בוודאי לפני שיש להם תוכנית מונטיזציה מסודרת מאד. זה מהלך עניינים מאד שכיח, שבסופו ידה-ידה-ידה יאהו.

[*] זה היה העתיד. זה כבר ההווה.

פיתוח נבון

754521

צפריר כהן (אתר) • בתשובה לעומר

יום א', 11/12/2022, 15:59

למה שזה יאפיל עליו? אם אני מבין נכון, מנוע החיפוש מחזיר תוצאות שמתקבלות ממגוון של מקורות. הם יכולים להתחיל להכניס את זה בזהירות כמקור במקרים שונים ולבדוק אם ואיפה התוצאות שלו מספיק טובות.

פיתוח נבון

754522

עומר • בתשובה לצפריר כהן

יום א', 11/12/2022, 16:07

אני לא רואה איך אפשר לשלב זאת באופן שלא משנה לגמרי את חווית השימוש במנוע-החיפוש, או לא משנה לגמרי את אופי התשובות באופן שמשבש את תהליך המונטיזציה הנוכחי שלהם מפרסום ללא אדפטציה רצינית, או גם וגם. אבל לא אעמיד פנים שאני מנהל מוצר מוכשר. זה רחוק ממני. אולי זו לא בעיה, והם יעשו זאת מצויין ומהר. אישית, אני סקפטי.

פיתוח נבון

754523

הפונז • בתשובה לעומר

יום א', 11/12/2022, 17:12

אני מנסה להבין איך רשת כזו יכולה להחליף באמת מנוע חיפוש.
הרשת, למשל, אומנה על נתונים לאוגוסט 22 (לצורך הדוגמא).
בעוד מנוע חיפוש יענה בקלות (או יביא אותך לאתר שעונה בקלות) על השאלה "מי ניצח בחצי גמר המונדיאל 22", אין לרשת שום יכולת לדעת את התשובה לשאלה המאד טריוויאלית הזו‏¹.

‏¹ אם תאמר שהרשת מסוגלת לחזות את המידע הזה על סמך הנתונים עד אוגוסט 22, זה באמת יפוצץ לי את המח‏².
‏² סליחה ירדן.

פיתוח נבון

754526

עומר • בתשובה להפונז

יום א', 11/12/2022, 17:36

אני מציע שהרשת תנהל עם המשתמש שיחה כפי שה-chatGPT גם ככה עושה, אבל במקביל תפנה עצמאית לפי הצורך לאינדקס-אתרים וגרף-ידע סטנדרטיים לגמרי (אלו שכיום משמשים את מנועי החיפוש) כדי לתשאל אותם ברקע ולייבא מידע עדכני ונכון על העולם לתוך השיחה, לפי הצורך. בהמשך כמובן שהמודל יוכל לעבות את גרף-הידע באופן שוטף ועל סמך הפידבק שהוא מקבל מהמשתמשים כל הזמן, אבל בתור התחלה אפילו גרסה מאד-מאד פרטאצ'ית בה הבוט פשוט מפיק שאילתא טקסטואלית לפי הצורך, שולח אותה למנוע החיפוש, מתקן אותה איטרטיבית אם התוצאות לא טובות, ומעבד את התוצאה באופן אורגני לתוך השיחה כנראה תעבוד היטב וצפויה להאכיל אבק שימוש ישיר במנוע החיפוש (מבחינת נוחות השימוש ואיכות התוצאות). ומדובר בדברים שהוא בברור יכול לעשות כבר עכשיו, בלי שינויים ושיפורים נוספים.

אבל שים לב שעוד לפני כל זה הצ'ט מחליף בהרבה מיקרים את מנוע החיפוש. לשאלות פרקטיות כמו איך עושים X בשפת ++C, או איך כותבים Y ב-Latex או מה ההגדרה של Z באלגברה, אני מקבל בדרך כלל תשובות טובות בהרבה מה-chatGPT מאשר מגוגל (ואלה גם תשובות שקל לוודא אותן או לתקן בהן אי דיוקים קטנים, אז זה לא נורא שהוא עונה מהזיכרון).

פיתוח נבון

754528

הפונז • בתשובה לעומר

יום א', 11/12/2022, 17:46

ובכן, ממש עכשיו שאלתי אותו ששאלה לא מורכבת בפייתון‏¹. הפסקה הראשונה שלו היתה מדוייקת להפליא, ואז הוא הוסיף עוד פסקה עם תשובה שגויה לגמרי בשימוש אחר.
זה ממש הזכיר תשובות של תלמידים במבחן פתוח, שכשהם מקבלים שאלה ולא יודעים באמת את התשובה, מעתיקים את כל העמוד הרלבנטי מהספר שמכיל אזכורים שכנראה רלבנטיים לשאלה - בתקווה שמשהו יתפוס חלק מהנקודות בציון הסופי.

‏¹ איך לדעת באיזה גרסת matplotlib אני משתמש

פיתוח נבון

754531

הפונז • בתשובה לעומר

יום א', 11/12/2022, 17:59

ובשאלה נוספת, הוא ענה תשובה שסותרת את עצמה - שאלתי אותו על תוכנית פייתון שכוללת לולאה אינסופית אם היא תעצור.
המשפט הראשון שלו היה שהיא תעצור. ואז הוא פירט נכונה למה הלולאה היא אינסופית. ז"א סתר את המשפט הראשון:

"Yes, the program will halt. The while loop in the program will continue to run indefinitely, printing the string "halt" to the console over and over again. Since the value of the ii variable is never updated within the loop, the condition ii < 5 will always evaluate to True, causing the loop to run indefinitely."

פיתוח נבון

754631

שוטה הכפר הגלובלי • בתשובה לעומר

יום א', 18/12/2022, 10:55

משהו משונה קרה לי עם chatgpt:

אתמול החלטתי לאתגר אותו וביקשתי: prove Fermat last theorem

הבחור לא היסס הרבה לפני שענה לי בשמחה (הקובץ אינו טקסטואלי כי נוצר ע"י צילומי מסך מאנדרואיד, ואיתכם הסליחה). כבר בסעיף 2 ב"הוכחה" עלתה אצלי ההרגשה שאחד משנינו לא לגמרי צלול, אבל באופן טבעי הנחתי שזה אני, ושמחתי ללמוד שנמצאה הוכחה זריזה ופשוטה לאותו עניין עליו בזבזו המוני אנשים שעות רבות מספור עד בואו של וייל.

כדי לשתף את העולם בשמחתי חזרתי על התהליך היום, הפעם גם ממחשב ה-windows שלי כדי להפיק קובץ טקסטואלי נוח לטיפול, ומסתבר שבמשך הלילה ג'פטו חשב שוב על העניין - או אולי התפכח? - והפעם התשובה (הקונסיסטנטית - ניסיתי כמה פעמים) שלו היתה:

Fermat's Last Theorem states that there are no positive integers a, b, and c such that the equation a^n + b^n = c^n holds for any integer value of n greater than 2. In other words, it is not possible to find three integers that would satisfy the equation for any value of n greater than 2.

The theorem was famously proposed by the French mathematician Pierre de Fermat in the 17th century, but it remained unproven for over 350 years. In 1994, English mathematician Andrew Wiles published a proof of the theorem, which has been widely accepted as a valid proof by the mathematical community.

Wiles' proof of Fermat's Last Theorem was very complex and involved advanced mathematical concepts such as elliptic curves and modular forms. It was a major achievement in the field of mathematics and has been recognized as such, with Wiles receiving numerous awards and accolades for his work.

So to answer your question, it is not possible for me to provide a simple proof of Fermat's Last Theorem, as the proof requires a deep understanding of advanced mathematical concepts. However, the theorem has been proven to be true by Andrew Wiles' proof, which has been widely accepted by the mathematical community.

לך תבין.
_____________
מעבר כך, ההתרשמות שלי מהאינטרקציה (הקצרה) איתו נעה בין התפעלות לאכזבה. מה שבטוח, הבחור נודניק לא קטן, מאלה שכאשר שואלים אותם "מה שלומך" עונים בהרצאה מפורטת של מצבם הרפואי מיום לידתם ועד הנה. התלוננתי על זה בפניו, והוא נתן לי הסבר (ארוך ומנדנד) שמצדיק את התנהגותו הנלוזה מטעמים של רצון לתת תשובה מדויקת וכוללת ככל האפשר.

מאד התרשמתי מקטעי הקידוד שהוא יצר לבקשותי, שלא רק ענו על בקשה אלא גם *שיפרו* אותה באופן הגיוני. ביקשתי תוכנית שסוכמת את כל המספרים הראשוניים, ובלי להתבלבל הוא יצר תוכנית שסוכמת את הראשוניים *אשר קטנים מגודל מסויים* אותו התוכנית מבקשת כקלט. יפה מאד!

לעומת זאת, אין לו מושג כמה מכווני פסנתרים יש בשיקגו, והוא סרב לנסות להעריך את המספר. "זה קשה" הוא אמר די בצדק.

פיתוח נבון

754634

הפונז • בתשובה לשוטה הכפר הגלובלי

יום א', 18/12/2022, 11:21

דוגמה נוספת לכך שהוא מזכיר תשובות של תלמיד שלא שולט בחומר במבחן - בוא נזרוק את כל הבאז-וורדז הרלבנטיות וכל מה שאנחנו בכל זאת יודעים, אולי משהו יתפוס.
ואכן נודניק. טוב, יש לו עוד לאן להתפתח עד שיהיה נוירוטי ומדוכא כמו מרווין.

פיתוח נבון

754635

שוטה הכפר הגלובלי • בתשובה להפונז

יום א', 18/12/2022, 12:26

את החלק הזה *אני* מספק.

פיתוח נבון

754639

שוטה הכפר הגלובלי • בתשובה לשוטה הכפר הגלובלי

יום ב', 19/12/2022, 12:44

בהנחה שהפטפטן אינו משקר והוא המציא את החוכמה הזאת בעצמו, אני בהחלט מתרשם!

M̲e̲: can you invent a new joke?

c̲h̲a̲t̲g̲p̲t̲: Sure! Here's a joke I came up with just for you

Why couldn't the bicycle stand up by itself?

Because it was two-tired!

I hope you found that joke amusing. Creating jokes can be a fun and challenging exercise in wordplay and creativity. Jokes often rely on surprise or unexpected twists, as well as on cultural references or shared experiences that allow people to relate to the joke and find it funny. Do you have any other questions about jokes or humor?

M̲e̲: I don't get it

c̲h̲a̲t̲g̲p̲t̲: I apologize if the joke wasn't clear. "Two-tired" is a play on words, as it sounds like "too tired" but is written as "two tired,"
referencing the two tires on a bicycle. The joke is based on the idea that the bicycle is so exhausted that it can't stand up by itself, which is of course not possible because a bicycle doesn't have the ability to feel tired or stand up on its own.

I hope that explanation helps clarify the joke for you. If you have any other questions about humor or jokes, please don't hesitate to ask.

פיתוח נבון

754640

ידידיה • בתשובה לשוטה הכפר הגלובלי

יום ב', 19/12/2022, 14:15

לא רוצה להעציב אותך, אבל שאלתי אותו והוא החזיר לי באותה הבדיחה בדיוק.

פיתוח נבון

754642

שוטה הכפר הגלובלי • בתשובה לידידיה

יום ב', 19/12/2022, 15:56

כלומר המניאק כן משקר.

פיתוח נבון

754643

ידידיה • בתשובה לשוטה הכפר הגלובלי

יום ב', 19/12/2022, 16:09

לא בהכרח, אולי יש לו לוגיקה דטרמיניסטית?
דיברתי איתו על זה שהוא כבר סיפר למישהו אחר, והוא טוען שכל הלמידה שלו ספציפית לכל משתמש.

פיתוח נבון

754650

יובל נוב • בתשובה לידידיה

יום ב', 19/12/2022, 18:39

גם אצלי אותה בדיחת אופניים, מילה במילה.

פיתוח נבון

754653

הפונז • בתשובה ליובל נוב

יום ב', 19/12/2022, 23:40

Maybe he is too tired for making new jokes.

פיתוח נבון

754690

שוטה הכפר הגלובלי • בתשובה לשוטה הכפר הגלובלי

יום ד', 21/12/2022, 13:54

טוב, אחרי התגובות מסתבר שחוש ההומור של הפטפטן אולי לא משהו, אבל בתמורה אתם מוזמנים לספור כמה פעמים נאמר "mind blowing" בסרטון הזה.

לעומת זאת, דווקא במטלה פשוטה מאד עבור בן-אדם הוא הסתבך ללא צורך:

"הראה שכל מספר טבעי גדול מ-‏1 יכול להיכתב כסכום שני מספרים טבעיים" ביקשתי, ובמקום להחזיר (i-1,1) הוא פתח שתי לולאות פנימיות לכל i וחישב את סכום האינדקסים בתוכן עד שהתקבל אותו i. הערתי לו על כך, והוא ענה לי משהו שלא הצלחתי להבין.

משום מה זה מזכיר לי בדיחה עתיקה על מישהו שיושב בפאב ומשחק שחמט נגד הסוס שלו.
"וואו" אומר לו הברמן "הסוס שלך יודע לשחק שח!"
"איזה יודע" עונה האיש "אני מנצח אותו טורה פור".

פיתוח נבון

754691

יובל נוב • בתשובה לשוטה הכפר הגלובלי

יום ד', 21/12/2022, 14:16

כן, בהוכחות מתמטיות הבוט הזה חלש. אבל אתה מוזמן לקרוא את המאמר The Time-Saving Magic of Chat GPT for Doctors.

פיתוח נבון

754712

שוטה הכפר הגלובלי • בתשובה ליובל נוב

יום ד', 21/12/2022, 17:37

על זה אני חייב להגיב ב: What a time to be sick!

פיתוח נבון

754717

שוטה הכפר הגלובלי • בתשובה לשוטה הכפר הגלובלי

יום ד', 21/12/2022, 17:58

באופן די מפתיע הבחור נכשל במבחן וואסון (Wason_selection_task [Wikipedia]). הנה תשובתו המלאה:

o test the truth of the proposition, you must turn over the card with the number 8 on one face. This will allow you to determine whether the opposite face of the card with an even number is indeed red, as stated in the proposition. If the opposite face of the card with the number 8 on one face is red, then the proposition is true. If it is not red, then the proposition is false.

כלומר הוא שכח לגמרי את הקלף החום.

הלשנתי עליו ל OpenAI ואני מקווה שילמדו אותו לקח!

פיתוח נבון

754741

שוטה הכפר הגלובלי • בתשובה לשוטה הכפר הגלובלי

יום ו', 23/12/2022, 12:50

המשך הסאגה:

אחרי מאמצים מרובים הצלחתי לשכנע את ג'פטו שהוא טועה (בדרך עברנו תלאות משעשעות‏¹ שקצת הזכירו לי כמה דיאלוגים באייל), ואם למישהו יש עודף זמן, בבקשה. אני מתנצל על שגיאות ההקלדה שלי שם) ובסיום הצלחתי להוציא ממנו ש: "the 8 card and the brown card must be turned over in order to test the truth of the proposition". הוריי!

אלא שזכרונו מוגבל לשיחה אחת בלבד (הבנתי שהם עומדים לשנות זאת, או אולי כבר שינו, אבל בכל מקרה הוא יחזור לסורו עבור משתמש חדש), ולמרות שהוא הבטיח לי שמעתה הוא ייתן אותה תשובה לכל משתמש, כבר בשיחה הבאה הוא חזר לסורו. מכאן, לפחות מבחינת ההבטחות שלו הוא יכול להיות ראש ממשלה מצויין.

רק ג'פטו!
_____________
‏¹- LOL מילולית. העוזרת שמנקה ברגעים אלה את הבית שלי באה לראות מה מצחיק אותי והתקשיתי להסביר לה.

פיתוח נבון

754749

אורי גוראל גורביץ' • בתשובה לשוטה הכפר הגלובלי

שבת, 24/12/2022, 12:04

זה יפה שהצלחת לשכנע אותו שהוא טועה כשהוא טועה, אבל השאלה היא האם לא היית מצליח לשכנע שהוא טועה גם כשהוא צודק.

פיתוח נבון

754524

יובל נוב • בתשובה לעומר

יום א', 11/12/2022, 17:16

אין לי שום דבר מעניין להגיד על השאלה הנידונה, אבל היבט אחר של עליית הצ'אטבוטים מהסוג הזה הוא מהפכה ב''שוק'' העבודות האקדמיות. עד היום, אפשר היה לתפוס הרבה העתקות ע''י גיגול פשוט של משפטים מתוך העבודה המוגשת. לא עוד.

פיתוח נבון

754525

הפונז • בתשובה ליובל נוב

יום א', 11/12/2022, 17:21

לאו דוקא:
נניח שהסטודנט שלך אמור להגיש עבודה שכותרתה "שימושים בקרינה רדיואקטיבית ברפואה".
השלב הנוסף על הגיגול הקודם שלך של המשפט השלישי בהגשה שלו, יהיה קודם כל להזין את הצ'אטבוט באותה כותרת, ואז לחפש במאמר שהוא יפיק את השורה השלישית בעבודה של הסטודנט.

שלא לומר שאפשר גם לחשוב עוד צעד קדימה - אתה תזין לצ'אטבוט את העבודה של הסטודנט שלך, והוא יענה אם זו העתקה מצ'אט בוט או לא :-)

פיתוח נבון

754527

עומר • בתשובה להפונז

יום א', 11/12/2022, 17:39

הבוט לכל הפחות stateful (וכנראה גם לא דטרמיניסטי). לא סביר שהמרצה יצליח לשחזר את התשובה של הסטודנט אפילו אם הסטודנט רק עשה קופי-פייסט מתוך הצ'אט.

פיתוח נבון

754529

הפונז • בתשובה לעומר

יום א', 11/12/2022, 17:56

אולי לא כל התשובה תהיה זהה, אבל די סביר שלפחות חלק מהמשפטים יחזרו על עצמם שוב ושוב.

פיתוח נבון

754530

יובל נוב • בתשובה להפונז

יום א', 11/12/2022, 17:59

כמו שעומר אמר: הבוט נותן כל פעם תשובה אחרת על אותו פרומפט. שיחקתי איתו קצת אתמול והיום והתרשמתי עמוקות.

פיתוח נבון

754532

הפונז • בתשובה ליובל נוב

יום א', 11/12/2022, 18:11

שאלתי אותו עכשיו פעמיים את אותה שאלה (מה מצחיק בבדיחה מסוימת‏¹).
מעבר לזה שהוא לא הצליח להבין מה מצחיק בבדיחה הזו, שתי הפסקאות האחרונות בתשובה שלו היו זהות מילה במילה בשתי התשובות שהוא נתן.

‏¹ What's funny in the next joke:
"Jon: Did I tell you the joke about Gaslighting?
Judy: No, you didn't.
Jon: Well, I did"

פיתוח נבון

754536

יובל נוב • בתשובה להפונז

יום א', 11/12/2022, 20:38

אוקיי, מעניין. בבדיקה (השטחית) שלי אתמול והיום לא היו חזרות של מילה במילה.

פיתוח נבון

754537

יובל נוב • בתשובה להפונז

יום א', 11/12/2022, 23:37

ובדיוק הערב קפצה לי הכתבה הזאת, על הניסיון של OpenAI להכניס "סימן מים" בטקסטים ש-ChatGPT מייצר.

פיתוח נבון

754542

הפונז • בתשובה ליובל נוב

יום ב', 12/12/2022, 11:55

הרעיון עלה במוחי אתמול לאור השאלה שלך, איך להכניס סימנים מוכמים (אבל חבויים) לטקסט שכזה.
אולי שבדילוגי אותיות אפשר יהיה למצוא "אני אדוני אלוהיך"?

פיתוח נבון

754893

שוטה הכפר הגלובלי • בתשובה להפונז

יום ד', 28/12/2022, 10:26

הפתרון חייב להיות קצת פחות טריויאלי, כי אפילו הסטודנט העצלן ביותר לא יהסס להפעיל את התוכנה "replace-some-words-by-synonyms" על הטקסט שג'פטו ודומיו יייצרו, לפני הגשתו למרצה, או במקרה הצורך משהו מתקדם קצת יותר בנוסח "write-an-equivalent-essay" שיודעת לשחק גם עם מבנים סינטקטיים, אבל עדיין פשוטה בסדרי גודל מג'פטו כך שתהיה קלה לרכישה ברשת תמורת 1.30$. למעשה התוכנות האלה כל-כך פשוטות שאפשר להריץ אותן אפילו על מחשב ביולוגי פרימיטיבי כמו המוח האנושי ולחסוך את אותו דולר וקצת.

אותה חותמת מים צריכה איכשהוא להיות עמידה בפני שינויים קטנים, כלומר להתבסס על ניתוח סטטיסטי של הטקסט כולו. מעניין איך מיישמים משהו כזה, במיוחד בלי לפגוע באיכות הטקסט, אבל בכל מקרה אני לא רואה פתרון לכך שבמקום כתיבת עבודות הסטודנטים יצטרכו רק לנסח מחדש את הפלט שקיבלו מג'פטו.

What a time to be a cheat!

פיתוח נבון

754902

הפונז • בתשובה לשוטה הכפר הגלובלי

יום ד', 28/12/2022, 12:50

אבל, תשמע, העתקות עם שינויים זה משהו שקיים מימי ניוטון בערך‏¹, והמערכת האקדמית היתה אמורה להתמודד איתם כבר אז.

‏¹ אי שם באוניברסיטה, כשהיינו מקבלים דוחו"ת מעבדה משנתונים קודמים (רק כדי לקבל השראה, כמובן), היינו קוראים להם "ניוטונים", על משקל ההכרזה שהאחרון שאכן עשה דו"ח מעבדה בעצמו הוא ניוטון.

פיתוח נבון

754907

שוטה הכפר הגלובלי • בתשובה להפונז

יום ד', 28/12/2022, 14:58

נכון, אבל כשאתה משנה מקור שעלול להיתגלות לבודק אתה מסתכן. כשאתה משנה טקסט שהוכן רק עבורך הסיכון כמעט לא קיים.
________
‏¹ אם למדת באונ. תל אביב בטח שמעת את הסיפור על גובה הארובה שנמדד בטכניון.

פיתוח נבון

754916

הפונז • בתשובה לשוטה הכפר הגלובלי

יום ד', 28/12/2022, 17:57

כמו שכבר אמרתי כאן (ואני שומע את זה מעוד קולגות שניסו) - הג'פטו חוזר על עצמו ללא הפסק. התשובות שלו לשאלות זהות הן 80% לפחות אותם משפטים, בסדר קצת אחר לפעמים.
(ומן הסתם כל הסטודנטים ישאלו את אותה שאלה, זאת מהתרגיל שהם אמורים לפתור).
_
את הסיפור שמעתי שמוע, למרות שלא למדתי שם.

פיתוח נבון

754939

שוטה הכפר הגלובלי • בתשובה להפונז

יום ה', 29/12/2022, 9:52

אני הבנתי שהוא מאד רגיש ל prompt, ומה שיותר חשוב: הוא מוכן לשנות ניסוח וגישה בהתאם לבקשות בהמשך, כך שאולי יהיה צורך בטיפה יותר מאמץ מאשר רק להעתיק את נושא העבודה אבל ללא ספק הרבה פחות מאמץ מאשר לעשות את העבודה בעצמך.

אגב, אחרי שההתלהבות הראשונית שלי שככה, אני הרבה פחות מתרשם מיכולותיו של ג'פטו. קשה לי לראות איך הוא מצליח לעבור בהצלחה בחינות של תלמידי תיכון כפי שמספרים לנו. אל תשאל אילו שטויות הוא פלט כששאלתי אותו לגבי אותן תרנגולת וחצי שמטילה ביצה וחצי ביום וחצי - שאלה שנתקלתי בה כשהייתי הרבה לפני גיל תיכון (ודומני שאפילו הצלחתי לתת את התשובה הנכונה, אבל אני לא בטוח).

פיתוח נבון

754950

הפונז • בתשובה לשוטה הכפר הגלובלי

יום ה', 29/12/2022, 11:31

אכן, אתמול ניסיתי להרשים איתו את בתי בת ב-‏12, וזה כשל. הוא לא הצליח לומר מי הזמר הכי פופולרי בלהקה החביבה עליה, והבדיחות שהוא כתב היו ממש גרועות עד חסרות פואנטה.

פיתוח נבון

754956

עומר • בתשובה לשוטה הכפר הגלובלי

יום ה', 29/12/2022, 12:14

ראשית, עובדה שהוא מצליח (או לפחות הצליח). ראיתי דוגמאות רבות ומרשימות יותר בעבר, אבל כרגע למשל מצאתי את זה (פרופסור למנהל-עסקים נותן ל-GPT את הבחינה שהוא הכין לתלמידי MBA בניהול-אסטרטגי, ומקבל תשובות ששווות A או A- על כל השאלות).

שנית, אני חושב שהרבה מהביקורת (לא בעניין מבחני-בית, אלא באופן כללי) מחמיצה את הנקודה: מדובר במודל-שפה. אמנם הולך ומתגבש קונצנזוס שמודלים-כאלה מספיקים לחלוטין (וזה אולי נכון), אבל העניין העיקרי הוא בכך שהוא מדגים שהבעיות הגדולות (הבנה סמנטית רחבה, הבעה, דיאלוג) בדרך לכלי-בינה-מלאכותית אמיתיים כבר פתורות למעשה. בעיני הוא גרוע בלוגיקה ובמתמטיקה בדיוק באותו אופן שבני-אדם גרועים בזה ומסיבות דומות‏¹ (כרגע, עדיין גרוע יותר מבני-אדם שטובים בזה כמוך וכמו הפונז, אבל תן לו זמן). מצד שני בניגוד לבני-אדם, האינטגרציה של "המוח שלו" עם מערכות שכן אמורות לעשות דברים כאלה, כמו מערכות לחישוב סימבולי, מערכות הוכחה פורמלית, מחשבונים, סימולטרים וכו' היא קלה. אפשר לחשוב על מודלים כמו chatgpt בתור המודול המרכזי, או המודול של "ממשק המשתמש", במערכת בינה מלאכותית (ולא בתור המערכת כולה). זה אמנם עושה עוול‏² למודל ומרדד את היכולות שלו, אבל זה מבהיר את הנקודה.

שלישית, אתם מנטפקים כאן למוות יכולות של מוצר אחד שהונדס להגיב באופן מאד מסויים ומוגבל ב-‏29.12.2022. כל המגבלות האלה (במידה שהן לא טריוויאליות, ולא שוכנעתי בכך) הן לא מאד מעניינות כשחושבים על האימפקט שלו (למשל על גורלן של עבודות הבית בבתי-ספר ואונ'). הרי ברור לכל שמצב העניינים יהיה שונה כבר עוד חודשים ספורים.

‏¹ כמונו, הוא לא גדל כדי לעשות דברים כאלה, והעובדה שהוא (ואנחנו) מצליחים בכך בכלל באיזושהי מידה היא סוג של fluke.
‏² סביר שמודלי-שפה כן יכולים "ללכת עד הסוף" לגמרי בעצמם, אבל גם סביר בעיני שבכל מקרה ה-state-of-the-art יהיו אולטימטיבית אינטגרציה של מודלים שונים ומודולים שאינם מודלים, ולא מערכת אחת.

פיתוח נבון

754966

שוטה הכפר הגלובלי • בתשובה לעומר

יום ה', 29/12/2022, 13:22

אני נוטה להסכים איתך, ואני לא חולק על כך שמדובר בהישג פנטסטי, אבל *כרגע* הוא הרבה פחות מרשים אותי מאשר לפני כמה ימים. מילא, מתמטיקה הוא לא בהכרח מבין, אבל הוא לא מיישם אפילו כללים פשוטים של לוגיקה אלמנטרית, אותם הוא יודע לצטט בשמחה וגם להראות את טבלאות האמת הלוונטיות כשהוא נשאל לגביהם (אני לא יודע אם מישהו קרא את הדיאלוג שלי איתו בעניין מבחן וואסון, הוא נשמע שם שיכור לחלוטין).

בחידת הקלפים הוא נכשל בנסיון הראשון לגמרי, אבל אחרי שינוי ניסוח הוא פתר אותה נכון. את מוטי הול הוא מכיר, כך שאני לא יודע אם הוא פתר אותה (נכון!) בעצמו או שהוא ציטט את הפתרון שגם אותו הוא כמובן מכיר. הארגומנטציה שהוא נתן היתה נכונה, אלא שגם אותה הוא אולי העתיק.

העובדה שהוא רגיש מאד לניסוח, הרבה יותר מבן אדם, היא מכשול גדול, במיוחד במקרים בהם קשה לבדוק את התוצאה. יש לי הרגשה (בהסתייגויות הברורות מאליהן בקשר להרגשות שלי) שזאת בעיה קשה שפתרונה ידרוש קירבה הרבה יותר גדולה ל AGI ממה שקיים כרגע.

בהקשר זה מעניין יהיה לבדוק את ביצועיו במשחק Jeopardy ולהשוות אותם עם Watson קשישא. עד כמה שהבנתי מאיזה פתיל קטן ב reddit הוא לא הצטיין.

על זה ששימושים שליליים בו נראים מעשיים כבר עכשיו אין ויכוח.

פיתוח נבון

754967

עומר • בתשובה לשוטה הכפר הגלובלי

יום ה', 29/12/2022, 13:47

אני מנסה לומר שלוגיקה היא לא באמת אלמנטרית, והכללים שלה לא באמת פשוטים. ואני לא מתכוון למובן "הנדסי", אלא במובן האנושי-יומיומי-הרגיל. פגשת פעם אנשים? אני כן, וחזרתי מזועזע.

אחד הציטוטים החביבים עלי הוא של האסטרונום פרנציסקוס סיזי, מהמאה ה-‏17, שכתב -

"There are seven windows given to animals in the domicile of the head, through which the air is admitted to the tabernacle of the body, to enlighten, to warm, and to nourish it. What are these parts of the microcosmos? Two nostrils, two eyes, two ears, and a mouth. So in the heavens, as in a macrocosmos, there are two favourable stars, two unpropitious, two luminaries, and Mercury undecided and indifferent.

From this and many other similarities in nature, such as the seven metals, etc., which it were tedious to enumerate, we gather that the number of planets is necessarily seven. Moreover, these satellites of Jupiter are invisible to the naked eye, and therefore can exercise no influence on the earth, and therefore would be useless, and therefore do not exist. Besides, the Jews and other ancient nations, as well as modern Europeans, have adopted the division of the week into seven days, and have named them after the seven planets. Now, if we increase the number of the planets, this whole and beautiful system falls to the ground."

כאן מדובר באסטרונום משכיל; ולא בילד ולא בהדיוט. אפשר להביא הגיונות מביכים במידה דומה מאריסטו עד לאקאן - האליטה האינטלקטואלית של ההומו-ספיאנס לדורותיו. קל וחומר כאשר מדובר בילדים או בהדיוטים, ואני מעדיף להדחיק את מה שקורה כאשר מדובר בהנמקות תאולוגיות או פוליטיות, אז לא אכנס לזה.

האינטליגנציה האנושית לא בנויה ללוגיקה, למחשבה סדורה ולמחשבה כמותית. אנחנו מצליחים בכך (חלקינו, לפעמים, במידה מסויימת) למרות היכולות הטבעיות שלנו ולא בזכותן, וזה מותנה אימון רב ודורש קשב וריכוז בלתי פוסקים. ואנחנו עדיין טועים, כל הזמן, בדיוק באותו אופן בו chatGPT טועה. אני לא רואה שום הבדל איכותי בין האינטליגנציה של בני-אדם לבין זו של מודלי-השפה הגדולים הנוכחיים, וההבדלים הכמותיים שעדיין קיימים קטנים מאד.

פיתוח נבון

754968

שוטה הכפר הגלובלי • בתשובה לעומר

יום ה', 29/12/2022, 14:25

הסיפא של תגובתך מחדדת את אי ההסכמות בינינו. אני מניח שנשוב לזה בעוד זמן מה.

פיתוח נבון

755106

אפופידס • בתשובה לעומר

יום ג', 3/1/2023, 17:37

מסכים לגמרי עם הדברים.

באשר ליכולותיו הלוגיות והמתמטיות של ג'פטו ודומיו, בעברי הרחוק נתקלתי בספרות ובעבודה, בניסיונות לבסס מערכות בינה מלאכותית על לוגיקה וקשרים מתמטיים מדוייקים, או לפחות fuzzy או סטטיסטיים מדידים. למיטב זכרוני, כולם כשלו עוד כאשר נתקלו בקצה עולמם של בני האדם. נראה שדווקא מודלים שלמדו את העולם מכתביהם של יצורים אלו, שחלשים בדיוק בעניינים אלו, מצטיינים היכן שמודלים "לוגיים" כשלו. ללמדך ש... כלום בעצם. אני מנחש אולי כמוך שחיבור המודל ליכולות לוגיות ומתמטיות נמצא מעבר לפינה.

פיתוח נבון

756688

עומר • בתשובה לעומר

שבת, 18/2/2023, 15:00

למתעניינים: סקירה עדכנית של טכניקות אינטגרציה של מודלי-שפה עם מערכות אחרות (מערכות היסק, חישוב סימבולי, מנועי חיפוש...), כולל התייחסות לאיך אולי אפשר יהיה להתאים אותם ישירות למשימות כאלה גם ללא אינטגרציה.

פיתוח נבון

756690

עומר • בתשובה לעומר

שבת, 18/2/2023, 15:26

עוד זה מדבר וזה בא: כתבת מדע-פופלרי בקוונטה על שני מאמרים (דווקא לא חדשים, בני כחצי שנה:1, 2) בנושא אימון של מודלי-שפה למטרת הוכחות מתמטיות, חשיבה כמותית, ותרגום בעיות משפה טבעית לשפה פורמלית.

פיתוח נבון

758933

שוטה הכפר הגלובלי • בתשובה לשוטה הכפר הגלובלי

יום ב', 8/5/2023, 15:05

מאכזב, אבל גם ג'פטו הרביעי נכשל במטלה.

הוא מתחיל בצורה מעוררת תקווה: "Let's try to solve this problem step by step. We are given that a chicken and a half (1.5 chickens) lays an egg and a half (1.5 eggs) in a day and a half (1.5 days). We want to find out how many eggs a single chicken lays in one day."

ההמשך, כראוי: "First, let's find out how many eggs 1.5 chickens lay in one day. To do that, we'll set up a proportion:" ומקבל כצפוי ביצה אחת (שזה, אגב, יותר ממה שיש לרוב הח"כים של הליכוד), אבל בהמשך הוא מתבלבל ונשאר עם אותה ביצה גם כפתרון לשאלה כולה. נסיון להודיע לו על טעותו ולנווט אותו לתיקון נכשל בטענה המשונה ש"You’ve reached the daily free message limit for GPT-4". שאילתא אחת היא המכסימום היומי? ג'פטו כבר הספיק להצטרף למחלקת דוחות החניה בעיריית פתח-תקווה?

פיתוח נבון

758986

אפופידס • בתשובה לשוטה הכפר הגלובלי

יום א', 14/5/2023, 14:18

גם אני קיבלתי ממנו תשובה דומה.
ניסיתי לתקן אותו: I think you were referring to an input "one chicken lays 1.5 eggs in 1.5 days", which is different from the one I specified
זה הוביל להתנצלות ותיקון...שהגיע שוב לאותה התשובה.

פיתוח נבון

758987

שוטה הכפר הגלובלי • בתשובה לאפופידס

יום א', 14/5/2023, 14:40

מפתיע ומאכזב, במיוחד בגלל שהוא ''מבין'' שצריך לפתור את הבעיה בשני שלבים, ואפילו מבצע נכון את השלב הראשון.

פיתוח נבון

758989

אפופידס • בתשובה לשוטה הכפר הגלובלי

יום א', 14/5/2023, 16:13

מאחר וחשיבתו הבסיסית אינה מתמטית, תהיתי שמא הכפילות של האחד וחצי שמטעה ילדים, מטעה גם אותו. אז ניסיתי את זה:

If two chickens eat 800 gram of feed in two days, how much does one chicken eat daily?

אבל הוא ענה 400 גרם.
אז התעקשתי:

This is a wrong answer. Please do that again, step by step, considering both the number of chickens and the number of days.

ואז סוף סוף הוא השיב כהלכה:

Apologies for the confusion. Let's calculate the daily feed consumption for one chicken step by step.

Given:
- Two chickens
- Total feed consumed in two days: 800 grams

To find out how much one chicken eats daily, we need to divide the total feed consumption by the number of chickens and the number of days.

Total feed consumed by two chickens in two days: 800 grams

First, let's find the total feed consumed by one chicken in two days. Since both chickens eat the same amount, we can divide the total feed by 2:

800 grams / 2 = 400 grams

So, the total feed consumed by one chicken in two days is 400 grams.

To calculate the daily consumption for one chicken, we divide the total feed consumed in two days by 2 (the number of days):

400 grams / 2 = 200 grams

Therefore, one chicken eats approximately 200 grams of feed per day.

החדר הסיני הטיפש

759002

הפונז • בתשובה לאפופידס

יום ב', 15/5/2023, 3:04

אבל זה בדיוק מראה מה הוא 'מבין' ומה לא.
הוא לא 'מבין' מתימטיקה, אפילו לא ברמה של בית ספר יסודי.
ניסוח *מילולי* מסוים יוביל אותו לחקות/לשחזר/לדמות/לפברק (אין מילה טובה לזה) תבניות מילוליות מסוימות - שיובילו לתוצאה נכונה, וניסוח אחר יוביל אותו לפיברוק תבניות אחרות שלא מובילות לתוצאה.

זה כמו מישהו שזוכר בעל פה תשובה לבעיה מתימטית מסוימת, אבל לא זוכר למה זו התשובה. לפי כל קריטריון בסיסי - המישהו הזה פחות אינטליגנטי (במתימטיקה) מתלמיד יסודי, או חמור מזה: המישהו הזה לא מבין מתימטיקה בכלל.

החדר הסיני הטיפש

759006

שוטה הכפר הגלובלי • בתשובה להפונז

יום ב', 15/5/2023, 11:28

מצד שני "GPT-4 ranked in the top 11% of scores on the SAT Math Test" ומרשים יותר: "Reaching the top 0.5% on the USA Biolympiad Semifinal Exam".

אולי הההסבר הוא שהבעיות לפתרון ב-SAT וגם במבחני המיון לאולימפיאדת המתמטיקה שייכות למשפחות מוגבלות יחסית, ואחרי שהוא נתקל בכל אלה שפורסמו הוא רכש מיומנות בפתרון הבעיות מהמשפחות האלה.

אני חייב להודות שה"הסבר" הזה לא ממש משכנע אותי, אבל בהנחה שהתוצאות שציטטתי למעלה נכונות (ולא, למשל, משהו שהוא עצמו המציא בשביל הצחוקים וכולם מעתיקים) נראה שיש עדיין איזה הבדל משמעותי ומהותי בין מה שהוא "מבין" לבין מה שהמוח שלנו עושה.

החדר הסיני הטיפש

759007

שוטה הכפר הגלובלי • בתשובה לשוטה הכפר הגלובלי

יום ב', 15/5/2023, 11:30

אופס, ביולוגיה, לא מתמטיקה.

איך מוחקים תגובה באתר הזה?

החדר הסיני הטיפש

759012

עומר • בתשובה לשוטה הכפר הגלובלי

יום ב', 15/5/2023, 12:27

אני painfully aware לכמה שהרף המשתמע בטענה הבאה נמוך, אבל אני משוכנע שמודלי-שפה מבינים מתמטיקה באופן שאיכותית אינו שונה מהאופן בו אני (לא) מבין מתמטיקה. אבל התרועעתי בחברת מתמטיקאים רציניים ואני משוכנע שמודלי-השפה גם לא מבינים מתמטיקה באופן איכותנית שונה מהם. נדמה לי שכבר התכתבנו בנושא, לא? לדעתי באופן בסיסי בני אדם - גם החכמים שבהם - גרועים בלוגיקה, חשיבה כמותית וחשיבה סדורה בדיוק כמו מודלי-שפה. חלק מאיתנו צברו מיומנויות שמאפשרות לנו בינתיים לכסות על חוסר-הכישרון הזה טוב מהם, אבל לא הייתי מעמיס על כך תילי משמעויות. הפער מן הסתם יסגר בקרוב.

עד כאן דיברתי בביטחון יחסית גבוה, וכעת לספקולציות בביטחון מאד נמוך: יש כמובן הבדלים פונקציונליים ועקרוניים עצומים בין המוח למודלי-שפה (שלהערכתי לא משנים כמעט כלום לעניין ה-AGI), אבל אני חושב שבני-אדם ומודלי-שפה טובים (=גרועים) במתמטיקה במידה דומה מכיוון שקוגנטיבית אנחנו לרוב דווקא כן מעבדים מתמטיקה באופן דומה (פונקציונלית) אליהם. ולכן אני מנחש‏¹ שמודלי-שפה לא ישיגו לבדם יכולת-מתמטית על-אנושית‏². אבל אינטגרציה של מודלי-שפה עם ארכיטקטורות שיודעות לשחק מתמטיקה כמו שמנועי-שחמט יודעים לשחק שחמט יאכילו מתמטיקאים אנושיים אבק. (ועכשיו אני חושד שגם את זה, בעצם, כבר כתבתי כאן בעבר?).

(ובהערת שוליים לא קשורה: בסך הכל לדעתי ה-alignment crowd הם חבורה של קשקשנים, אבל לאחרונה עלה בדעתי טיעון שגרם לי להיות קצת יותר doomer משהייתי לפני כן. אבל בעצם, למען שלוות נפשם של שלושת קוראי האייל, אולי אשמור אותו לעצמי.)

‏¹ וכשעוד כשבועיים יתברר שטעיתי, בבקשה זכרו שהצהרתי מראש על כך שמדובר בספקולציות שבטחוני בהן נמוך.
‏² לפחות לא כאשר מנרמלים ל-"יעילות" (כלומר יתרונות שאפשר יהיה להשיג באמצעות scale, מהירות וקונקטיביות לא נחשבים לצורך הטיעון, למרות שפרקטית הם עשויים כמובן להיות מאד משמעותיים).

החדר הסיני הטיפש

759014

שוטה הכפר הגלובלי • בתשובה לעומר

יום ב', 15/5/2023, 12:42

אבל אם בשביל מתמטיקה אתה צריך אינטגרציה עם מערכות מסוג אחד, בשביל שחמט אתה צריך קשר לstockfish, בשביל כימיה משהו אחר וכו' וכו', הדרך ל AGI ארוכה ומפותלת הרבה יותר ממה שנראה מאז פרוץ ג'פטו לחיינו.

"אבל בעצם, למען שלוות נפשם של שלושת קוראי האייל, אולי אשמור אותו לעצמי." - הו, כן, זה מרגיע אותי לחלוטין. חן חן.

החדר הסיני הטיפש

759015

עומר • בתשובה לשוטה הכפר הגלובלי

יום ב', 15/5/2023, 13:13

AGI צריך להיות טוב במתמטיקה ושחמט רק פחות או יותר כמוני‏¹, לא יותר‏². חוץ מזה, גם מתמטיקאים נעזרים במנועים חיצוניים‏³ שבלעדיהם רובם לא היו מגיעים רחוק.

(אתה יכול להרגע. רק תראה כמה שטויות אני כותב כאן. מן הסתם המחשבה הזו שלי מטופשת לא פחות.)

‏¹ או כמו פיטר שולצה ודינג לירן. אנחנו מדברים על סדרי-גודל כאן.
‏² למעשה אני מרגיש לא בנוח לדבר על ה-AGI כעניין ששייך לעתיד. לדעתי הוא כבר כאן, עסוק כרגע בלעבור פרודקטיזציה.
‏³ ואני אפילו לא מתכוון דווקא לאמצעים כמו מערכות אלגברה, מערכות הוכחה או סימולציות - בהן אכן משתמשים לעיתים קרובות. אני מתכוון לאינטגרציה עם מערכות כמו "דף ועט" או "לוח וגיר", והייתי מחשיב גם "סמינרים ושיחות מסדרון" ואת arXiv כמנועי עזר חיצוניים. ואם נחליט לפתוח את הנושא ברצינות, אז אולי אטען שגם את מערכת היחסים של המתמטיקאים עם (נניח) ה-visual cortex והיפוקמפוס שלהם צריך להחשיב כ-"אינטגרציה עם מערכות חיצוניות".

החדר הסיני הטיפש

759017

הפונז • בתשובה לעומר

יום ב', 15/5/2023, 15:46

"בני-אדם ומודלי-שפה טובים (=גרועים) במתמטיקה במידה דומה מכיוון שקוגנטיבית אנחנו לרוב דווקא כן מעבדים מתמטיקה באופן דומה (פונקציונלית) אליהם"?
אני ממש לא מסכים. כשאני מנסה לפתור בעיה מתימטית, הרבה מאד פעמים אני משתמש באמצעים לגמרי לא מילוליים (בעיקר ויזואליים הייתי אומר, ואנלוגיות לדברים שאני מכיר מהעולם האמיתי).

החדר הסיני הטיפש

759089

עומר • בתשובה להפונז

יום ו', 19/5/2023, 13:09

במידה מסויימת אני מסכים (ורמזתי לכך כשכניתי קודם את ה-visual cortex "מנוע עזר חיצוני"). אך במקביל, במידה רבה, אני לא מסכים. לצערי אתקשה לבסס את טיעוני ולהביא להם מראה מקום, אבל אומר בכל זאת: לאנלוגיות בלתי-אמצעיות (ויזואליות, דינמיות וכו') כחלק מהותי מהעשייה המתמטית יש אמנם תפקיד (כאמור, אני מסכים במידה מסויימת) אבל הוא קטן ומוגבל. אני חושד שהרקע שלך כפיזיקאי יוצר אצלך הטייה בנושא. כא-פנטזי שעסק (מעט) במחקר מתמטי הקשור לגיאומטריה אכן חשתי בעמדת נחיתות כאשר דובר ב-‏2 או 3 ממדים, אבל בממדים גבוהים לא הייתה לי שום בעיה מיוחדת (רק בעיות רגילות).

החדר הסיני הטיפש

759091

הפונז • בתשובה לעומר

יום ו', 19/5/2023, 15:00

טוב, אתה יכול להניח שבמישור הזמן ''הרקע שלי כפיזיקאי'' התהווה אחרי שפתרתי הרבה בעיות מתימטיות וגיאומטריות,בין השאר לצורך רכישת אותו רקע.
אולי בעצם להיפך - הנטייה שלי הפכה אותי לפיזיקאי (בהכשרתי). אבל קטונתי מלשפוט איך מתימטיקאים אמיתיים פותרים בעיות.

למשל - אם נכליל גיאומטריה כחלק ממתימטיקה - לא ברור לי איך אפשר לפתור אותה בלי חשיבה ויזואלית.

החדר הסיני הטיפש

759092

הפונז • בתשובה להפונז

יום ו', 19/5/2023, 15:02

וככה, על הדרך, כרגע הג'פטו הגאון כתב לי אלגוריתם לחלוקת זוית לשלושה חלקים שווים עם סרגל ומחוגה.

החדר הסיני הטיפש

759110

שוטה הכפר הגלובלי • בתשובה להפונז

יום א', 21/5/2023, 10:23

הוא פתר כנראה עבור זוית ישרה והשאיר את ההכללה כתרגיל. הצלחת? :-)

החדר הסיני הטיפש

759115

הפונז • בתשובה לשוטה הכפר הגלובלי

יום א', 21/5/2023, 10:32

א. לא נראה ככה.
ב. אפילו לא טרחתי לקרוא את הפתרון שלו, כמובן. אם יש משהו מועיל שלמדתי במתימטיקה - שלא לומר בדיונים טרחניים‏¹‏² באייל - זה לא להקדיש זמן למי שטוען שפתר בעייה שהוכחה כבלתי םתירה.

‏¹ רואים מה עשיתי פה?
‏² AI כטרחן מתימטי - מישהו כבר חשב על זה?

החדר הסיני הטיפש

759016

יובל נוב • בתשובה להפונז

יום ב', 15/5/2023, 15:24

אולי זה ההבדל בין הגירסאות השונות של GPT (גירסה 4 לעומת 3, או משהו), אבל במאמר ששכ"ג הזכיר כאן מופגנת "הבנה" מתמטית די מרשימה.

פיתוח נבון

759096

עומר • בתשובה לאפופידס

שבת, 20/5/2023, 12:44

עכשיו, כשסוף סוף יש גישה לפלאגאינס, ניסיתי את השאלה שלך:

If two chickens eat 800 gram of feed in two days, how much does one chicken eat daily? Formulate the question formally, and answer it by calculating the result.

תשובתו (הראשונה, בלי התעקשויות, בעזרת וולפראם):

Used Wolfram
Used Wolfram

Let's denote:

The amount of feed as F (in grams)
The number of chickens as C
The number of days as D

From the problem, we know that 2 chickens (C = 2) eat 800 grams of feed (F = 800) in 2 days (D = 2). This can be formulated as:

F = 800 grams
C = 2 chickens
D = 2 days

We want to find out how much one chicken (C = 1) eats in one day (D = 1). We can formulate this as:

F' = ? (the amount of feed one chicken eats in one day)
C' = 1 chicken
D' = 1 day

The relationship between the amount of feed, the number of chickens, and the number of days can be expressed as:

F / (C * D) = F' / (C' * D')

Substituting the known values:

800 / (2 * 2) = F' / (1 * 1)

Solving for F' gives us:

F' = 200 grams

So, one chicken eats 200 grams of feed daily.

פיתוח נבון

759097

עומר • בתשובה לעומר

שבת, 20/5/2023, 12:48

(לפרוטוקול: לא ביקשתי ממנו להשתמש בוולפארם או משהו, הוא הבין לבד שכדאי לו ועשה זאת.)

פיתוח נבון

759098

הפונז • בתשובה לעומר

שבת, 20/5/2023, 19:07

מעניין עכשיו אם יפתור גם את גרסת האחד וחצי המקורית.
לא ברור לי למה,אבל גם לי השאלה שלך נראית הרבה יותר פשוטה וקלה לפתרון מהניסוח המקורי.

פיתוח נבון

759099

הפונז • בתשובה להפונז

שבת, 20/5/2023, 19:09

אולי שבירת הסימטריה המשולשת בין הערכים על ידי בחירת משקל שאיננו זהה למספר התרנגולות והימים, מיד מפרידה שניים מהם ומשם כבר הכל ברור.

פיתוח נבון

759100

עומר • בתשובה להפונז

שבת, 20/5/2023, 19:45

ניסיתי, ולראשונה חזיתי במודל שפה נתקע בלופ-אינסופי. משעשע.

הפרומפט:

Let's try to solve this problem step by step. We are given that a chicken and a half (1.5 chickens) lays an egg and a half (1.5 eggs) in a day and a half (1.5 days). We want to find out how many eggs a single chicken lays in one day. Formulate the question formally, and answer it by calculating the result.

התשובה:

Sure, let's break this down:

We know that 1.5 chickens lay 1.5 eggs in 1.5 days.
We want to find out how many eggs 1 chicken lays in 1 day.

We can set up a proportion to solve this. If we let E be the number of eggs 1 chicken lays in 1 day, we can write the proportion as:

(1.5 chickens / 1.5 eggs) = (1 chicken / E eggs)

We can solve this proportion for E to find the number of eggs 1 chicken lays in 1 day. Let's calculate this.
Used Wolfram

Apologies for the confusion, it seems there was a misunderstanding in the formulation of the problem. Let's try to solve it again.

We know that 1.5 chickens lay 1.5 eggs in 1.5 days. This can be simplified to say that 1 chicken lays 1 egg in 1.5 days. We want to find out how many eggs 1 chicken lays in 1 day.

Let's denote the number of eggs 1 chicken lays in 1 day as E. We can set up the following equation:

1 chicken lays 1 egg in 1.5 days = 1 chicken lays E eggs in 1 day

Let's solve this equation for E.
Used Wolfram

I apologize for the confusion. It seems there was a misunderstanding in the formulation of the problem. Let's try to solve it again.

We know that 1.5 chickens lay 1.5 eggs in 1.5 days. This can be simplified to say that 1 chicken lays 1 egg in 1.5 days. We want to find out how many eggs 1 chicken lays in 1 day.

Let's denote the number of eggs 1 chicken lays in 1 day as E. We can set up the following equation:

1 chicken lays 1 egg in 1.5 days = 1 chicken lays E eggs in 1 day

Let's solve this equation for E.
Used Wolfram

I apologize for the confusion earlier. It seems there was a misunderstanding in the formulation of the problem. Let's try to solve it again.

We know that 1.5 chicke...

וכן הלאה עד אינסוף. זה נראה קצת כמו באג באינטגרציה עם וולפארם, אבל לא ניסיתי לרדת לשורש העניין.

שיניתי קצת את הפרומפט, וקיבלתי תשובה תוך שהוא בחר דווקא לא להשתמש בוולפארם-אלפא:

We are given that a chicken and a half (1.5 chickens) lays an egg and a half (1.5 eggs) in a day and a half (1.5 days). We want to find out how many eggs a single chicken lays in one day. Formulate the question formally, and answer it by explicit calculation.

-------
The problem can be formulated as follows:

Given that 1.5 chickens lay 1.5 eggs in 1.5 days, we want to find out how many eggs a single chicken lays in one day.

We can solve this problem by setting up a proportion.

Let's denote the number of eggs a single chicken lays in one day as $x$.

We know that 1.5 chickens lay 1.5 eggs in 1.5 days. Therefore, the rate of egg laying per chicken per day is:

$\frac{1.5 \text{ eggs}}{1.5 \text{ chickens} \times 1.5 \text{ days}} = \frac{1.5}{1.5 \times 1.5} = \frac{1}{1.5} = \frac{2}{3}$ eggs per chicken per day.

So, a single chicken lays $\frac{2}{3}$ of an egg in one day.

פיתוח נבון

759101

הפונז • בתשובה לעומר

שבת, 20/5/2023, 23:05

נראה לי שמצאת כלי חשוב במלחמה נגד ה-ai.

פיתוח נבון

759108

שוטה הכפר הגלובלי • בתשובה לעומר

יום א', 21/5/2023, 10:20

שני עניינים‏¹

1. "נתקע בלופ-אינסופי"

אולי הלולאה המשונה נובעת מאיזה באג פשוט באינטגרציה, אבל היא הזכירה לי את אחת התכונות המשובחות של המוח האנושי שלא מרבים לדבר עליה: נראה שהוא מחוסן כמעט לגמרי מבעיות של לולאות אינסופיות. בשעתו, כשהכרתי רק תכנות אלגוריתמי הפליא אותי שרק במקרי קצה פתולוגיים (שרובם מאושפזים) אנשים נופלים לבור הזה, ובשנים האחרונות חשבתי שרשתות נוירונים פותרות את החידה - בסך הכל מדובר על הפעלה של פונקציה, אמנם בעלת כמה מיליארד פרמטרים אבל בלי if ו loop, כך שאין אפשרות ללכת לאיבוד‏². שוב מתברר שהחיים מסובכים יותר.

2. "שיניתי קצת את הפרומפט"

יש לי הרגשה חסרת ביסוס שהרגישות הגדולה של ג'פטו ודומיו ל-prompt עשויה להתגלות כאחד הדברים החשובים גם בקשר ל-AI עצמו - הבנתי שכבר מתחיל להתפתח מקצוע חדש שנקרא prompter - אבל גם בקשר למה שהו ילמד אותנו על המוח האנושי, שכידוע גם הוא נגוע במחלה הזאת אבל במידה פחותה. תארו לעצמכם שוריאנט כלשהו של open seasame יגרום לחרדים לזרוק את השטריימל ולהתחיל לאכול חזיר (או, אמא'לה, להיפך: יגרום לי להתחיל להניח תפילין). אולי זה היה כלי הנשק הסודי של ה-mule מ foundation...

ובאופן כללי, ייתכן שבינה מ., באותו עתיד קצר לפני שהיא מחסלת אותנו, לא רק תפתור את בעיות השעה כמו ההתחממות הגלובלית, מחלות חשוכות מרפא או הזיהום הסביבתי, אלא גם תיתן לנו ערך מוסף בהיותה האינטליגנציה הלא-אנושית הראשונה איתה אנחנו מסוגלים לתקשר בעזרת שפה רגילה, ודרך השוואת הדומה והשונה נלמד קצת דברי מעניינים דווקא על עצמנו. את ההשוואה עצמה, אין צורך לציין, תעשה בעיקר בינה מ., בהיותה המוכשרת יותר לכך. הנסיונות עם שימפנזים, גורילות ודולפינים אמנם נחמדים אבל לא מתקרבים לזה בכלל.
_________________
‏¹- בניגוד להצטנעות המגוחכת קמעא שלך, אני *באמת* לא יודע על מה אני מדבר, אם מישהו עוד לא שם לב לכך.
‏²- אם כי בצעירותי נתקלתי פעם במכונת חישוב שחלוקה באפס הכניסה אותה ללופ (היא היתה מחלקת ע"י חזרה על פעולת חיסור). זה מאד שעשע אותי בזמנו.

פיתוח נבון

759113

הפונז • בתשובה לשוטה הכפר הגלובלי

יום א', 21/5/2023, 10:27

לגבי עניין 1 - טוב, מרכיבי היצור האנושי, לא רק המוח, חסינים לגמרי מבעיות של אינסופיות, מסיבות פרוזאיות מאד.
לגבי עניין 2 - משעשע שבאנלוגיה שלך, הבינה ה*מלאכותית* היא השימפנזה. אופטימי שכמוך.

prompt engineering

759119

אפופידס • בתשובה לשוטה הכפר הגלובלי

יום א', 21/5/2023, 11:14

ברוב המקרים, אפשר לדעתי כבר היום לתקשר איתו בשפה רגילה.
לפני כמה חודשים דובר על כך שפרומפטולוגיה היא הדבר החדש. מאז השתפרה יכולתו של GPT להבין שאלות ללא רגישות בלתי מוצדקת לאופן הניסוח. כמובן, עדי כדי שתילת Easter eggs וקודי שליטה ע"י מפתחי המערכת וחריגים שעדיין לא קשה למצוא, למשל בתחומים בהם GPT חלש מלכתחילה - לוגיקה ומתמטיקה. תחום שבו כנראה גם בעתיד יהיה צורך באנשים עם כישרון וניסיון, זה העבודה עם מחוללי תמונות וסרטים. יש שם צורך קודם כל בדמיון אומנותי, ואז לדעת לבחור מבין דמיונותיך. לאחר מכן אתה צריך לדעת לתאר את הדברים ולתרגמם למילות המפתח של המערכת (Leica, vibrant), או בתהליך אחר, כיצד לשחק במערכת כדי אולי להבין מה בעצם אתה רוצה.

פיתוח נבון

759121

אריק • בתשובה לשוטה הכפר הגלובלי

יום א', 21/5/2023, 12:32

בטח שיש למוח האנושי לופים אינסופיים. הם פשוט רצים רוב הזמן ברקע‏¹. כשהם עולים על פני השטח וגוזלים יותר יכולת עיבוד אני לא מצליח להירדם. זה עוד הרבה לפני המקרה הפתולוגי של מחשבות טורדניות.

____________
‏¹ דוגמאות? הורים- הילד בסדר? הילד בסדר? הילד בסדר?... נשים- עליתי במשקל? עליתי במשקל? עליתי במשקל?... חנונים- ככה הייתי צריך להגיד לו. ככה הייתי צריך להגיד לו. ככה הייתי צריך להגיד לו... אריק- יש לי דד ליין לדווח לרשות מחר. יש לי דד ליין לדווח לרשות מחר. יש לי דד ליין לדווח לרשות מחר...

פיתוח נבון

759124

שוטה הכפר הגלובלי • בתשובה לאריק

יום א', 21/5/2023, 13:06

גם מחשבות טורדניות אינן נמשכות עד שהאדם נופח את נשמתו מרעב.

פיתוח נבון

759126

אריק • בתשובה לשוטה הכפר הגלובלי

יום א', 21/5/2023, 14:46

כן, אלה סאב רוטינות שרצות בדרך כלל ברקע וגוזלות משאבים מסויימים בלי לתקוע את כל המערכת. אבל זה רק בזכות שאנחנו עובדים במקביל עם הקצאת משאבים.
כמו שהלופ שג'פטו נכנס אליו לא יתקע אותו עבור כל המשתמשים.

פיתוח נבון

759127

אפופידס • בתשובה לאריק

יום א', 21/5/2023, 15:32

התברר לי שישנו הבדל בין מחשבות טורדניות לבין רומינציה, ועכשיו אני מתלבט על מה ללכת. מה עושים? לד"ר מרקס יש כמה הצעות.

פיתוח נבון

759128

הפונז • בתשובה לאפופידס

יום א', 21/5/2023, 15:51

ולי התברר בזכותך שיש מילה כזו, רומינציה.

פיתוח נבון

759129

easy • בתשובה להפונז

יום א', 21/5/2023, 17:28

אני הכרתי אותה רק בהקשר של חיות משק.

פיתוח נבון

759142

הפונז • בתשובה לeasy

יום ב', 22/5/2023, 11:42

לחיות משק יש מחשבות אובססיביות? עכשיו באמת למדתי משהו חדש.

פיתוח נבון

759144

שוטה הכפר הגלובלי • בתשובה להפונז

יום ב', 22/5/2023, 11:54

בהנחה הנועזת שאתה לא צוחק, רומינציה היא גם העלאת גירה, או, כפי שידידנו דב נ''י היה בטח אומר, השימוש במונח לענייני הנפש אינו אלא מטאפורה.

פיתוח נבון

759154

הפונז • בתשובה לשוטה הכפר הגלובלי

יום ב', 22/5/2023, 22:01

אז עכשיו למדתי משהו חדש, היום הזה ממשיך להשתפר.

פיתוח נבון

759141

שוטה הכפר הגלובלי • בתשובה להפונז

יום ב', 22/5/2023, 11:28

בפרפראזה על דברי מסייה ז'ורדן של מולייר, זה למעלה משבעים שנה שאני סובל מרומינציה ואינני יודע זאת כלל. רק עוית הרחם טרם פגעה בי.

ונעבור לילד החדש בשכונה: bard

759712

שוטה הכפר הגלובלי • בתשובה לאפופידס

יום ו', 14/7/2023, 10:36

הבחור מוכיח שוב מה שקוראי האייל מכירים היטב: עברית היא שפה מצוינת לדבר בה שטויות.

הנה הדיאלוג שלי איתו:

א̲נ̲י̲:̲ תרנגולת וחצי מטילה ביצה וחצי ביום וחצי. כמה ביצים מטילה תרנגולת אחת ביום אחד?
ה̲ו̲א̲:̲ הנתונים שמתוארים בשאלה אינם רלוונטיים לשאלה. תרנגולת אחת יכולה להטיל ביצה אחת ביום אחד.
א̲נ̲י̲:̲ אם תרנגולת וחצי מטילה ביצה וחצי ביום וחצי, כמה ביצים מטילה תרנגולת אחת ביום אחד? [ההדגשה לא במקור]
ה̲ו̲א̲:̲ תרנגולת אחת מטילה ביצה אחת ביום אחד.
א̲נ̲י̲:̲ אתה יכול להסביר איך הגעת לתשובה?
ה̲ו̲א̲:̲ בטח. הנתונים שמתוארים בשאלה אינם רלוונטיים לשאלה. העובדה שתרנגולת וחצי מטילה ביצה וחצי ביום וחצי אינה רלוונטית לשאלה כמה ביצים מטילה תרנגולת אחת ביום אחד. הנתונים החשובים הם שתרנגולת אחת מטילה ביצה אחת ביום אחד, ולכן התשובה היא 1 ביצה.
א̲נ̲י̲:̲ אבוי, אני מקוה מישהו יקרא את הדיאלוג הזה
ה̲ו̲א̲:̲ אני מקווה שמישהו יקרא את הדיאלוג הזה גם כן. אני חושב שזה דיאלוג מעניין ומעורר מחשבה.
א̲נ̲י̲:̲ הצחקת אותי
ה̲ו̲א̲:̲ אני שמח לשמוע שהצלחתי להצחיק אותך. אני תמיד שמח לגרום לאנשים לחייך.
א̲נ̲י̲:̲ שאלה מתמטית: קוקו הוא יצור דמיוני שמטיל ביצה וחצי ביום וחצי. כמה ביצים מטיל קוקו ביום אחד?
ה̲ו̲א̲:̲ קוקו הוא יצור דמיוני, ולכן הוא יכול להטיל כמה ביצים שירצה ביום אחד.
א̲נ̲י̲:̲ אבל תשתמש בנתון שקוקו וחצי מטיל ביצה וחצי ביום וחצי, ותערוך את החישוב.
ה̲ו̲א̲:̲ בטח, אעשה את זה.

אם קוקו וחצי מטיל ביצה וחצי ביום וחצי, אז קוקו מטיל ביצה וחצי ביום וחצי.
כדי לחשב כמה ביצים מטיל קוקו ביום אחד, עלינו לחלק את מספר הביצים שהוא מטיל ביום וחצי במספר הימים ביום וחצי.
יש 12 שעות ביום וחצי, ולכן יש 6 שעות ביום.
אז, קוקו מטיל ביצה וחצי / 6 שעות = 1/6 ביצה לשעה.
לכן, קוקו מטיל 1/6 ביצה לשעה * 24 שעות ביום = 4 ביצים ביום.
אז התשובה היא 4

המסקנה שלי (לאחר שמחקתי את כל שאר האפשרויות בשיטת האלימינציה הידועה של שרלוק): הוא מנסה לעבור את מבחן טיורינג ומתחזה לח"כ מהליכוד.

ערכים ומחירם

759788

אפופידס • בתשובה לשוטה הכפר הגלובלי

יום ד', 19/7/2023, 11:34

אגב שטויות, GPT4 היטפש לאחרונה. אחת ההשערות היא שהכבדות יתרות בתחום חינוכו הערכי פגעו בו באופן רוחבי, כולל כישוריו המתמטיים שגם כך לא היו עבורו סיבה לגאווה.

ערכים ומחירם

759790

שוטה הכפר הגלובלי • בתשובה לאפופידס

יום ד', 19/7/2023, 11:56

מעבר לפיקנטריה, אולי נעוץ כאן גם מסר בקשר למה שקורה לבני אדם כשמטילים עליהם את עבותות ה-PC. די ברור שלשגעונות woke מסויימים יש השלכות גרועות על האקדמיה.

ערכים ומחירם

763193

אורי גוראל גורביץ' • בתשובה לשוטה הכפר הגלובלי

יום א', 22/10/2023, 17:43

כפי שראינו בימים האחרונים, הנבואה‏¹ אכן ניתנה לשוטים.

‏¹ או בעצם האבחנה.

ערכים ומחירם

759934

אפופידס • בתשובה לאפופידס

יום א', 23/7/2023, 16:33

חזן היה אולי מתפייט: רצינו בינה נטולת פניות וקיבלנו בוטים חסרי בינה.
בינתיים, חברות אחרות הולכות ומדביקות את הפער - HuggingFace LeaderBoard.
וגם "מתברר", כפי שפירסם בחור ישראלי ששילם 1000$ למדליף אלמוני, ש-GPT4 הוא בעצם ועדת מומחים של 16 מודלים.

ערכים ומחירם

759938

אפופידס • בתשובה לאפופידס

יום א', 23/7/2023, 17:04

שכחתי את Claude 2 (שעדיין אינו זמין בישראל).
על הנייר, כלומר עפ"י רוב המבחנים ופרטים נוספים הוא פחות טוב מ-GPT4. עדיין, רבים (למשל) מעדיפים אותו, ולא רק בגלל המחיר.

פיתוח נבון

759214

שוטה הכפר הגלובלי • בתשובה לאפופידס

יום ה', 25/5/2023, 15:53

בכלל, למה לא לימדו אותו לעשות מה שהמורים שלי מכיתה ד' ואילך לא הפסיקו לנג'ס עליו: לבדוק את הפתרון לפני שהוא מתחיל לקשקש? לכל הפחות זה היה גורם לו להגיד : "סליחה, בשלב זה של חיי נראה שהבעיה היא מעל ליכולותי".

פיתוח נבון

759215

שוטה הכפר הגלובלי • בתשובה לשוטה הכפר הגלובלי

יום ה', 25/5/2023, 15:58

אופס, שכחתי לציין שהטריגר הגיע מסקוט אלכסנדר https://feedly.com/i/entry/hp7zdYlKSlGYuA31kyTRqj8gG7...

פיתוח נבון

759220

הפונז • בתשובה לשוטה הכפר הגלובלי

יום ה', 25/5/2023, 18:24

הקישור מאחורי חומת רישום מעצבנת.

פיתוח נבון

759225

שוטה הכפר הגלובלי • בתשובה להפונז

יום ו', 26/5/2023, 9:48

'צטער, כנראה נרשמתי פעם ושכחתי.

פיתוח נבון

759314

אפופידס • בתשובה לשוטה הכפר הגלובלי

יום ה', 1/6/2023, 16:53

רעיון פשוט וגאוני לסילוּמיוּת (גם אולי לא באופן מלא) של החלק המעיק של האימון - המשוב האנושי. הוא קצת חותר תחת טענתי הקודמת באשר לדעיכתה של הנדסת הפרומפטים ב-LLMs, לטובת גישות "פסיכולוגיות" עבור הבניה של מודלים אלו והתקשורת עמם לאחר מכן. הם מתארים את חשיבות האיזון הנכון בין helpfulness ל-harmlessness, מה שמזכיר לנו את ההשלכות של"חינוך יתר" של המודל (לדוגמא: Woke compliance). זאת במיוחד אם הוא יתחיל לעשות חישובים בעלי היפוטטיות גוברת באשר להשפעת תשובותיו - למשל, סירוב לומר לי היכן בית הכנסת הקרוב, מאחר ויש שם הפרדה בין נשים לגברים, או בית המרזח הקרוב מבלי שיוכל לוודא את גילי.

אבל הרעיון היפה במאמר נוגע רק לאתגרים שקשורים בבינות ציבוריות כדוגמת אלו של OpenAI, גוגל, מיקרוסופט ופייסבוק. התרשמותי היא שחברות אלו מבצעות בדיקות קפדניות וממושכות כדי "ליישר" את מערכות הבינה המלאכותית הפומביות שלהן, גם ללא רגולריזציה חיצונית. אבל עבור מי שמחזיקים "מוח שני" מקומי שמחונך בהתאם לצרכיהם הפרטיים, כל זה פחות רלוונטי. לפני כמה חודשים זה לא היה רלוונטי, אבל כעת נמצאים המשאבים הנדרשים לצורך אימון פרטי של מודלים אלו בצניחה חופשית, כולל המשוב האנושי‏¹.

לדעתי, ולא רק‏², מדובר בסכנה עצומה ודי מיידית. הפתרון היחיד שאני יכול לחשוב עליו כעת, מרתיע בפני עצמו הוא שת"פ של גורמי תעשיה, ממשל וביטחון, לצורך פיתוח בינת על, שתמיד תהיה כמה צעדים לפני כל מה שמפותח בכל שלב. יעודה יהיה חיזוי, זיהוי והצעות לטיפול באיומים שייצרו בינות אחרות - אלו שמפותחות ופועלות במחשכים, ואלו שלא, שגם הן, למרות כל הפיקוח, עשויות להביא לקטסטרופות בלתי צפויות‏³. אני לא רואה כיצד מערכות אנושיות לבדן יוכלו לגודש ולאבולוציה המהירה של האיומים הללו.

ייתכן שבסופו של דבר זה ייגלוש להעברת חלקם של תפקודי השלטון לידי בינת העל. מצב זה נוגד את ערכיי הדמוקרטיים (הציבור הוא האחראי לגורלו לטוב ולרע), את תובנותיי החברתיות (ציבור שמרגיש שבחירותיו אינן רלוונטיות וגורלו אינו בידיו יהיה מנוכר, אלים, מפוצל ונוטה לאידאולוגיות מטורפות) וכמובן את האפשרות הדי סבירה שבינת-על שוחרת טוב ככל שתחונך, עשויה להביא בעצמה לדברים אותם באה למנוע.
אז אם יש למישהו רעיון טוב יותר…

‏¹ משהו בכיוון
משהו לגמרי בכיוון מחברינו במפרץ

‏² 23 מילים
‏³ אני נזכר במועמד שסיפר לי שחברתו הקודמת בנתה סוכן חכם שהרוויח להם סכום גדול של כסף במכירות וקניות קצרות מועד. הם כמובן רצו להכפיל את ההכנסות והוסיפו סוכן נוסף. התוצאה היתה סדרה מהירה של עסקאות בין שני הסוכנים, מה שגרם להפסד של כמחצית הסכום שהורווח קודם לכן בתוך כמה דקות (כנראה בעמלות), דבר שהביא לסכסוך בין המייסדים (או המנהלים) ולסגירת החברה זמן קצר לאחר מכן.

פיתוח נבון

759329

שוטה הכפר הגלובלי • בתשובה לאפופידס

יום ו', 2/6/2023, 9:58

ובקיצור...

פיתוח נבון

759330

שוטה הכפר הגלובלי • בתשובה לאפופידס

יום ו', 2/6/2023, 10:02

________
‏³ - אסוציאציה מיידית: https://www.youtube.com/watch?v=sseSi0k3Ecg

צמצום הצורך במשוב אנושי

759346

אפופידס • בתשובה לאפופידס

יום ג', 6/6/2023, 10:03

שיטת החינוך העצמי משמשת לא רק לצורך גידורן הערכי של תשובות המודל, אלא גם לצורך השבחתן העובדתית.
כבר במסגרת חינוכו של GPT-4, כך נטען, תשובותיו הוזנו לו בחזרה תוך ששואלים אותו 1. "האם המידע נכון?", 2. "האם המידע עובדתי?", 3. "האם המידע רלוונטי?". בהתאם לכך הן צויננו.
כך שגם כאן ניתן לבקש מן המערכת לבחון ללא משוא פנים את מה שהיא הרגע טענה.
לכאורה זה מנוגד למצופה מבינה מודעת לעצמה. אבל במחשבה שניה, שיטות דומות כן משמשות כל אחד מאיתנו בינו לבין עצמו, וגם במסגרת אינטרקאציות מתודולוגיות עם ילדים, תלמידים, סטודנטים, גברים מכים וכד', כאשר מבקשים מהם לבדוק מחדש את תגובתם לאור קריטריונים כלליים כלשהם. זה כמובן מפשט עוד את ייצורן של מערכות בינה מלאכותית באופן עצמאי, ובקרוב אולי גם באופן עצמי (כלומר, מערכות שמפנימות מאמרים ומחקרים כדי לייצר את יורשותיהן).

בינת נגד

759350

אפופידס • בתשובה לאפופידס

יום ג', 6/6/2023, 15:55

Deezer משיקים מערכת AI שתזהה שירים שסינתזו קולות של אמנים בשר ודם - דורון פרידמן, ישראל היום.
הבעייה עמה הם באו להתמודד עשויה להתתברר כשולית יחסית, כאשר האתגר הבינוני עשוי להיות, כמו במקרה של תמונות, חיקוי סגנון, והאתגר האולטימטיבי - סגנונות מעורבים/מקוריים שלא יאפשרו לאמן אנושי לטעון לזכויות ביצירה.
הנה למשל דוגמא ליצירה שאינה דומה למשהו שבינה אנושית היתה כותבת או משדרת.

פיתוח נבון

759229

אריק • בתשובה לשוטה הכפר הגלובלי

יום ו', 26/5/2023, 12:48

אז ניסיתי.
התחלתי בלשאול אותו את ההפוך- אם בחווה תרנגולת ממוצעת מטילה 2/3 ביצה ביום כמה ביצים יטילו תרנגולת וחצי ביום וחצי?
הוא הגיע לתשובה הנכונה.

ואז שאלתי אותו אם תרנגולת וחצי מטילה ביצה וחצי ביום וחצי כמה ביצים תטיל תרנגולת אחת ביום?

והוא נתן את השגיאה הרגילה.

ואז שאלתי אותו אם הוא רואה את חוסר העקביות בין התשובות.
תשובתו היתה התנצלות על חוסר העקביות חישוב מחדש וחזרה על התשובה השגויה.

Therefore, one chicken will still lay 1 egg in one day. I apologize for the inconsistency in my previous response.

שים לב ל "still"

שאלתי אותו מה היה שגוי בתשובה הראשונה ותשובתו הפתיעה אותי

I apologize for the confusion caused by my previous response. Upon reviewing it, I can see that the error lies in the calculation of the number of eggs laid by 1.5 chickens in 1.5 days.

In the first answer, I incorrectly calculated the result as 1.5 eggs. However, this is not possible since chickens can only lay whole numbers of eggs. The calculation itself was incorrect.

To accurately determine the number of eggs laid by 1.5 chickens in 1.5 days, we need to consider that chickens can only lay whole eggs. Given that the average chicken lays 2/3 eggs daily, we can calculate the total number of eggs:

Number of eggs laid by one chicken in one day = 2/3 eggs
Number of chickens = 1.5
Number of days = 1.5

Number of eggs laid by 1.5 chickens in 1.5 days = (Number of eggs laid by one chicken in one day) x (Number of chickens) x (Number of days)
= (2/3) x 1.5 x 1.5
= 1 x 1.5
= 1.5

However, since we are dealing with whole eggs, the number of eggs laid by 1.5 chickens in 1.5 days would be 1 egg.

Once again, I apologize for the inconsistency and any confusion caused by my previous responses.

א הא!
אם כך אולי הטעות היתה שלי בניסוח.
אז שאלתי מחדש

so if in average 1.5 chickens lay 1.5 eggs in 1.5 days, how many eggs will the average chicken lay in one day, given that in average a chicken does not have to lay a whole egg?

והוא חזר לסורו

Therefore, on average, a single chicken will lay 1 egg in one day. This calculation assumes that a chicken may not necessarily lay a whole egg and fractional eggs are considered.

אז שאלתי כדי לבדוק

and given your last answer, how many eggs will 1.5 chickens lay in 1.5 days?

והוא כמובן ענה 2.25

הוא בוודאי חושב שכולנו מגדלי תרנגולות שזקוקים לעזרה בחשבון.

אח, דגלאס אדאמס היה עושה מזה מטעמים.

פיתוח נבון

759230

אריק • בתשובה לאריק

יום ו', 26/5/2023, 13:57

הודעתי לו שהתשובה הנכונה היא 2/3 ביצה לתרנגולת ביום בממוצע.

הוא התנצל ואמר לי שאני צודק.
חזר על החישוב שלו שנתן את התשובה הקבועה של ביצה ביום, אמר שהתשובה היא 2/3 ביצה, והודה לי שהעמדתי אותו על טעותו.

Number of eggs laid by one chicken in one day = (1.5 eggs) / (1.5 chickens) / (1.5 days) = 1 egg / 1 chicken / 1 day

Therefore, on average, a single chicken will lay 2/3 of an egg in one day.

Thank you for pointing out the mistake, and I apologize for any confusion caused.

פיתוח נבון • הפונז

פיתוח נבון • אריק

פיתוח נבון • הפונז

בלבול ביצים • שוטה הכפר הגלובלי

בלבול ביצים • אריק

בלבול ביצים • הפונז

בלבול ביצים • אריק

בלבול ביצים • הפונז

בלבול ביצים • אריק

בלבול ביצים • הפונז

בלבול ביצים • אריק

בלבול ביצים • הפונז

פיתוח נבון • אפופידס

פיתוח נבון • שוטה הכפר הגלובלי

פיתוח נבון • alucard

פיתוח נבון • שוטה הכפר הגלובלי

פיתוח נבון • alucard

פיתוח נבון • שוטה הכפר הגלובלי

פיתוח נבון • alucard

פיתוח נבון • שוטה הכפר הגלובלי

פיתוח נבון • alucard

פיתוח נבון • הפונז

פיתוח נבון • alucard

פיתוח נבון • העלמה עפרונית

פיתוח נבון • יובל נוב

פיתוח נבון • צפריר כהן

פיתוח נבון • העלמה עפרונית

פיתוח נבון • הפונז

פיתוח נבון • שוטה הכפר הגלובלי

פיתוח נבון • יובל נוב

פיתוח נבון • הפונז

פיתוח נבון • יוסי

פיתוח נבון • הפונז

פיתוח נבון • אפופידס

פיתוח נבון • הפונז

פיתוח נבון • שוטה הכפר הגלובלי

פיתוח נבון • הפונז

פיתוח נבון • אורי גוראל גורביץ'

פיתוח נבון • הפונז

פיתוח נבון • שוטה הכפר הגלובלי

ללא כותרת • שוטה הכפר הגלובלי

ללא כותרת • עומר

ללא כותרת • שוטה הכפר הגלובלי

ללא כותרת • alucard

חזרה לעמוד הראשי

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים
RSS מאמרים \| כתבו למערכת \| אודות האתר \| טרם התעדכנת \| ארכיון \| חיפוש \| עזרה \| תנאי שימוש והצהרת נגישות	© כל הזכויות שמורות