|
||||
|
||||
אחרי שהגדרתי ל gpt-4-1106-preview מי הוא: You are an expert at logic which has won many contests, שאלתי אותו: One and a quarter goose lays one and a quarter eggs in one and a quarter days. How many eggs does one goose lay in 1 day? ונעניתי בתשובה נכונה ומנומקת:Let's analyze the given information carefully.
"If one and a quarter goose lays one and a quarter eggs in one and a quarter days," we can simplify this by recognizing that the ratio of geese to eggs is 1:1 over the given timeframe since one and a quarter goose lays one and a quarter eggs. Now, we want to find out how many eggs one goose lays in one day. We can set up a proportion using the data we have: 1.25 geese lay 1.25 eggs in 1.25 days. Therefore, the egg-laying rate for each goose is: 1.25 eggs / (1.25 geese * 1.25 days) To find the number of eggs laid by one goose in one day, you would divide the number of eggs by the number of geese and then again by the number of days: 1.25 eggs / 1.25 geese = 1 egg per goose This is the rate of egg-laying per goose for 1.25 days. Now, we want to know how many eggs are laid by one goose in one day. Therefore, we take the rate per goose and divide by the number of days (1.25) to normalize it to a single day: 1 egg per goose / 1.25 days = 0.8 eggs per goose per day So one goose lays 0.8 eggs in one day. |
|
||||
|
||||
עברתי לשפת הקודש, מה שלא הפריע לו למצוא את התשובה (לשאלה אחרת :-)) אני: ענה על השאלה הבאה בתור מומחה ללוגיקה: עז ורבע מפיקה ליטר ורבע חלב ביום ורבע. כמה ליטר חלב מפיקה עז אחת ביום אחד? הוא: אחת תפיק רק ליטר אחד של חלב באותו הזמן: יום ורבע. כלומר, אם עז אחת תחליב ליטר אחד ביום ורבע, זה אומר שעז אחת תחליב רק ⅔ מליטר חלב ביום אחד. לכן התשובה היא ⅔ מליטר חלב[123}. 🐔🥚 שים לב שזו חידה מתמטית ובמציאות, עזים לא מחליבות חלב בכמות של רק חלק מליטר. Learn more
1 gardens.desigusxpro.com 2 hamichlol.org.il 3 he.wikipedia.org 4 bing.com 5 milk.org.il +3 more |
|
||||
|
||||
אוי, הוא אפילו טעה במעבר מ-1:1.25 ל-0.8:1 |
|
||||
|
||||
הוא העתיק בלי לבדוק. |
|
||||
|
||||
ותשובתו של ג׳פטו 4 של OpenAi בשפת הקודש: אם עז ורבע (1.25 עזים) מפיקות ליטר ורבע (1.25 ליטרים) חלב ביום ורבע (1.25 ימים), נרצה לדעת כמה ליטר חלב מפיקה עז אחת ביום אחד. נחלק את כמות החלב שמפיקות העזים בכמות הימים ואחר כך בכמות העזים, כדי לקבל את כמות החלב שעז אחת מפיקה ביום אחד. ... עז אחת מפיקה 0.8 ליטר חלב ביום אחד. את ההערות הפעם, בקוד הפייתון שהוא כתב לעצמו, הוא כתב בעברית :-) מן הסתם זה עובד גם אם נחליף את הפרמטרים במספרים אחרים (כי זאת כבר תוצאה של הסקריפט). אני שואל ברצינות, איך זה שונה באופן מהותי ממה שבני אדם עושים כשהם נתקלים בבעיה מילולית בחשבון? 1) הבנת הבעיה שמנוסחת בשפה טבעית והסבר מילולי (גם אם זה בראש) לסידרת הפעולות החשבוניות שצריך לבצע כדי להגיע אל התשובה הנכונה. 2) שימוש במכונה חישובית (גם אם בנאדם עושה זאת בראש אן על נייר - השלב הזה הוא לגמרי מכניסטי גם כשבני אדם עושים אותו) כדי להגיע אל התוצאה של הפעולה שכבר ניסחנו באופן פורמלי יותר. המוצר הספציפי שאתה משתמש בו לא מיצג נאמנה את הכלים הזמינים לציבור (ובטח לא את מה שסביר להניח יש כבר מאחורי הקלעים, בלי שהוא הונגש לציבור). אתה בודק את הטכנולוגיה של האתמול. |
|
||||
|
||||
הוא באמת הצליח להמציא את הפועל "להחליב"? ואתם נטפלים לשגיאות בלוגיקה? אני באמת נופל מהכיסא. חשבתי שהמודלים האלו מרכיבים משפטים חדשים ממילים קיימות שהם למדו, לא חשבתי שהם יודעים להמציא מילים. |
|
||||
|
||||
אני לא מצליח לשחזר את התשובה עם ה"תחליב"1 כדי לשאול אותו מאיפה הוא הגיע לזה. לא חשבתי עד עכשיו על מידת הבקיאות של קופיילוט בעברית, ובעיקר אך הוא מסתדר עם הבעייתיות של בנייני הפעלים וכללי גזירות מלים. משום מה ה"תחליב" לא עורר אצלי שום התפעלות והתייחסתי אליו יותר כאל שגיאה מאשר חידוש, משהו שהייתי מצפה אולי מעולה חדש. מה שמרפה את יד מלהשתעשע יותר עם ג'פטו הוא בדיוק הפתיח של ההודעה: בלי הדירוּת קשה להתקדם. ____________ 1-היום על אותה שאלה ובאותו ניסוח בדיוק הוא ענה לי: כדי לחשב כמה חלב מפיקה עז אחת ביום אחד, נצטרך להכפיל את הכמות היומית של עז (ליטר ורבע) במספר הימים ביום אחד: 1.25ליטר×1=1.25ליטר לכן, עז אחת מפיקה 1.25 ליטר חלב ביום אחד. |
|
||||
|
||||
לעניות דעתי כשהשאלה מנוסחת עם אחד ורבע במקום אחד וחצי, היא פחות מבלבלת לפתרון. הצדקה אינטואיטיבית חסרת ביסוס: בסגנון "לחשוב מהר, לחשוב לאט" של כהנמן, הסגנון הנפוץ נותן תקווה ש"לחשוב מהר" ייתן תשובה מהירה (ולכן מכשיל את העונה), בעוד שכשעוברים לשברים מורכבים יותר, ברור שצריך פה "לחשוב לאט" וממש לעשות את החישובים באופן מסודר שפחות נתון לבלבול. |
|
||||
|
||||
ייתכן שאתה צודק. gpt ודומיו מושפעים מן המאמץ שהשקעת בשאלה ומה שלדעתם זה אומר עליך. דוגמא שנתקלתי בה מקרוב היא בקשה לניסוח אימייל קצר אך עתיר דקויות שקשורות לרבדים בשפה האנגלית, לדימוי של המוסד ממנו יוצא האימייל ולדקויות שקשורות לנמען. אחרי הרבה איטרציות, התברר למשתמש שבמקום להנחות את gpt כיצד לשפר אימייל שהוא כבר השקיע מזמנו כדי להביא אותו קרוב ככל האפשר לנוסח הרצוי, עדיף לכתוב באנגלית פשוטה (לא מקצועית), ורק אחרי זה להנחות את gpt. אפשרות זו דורשת פחות איטרציות - שזה אומר פחות זמן וכסף. מה שהפתיע הוא שביחס לאפשרות הראשונה, הניסוח שהתקבל התברר כעדיף באופנים שהמשתמש לא שיער מראש. מה שקרה הוא אולי1 שכאשר אתה מגיש לו משהו מוקפד, gpt, בדומה למזכיר אנושי, מנסה לשמור ככל האפשר על מרכיבים במסמך המקורי בבצעו את השיפורים. כאשר המסמך כתוב מראש בלשון המוסכים של דרום שיקגו, ואני לא מדבר על אלו המורשים, הוא נוטל לעצמו חירות מלאה, תוך שימוש במלוא כישוריו לצורך ביצוע ההנחיות. 1 הזהרת ספקולציה: אחרי שנים של דיאגנוזות של רשתות נוירונים, שמתי לב שאפשר לתת הסבר משכנע עבור הגורם כביכול לכל תוצר מפתיע שלהן...והיפוכו, מה שמביא אותי לזהירות יתרה בכגון אלו. |
|
||||
|
||||
ייתכן שהרגישות הגדולה של בינה מ., ובפרט של LLM's, לפרומפט מעידה על משהו ששונה באופן די מהותי מהדרך בה רשתות הנוירונים שלנו עובדות. שאלתי אותו מ דעתו. הוא החזיר לי רשימה של הבדלים בין AI ל-HS בלי שום התייחסות לעניין הפרומפט שהיה נושא השאלה שלי. אין לי חשק מיוחד לשחק עם הפרומפט הזה... |
|
||||
|
||||
מעניין. הדבר הראשון שהוביל אותי לתפוס את gpt כחושב, עוד בדצמבר האחרון, היה היכולת שלו להבין שניתן לשאול את אותו הדבר במגוון דרכים, עוד לפני בדיקת נכונות התשובות שלו. אבל כמו שראינו אח"כ, זה מסובך יותר. ויש לכך כמה גורמים. עיקרם, להבנתי, אינו קשור ישירות לארכיטקטורה שלו, אלא יותר לשלבי הלימוד, ובמיוחד החינוך שהוא עובר בסוף, כולל ניסיונות להבין מה באמת רצה המשתמש לשאול, במקום פשוט לענות על זה. כנראה שסטטיסטית, זו איסטרטגיה יכולה יותר עבור המשתמש הממוצע. לצורך זה הוסיפו עבור משתמשים משקיענים, יכולת להגדיר עבורו בתור מי הוא עונה ובתור מי המשתמש שואל. כשלעצמי, לא תמיד יש לי חשק להגדיר את מערכת היחסים ואז אחרי ניסיון אחד אני נוטש לטובת סידרת גיגולים. |
|
||||
|
||||
ברור שזו דרך שונה, מה השאלה. כל מה שהוא עושה זה מניפולציות על מחרוזות של טקסט. יש לך ספק בכלל שהביולוגיה של המוח האנושי לא נולדה ועוצבה עבור מחרוזות של טקסט? |
|
||||
|
||||
סיקרנת אותי וגם שיחקתי עם זה קצת. המוצר הזה שאתה משחק איתו (Copilot של מיקרוסופט) הוא מסכן - יש לו פיגור. הוא טועה על דברים די פשוטים שמוצרים אחרים לא טועים בהם. זה מרגיש כמו אינטגרציה די גרועה שעשה איזה Web code monkey בין GPT מן המוכן לבין מנוע חיפוש מן המוכן, בלי הרבה מחשבה או תכנון. זאת לא דוגמה טובה למוצר טוב או למקום בו אנו נמצאים. שאלת דוגמה שסיפקתי לו ול-ChatGPT4 של OpenAi: What prime number bigger than 2^24 is the smallest number that has 3 as one of the digits?
Copilot: The smallest prime number greater than 2^24 (which is 16,777,216) that contains the digit 3 is 3,173,311. This number satisfies both conditions: it is a prime number and has the digit 3 in it OpenAi: The smallest prime number greater than 2^24 that contains the digit 3 is 16,777,331. |
|
||||
|
||||
לתומי חשבתי שמה שקובע זה GPT4 שיושב ברקע. |
|
||||
|
||||
כנראה פספסתי את התגובה הזו בזמן אמת. התשובה של קופיילוט כל כך קפקאית בעיני, שאני תוהה אילו נזקים נפשיים ייגרמו לאוכלוסיית העולם כתוצאה מאינטגרציה של AI במענה של שירות לקוחות, למשל. רגע, דיון 4212! |
|
||||
|
||||
בהחלט, אבל לדעתי זאת לא ביקורת על בינה מלאכותית או הנדסת תוכנה. הפיגור של המוצר הזה מריח לגמרי כמו קלאסטרפאק טיפוסי של אנשי שיווק ומנהלי מוצר1. ___________________ 1 שיחת זום בחדר ישיבות בקומה 27 באיזה בניין זכוכית ״מה? מישהו פיתח מנוע V8 יעיל יותר? מהר, זירקו עליהם כסף, החתימו אותם על NDA ותנו ל-R&D שלושה ימים לעשות לזה אינטגרציה עם דגם האופניים שרצינו להשיק לפני החגים.״ |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |