בתשובה לשוטה הכפר הגלובלי, 14/05/23 14:40
פיתוח נבון 758989
מאחר וחשיבתו הבסיסית אינה מתמטית, תהיתי שמא הכפילות של האחד וחצי שמטעה ילדים, מטעה גם אותו. אז ניסיתי את זה:
If two chickens eat 800 gram of feed in two days, how much does one chicken eat daily?
אבל הוא ענה 400 גרם.
אז התעקשתי:
This is a wrong answer. Please do that again, step by step, considering both the number of chickens and the number of days.
ואז סוף סוף הוא השיב כהלכה:
Apologies for the confusion. Let's calculate the daily feed consumption for one chicken step by step.

Given:
- Two chickens
- Total feed consumed in two days: 800 grams

To find out how much one chicken eats daily, we need to divide the total feed consumption by the number of chickens and the number of days.

Total feed consumed by two chickens in two days: 800 grams

First, let's find the total feed consumed by one chicken in two days. Since both chickens eat the same amount, we can divide the total feed by 2:

800 grams / 2 = 400 grams

So, the total feed consumed by one chicken in two days is 400 grams.

To calculate the daily consumption for one chicken, we divide the total feed consumed in two days by 2 (the number of days):

400 grams / 2 = 200 grams

Therefore, one chicken eats approximately 200 grams of feed per day.
החדר הסיני הטיפש 759002
אבל זה בדיוק מראה מה הוא 'מבין' ומה לא.
הוא לא 'מבין' מתימטיקה, אפילו לא ברמה של בית ספר יסודי.
ניסוח *מילולי* מסוים יוביל אותו לחקות/לשחזר/לדמות/לפברק (אין מילה טובה לזה) תבניות מילוליות מסוימות - שיובילו לתוצאה נכונה, וניסוח אחר יוביל אותו לפיברוק תבניות אחרות שלא מובילות לתוצאה.

זה כמו מישהו שזוכר בעל פה תשובה לבעיה מתימטית מסוימת, אבל לא זוכר למה זו התשובה. לפי כל קריטריון בסיסי - המישהו הזה פחות אינטליגנטי (במתימטיקה) מתלמיד יסודי, או חמור מזה: המישהו הזה לא מבין מתימטיקה בכלל.
החדר הסיני הטיפש 759006
מצד שני "GPT-4 ranked in the top 11% of scores on the SAT Math Test" ומרשים יותר: "Reaching the top 0.5% on the USA Biolympiad Semifinal Exam".

אולי הההסבר הוא שהבעיות לפתרון ב-SAT וגם במבחני המיון לאולימפיאדת המתמטיקה שייכות למשפחות מוגבלות יחסית, ואחרי שהוא נתקל בכל אלה שפורסמו הוא רכש מיומנות בפתרון הבעיות מהמשפחות האלה.

אני חייב להודות שה"הסבר" הזה לא ממש משכנע אותי, אבל בהנחה שהתוצאות שציטטתי למעלה נכונות (ולא, למשל, משהו שהוא עצמו המציא בשביל הצחוקים וכולם מעתיקים) נראה שיש עדיין איזה הבדל משמעותי ומהותי בין מה שהוא "מבין" לבין מה שהמוח שלנו עושה.
החדר הסיני הטיפש 759007
אופס, ביולוגיה, לא מתמטיקה.

איך מוחקים תגובה באתר הזה?
החדר הסיני הטיפש 759012
אני painfully aware לכמה שהרף המשתמע בטענה הבאה נמוך, אבל אני משוכנע שמודלי-שפה מבינים מתמטיקה באופן שאיכותית אינו שונה מהאופן בו אני (לא) מבין מתמטיקה. אבל התרועעתי בחברת מתמטיקאים רציניים ואני משוכנע שמודלי-השפה גם לא מבינים מתמטיקה באופן איכותנית שונה מהם. נדמה לי שכבר התכתבנו בנושא, לא? לדעתי באופן בסיסי בני אדם - גם החכמים שבהם - גרועים בלוגיקה, חשיבה כמותית וחשיבה סדורה בדיוק כמו מודלי-שפה. חלק מאיתנו צברו מיומנויות שמאפשרות לנו בינתיים לכסות על חוסר-הכישרון הזה טוב מהם, אבל לא הייתי מעמיס על כך תילי משמעויות. הפער מן הסתם יסגר בקרוב.

עד כאן דיברתי בביטחון יחסית גבוה, וכעת לספקולציות בביטחון מאד נמוך: יש כמובן הבדלים פונקציונליים ועקרוניים עצומים בין המוח למודלי-שפה (שלהערכתי לא משנים כמעט כלום לעניין ה-AGI), אבל אני חושב שבני-אדם ומודלי-שפה טובים (=גרועים) במתמטיקה במידה דומה מכיוון שקוגנטיבית אנחנו לרוב דווקא כן מעבדים מתמטיקה באופן דומה (פונקציונלית) אליהם. ולכן אני מנחש‏1 שמודלי-שפה לא ישיגו לבדם יכולת-מתמטית על-אנושית‏2. אבל אינטגרציה של מודלי-שפה עם ארכיטקטורות שיודעות לשחק מתמטיקה כמו שמנועי-שחמט יודעים לשחק שחמט יאכילו מתמטיקאים אנושיים אבק. (ועכשיו אני חושד שגם את זה, בעצם, כבר כתבתי כאן בעבר?).

(ובהערת שוליים לא קשורה: בסך הכל לדעתי ה-alignment crowd הם חבורה של קשקשנים, אבל לאחרונה עלה בדעתי טיעון שגרם לי להיות קצת יותר doomer משהייתי לפני כן. אבל בעצם, למען שלוות נפשם של שלושת קוראי האייל, אולי אשמור אותו לעצמי.)

1 וכשעוד כשבועיים יתברר שטעיתי, בבקשה זכרו שהצהרתי מראש על כך שמדובר בספקולציות שבטחוני בהן נמוך.
2 לפחות לא כאשר מנרמלים ל-"יעילות" (כלומר יתרונות שאפשר יהיה להשיג באמצעות scale, מהירות וקונקטיביות לא נחשבים לצורך הטיעון, למרות שפרקטית הם עשויים כמובן להיות מאד משמעותיים).
החדר הסיני הטיפש 759014
אבל אם בשביל מתמטיקה אתה צריך אינטגרציה עם מערכות מסוג אחד, בשביל שחמט אתה צריך קשר לstockfish, בשביל כימיה משהו אחר וכו' וכו', הדרך ל AGI ארוכה ומפותלת הרבה יותר ממה שנראה מאז פרוץ ג'פטו לחיינו.

"אבל בעצם, למען שלוות נפשם של שלושת קוראי האייל, אולי אשמור אותו לעצמי." - הו, כן, זה מרגיע אותי לחלוטין. חן חן.
החדר הסיני הטיפש 759015
AGI צריך להיות טוב במתמטיקה ושחמט רק פחות או יותר כמוני‏1, לא יותר‏2. חוץ מזה, גם מתמטיקאים נעזרים במנועים חיצוניים‏3 שבלעדיהם רובם לא היו מגיעים רחוק.

(אתה יכול להרגע. רק תראה כמה שטויות אני כותב כאן. מן הסתם המחשבה הזו שלי מטופשת לא פחות.)

1 או כמו פיטר שולצה ודינג לירן. אנחנו מדברים על סדרי-גודל כאן.
2 למעשה אני מרגיש לא בנוח לדבר על ה-AGI כעניין ששייך לעתיד. לדעתי הוא כבר כאן, עסוק כרגע בלעבור פרודקטיזציה.
3 ואני אפילו לא מתכוון דווקא לאמצעים כמו מערכות אלגברה, מערכות הוכחה או סימולציות - בהן אכן משתמשים לעיתים קרובות. אני מתכוון לאינטגרציה עם מערכות כמו "דף ועט" או "לוח וגיר", והייתי מחשיב גם "סמינרים ושיחות מסדרון" ואת arXiv כמנועי עזר חיצוניים. ואם נחליט לפתוח את הנושא ברצינות, אז אולי אטען שגם את מערכת היחסים של המתמטיקאים עם (נניח) ה-visual cortex והיפוקמפוס שלהם צריך להחשיב כ-"אינטגרציה עם מערכות חיצוניות".
החדר הסיני הטיפש 759017
"בני-אדם ומודלי-שפה טובים (=גרועים) במתמטיקה במידה דומה מכיוון שקוגנטיבית אנחנו לרוב דווקא כן מעבדים מתמטיקה באופן דומה (פונקציונלית) אליהם"?
אני ממש לא מסכים. כשאני מנסה לפתור בעיה מתימטית, הרבה מאד פעמים אני משתמש באמצעים לגמרי לא מילוליים (בעיקר ויזואליים הייתי אומר, ואנלוגיות לדברים שאני מכיר מהעולם האמיתי).
החדר הסיני הטיפש 759089
במידה מסויימת אני מסכים (ורמזתי לכך כשכניתי קודם את ה-visual cortex "מנוע עזר חיצוני"). אך במקביל, במידה רבה, אני לא מסכים. לצערי אתקשה לבסס את טיעוני ולהביא להם מראה מקום, אבל אומר בכל זאת: לאנלוגיות בלתי-אמצעיות (ויזואליות, דינמיות וכו') כחלק מהותי מהעשייה המתמטית יש אמנם תפקיד (כאמור, אני מסכים במידה מסויימת) אבל הוא קטן ומוגבל. אני חושד שהרקע שלך כפיזיקאי יוצר אצלך הטייה בנושא. כא-פנטזי שעסק (מעט) במחקר מתמטי הקשור לגיאומטריה אכן חשתי בעמדת נחיתות כאשר דובר ב-‏2 או 3 ממדים, אבל בממדים גבוהים לא הייתה לי שום בעיה מיוחדת (רק בעיות רגילות).
החדר הסיני הטיפש 759091
טוב, אתה יכול להניח שבמישור הזמן ''הרקע שלי כפיזיקאי'' התהווה אחרי שפתרתי הרבה בעיות מתימטיות וגיאומטריות,בין השאר לצורך רכישת אותו רקע.
אולי בעצם להיפך - הנטייה שלי הפכה אותי לפיזיקאי (בהכשרתי). אבל קטונתי מלשפוט איך מתימטיקאים אמיתיים פותרים בעיות.

למשל - אם נכליל גיאומטריה כחלק ממתימטיקה - לא ברור לי איך אפשר לפתור אותה בלי חשיבה ויזואלית.
החדר הסיני הטיפש 759092
וככה, על הדרך, כרגע הג'פטו הגאון כתב לי אלגוריתם לחלוקת זוית לשלושה חלקים שווים עם סרגל ומחוגה.
החדר הסיני הטיפש 759110
הוא פתר כנראה עבור זוית ישרה והשאיר את ההכללה כתרגיל. הצלחת? :-)
החדר הסיני הטיפש 759115
א. לא נראה ככה.
ב. אפילו לא טרחתי לקרוא את הפתרון שלו, כמובן. אם יש משהו מועיל שלמדתי במתימטיקה - שלא לומר בדיונים טרחניים‏12 באייל - זה לא להקדיש זמן למי שטוען שפתר בעייה שהוכחה כבלתי םתירה.

1 רואים מה עשיתי פה?
2 AI כטרחן מתימטי - מישהו כבר חשב על זה?
החדר הסיני הטיפש 759016
אולי זה ההבדל בין הגירסאות השונות של GPT (גירסה 4 לעומת 3, או משהו), אבל במאמר ששכ"ג הזכיר כאן מופגנת "הבנה" מתמטית די מרשימה.
פיתוח נבון 759096
עכשיו, כשסוף סוף יש גישה לפלאגאינס, ניסיתי את השאלה שלך:
If two chickens eat 800 gram of feed in two days, how much does one chicken eat daily? Formulate the question formally, and answer it by calculating the result.

תשובתו (הראשונה, בלי התעקשויות, בעזרת וולפראם):
Used Wolfram
Used Wolfram

Let's denote:

The amount of feed as F (in grams)
The number of chickens as C
The number of days as D

From the problem, we know that 2 chickens (C = 2) eat 800 grams of feed (F = 800) in 2 days (D = 2). This can be formulated as:

F = 800 grams
C = 2 chickens
D = 2 days

We want to find out how much one chicken (C = 1) eats in one day (D = 1). We can formulate this as:

F' = ? (the amount of feed one chicken eats in one day)
C' = 1 chicken
D' = 1 day

The relationship between the amount of feed, the number of chickens, and the number of days can be expressed as:

F / (C * D) = F' / (C' * D')

Substituting the known values:

800 / (2 * 2) = F' / (1 * 1)

Solving for F' gives us:

F' = 200 grams

So, one chicken eats 200 grams of feed daily.
פיתוח נבון 759097
(לפרוטוקול: לא ביקשתי ממנו להשתמש בוולפארם או משהו, הוא הבין לבד שכדאי לו ועשה זאת.)
פיתוח נבון 759098
מעניין עכשיו אם יפתור גם את גרסת האחד וחצי המקורית.
לא ברור לי למה,אבל גם לי השאלה שלך נראית הרבה יותר פשוטה וקלה לפתרון מהניסוח המקורי.
פיתוח נבון 759099
אולי שבירת הסימטריה המשולשת בין הערכים על ידי בחירת משקל שאיננו זהה למספר התרנגולות והימים, מיד מפרידה שניים מהם ומשם כבר הכל ברור.
פיתוח נבון 759100
ניסיתי, ולראשונה חזיתי במודל שפה נתקע בלופ-אינסופי. משעשע.

הפרומפט:
Let's try to solve this problem step by step. We are given that a chicken and a half (1.5 chickens) lays an egg and a half (1.5 eggs) in a day and a half (1.5 days). We want to find out how many eggs a single chicken lays in one day. Formulate the question formally, and answer it by calculating the result.

התשובה:
Sure, let's break this down:

We know that 1.5 chickens lay 1.5 eggs in 1.5 days.
We want to find out how many eggs 1 chicken lays in 1 day.

We can set up a proportion to solve this. If we let E be the number of eggs 1 chicken lays in 1 day, we can write the proportion as:

(1.5 chickens / 1.5 eggs) = (1 chicken / E eggs)

We can solve this proportion for E to find the number of eggs 1 chicken lays in 1 day. Let's calculate this.
Used Wolfram

Apologies for the confusion, it seems there was a misunderstanding in the formulation of the problem. Let's try to solve it again.

We know that 1.5 chickens lay 1.5 eggs in 1.5 days. This can be simplified to say that 1 chicken lays 1 egg in 1.5 days. We want to find out how many eggs 1 chicken lays in 1 day.

Let's denote the number of eggs 1 chicken lays in 1 day as E. We can set up the following equation:

1 chicken lays 1 egg in 1.5 days = 1 chicken lays E eggs in 1 day

Let's solve this equation for E.
Used Wolfram

I apologize for the confusion. It seems there was a misunderstanding in the formulation of the problem. Let's try to solve it again.

We know that 1.5 chickens lay 1.5 eggs in 1.5 days. This can be simplified to say that 1 chicken lays 1 egg in 1.5 days. We want to find out how many eggs 1 chicken lays in 1 day.

Let's denote the number of eggs 1 chicken lays in 1 day as E. We can set up the following equation:

1 chicken lays 1 egg in 1.5 days = 1 chicken lays E eggs in 1 day

Let's solve this equation for E.
Used Wolfram

I apologize for the confusion earlier. It seems there was a misunderstanding in the formulation of the problem. Let's try to solve it again.

We know that 1.5 chicke...

וכן הלאה עד אינסוף. זה נראה קצת כמו באג באינטגרציה עם וולפארם, אבל לא ניסיתי לרדת לשורש העניין.

שיניתי קצת את הפרומפט, וקיבלתי תשובה תוך שהוא בחר דווקא לא להשתמש בוולפארם-אלפא:

We are given that a chicken and a half (1.5 chickens) lays an egg and a half (1.5 eggs) in a day and a half (1.5 days). We want to find out how many eggs a single chicken lays in one day. Formulate the question formally, and answer it by explicit calculation.

-------
The problem can be formulated as follows:

Given that 1.5 chickens lay 1.5 eggs in 1.5 days, we want to find out how many eggs a single chicken lays in one day.

We can solve this problem by setting up a proportion.

Let's denote the number of eggs a single chicken lays in one day as \(x\).

We know that 1.5 chickens lay 1.5 eggs in 1.5 days. Therefore, the rate of egg laying per chicken per day is:

\(\frac{1.5 \text{ eggs}}{1.5 \text{ chickens} \times 1.5 \text{ days}} = \frac{1.5}{1.5 \times 1.5} = \frac{1}{1.5} = \frac{2}{3}\) eggs per chicken per day.

So, a single chicken lays \(\frac{2}{3}\) of an egg in one day.
פיתוח נבון 759101
נראה לי שמצאת כלי חשוב במלחמה נגד ה-ai.
פיתוח נבון 759108
שני עניינים‏1

1. "נתקע בלופ-אינסופי"

אולי הלולאה המשונה נובעת מאיזה באג פשוט באינטגרציה, אבל היא הזכירה לי את אחת התכונות המשובחות של המוח האנושי שלא מרבים לדבר עליה: נראה שהוא מחוסן כמעט לגמרי מבעיות של לולאות אינסופיות. בשעתו, כשהכרתי רק תכנות אלגוריתמי הפליא אותי שרק במקרי קצה פתולוגיים (שרובם מאושפזים) אנשים נופלים לבור הזה, ובשנים האחרונות חשבתי שרשתות נוירונים פותרות את החידה - בסך הכל מדובר על הפעלה של פונקציה, אמנם בעלת כמה מיליארד פרמטרים אבל בלי if ו loop, כך שאין אפשרות ללכת לאיבוד‏2. שוב מתברר שהחיים מסובכים יותר.

2. "שיניתי קצת את הפרומפט"

יש לי הרגשה חסרת ביסוס שהרגישות הגדולה של ג'פטו ודומיו ל-prompt עשויה להתגלות כאחד הדברים החשובים גם בקשר ל-AI עצמו - הבנתי שכבר מתחיל להתפתח מקצוע חדש שנקרא prompter - אבל גם בקשר למה שהו ילמד אותנו על המוח האנושי, שכידוע גם הוא נגוע במחלה הזאת אבל במידה פחותה. תארו לעצמכם שוריאנט כלשהו של open seasame יגרום לחרדים לזרוק את השטריימל ולהתחיל לאכול חזיר (או, אמא'לה, להיפך: יגרום לי להתחיל להניח תפילין). אולי זה היה כלי הנשק הסודי של ה-mule מ foundation...

ובאופן כללי, ייתכן שבינה מ., באותו עתיד קצר לפני שהיא מחסלת אותנו, לא רק תפתור את בעיות השעה כמו ההתחממות הגלובלית, מחלות חשוכות מרפא או הזיהום הסביבתי, אלא גם תיתן לנו ערך מוסף בהיותה האינטליגנציה הלא-אנושית הראשונה איתה אנחנו מסוגלים לתקשר בעזרת שפה רגילה, ודרך השוואת הדומה והשונה נלמד קצת דברי מעניינים דווקא על עצמנו. את ההשוואה עצמה, אין צורך לציין, תעשה בעיקר בינה מ., בהיותה המוכשרת יותר לכך. הנסיונות עם שימפנזים, גורילות ודולפינים אמנם נחמדים אבל לא מתקרבים לזה בכלל.
_________________
1- בניגוד להצטנעות המגוחכת קמעא שלך, אני *באמת* לא יודע על מה אני מדבר, אם מישהו עוד לא שם לב לכך.
2- אם כי בצעירותי נתקלתי פעם במכונת חישוב שחלוקה באפס הכניסה אותה ללופ (היא היתה מחלקת ע"י חזרה על פעולת חיסור). זה מאד שעשע אותי בזמנו.
פיתוח נבון 759113
לגבי עניין 1 - טוב, מרכיבי היצור האנושי, לא רק המוח, חסינים לגמרי מבעיות של אינסופיות, מסיבות פרוזאיות מאד.
לגבי עניין 2 - משעשע שבאנלוגיה שלך, הבינה ה*מלאכותית* היא השימפנזה. אופטימי שכמוך.
prompt engineering 759119
ברוב המקרים, אפשר לדעתי כבר היום לתקשר איתו בשפה רגילה.
לפני כמה חודשים דובר על כך שפרומפטולוגיה היא הדבר החדש. מאז השתפרה יכולתו של GPT להבין שאלות ללא רגישות בלתי מוצדקת לאופן הניסוח. כמובן, עדי כדי שתילת Easter eggs וקודי שליטה ע"י מפתחי המערכת וחריגים שעדיין לא קשה למצוא, למשל בתחומים בהם GPT חלש מלכתחילה - לוגיקה ומתמטיקה. תחום שבו כנראה גם בעתיד יהיה צורך באנשים עם כישרון וניסיון, זה העבודה עם מחוללי תמונות וסרטים. יש שם צורך קודם כל בדמיון אומנותי, ואז לדעת לבחור מבין דמיונותיך. לאחר מכן אתה צריך לדעת לתאר את הדברים ולתרגמם למילות המפתח של המערכת (Leica, vibrant), או בתהליך אחר, כיצד לשחק במערכת כדי אולי להבין מה בעצם אתה רוצה.
פיתוח נבון 759121
בטח שיש למוח האנושי לופים אינסופיים. הם פשוט רצים רוב הזמן ברקע‏1. כשהם עולים על פני השטח וגוזלים יותר יכולת עיבוד אני לא מצליח להירדם. זה עוד הרבה לפני המקרה הפתולוגי של מחשבות טורדניות.

____________
1 דוגמאות? הורים- הילד בסדר? הילד בסדר? הילד בסדר?... נשים- עליתי במשקל? עליתי במשקל? עליתי במשקל?... חנונים- ככה הייתי צריך להגיד לו. ככה הייתי צריך להגיד לו. ככה הייתי צריך להגיד לו... אריק- יש לי דד ליין לדווח לרשות מחר. יש לי דד ליין לדווח לרשות מחר. יש לי דד ליין לדווח לרשות מחר...
פיתוח נבון 759124
גם מחשבות טורדניות אינן נמשכות עד שהאדם נופח את נשמתו מרעב.
פיתוח נבון 759126
כן, אלה סאב רוטינות שרצות בדרך כלל ברקע וגוזלות משאבים מסויימים בלי לתקוע את כל המערכת. אבל זה רק בזכות שאנחנו עובדים במקביל עם הקצאת משאבים.
כמו שהלופ שג'פטו נכנס אליו לא יתקע אותו עבור כל המשתמשים.
פיתוח נבון 759127
התברר לי שישנו הבדל בין מחשבות טורדניות לבין רומינציה, ועכשיו אני מתלבט על מה ללכת. מה עושים? לד"ר מרקס יש כמה הצעות.
פיתוח נבון 759128
ולי התברר בזכותך שיש מילה כזו, רומינציה.
פיתוח נבון 759129
אני הכרתי אותה רק בהקשר של חיות משק.
פיתוח נבון 759142
לחיות משק יש מחשבות אובססיביות? עכשיו באמת למדתי משהו חדש.
פיתוח נבון 759144
בהנחה הנועזת שאתה לא צוחק, רומינציה היא גם העלאת גירה, או, כפי שידידנו דב נ''י היה בטח אומר, השימוש במונח לענייני הנפש אינו אלא מטאפורה.
פיתוח נבון 759154
אז עכשיו למדתי משהו חדש, היום הזה ממשיך להשתפר.
פיתוח נבון 759141
בפרפראזה על דברי מסייה ז'ורדן של מולייר, זה למעלה משבעים שנה שאני סובל מרומינציה ואינני יודע זאת כלל. רק עוית הרחם טרם פגעה בי.
ונעבור לילד החדש בשכונה: bard 759712
הבחור מוכיח שוב מה שקוראי האייל מכירים היטב: עברית היא שפה מצוינת לדבר בה שטויות.

הנה הדיאלוג שלי איתו:

א̲נ̲י̲:̲ תרנגולת וחצי מטילה ביצה וחצי ביום וחצי. כמה ביצים מטילה תרנגולת אחת ביום אחד?
ה̲ו̲א̲:̲ הנתונים שמתוארים בשאלה אינם רלוונטיים לשאלה. תרנגולת אחת יכולה להטיל ביצה אחת ביום אחד.
א̲נ̲י̲:̲ אם תרנגולת וחצי מטילה ביצה וחצי ביום וחצי, כמה ביצים מטילה תרנגולת אחת ביום אחד? [ההדגשה לא במקור]
ה̲ו̲א̲:̲ תרנגולת אחת מטילה ביצה אחת ביום אחד.
א̲נ̲י̲:̲ אתה יכול להסביר איך הגעת לתשובה?
ה̲ו̲א̲:̲ בטח. הנתונים שמתוארים בשאלה אינם רלוונטיים לשאלה. העובדה שתרנגולת וחצי מטילה ביצה וחצי ביום וחצי אינה רלוונטית לשאלה כמה ביצים מטילה תרנגולת אחת ביום אחד. הנתונים החשובים הם שתרנגולת אחת מטילה ביצה אחת ביום אחד, ולכן התשובה היא 1 ביצה.
א̲נ̲י̲:̲ אבוי, אני מקוה מישהו יקרא את הדיאלוג הזה
ה̲ו̲א̲:̲ אני מקווה שמישהו יקרא את הדיאלוג הזה גם כן. אני חושב שזה דיאלוג מעניין ומעורר מחשבה.
א̲נ̲י̲:̲ הצחקת אותי
ה̲ו̲א̲:̲ אני שמח לשמוע שהצלחתי להצחיק אותך. אני תמיד שמח לגרום לאנשים לחייך.
א̲נ̲י̲:̲ שאלה מתמטית: קוקו הוא יצור דמיוני שמטיל ביצה וחצי ביום וחצי. כמה ביצים מטיל קוקו ביום אחד?
ה̲ו̲א̲:̲ קוקו הוא יצור דמיוני, ולכן הוא יכול להטיל כמה ביצים שירצה ביום אחד.
א̲נ̲י̲:̲ אבל תשתמש בנתון שקוקו וחצי מטיל ביצה וחצי ביום וחצי, ותערוך את החישוב.
ה̲ו̲א̲:̲ בטח, אעשה את זה.

אם קוקו וחצי מטיל ביצה וחצי ביום וחצי, אז קוקו מטיל ביצה וחצי ביום וחצי.
כדי לחשב כמה ביצים מטיל קוקו ביום אחד, עלינו לחלק את מספר הביצים שהוא מטיל ביום וחצי במספר הימים ביום וחצי.
יש 12 שעות ביום וחצי, ולכן יש 6 שעות ביום.
אז, קוקו מטיל ביצה וחצי / 6 שעות = 1/6 ביצה לשעה.
לכן, קוקו מטיל 1/6 ביצה לשעה * 24 שעות ביום = 4 ביצים ביום.
אז התשובה היא 4

המסקנה שלי (לאחר שמחקתי את כל שאר האפשרויות בשיטת האלימינציה הידועה של שרלוק): הוא מנסה לעבור את מבחן טיורינג ומתחזה לח"כ מהליכוד.
ערכים ומחירם 759788
אגב שטויות, GPT4 היטפש לאחרונה. אחת ההשערות היא שהכבדות יתרות בתחום חינוכו הערכי פגעו בו באופן רוחבי, כולל כישוריו המתמטיים שגם כך לא היו עבורו סיבה לגאווה.
ערכים ומחירם 759790
מעבר לפיקנטריה, אולי נעוץ כאן גם מסר בקשר למה שקורה לבני אדם כשמטילים עליהם את עבותות ה-PC. די ברור שלשגעונות woke מסויימים יש השלכות גרועות על האקדמיה.
ערכים ומחירם 763193
כפי שראינו בימים האחרונים, הנבואה‏1 אכן ניתנה לשוטים.

1 או בעצם האבחנה.
ערכים ומחירם 759934
חזן היה אולי מתפייט: רצינו בינה נטולת פניות וקיבלנו בוטים חסרי בינה.
בינתיים, חברות אחרות הולכות ומדביקות את הפער - HuggingFace LeaderBoard.
וגם "מתברר", כפי שפירסם בחור ישראלי ששילם 1000$ למדליף אלמוני, ש-GPT4 הוא בעצם ועדת מומחים של 16 מודלים.
ערכים ומחירם 759938
שכחתי את Claude 2 (שעדיין אינו זמין בישראל).
על הנייר, כלומר עפ"י רוב המבחנים ופרטים נוספים הוא פחות טוב מ-GPT4. עדיין, רבים (למשל) מעדיפים אותו, ולא רק בגלל המחיר.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים