איזה מהארועים הבאים ישמח אותך ביותר?

יום ג', 8/4/2025, 10:45

בתשע השנים שעברו לא קרה הרבה לרשימה, אבל ממש לאחרונה מבחן טיורינג והחזרה של בעל חיים נכחד התמלאו, או לפחות קרובות מאד להתמלא (לא בדקתי לעומק, בעיקר את עניין הזאב).

אפשר לקוות שההתקדמות בתחום המחשוב תזרז את הטיפול בשאר הנקודות (וברבות אחרות).

777994

אח של אייל • בתשובה לשוטה הכפר הגלובלי

יום ג', 8/4/2025, 11:00

מאמר מלפני שנה על מבחן טיורינג וצ'אט גיפיטי. מתודולוגיה שונה אבל תוצאות דומות.

777997

הפונז • בתשובה לשוטה הכפר הגלובלי

יום ג', 8/4/2025, 13:16

לגבי טיורינג. נתקלתי לאחרונה בפוסט של מישהו שנראה שזיהה נקודה מעניינת לגבי ג'פטו - הוא לא יודע לסיים שיחה.
זאת אומרת - הוא *תמיד* מגיב, גם להודעה של "תודה, שלום".

באותה שיחה הוא אפילו שאל אותו מראש, אם יש הודעות שהוא לא מחזיר להן תשובה. ג'פטו אמר שיש, ופירט בדיוק רב הודעות שלא מצריכות תגובה כמו "Got it" ואחרות. אבל כשההודעה הבאה היתה Got it, הוא דוקא כן ענה.
זה הגיע למצב שהוא ענה ב"(Silence)", שלא רק ששוב לא מקיים את תנאי אי-התגובה, אלא עונה גם בתגובה שאני לא מכיר אף אחד שהיה מגיב ככה.

זה מאד אנקדוטלי, אבל אולי אפילו לטיורינג יש עוד כמה זמן להחזיק מעמד.

778004

שוטה הכפר הגלובלי • בתשובה להפונז

יום ג', 8/4/2025, 16:13

אני עדיין מחזיק מעמד ולא נגרר לנימוסים מגוחכים כמו ''בבקשה'' או ''תודה'', למרות שהדגדוג באצבעות קיים. פשוט עובר לעניין אחר והשיחה מחכה לי בסבלנות עד לפעם הבאה שאני צריך משהו.

778010

הפונז • בתשובה לשוטה הכפר הגלובלי

יום ג', 8/4/2025, 16:42

גם אני. לא ברור לי למה זה נחוץ - גם לאתר stackexchange או גוגל לא אמרתי תודה אחרי כל פעם שמצאתי בהם מידע.
מצד שני, אולי הסוכן סמית יזכור לי את זה לרעה בהמשך הדרך.

777998

הפונז • בתשובה לשוטה הכפר הגלובלי

יום ג', 8/4/2025, 13:19

ואגב, מהקישור עצמו:

"The results showed that GPT-4.5 was mistaken for a human in 73% of cases—more often than actual people were".

ברצינות? זה המדד? שבגלל המון false negative‏¹, אז זיהוי כאדם עבור פחות מ-‏3/4 מהמקרים נחשב סף סביר?

‏¹ כבר נכתב לעייפה שחלק מהפגמים של מבחן טיורינג זה שהרבה אנשים לא יעברו אותו.

777999

אריק (אתר) • בתשובה להפונז

יום ג', 8/4/2025, 13:51

לי זה נשמע עובר בענק.
הוא עבר את המבחן בתוצאה טובה יותר מאשר בנאדם אמיתי.

778008

הפונז • בתשובה לאריק

יום ג', 8/4/2025, 16:30

נראה לי שאתה מפספס את הנקודה שלי.
בן אדם לא יכול "להיכשל" במבחן טיורינג. זה לא מבחן בחשבון או בשחמט, שאז קל לומר "המחשב הצליח בו יותר טוב מהאדם".

אם בן אדם "נכשל" במבחן טיורינג, זה אומר שהמבחן נכשל, לא בן האדם.
המבחן מטרתו לעשות קלאסיפיקציה לשני סוגים - 'אדם' או 'מחשב'.
כשהמבחן מסווג אדם כמחשב, האדם לא נכשל יותר מתמונת חתול שסווגה ככלב על ידי אלגוריתם זיהוי תמונה.

אולי הבוחנים הם אלו שנכשלו?
(ומיד עולה השאלה - אם אנשים כל כך גרועים בלהיות בוחנים במבחן טיורינג, למה לא נאמן AI שיעשה את זה טוב יותר? והרקורסיה מכאן מתבקשת)

778012

אביב • בתשובה להפונז

יום ג', 8/4/2025, 16:55

אני לא חושב שפירוש מבחן טיורינג כאל Classifier הוא כוונת המשורר.

זה נשמע לי כמו פתח לכשל הדומה באופיו ל״אלוהי הפערים״. התבונה האנושית תמיד תהיה מאחורי איזשהו גבול שאפשר תמיד להזיז ואי אפשר אף פעם לעבור.
המכונות יצליחו להדגים עוד ועוד יכולות שבעבר סיווגנו כ״אנושיות״. כל פעם כשהן יתקדמו בכיוון זה, נזיז את ההגדרה/הקריטריונים שיגדירו עבורנו מה באמת נחשב בעינינו כתבונה אנושית.
בקצב הזה נראה לי שהדבר שישאר ברשותנו זה ההתבכיינות‏¹ הכה אנושית לכך שמותר האדם מן המכונה וכך ירכיבו את מבחן הטיורינג העתידי, גם כשהמכונות יהיו טובות מאיתנו בכל מובן אחר.
אם נעלבתי עמוקות מהרמיזה שאני רק אוסף אטומים מגוחך פלוס שרשראות סיבה-תוצאה מכניסטיות - משמע אני אדם!

_______________
‏¹ משהו שלפני המון שנים קראתי לו בצחוק ״טיעון מן האגו״ - Argumentum ab ego או Argumentum ad superbiam – "טיעון אל הגאווה".

778014

הפונז • בתשובה לאביב

יום ג', 8/4/2025, 17:04

נה, אתה רק מסמלץ היעלבות עמוקה (הה!).

778020

אביב • בתשובה להפונז

יום ג', 8/4/2025, 19:21

יאפ.

778018

ירדן ניר-בוכבינדר (אתר) • בתשובה להפונז

יום ג', 8/4/2025, 17:59

אני לא מבין את כוונתך. מבחן טיורינג הוא לא מבחן שאמור לסווג מכונות לעומת אדם. הוא מבחן שאמור לסווג מכונות טיפשות לעומת מכונות חכמות.

אבל ברור שאופיו של המבחן הוא כזה שהסיווג עצמו משתנה לפי ציפיות הבוחנים, וציפיות הבוחנים נקבעות לפי ''רוח הזמן'' והידע שלהם על מה יש בעולם. בזמנו של טיורינג, וגם כמה עשורים אחר כך, גם שיחה מאוד טפשית ובסיסית היתה מבהירה גם לבוחן טיפש ובסיסי שהמשוחח הוא אדם. היום הבוחנים כבר יודעים שמכונות יכולות לשוחח שיחה יותר מבסיסית, ולכן הם משנים בהתאם את ניחושיהם.

מכאן, מבחן טיורינג הוא לא מבחן טהור למכונה נתונה, אלא מבחן לכל ''קו החזית'' של טכנולוגיית המכונות המשוחחות.

778027

הפונז • בתשובה לירדן ניר-בוכבינדר

יום ה', 10/4/2025, 6:32

קודם כל אני מסכים לאבחנה החשובה שהמבחן משתנה עם הזמן.
וגם קצת לזה שהוא מבחן ל''חוכמת'' המכונה.
אבל - בכל זאת יש כאן משהו קטן שעדיין נשאר, והוא השאלה האם המכונה היא ''יישות תבונית'' במידה שהאדם הוא כזה.

הרי ב''מבחן חוכמה'' ישיר ברור שהמכונה יותר חכמה מבן אדם במיליון נושאים. משחמט ו'גו' וזיהוי חתולים ועד ידע כללי ושאר ירקות.
אבל עדיין נראה לי שמבחן השיחה מחפש משהו מעבר למדידת ''חוכמה'' אבסולוטית.

בכל מקרה, אין לי טיעון חזק יותר, בעיקר בגלל שמזמן כבר חשבתי ואולי אפילו כתבתי שמבחן טיורינג הוא קצת ארכאי.
אולי, דוקא לשיטתך בנוגע לשינויים, ראוי להמציא מבחן חדש ומתאים יותר.

אני עדיין מרגיש בהרבה אינטראקציות עם ג'פטו וחבריו שאני מדבר עם חדר סיני, ואפילו לא במלואו. מידי יום אני נתקל בתשובות שגויות לשאלות לא מאד קשות.

778005

שוטה הכפר הגלובלי • בתשובה להפונז

יום ג', 8/4/2025, 16:16

‏¹ אתה טוען שהרף שטיורינג הציב נמוך מדי?

778011

הפונז • בתשובה לשוטה הכפר הגלובלי

יום ג', 8/4/2025, 16:44

משהו כזה (לא יודע אם נמול מדי או גבוה מדי זה המונח הנכון כאן, אז אני נזהר).
כשאתה עושה classifier לשתי מחלקות, ואפילו כשאתה מאמן רק על הראשונה אתה מקבל עשרות אחוזים של שגיאות, משהו לא בסדר כאן.

778009

אפופידס • בתשובה לשוטה הכפר הגלובלי

יום ג', 8/4/2025, 16:36

מענין כיצד יסתדרו זאבי הבלהות עם ציפורי האימה, שהן בוודאי היעד הבא של אותם המדענים.

778013

הפונז • בתשובה לאפופידס

יום ג', 8/4/2025, 17:03

בדיוק כמו שטי-רקס ואינדומינוס רקס יסתדרו‏¹, אלא מה?

‏¹ הקטע הכי בידיוני בסצינה הזו זה כמה מהר שהיא‏² רצה על עקבים.
‏² לא הטי-רקס.

חזרה לעמוד הראשי

המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים
RSS מאמרים \| כתבו למערכת \| אודות האתר \| טרם התעדכנת \| ארכיון \| חיפוש \| עזרה \| תנאי שימוש והצהרת נגישות	© כל הזכויות שמורות