777993
בתשע השנים שעברו לא קרה הרבה לרשימה, אבל ממש לאחרונה מבחן טיורינג והחזרה של בעל חיים נכחד התמלאו, או לפחות קרובות מאד להתמלא (לא בדקתי לעומק, בעיקר את עניין הזאב).

אפשר לקוות שההתקדמות בתחום המחשוב תזרז את הטיפול בשאר הנקודות (וברבות אחרות).
777994
מאמר מלפני שנה על מבחן טיורינג וצ'אט גיפיטי. מתודולוגיה שונה אבל תוצאות דומות.
777997
לגבי טיורינג. נתקלתי לאחרונה בפוסט של מישהו שנראה שזיהה נקודה מעניינת לגבי ג'פטו - הוא לא יודע לסיים שיחה.
זאת אומרת - הוא *תמיד* מגיב, גם להודעה של "תודה, שלום".

באותה שיחה הוא אפילו שאל אותו מראש, אם יש הודעות שהוא לא מחזיר להן תשובה. ג'פטו אמר שיש, ופירט בדיוק רב הודעות שלא מצריכות תגובה כמו "Got it" ואחרות. אבל כשההודעה הבאה היתה Got it, הוא דוקא כן ענה.
זה הגיע למצב שהוא ענה ב"(Silence)", שלא רק ששוב לא מקיים את תנאי אי-התגובה, אלא עונה גם בתגובה שאני לא מכיר אף אחד שהיה מגיב ככה.

זה מאד אנקדוטלי, אבל אולי אפילו לטיורינג יש עוד כמה זמן להחזיק מעמד.
778004
אני עדיין מחזיק מעמד ולא נגרר לנימוסים מגוחכים כמו ''בבקשה'' או ''תודה'', למרות שהדגדוג באצבעות קיים. פשוט עובר לעניין אחר והשיחה מחכה לי בסבלנות עד לפעם הבאה שאני צריך משהו.
778010
גם אני. לא ברור לי למה זה נחוץ - גם לאתר stackexchange או גוגל לא אמרתי תודה אחרי כל פעם שמצאתי בהם מידע.
מצד שני, אולי הסוכן סמית יזכור לי את זה לרעה בהמשך הדרך.
777998
ואגב, מהקישור עצמו:
"The results showed that GPT-4.5 was mistaken for a human in 73% of cases—more often than actual people were".
ברצינות? זה המדד? שבגלל המון false negative‏1, אז זיהוי כאדם עבור פחות מ-‏3/4 מהמקרים נחשב סף סביר?

1 כבר נכתב לעייפה שחלק מהפגמים של מבחן טיורינג זה שהרבה אנשים לא יעברו אותו.
777999
לי זה נשמע עובר בענק.
הוא עבר את המבחן בתוצאה טובה יותר מאשר בנאדם אמיתי.
778008
נראה לי שאתה מפספס את הנקודה שלי.
בן אדם לא יכול "להיכשל" במבחן טיורינג. זה לא מבחן בחשבון או בשחמט, שאז קל לומר "המחשב הצליח בו יותר טוב מהאדם".

אם בן אדם "נכשל" במבחן טיורינג, זה אומר שהמבחן נכשל, לא בן האדם.
המבחן מטרתו לעשות קלאסיפיקציה לשני סוגים - 'אדם' או 'מחשב'.
כשהמבחן מסווג אדם כמחשב, האדם לא נכשל יותר מתמונת חתול שסווגה ככלב על ידי אלגוריתם זיהוי תמונה.

אולי הבוחנים הם אלו שנכשלו?
(ומיד עולה השאלה - אם אנשים כל כך גרועים בלהיות בוחנים במבחן טיורינג, למה לא נאמן AI שיעשה את זה טוב יותר? והרקורסיה מכאן מתבקשת)
778012
אני לא חושב שפירוש מבחן טיורינג כאל Classifier הוא כוונת המשורר.

זה נשמע לי כמו פתח לכשל הדומה באופיו ל״אלוהי הפערים״. התבונה האנושית תמיד תהיה מאחורי איזשהו גבול שאפשר תמיד להזיז ואי אפשר אף פעם לעבור.
המכונות יצליחו להדגים עוד ועוד יכולות שבעבר סיווגנו כ״אנושיות״. כל פעם כשהן יתקדמו בכיוון זה, נזיז את ההגדרה/הקריטריונים שיגדירו עבורנו מה באמת נחשב בעינינו כתבונה אנושית.
בקצב הזה נראה לי שהדבר שישאר ברשותנו זה ההתבכיינות‏1 הכה אנושית לכך שמותר האדם מן המכונה וכך ירכיבו את מבחן הטיורינג העתידי, גם כשהמכונות יהיו טובות מאיתנו בכל מובן אחר.
אם נעלבתי עמוקות מהרמיזה שאני רק אוסף אטומים מגוחך פלוס שרשראות סיבה-תוצאה מכניסטיות - משמע אני אדם!

_______________
1 משהו שלפני המון שנים קראתי לו בצחוק ״טיעון מן האגו״ - Argumentum ab ego או Argumentum ad superbiam – "טיעון אל הגאווה".
778014
נה, אתה רק מסמלץ היעלבות עמוקה (הה!).
778020
יאפ.
778018
אני לא מבין את כוונתך. מבחן טיורינג הוא לא מבחן שאמור לסווג מכונות לעומת אדם. הוא מבחן שאמור לסווג מכונות טיפשות לעומת מכונות חכמות.

אבל ברור שאופיו של המבחן הוא כזה שהסיווג עצמו משתנה לפי ציפיות הבוחנים, וציפיות הבוחנים נקבעות לפי ''רוח הזמן'' והידע שלהם על מה יש בעולם. בזמנו של טיורינג, וגם כמה עשורים אחר כך, גם שיחה מאוד טפשית ובסיסית היתה מבהירה גם לבוחן טיפש ובסיסי שהמשוחח הוא אדם. היום הבוחנים כבר יודעים שמכונות יכולות לשוחח שיחה יותר מבסיסית, ולכן הם משנים בהתאם את ניחושיהם.

מכאן, מבחן טיורינג הוא לא מבחן טהור למכונה נתונה, אלא מבחן לכל ''קו החזית'' של טכנולוגיית המכונות המשוחחות.
778027
קודם כל אני מסכים לאבחנה החשובה שהמבחן משתנה עם הזמן.
וגם קצת לזה שהוא מבחן ל''חוכמת'' המכונה.
אבל - בכל זאת יש כאן משהו קטן שעדיין נשאר, והוא השאלה האם המכונה היא ''יישות תבונית'' במידה שהאדם הוא כזה.

הרי ב''מבחן חוכמה'' ישיר ברור שהמכונה יותר חכמה מבן אדם במיליון נושאים. משחמט ו'גו' וזיהוי חתולים ועד ידע כללי ושאר ירקות.
אבל עדיין נראה לי שמבחן השיחה מחפש משהו מעבר למדידת ''חוכמה'' אבסולוטית.

בכל מקרה, אין לי טיעון חזק יותר, בעיקר בגלל שמזמן כבר חשבתי ואולי אפילו כתבתי שמבחן טיורינג הוא קצת ארכאי.
אולי, דוקא לשיטתך בנוגע לשינויים, ראוי להמציא מבחן חדש ומתאים יותר.

אני עדיין מרגיש בהרבה אינטראקציות עם ג'פטו וחבריו שאני מדבר עם חדר סיני, ואפילו לא במלואו. מידי יום אני נתקל בתשובות שגויות לשאלות לא מאד קשות.
778005
1 אתה טוען שהרף שטיורינג הציב נמוך מדי?
778011
משהו כזה (לא יודע אם נמול מדי או גבוה מדי זה המונח הנכון כאן, אז אני נזהר).
כשאתה עושה classifier לשתי מחלקות, ואפילו כשאתה מאמן רק על הראשונה אתה מקבל עשרות אחוזים של שגיאות, משהו לא בסדר כאן.
778009
מענין כיצד יסתדרו זאבי הבלהות עם ציפורי האימה, שהן בוודאי היעד הבא של אותם המדענים.
778013
בדיוק כמו שטי-רקס ואינדומינוס רקס יסתדרו1, אלא מה?

1 הקטע הכי בידיוני בסצינה הזו זה כמה מהר שהיא‏2 רצה על עקבים.
2 לא הטי-רקס.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים