![]() |
|
![]() |
||
|
||||
![]() |
בתשע השנים שעברו לא קרה הרבה לרשימה, אבל ממש לאחרונה מבחן טיורינג והחזרה של בעל חיים נכחד התמלאו, או לפחות קרובות מאד להתמלא (לא בדקתי לעומק, בעיקר את עניין הזאב). אפשר לקוות שההתקדמות בתחום המחשוב תזרז את הטיפול בשאר הנקודות (וברבות אחרות). |
![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
מאמר מלפני שנה על מבחן טיורינג וצ'אט גיפיטי. מתודולוגיה שונה אבל תוצאות דומות. | ![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
לגבי טיורינג. נתקלתי לאחרונה בפוסט של מישהו שנראה שזיהה נקודה מעניינת לגבי ג'פטו - הוא לא יודע לסיים שיחה. זאת אומרת - הוא *תמיד* מגיב, גם להודעה של "תודה, שלום". באותה שיחה הוא אפילו שאל אותו מראש, אם יש הודעות שהוא לא מחזיר להן תשובה. ג'פטו אמר שיש, ופירט בדיוק רב הודעות שלא מצריכות תגובה כמו "Got it" ואחרות. אבל כשההודעה הבאה היתה Got it, הוא דוקא כן ענה. זה הגיע למצב שהוא ענה ב"(Silence)", שלא רק ששוב לא מקיים את תנאי אי-התגובה, אלא עונה גם בתגובה שאני לא מכיר אף אחד שהיה מגיב ככה. זה מאד אנקדוטלי, אבל אולי אפילו לטיורינג יש עוד כמה זמן להחזיק מעמד. |
![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
אני עדיין מחזיק מעמד ולא נגרר לנימוסים מגוחכים כמו ''בבקשה'' או ''תודה'', למרות שהדגדוג באצבעות קיים. פשוט עובר לעניין אחר והשיחה מחכה לי בסבלנות עד לפעם הבאה שאני צריך משהו. | ![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
גם אני. לא ברור לי למה זה נחוץ - גם לאתר stackexchange או גוגל לא אמרתי תודה אחרי כל פעם שמצאתי בהם מידע. מצד שני, אולי הסוכן סמית יזכור לי את זה לרעה בהמשך הדרך. |
![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
ואגב, מהקישור עצמו: "The results showed that GPT-4.5 was mistaken for a human in 73% of cases—more often than actual people were". ברצינות? זה המדד? שבגלל המון false negative1, אז זיהוי כאדם עבור פחות מ-3/4 מהמקרים נחשב סף סביר?1 כבר נכתב לעייפה שחלק מהפגמים של מבחן טיורינג זה שהרבה אנשים לא יעברו אותו. |
![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
לי זה נשמע עובר בענק. הוא עבר את המבחן בתוצאה טובה יותר מאשר בנאדם אמיתי. |
![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
נראה לי שאתה מפספס את הנקודה שלי. בן אדם לא יכול "להיכשל" במבחן טיורינג. זה לא מבחן בחשבון או בשחמט, שאז קל לומר "המחשב הצליח בו יותר טוב מהאדם". אם בן אדם "נכשל" במבחן טיורינג, זה אומר שהמבחן נכשל, לא בן האדם. המבחן מטרתו לעשות קלאסיפיקציה לשני סוגים - 'אדם' או 'מחשב'. כשהמבחן מסווג אדם כמחשב, האדם לא נכשל יותר מתמונת חתול שסווגה ככלב על ידי אלגוריתם זיהוי תמונה. אולי הבוחנים הם אלו שנכשלו? (ומיד עולה השאלה - אם אנשים כל כך גרועים בלהיות בוחנים במבחן טיורינג, למה לא נאמן AI שיעשה את זה טוב יותר? והרקורסיה מכאן מתבקשת) |
![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
אני לא חושב שפירוש מבחן טיורינג כאל Classifier הוא כוונת המשורר. זה נשמע לי כמו פתח לכשל הדומה באופיו ל״אלוהי הפערים״. התבונה האנושית תמיד תהיה מאחורי איזשהו גבול שאפשר תמיד להזיז ואי אפשר אף פעם לעבור. המכונות יצליחו להדגים עוד ועוד יכולות שבעבר סיווגנו כ״אנושיות״. כל פעם כשהן יתקדמו בכיוון זה, נזיז את ההגדרה/הקריטריונים שיגדירו עבורנו מה באמת נחשב בעינינו כתבונה אנושית. בקצב הזה נראה לי שהדבר שישאר ברשותנו זה ההתבכיינות1 הכה אנושית לכך שמותר האדם מן המכונה וכך ירכיבו את מבחן הטיורינג העתידי, גם כשהמכונות יהיו טובות מאיתנו בכל מובן אחר. אם נעלבתי עמוקות מהרמיזה שאני רק אוסף אטומים מגוחך פלוס שרשראות סיבה-תוצאה מכניסטיות - משמע אני אדם! _______________ 1 משהו שלפני המון שנים קראתי לו בצחוק ״טיעון מן האגו״ - Argumentum ab ego או Argumentum ad superbiam – "טיעון אל הגאווה". |
![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
אני לא מבין את כוונתך. מבחן טיורינג הוא לא מבחן שאמור לסווג מכונות לעומת אדם. הוא מבחן שאמור לסווג מכונות טיפשות לעומת מכונות חכמות. אבל ברור שאופיו של המבחן הוא כזה שהסיווג עצמו משתנה לפי ציפיות הבוחנים, וציפיות הבוחנים נקבעות לפי ''רוח הזמן'' והידע שלהם על מה יש בעולם. בזמנו של טיורינג, וגם כמה עשורים אחר כך, גם שיחה מאוד טפשית ובסיסית היתה מבהירה גם לבוחן טיפש ובסיסי שהמשוחח הוא אדם. היום הבוחנים כבר יודעים שמכונות יכולות לשוחח שיחה יותר מבסיסית, ולכן הם משנים בהתאם את ניחושיהם. מכאן, מבחן טיורינג הוא לא מבחן טהור למכונה נתונה, אלא מבחן לכל ''קו החזית'' של טכנולוגיית המכונות המשוחחות. |
![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
קודם כל אני מסכים לאבחנה החשובה שהמבחן משתנה עם הזמן. וגם קצת לזה שהוא מבחן ל''חוכמת'' המכונה. אבל - בכל זאת יש כאן משהו קטן שעדיין נשאר, והוא השאלה האם המכונה היא ''יישות תבונית'' במידה שהאדם הוא כזה. הרי ב''מבחן חוכמה'' ישיר ברור שהמכונה יותר חכמה מבן אדם במיליון נושאים. משחמט ו'גו' וזיהוי חתולים ועד ידע כללי ושאר ירקות. אבל עדיין נראה לי שמבחן השיחה מחפש משהו מעבר למדידת ''חוכמה'' אבסולוטית. בכל מקרה, אין לי טיעון חזק יותר, בעיקר בגלל שמזמן כבר חשבתי ואולי אפילו כתבתי שמבחן טיורינג הוא קצת ארכאי. אולי, דוקא לשיטתך בנוגע לשינויים, ראוי להמציא מבחן חדש ומתאים יותר. אני עדיין מרגיש בהרבה אינטראקציות עם ג'פטו וחבריו שאני מדבר עם חדר סיני, ואפילו לא במלואו. מידי יום אני נתקל בתשובות שגויות לשאלות לא מאד קשות. |
![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
1 אתה טוען שהרף שטיורינג הציב נמוך מדי? | ![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
משהו כזה (לא יודע אם נמול מדי או גבוה מדי זה המונח הנכון כאן, אז אני נזהר). כשאתה עושה classifier לשתי מחלקות, ואפילו כשאתה מאמן רק על הראשונה אתה מקבל עשרות אחוזים של שגיאות, משהו לא בסדר כאן. |
![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
מענין כיצד יסתדרו זאבי הבלהות עם ציפורי האימה, שהן בוודאי היעד הבא של אותם המדענים. | ![]() |
![]() |
![]() |
![]() |
|
![]() |
||
|
||||
![]() |
בדיוק כמו שטי-רקס ואינדומינוס רקס יסתדרו1, אלא מה? 1 הקטע הכי בידיוני בסצינה הזו זה כמה מהר שהיא2 רצה על עקבים. 2 לא הטי-רקס. |
![]() |
![]() |
![]() |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
![]() |
© כל הזכויות שמורות |