|
||||
|
||||
לתרגם את הדוגמה. זה לא עובד באנגלית, זה עובד רק בעברית. צריך לבחור על איזה משחק מלים לוותר, על כמה, ולעומת מה. אף אדם לא יכול לעשות את זה מושלם, ולא כל אדם יכול לעשות את זה בצורה סבירה בכלל, אז זה לא ממש מפתיע שאנחנו לא יודעים איך לעשות את זה עם מחשב. לא זו המטרה של הבנת שפה טבעית (או של תרגום אוטומטי, אם כבר). |
|
||||
|
||||
עזוב את משחק המלים. זה לא בדיוק טקסט ספרותי. כל מתרגם אנושי יידע איזה מנצח כאם הוא "victor" ואידה "onductor". איך המחשב יידע את זה? |
|
||||
|
||||
לפי סמיכות המילה ''מלחמה'' ל''ניצח'' הראשון ו''תזמורת'' לשני. אחרי שהמחשב עובר על אלפי טקסטים הוא יכול לזהות הקשרים שכאלו. |
|
||||
|
||||
טוב. אם אני אגיד "המנצח היה חניבעל", או "המנצח היה מנדי רודן" - מה אז? |
|
||||
|
||||
אז זה יותר קשה, אבל לדעתי טכניקה דומה (אם כי מתוחכמת יותר) תשיג את אותה המטרה. קרוב לודאי ש''חניבעל'' נמצא בקרבה גדולה יותר ל''מלחמה'' מאשר ל''תזמורת'' ברוב הטקסטים שהתוכנה למדה. כמובן שאפשר להיות אולטרה חכמים ולהגיד ''חניבעל ניצח על צבאו בצורה מופתית, כמו המנצח מנדי רודן'', ואת זה אני חושב שאפשר לפתור רק אם טורחים ללמוד קורס בלמידה חישובית ולא רק שומעים שמועות כמוני. |
|
||||
|
||||
לא צריך להיות חכמים גדולים כדי להמציא טקסט שבו לא יופיעו לא מלחמה ולא תזמורת, גם כשמדובר על אחד משני אלה. |
|
||||
|
||||
כן, אבל יופיעו בכל זאת מילים כלשהן שמספקות הקשר (אחרת גם בני אדם ייאלצו לנחש מה המשמעות). |
|
||||
|
||||
זדה תלוי. קודם כל יכול להיות משהו כמו "המנצח רודן נלחם בחירוף נפש עם הנהלת התזמורת" (נדמה לי שהייתה בפועל סיטואציה כזו). שנית, במסגרת שיחה בספר יכול להיות משהו כמו "אני בטוח שהמנצח יהיה רודן"/ "אז מה? אז שווה ללכת?"/ "לא יודע, הוא קצת מחורפן בזמן האחרון"... וכיו"ב. בן אדם אינו צריך לנחש. או שהוא מכיר את השמות, או שהוא יברר מי הוא מי. |
|
||||
|
||||
שתי האפשרויות - הכרת השמות, או בירור המקצועות - הן פשוטות מאוד עבור מחשב. |
|
||||
|
||||
כמו שאדם מכיר את השמות כך גם מחשב יכול. |
|
||||
|
||||
הפועל "ניצח" בעברית מקבל ביטוי יחס "על X" רק במשמעות המוסיקלית שלו ולא בצבאית. את הבעיה _הזו_ אפשר לפתור כבר ברמת התחביר (שזה בדיוק מה שגם אנשים עושים). |
|
||||
|
||||
כמה בני אדם ידעו ש"המנצח היה סטיוארט צ'אלנדר" מתיחס לניצחון על תזמורת, ש"המנצחת היתה ברברה מרויס" מתיחס לניצחון בהוקי קרח? |
|
||||
|
||||
אנשים יכולים לא לדעת: הם יכולים לברר. |
|
||||
|
||||
ולמחשבים אין גישה לגוגל? |
|
||||
|
||||
אתה נוגע פה בשתי נושאים שקשורים זה בזה, רקע משותף ותשתית (או איך שלא קוראים לזה בעברית). ריקוד, לחיצת ידים, זוג חותרים, מעשה אהבים או שניים שאוחזין בטלית, כולם פעילויות של שיתוף שדורשות קואורדינציה מורכבת במימדים שונים. אבל, הקואורדינציה דורשת סידרה של הנחות מוקדמות שהשותפים מחזיקים כל אחד צריך להניח שהשני מעוניין לשתף פעולה, שהשני יודע מה זה טלית, איזה רגל לשים קדימה בשעת הריקוד או מתי תורו להיכנס כשהם מנגנים דואט. בנוסף, כל אחד צריך להניח שהשני יודע שהוא יודע את אותם הדברים, וכה הלאה (אתה יכול לראות כיצד טיורינג ניכנס לסיפור?). הרקע המשותף - ידע על העולם, ידע אחד על השני, ידע על הדינמיקה של שיותף פעולה, ידע על העובדה שהשני הוא יצור תבוני בעל רגשות, כוונות, מחשבות וזכרונות - איננו דבר סטטי אלא הוא חלק מתהליך דינמי שנבנה תוך מהלך הפעילות. הפעילות עצמה יוצרת עובדות חדשות שעדכנות ומצטרפות למאגר הרקע המשותף, וכך נבנית התשתית שמאפשרת את המשך שיתוף הפעולה. שיחה היא שיתוף פעולה פר אקסלנס, והיא מתאפשרת רק אם קיים רקע משותף שמעוגן בתשתית. בשיחה פנים אל פנים אתה מתכנן מה אתה רוצה לומר, אבל אתה גם צריך לוודא שיבינו אותך. זה נעשה על ידי רקע משותף תחילי, וגם על ידי מערכת סימנים שמאותת הבנה הדדית. ברגע שאמרת/כתבת (אם כי תקשורת מילולית שונה מתקשורת כתובה) דבר מה, והובנת, והבנת שהבינו אותך (וכו'), הפרט החדש מצטרף למאגר התשתית ואפשר להתייחס אליו בהמשך. למשל, "לדודה שלי שרה נולדה בת." "מזל טוב," "היא שוקלת 2.5 קילו." "מי, שרה?" השאלה האחרונה משתמשת בידע המשותף ששרה היא הדודה, ולא צריך לשאול "מי, הדודה שרה?" |
|
||||
|
||||
נכון. שיחה טבעית היא פעולה מסובכת. מסקנה: התוכנה המשוחחת לא תהיה פשוטה, תצטרך לדעת המון על העולם, ולזכור מה אמרו לה לפני רגע. |
|
||||
|
||||
נדמה לי שבעיית הידע והזכרון הם דווקא החלקים הפחות מסובכים לתוכנה. ידע וזכרון רלוונטי לשיחה, זה כבר דבר אחר, לפני שעברנו לבעיות היותר מורכבות. |
|
||||
|
||||
התכוונתי למשהו הרבה יותר פשוט, תגובה 386267 ניסחה את זה בצורה מוצלחת ממני. בניגוד למה שנדמה לכל מני אנשים, הבעיה בפיתוח מחשב שמבין שפה שונה לגמרי מהביות איתם מתמודד בן אדם שמנסה להבין שפה. הדברים שקשים לנו, זיכרון, ידע, מהירות חישוב וכו', הם דברים שקלים מאד למחשבים, דברים בהם מחשים לא רק טובים כמונו, אלא אף טובים מאיתנו. בכלל, כל חוק בשפה שניתן לניסוח בצורה חד משמעית, מחשב "יבין" אותו טוב מבן אדם. |
|
||||
|
||||
(למידה חישובית היא לאו דווקא הטכניקה היחידה לעיבוד שפה טבעית בכלל ותרגום אוטומטי בפרט. לא בשמיים גם להכניס לתוכנה את ההקשרים הללו מראש.) |
|
||||
|
||||
(כל אחד מדבר על מה שהוא מכיר) |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |