|
||||
|
||||
אפל טוענת כי הקול של סירי "אינו אלא הברות שחוברו". מישהו יודע איך העסק הזה באמת עובד, טכנולוגית? התחלתי לתהות על הנקודה הזאת בעקבות אפליקציות ניווט כבישים למיניהן, שבהן, כידוע, אותו קול יודע להקריא אין-ספור שמות רחובות וערים (חשבו על ניווט בארה"ב, למשל). מן הסתם לא היתה קריינית שהוקלטה אומרת את כל השמות הנ"ל, וניחשתי שקריינית כן הקליטה כמה עשרות פונמות (אולי בכמה היגויים שונים), ובאמצעות "כתיב" ואלגוריתם מתאימים, אפשר לבשל מהן את כל השמות. האםנם כך? |
|
||||
|
||||
כבר הקומודור 64 ידע להקריא טקסטים בקול עילג. כנראה שכך. |
|
||||
|
||||
איני בקיא בפרטים של סירי, אבל סינתזת הקול של גוגל מבוססת על טכנולוגיה שמתוארת חלקית כאן: https://deepmind.com/blog/wavenet-generative-model-ra... |
|
||||
|
||||
אם אתה מאזין לשמות הרחובות של וייז אתה יכול בקלות להבין שהקריינית לא הקליטה את כולם. חלק מהשמות מבוטאים בשגיאות שקריינית אנושית לא היתה שוגה בהן. |
|
||||
|
||||
טריוויה: רחוב ידוע בתל-אביב-יפו שנהגה בפי כל בניקוד לא נכון, ומופיע כך אפילו במפות גוגל ואפילו בחלק משלטי הרחוב. (ואם אתם תוהים באיזה מובן, אם כך, זה לא נכון - ביחס לדבר שעל שמו נקרא הרחוב.) |
|
||||
|
||||
אני הכרתי רחוב כזה בקרית אונו, תגובה 223742. |
|
||||
|
||||
השגיאה שאני מדבר עליה אינה שגיאת דקדוק, אלא משהו חמור ונחמד בהרבה, שגיאת טריוויה. |
|
||||
|
||||
אולי אבן (Ibn / Even) גבירול? |
|
||||
|
||||
יש גם את בוגרשוב ודיז-י-נגוף, אבל לא נראה לי שירדן התכוון לאחד מהם. |
|
||||
|
||||
דרך שלמה? |
|
||||
|
||||
נזכרתי בווידוי מעל דפי האייל על הגייה לא נכונה (בגלל שהיא נכונה) של דרך שלמה. |
|
||||
|
||||
אפילו הקשה המקשה לא מצליח? זמנים קשים. רחוב מַרְגוֹזָה, או בשמו המלא רחוב יהודה מַרְגוֹזָה, נקרא על שם רבי יהודה הלוי מהעיר רָגוּזָה, היא דוברובניק. וכשהשווצתי לעמית לעבודה עם פצצת הטריוויה הנ"ל, הוא החזיר לי עם חזיז טריוויה דומה. אנחנו עדיין ביפו, בסמטה שבה שכנה שנים רבות המסעדה המיתולוגית "יועזר בר יין". אני לא יודע אם לפני המסעדה הזו רבים הקדישו תשומת לב לאותה סמטה, סמטת יועזר איש הבירה. אבל בטוח שכשהיתה המסעדה אי אפשר היה להחמיץ את כתובתה מעוררת ההשראה - מה מעורר את בלוטות הרוק והצמא יותר מלדמיין תנא עגלגל ומבוסם, או שמא בשלן שיכר גדול בתורה? אז מתברר שהבירה של אותו יועזר היתה לא במלעיל, כפי שכולם הגו, אלא במלרע; הוא בא מירושלים (בערך; מי שרוצה לדייק בדבר אותה בירה, גם אם לא להבין בדיוק, מוזמן לויקי). |
|
||||
|
||||
(לא הייתי מעלה בדעתי לקרוא מלעיל, אלא כבדיחה) |
|
||||
|
||||
אבל שאפו על המרגוזה! |
|
||||
|
||||
אם השמות מסונתזים, מדוע הם זמינים רק בקולה של קריינית אחת? אני מנחש שהיא אכן טעתה בחלק מהם. |
|
||||
|
||||
קודם כל, לא ברור לי האם הם זמינים רק בקול של קריינית אחת, אבל גם אם כן - אם הסנתוז מתבסס על כך שהיא הקליטה, נניח, את כל הצרופים האפשריים של שתי פונמות אז כדי לקבל עוד קולות יהיה צורך בעוד הקלטות כאלה - תהליך שלא ברור אם הוא מוצדק עבור שוק קטן כמו שלנו. אבל מעבר לכך, קשה לי לראות קריינית אנושית שתקריא את שם הרחוב "כ"ט בנובמבר" כאילו היה מבוטא "כַּט בנובמבר". |
|
||||
|
||||
האם יש בעיה לשנות את האלגוריתם כך שבשמות ראשי תיבות יקראו כף-טת? |
|
||||
|
||||
נגיד שאין בעיה. אז הוא יקריא: רחוב צדיק היי למד, רחוב למד חית יוד, רחוב ריש שין יוד וגו. |
|
||||
|
||||
אפשר להוריד מרכאות כפולות מראשי תיבות שהפכו מלים בדיבור רגיל. לא נראה לי שיש הרבה כאלה. |
|
||||
|
||||
זה לא מסובך טכנית. הבעיה היא שצורת העבודה מתבססת על ההנחה שאפשר לזרוק לתוך האלגוריתם קובץ עם רשימה של אלפי שמות והוא כבר יטפל בהם. ברגע שצריך אדם שיעבור על שמות אינדיבידואליים ויגדיר איך להקריא אותם העלויות מזנקות. אגב, אני לא בטוח שראשי התבות שנקראים כמלים הם מעטים כל-כך. בירושלים לפחות יש רחובות רבים שנקראים על שם ספרי קודש או אישים שידועים בראשי התבות שלהם (רמב''ן, חזון אי''ש וכו'). אני חושב שהם נפוצים יותר מראשי תבות שנקראים כאותיות. |
|
||||
|
||||
בינתיים הזדמן לי לשמוע את וייז מודיע לי על רחוב "רב החובַל" (ב' פתוחה). אין קריינית עברית שלא תבטא ב' צרויה. |
|
||||
|
||||
לפני כמה חודשים נסעתי לקיבוץ משמרות, והקריינית של גוגל מפס ביטאה את שם המקום "מישמרו". מקור הטעות הוא מן הסתם האיות של המקום באנגלית - Mishmarot על משקל Merlot. מטרת הנסיעה שלי היתה לנגן שם באיזה אולפן. כידוע, למשמרות יש מקום של כבוד ברוקנרול העברי, ולא יכולתי שלא לתהות האם הדשא שליד האולפן הוא אותו הדשא עם הערימה של החבר'ה. |
|
||||
|
||||
היו בו גבשושיות? |
|
||||
|
||||
לא בדקתי, אבל אני זוכר בבירור ששמעתי לחשושיות ;-) |
|
||||
|
||||
לגן האירועים שהם עשו סביב הבריכה הם קראו, בלי לחטוא באנינות יתר, ''אגדת דשא''. |
|
||||
|
||||
קצת קיטש (ועוד מוצדק היסטורית) לא הזיק לאף גן אירועים. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |