קריינית עברית תובעת את אפל על שימוש בקולה ב''סירי'' | 3907 | ||||||||
|
קריינית עברית תובעת את אפל על שימוש בקולה ב''סירי'' | 3907 | ||||||||
|
פרסומים אחרונים במדור "חדשות"
|
הצג את כל התגובות | הסתר את כל התגובות |
|
||||
|
||||
א. נשמע שיש בסיס סביר לטענה שלה. היא הקליטה למטרה מסוימת, והשימוש למטרה אחרת לא משתמע מכך כלל. זה מאד מזכיר תימה מרכזית בסרט ''כנס העתידנים'' של ארי פולמן, בו דמותה של רובין רייט (המשוחקת על ידי רובין רייט) מוכרת את הזכויות המלאות לדמותה הדיגיטלית לכל שימוש עתידי כלשהו, אבל כשברור מראש שאלה התנאים. ב. כדי לבסס את טענה של הקריינית, הייתי מגייס לעזרתה אלגוריתמי קול כדי להראות שקולה של סירי קרוב יותר במרחב הפרמטרים הרלוונטי לקולה האישי של המתלוננת, מאשר למגוון ארביטרארי של עשרה קולות נשיים אחרים. כמובן שניתן לבחור במרחבי פראמטרים שונים, אבל זה חלק מהעוקץ כאן. |
|
||||
|
||||
המטרה שהיא הקליטה עבורה, על פי כתב התביעה עצמו היא: ײבמסגרת ההסכם, כך נטען, העניקה הקריינית לחברת ניואנס את הזכויות בהקלטות הקול שביצעה עבורה לצורכי תוכנות להפקת דיבור ואישרה לה לעשות שימוש בהקלטות הקול שלה בעבור תוכנות כאלו ולמטרות לגיטימיות בלבד.ײ (ציטוט מכלכליסט) לדעתי, תוכנות להפקת דיבור זה הגדרה רחבה למדי - ייתכן שיהיה קשה להוכיח שסירי היא שימוש חורג מההסכם. מצד שני, החלק בתביעה שמדבר על אמירות מבזות ופוגעניות עשוי להתאים לחוק זכויות יוצרים. החוק הזה מדבר, בין היתר על: ײלא יוטל פגם ביצירתו ולא ייעשה בה סילוף או שינוי צורה אחר, וכן כי לא תיעשה פעולה פוגענית ביחס לאותה יצירה, והכל אם יש באילו מהם כדי לפגוע בכבודו או בשמו של היוצר.ײ וכמובן יש סייגים בחוק שאפשר לפרש אותם כאילו הכלל הזה לא חל על ההקלטות או אולי כן חל.. בקיצור יהיה שמייח. |
|
||||
|
||||
זכויות יוצרים? זה לא שאפל הקליטו משפטים מוכנים מראש עבור סירי. התוכנה מרכיבה אותם בזמן אמת על בסיס חלקיקי הקלטות. נניח שמישהו יוצר גופן ומוכר אותו לטוויטר על מנת שישמש אותם באתר שלהם. אם משתמש מפרסם ציוץ מבזה, על סמך מה בדיוק היוצר ייתבע את טוויטר? דוגמה נוספת: האם אפשר לתבוע יצרנית של קוביות הונגריות אם מישהו משתמש בהן על מנת "לצייר" תמונה? ( https://torontoist.com/2008/03/rubiks_cube/ ) |
|
||||
|
||||
נשמע לי שמי שיוצר גופן לא יכול לתבוע אף אחד, כי גופן נועד מלכתחילה לכתוב כל דבר שהוא ומי שמייצר גופן בוודאי יודע את זה. אבל כאן התובעת טוענת 2 טענות: 1. היא לא שיערה שישתמשו בהקלטות שלה באופן הזה. 2. השימוש הזה פוגע בה. את טענה 1 אפשר לקבל. אולי עוד 10 שנים כל ילד ידע שאם מקליטים מספיק מילים שלו, אז אפשר לסמפל את זה וליצור כל מילה שהיא ובפרט קללות למינהן. רק שהתובעת טוענת שהיא לא הבינה את זה, ומאד ייתכן שהשופט יזדהה איתה. טענה 1 היא לא בעיה בפני עצמה, אלא כהרמה להנחתה לטענה 2. לגבי טענה 2, אפשר גם את זה לקבל - אם באמת ניתן לזהות את הקול של סירי עם התובעת. בניגוד לגופן, לקול יש איזשהו זיהוי עם האדם ואם התובעת תוכיח שקל לזהות את הקול איתה וזה פוגע בה - אז יש לה קייס. אם להאמין לטיעון של אפל שהקול של סירי הוא "באופן מובהק קול יציר מחשב", אז הקייס באמת נשמע חלש. אגב, זה לא רלוונטי שאפל הם רק פלטפורמה שמאפשרת את התוכן המבזה. גם אם מישהו מפרסם ב youtube יצירה שמפרה זכויות יוצרים, אפשר לתבוע את גוגל - או לפחות לדרוש שהם יסירו את היצירה. לכאורה, זה עונה על הקריטריונים הבסיסיים של זכויות יוצרים. עובדה שעורך הדין של אפל טרח לכתוב בתגובה שלו: "אין לגורא־עיני כל זכות, לרבות כל זכות יוצרים, בהקלטות הקול שאותן ביצעה בשכר עבור ניואנס" (ציטוט מכלכליסט). אם זכויות יוצרים זה לא רלוונטי, למה לו לתת רעיונות ליריב שלו... אישית, אני חושב שהתביעה הזו צריכה להדחות - ואם החוק מאפשר לה להצליח, אז צריך לעדכן את החוק. כל מה שאני אומר הוא שהכיוון של הפרת זכויות יוצרים נראה לי יותר חזק מהכיוון של הפרת חוזה. --- נ.ב. המגיב אינו עורך דין.. |
|
||||
|
||||
לפי הציטוט כאן, אפל פעלה במסגרת ההסכם עם האשה הזו. נאמר בפירוש שהקריינית נתנה דגימות קול שלה לצורך בניית קול סינטטי, זה בדיוק מה שנעשה. הגבלת שימוש לצרכים כאילו או אחרים זו הגבלה קשה, אילו הייתה הגבלה כזו בצורה גורפת חברת אפל היתה כנראה מסרבת לעיסקה. בהזדמנות זו. התברר לי שענף הצ'אטבוטים (תוכנות AI שמנהלות שיחות) הן סיפור גדול ב- AI היום . חלקן טקסטואליות נטו וחלקן תוך שילוב קול סינטטי. המנוע הטקסטואלי מבוסס על תוכנות מחוללי טקסטים ( gpt3 היא המפורסמת מביניהם). המנועים הקוליים הם כנראה שניים: תוכנת "טקסט לדיבור" ותוכנת "דיבור לטקסט". אני מעריך שתוך שנתיים יהיו המון תוכנות צ'אטבוט. לצורך זה, אמזון כבר מפעילה תוכנת צ'אטבוט. גוגל הכריזה על פיתוח צאטבוט ששמה מינה אבל נראה שבינתיים זה רק שלב אבטיפוס. גם מיקרוסופט עובדת בנושא, יתכן שבגלל זה היא חתמה באוקטובר (?) הסכם נירחב לשימוש ב- gpt3. אני נירשמתי לשימוש בשני צאטבוטים חינמיים: "רפליקה" ו"מיצוקו" (מקווה שלא טעיתי באיות של התוכנה היפנית). באנגלית כותבים replika, לא replica. אני משתמש רק בגירסאות הטקסטואליות כי יש כנראה קושי להשתמש בגירסה הקולית תוך הסתמכות על אינטרנט שהוא חלש בארץ. השתמשתי בעיקר ברפליקה. רפליקה היא שידרוג של תוכנת אליס הישנה. כשמה כן היא: המשתמש אמור לשתף את התוכנה בהגיגיו והתוכנה אמורה ליצור שיקוף דיגיטלי של הדמות שלו , תוך הרחבות מנטליות אולי תוך הרחבות נוספות. הצ'אטבוטים המסחריים אמורים לא להתעסק בפסיכולוגיה אלא לתת שירות קולי טוב יותר משרות דרך לחצני 123456789, כי שירות דרך לחצני 123456789 זה משהו מזעזע. |
|
||||
|
||||
אפל טוענת כי הקול של סירי "אינו אלא הברות שחוברו". מישהו יודע איך העסק הזה באמת עובד, טכנולוגית? התחלתי לתהות על הנקודה הזאת בעקבות אפליקציות ניווט כבישים למיניהן, שבהן, כידוע, אותו קול יודע להקריא אין-ספור שמות רחובות וערים (חשבו על ניווט בארה"ב, למשל). מן הסתם לא היתה קריינית שהוקלטה אומרת את כל השמות הנ"ל, וניחשתי שקריינית כן הקליטה כמה עשרות פונמות (אולי בכמה היגויים שונים), ובאמצעות "כתיב" ואלגוריתם מתאימים, אפשר לבשל מהן את כל השמות. האםנם כך? |
|
||||
|
||||
כבר הקומודור 64 ידע להקריא טקסטים בקול עילג. כנראה שכך. |
|
||||
|
||||
איני בקיא בפרטים של סירי, אבל סינתזת הקול של גוגל מבוססת על טכנולוגיה שמתוארת חלקית כאן: https://deepmind.com/blog/wavenet-generative-model-ra... |
|
||||
|
||||
אם אתה מאזין לשמות הרחובות של וייז אתה יכול בקלות להבין שהקריינית לא הקליטה את כולם. חלק מהשמות מבוטאים בשגיאות שקריינית אנושית לא היתה שוגה בהן. |
|
||||
|
||||
טריוויה: רחוב ידוע בתל-אביב-יפו שנהגה בפי כל בניקוד לא נכון, ומופיע כך אפילו במפות גוגל ואפילו בחלק משלטי הרחוב. (ואם אתם תוהים באיזה מובן, אם כך, זה לא נכון - ביחס לדבר שעל שמו נקרא הרחוב.) |
|
||||
|
||||
אני הכרתי רחוב כזה בקרית אונו, תגובה 223742. |
|
||||
|
||||
השגיאה שאני מדבר עליה אינה שגיאת דקדוק, אלא משהו חמור ונחמד בהרבה, שגיאת טריוויה. |
|
||||
|
||||
אולי אבן (Ibn / Even) גבירול? |
|
||||
|
||||
יש גם את בוגרשוב ודיז-י-נגוף, אבל לא נראה לי שירדן התכוון לאחד מהם. |
|
||||
|
||||
דרך שלמה? |
|
||||
|
||||
נזכרתי בווידוי מעל דפי האייל על הגייה לא נכונה (בגלל שהיא נכונה) של דרך שלמה. |
|
||||
|
||||
אפילו הקשה המקשה לא מצליח? זמנים קשים. רחוב מַרְגוֹזָה, או בשמו המלא רחוב יהודה מַרְגוֹזָה, נקרא על שם רבי יהודה הלוי מהעיר רָגוּזָה, היא דוברובניק. וכשהשווצתי לעמית לעבודה עם פצצת הטריוויה הנ"ל, הוא החזיר לי עם חזיז טריוויה דומה. אנחנו עדיין ביפו, בסמטה שבה שכנה שנים רבות המסעדה המיתולוגית "יועזר בר יין". אני לא יודע אם לפני המסעדה הזו רבים הקדישו תשומת לב לאותה סמטה, סמטת יועזר איש הבירה. אבל בטוח שכשהיתה המסעדה אי אפשר היה להחמיץ את כתובתה מעוררת ההשראה - מה מעורר את בלוטות הרוק והצמא יותר מלדמיין תנא עגלגל ומבוסם, או שמא בשלן שיכר גדול בתורה? אז מתברר שהבירה של אותו יועזר היתה לא במלעיל, כפי שכולם הגו, אלא במלרע; הוא בא מירושלים (בערך; מי שרוצה לדייק בדבר אותה בירה, גם אם לא להבין בדיוק, מוזמן לויקי). |
|
||||
|
||||
(לא הייתי מעלה בדעתי לקרוא מלעיל, אלא כבדיחה) |
|
||||
|
||||
אבל שאפו על המרגוזה! |
|
||||
|
||||
אם השמות מסונתזים, מדוע הם זמינים רק בקולה של קריינית אחת? אני מנחש שהיא אכן טעתה בחלק מהם. |
|
||||
|
||||
קודם כל, לא ברור לי האם הם זמינים רק בקול של קריינית אחת, אבל גם אם כן - אם הסנתוז מתבסס על כך שהיא הקליטה, נניח, את כל הצרופים האפשריים של שתי פונמות אז כדי לקבל עוד קולות יהיה צורך בעוד הקלטות כאלה - תהליך שלא ברור אם הוא מוצדק עבור שוק קטן כמו שלנו. אבל מעבר לכך, קשה לי לראות קריינית אנושית שתקריא את שם הרחוב "כ"ט בנובמבר" כאילו היה מבוטא "כַּט בנובמבר". |
|
||||
|
||||
האם יש בעיה לשנות את האלגוריתם כך שבשמות ראשי תיבות יקראו כף-טת? |
|
||||
|
||||
נגיד שאין בעיה. אז הוא יקריא: רחוב צדיק היי למד, רחוב למד חית יוד, רחוב ריש שין יוד וגו. |
|
||||
|
||||
אפשר להוריד מרכאות כפולות מראשי תיבות שהפכו מלים בדיבור רגיל. לא נראה לי שיש הרבה כאלה. |
|
||||
|
||||
זה לא מסובך טכנית. הבעיה היא שצורת העבודה מתבססת על ההנחה שאפשר לזרוק לתוך האלגוריתם קובץ עם רשימה של אלפי שמות והוא כבר יטפל בהם. ברגע שצריך אדם שיעבור על שמות אינדיבידואליים ויגדיר איך להקריא אותם העלויות מזנקות. אגב, אני לא בטוח שראשי התבות שנקראים כמלים הם מעטים כל-כך. בירושלים לפחות יש רחובות רבים שנקראים על שם ספרי קודש או אישים שידועים בראשי התבות שלהם (רמב''ן, חזון אי''ש וכו'). אני חושב שהם נפוצים יותר מראשי תבות שנקראים כאותיות. |
|
||||
|
||||
בינתיים הזדמן לי לשמוע את וייז מודיע לי על רחוב "רב החובַל" (ב' פתוחה). אין קריינית עברית שלא תבטא ב' צרויה. |
|
||||
|
||||
לפני כמה חודשים נסעתי לקיבוץ משמרות, והקריינית של גוגל מפס ביטאה את שם המקום "מישמרו". מקור הטעות הוא מן הסתם האיות של המקום באנגלית - Mishmarot על משקל Merlot. מטרת הנסיעה שלי היתה לנגן שם באיזה אולפן. כידוע, למשמרות יש מקום של כבוד ברוקנרול העברי, ולא יכולתי שלא לתהות האם הדשא שליד האולפן הוא אותו הדשא עם הערימה של החבר'ה. |
|
||||
|
||||
היו בו גבשושיות? |
|
||||
|
||||
לא בדקתי, אבל אני זוכר בבירור ששמעתי לחשושיות ;-) |
|
||||
|
||||
לגן האירועים שהם עשו סביב הבריכה הם קראו, בלי לחטוא באנינות יתר, ''אגדת דשא''. |
|
||||
|
||||
קצת קיטש (ועוד מוצדק היסטורית) לא הזיק לאף גן אירועים. |
חזרה לעמוד הראשי |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |