פרופ' עוזי אורנן (שגם הגיב במאמר זה) ירצה ביום ג', 25.2, בשעה 11:00, במרכז המחקר של IBM בחיפה1 שצמוד לאוניברסיטת חיפה. על ההרצאה (מתוך ההזמנה):
תשתית יסוד לעיבוד עברית ויישומן במכונת דיבור ומנוע חיפוש
taštit ysod l-čibbud ha-‘ibrit w-yiśśuman b-mkonat dibbur w-b-mnoa‘ ĥippuś
בהרצאה נעלה את ארבעת חסרונות הכתב העברי ונראה איך אפשר להתגבר עליהם על ידי הכנסת כתב פונמי. תוכנות היסוד כוללות (1) מסירת כל אפשרויות הקריאה של כל מחרוזת מילים, (2) מחיקת קריאות בלתי אפשריות על פי בדיקה תחבירית, ו (3) בחירת הקריאות האפשריות על יסוד מילון תחבירי-סמנטי רחב היקף. נראה (ונשמיע) את פעולת מכונת הדיבור שנבנתה על יסוד שני השלבים הראשונים, ונציג את הישגי מנוע החיפוש הסמנטי, המסמן רק את המשמעות המבוקשת של מילה רב משמעית. המנוע הוא פרי מעבר על כל שלושת השלבים של תוכניות היסוד.
b-harca`a na‘le et arba‘at ha-ĥesronot šell ha-ktab ha-‘ibri w-nar`e eik epšar lhitgabber ‘leihem ‘al ydei haknasat ktab fonemi. toknot ha-ysod kol_lot : (1) msirat koll epšaruyot ha-qri`a šell koll maĥrozet millim, (2) mĥiqat qri`ot bilti `epšariyot ‘al pi bdiqa taĥbirit, w- (3) bĥirat ha-qri`ot ha-epšariyot ‘al ysod millon taĥbiri-semanţi rĥab heqqep. nir`e (w-našmia‘) et p‘ulat mkonat ha-dibbur še-nibnta ‘al ysod šnei ha-šlabbim ha-ri`šonim, w-naççig et heśśegei mnoa‘ ha-ĥippuś ha-semanţi, ha-msammen raq et ha-mašma‘ut ha-mbuqqešet šell milla rabb=mašma‘it. ha-manoa‘ hu` pri ma‘bar ‘al koll šlošet ha-šlabbim šell tokniyot ha-ysod.
1 גילוי נאות - אני עובד במרכז המחקר של IBM בחיפה.
|