שהם והמרכז לחקר חדשנות בטכנולוגיות למידה

הציבור מוזמן להרצאתה של
ד"ר רעות צרפתי
המחלקה למתמטיקה ולמדעי המחשב, האוניברסיטה הפתוחה

חיזוי מבני רב-שפתי בעיבוד שפה טבעית

מועד: יום שני 17.11.2014 בשעה 14:30-13:00
מקום: אולם קנבר, בניין הכיכר

תקציר:  
מערכות לעיבוד שפה טבעית הן מערכות המקבלות טקסט לשוני כקלט ומחזירות ניתוח מבני שלו כפלט. המבנים הלשוניים שמתקבלים מהווים בסיס לאפליקציות טכנולוגיות רבות כגון: זיהוי קולי, שליפה ואחזור של מידע, תרגום אוטומטי, ורבים נוספים. הפרקטיקה הנפוצה היום לפיתוח מערכות כאלה מקורה בטכניקות לעיבוד השפה האנגלית, המניחות עיבוד נפרד של השכבה המורפולוגית, התחבירית (סינטקטית) והסמנטית. אולם, מסתבר כי בשפות עשירות מורפולוגית (כמו עברית, ערבית, גרמנית, טורקית, פרסית, הונגרית, ועוד), הפרדה כזו היא בעייתית, והתאמה של המודלים שפותחו לאנגלית לעיבוד שפות עשירות-מורפולוגית אינה מניבה תוצאות משביעות רצון .

ההרצאה תפתח באתגרים הקיימים בניתוח חוצה-לשונות ובהצעה לפרקטיקה חדשה לחיזוי רב-שפתי משותף, שאינו תלוי-שפה. המודל המוצע לומד התנהגות של שפה ספציפית באמצעות אימון (training ) של המנוע (שאינו תלוי-שפה) על נתונים מקורפוס. לאחר תהליך האימון המודל מסוגל לבצע ניתוחים של טקסטים שמעולם לא עובדו קודם, בצורה אפקטיבית ויעילה. בהרצאה יוצגו ניסויים שנערכו על שבדית, עברית ואנגלית – שפות השונות מהותית מבחינת המבנים הלשוניים שלהן, ויוסבר כיצד המודל מגיע לתוצאות שדומות לעיבודים שנערכו על שפה בודדת או על סוג מסוים של יישום, ואפילו טובות יותר.

מהממצאים עולה שיש קשר חשוב בין המחקר האמפירי על ניתוח חוצה-לשונות והתיאוריה הבלשנית על דקדוק אוניברסלי (UG ), וכי יש לכך השלכות מרחיקות לכת על תחומי הפְּסִיכוֹלִינְגְּוִיסְטִיקָה והמדעים הקוגניטיביים.

על המרצה:
ד"ר רעות צרפתי היא חברת סגל בכיר במחלקה למתמטיקה ומדעי המחשב באוניברסיטה הפתוחה. לפני כן, סיימה  פוסט-דוקטורט במכון וייצמן למדע . לד"ר צרפתי תואר בוגר במדעי המחשב מהטכניון, תואר מוסמך ללוגיקה מהמרכז ללוגיקה, שפה וחישוביות באוניברסיטת אמסטרדם, ודוקטורט במודלים סטטיסטים לעיבוד שפות טבעיות מאותו המרכז. ד"ר צרפתי מתמחה בניתוח אוטומטי (מורפולוגי, סינטקטי וסמנטי) של שפות עשירות מורפולוגית ופרסמה מאמרים רבים בנושא. היא ערכה גיליון כתב-עת (CL, the MIT press) המתמקד בניתוח שפות עשירות מורפולוגית, וכעת כותבת ספר בנושא. בנוסף, היא עבדה על אפליקציות של עיבוד שפה טבעית, כגון, ייצור אוטומטי של תגובות למאמרים, ותרגום אוטומטי של טקסט לקוד. לד"ר צרפתי ניסיון בתעשייה כמהנדסת תוכנה באינטל וכיועצת לענייני עיבוד שפה לחברות הזנק.