22969 יישומי שפה טבעית מבוססי למידת מכונה
22969 יישומי שפה טבעית מבוססי למידת מכונה1
4 נקודות זכות
שיוך: תואר שני / למידת מכונה וניתוח נתוני עתק
תנאי קבלה: קבלה לתואר שני בלמידת מכונה וניתוח נתוני עתק. ידע קודם דרוש: מבוא ללמידה חישובית, מתמטיקה ללמידת מכונה, למידה עמוקה.
מטרות הסמינר
קורס זה מיועד להקנות לסטודנטים לתואר השני בלמידת מכונה הבנה מעמיקה ביישומי שפה טבעית מבוססי למידת מכונה. תחום זה עוסק בשיטות וטכניקות המאפשרות למחשבים להבין, לנתח וליצור שפה אנושית, ומהווה עמוד תווך בהתקדמות הטכנולוגיה המודרנית, בדגש על בינה מלאכותית ולמידת מכונה.
נושאי הלימוד
1. יסודות:
-
טוקניזציה
-
מודלי N-gram
-
סיווג טקסט
-
שיכוני וקטורים
-
טרנספורמרים, GPT
2. שימושים:
-
תרגום מכונה
-
מודלים יצרניים: צ'אט, retrieval augmented generation
-
זיהוי קול, text-to-speech
3. ניתוח בלשני:
-
זיהוי חלקי דיבר
-
תיוג תפקיד סמנטי
-
ניתוח תלויות
-
זיהוי יחסים, אירועים וזמן
כחלק ממטלות הקורס יהיה על הסטודנטים להעביר הרצאות בנושאים הנ"ל ובסיומו יגישו
הסטודנטים פרויקט יישומי.
הקורס יתבסס על קריאה באסופת מאמרים.
1 להשלכות על צבירת נ"ז בשל חפיפה עם קורס(ים) אחר(ים), ראו פירוט החפיפה.