זיהוי שפת האם

 

מוטיבציה:

בדיבור יש מידע לא ורבלי (אינטונציה, הפסקות, ...) שאינו קיים בטקסט כתוב. במסגרת הפרויקט ננסה לנצל מידע זה להבנת הדיבור. יעמדו לרשותכם תוכנות לעיבוד קול. תשתמשו בשיטות לימוד מכונה (Machine Learning) ובינה מלאכותית. התוכנית שתכתבו תלמד מדוגמאות מתויגות ואתם תיצרו את הדוגמאות. הפרויקט עוסק באחד ההיבטים בתחום "הבנת דיבור": זיהוי שפת האם של דובר באנגלית. זיהוי שפת האם עשוי לעזור לתכנות להמרת דיבור לכתב (speech to text). כמו כן, כיוון ששפת האם מגדירה תרבות שלמה ומשפיעה על הביטויים שהדובר עשוי להגות.

 

תיאור הפרויקט:

בפרויקט תידרשו לכתוב תוכנה עם:

 

אמצעי המחקר:

 

ספרות:

"Spoken Language Processing,

A Guide to Theory, Algorithm, and System Development"

מחברים:          Xuedong Huang, Alex Acero, Hsiao-Wuen Hon

פרק 17, עמודים 853-866