זיהוי קטעים חשובים לדובר

 

מוטיבציה:

בדיבור יש מידע לא ורבלי (אינטונציה, הפסקות, ...) שאינו קיים בטקסט כתוב. במסגרת הפרויקט ננסה לנצל מידע זה להבנת הדיבור. יעמדו לרשותכם תוכנות לעיבוד קול. תשתמשו בשיטות לימוד מכונה (Machine Learning) ובינה מלאכותית. התוכנית שתכתבו תלמד מדוגמאות מתויגות ואתם תיצרו את הדוגמאות. הפרויקט עוסק באחד ההיבטים בתחום "הבנת דיבור". בזמן הדיבור דוברים מדגישים בצורה קולית את הקטעים החשובים להם בתוך הדיבור. על-כן, ניתן להשתמש במידע על קטעים מודגשים בדיבור לזיהוי המידע החשוב לדובר בדיבורו.

 

תיאור הפרויקט:

בפרויקט תידרשו לכתוב תוכנה עם:

·        קלט:   

o       קלט למטרת לימוד:

§         אוסף קבצי דיבור.

§         לכל קובץ דיבור יהיה קובץ טקסט שבו מופיעים זוגות זמני התחלה והסוף של קטעים מודגשים בדיבור.

o       קלט למטרת הערכה:

§         קובץ דיבור.

o       פלט לשלב הערכה: קובץ טקסט שבו מופיעים זוגות זמני התחלה והסוף של קטעים מודגשים בקובץ הדיבור. לכל קטע התוכנית תצרף תג אחד:

§         ציון בין 0 ל- 1 שתציין את רמת הביטחון של התוכנה בהחלטתה.

 

אמצעי המחקר:

·        PRAAT:          תוכנה לעיבוד קול

·        C4.5:               תוכנה עבור Machine Learning

·        JAVA:             את התוכנה תכתבו ב- JAVA

·        ASR:               Speech Recognizer מתוך Microsoft Speech SDK 5.1

 

ספרות:

ספר:

כותרת:

"Spoken Language Processing,

A Guide to Theory, Algorithm, and System Development"

מחברים:          Xuedong Huang, Alex Acero, Hsiao-Wuen Hon

פרק 17, עמודים 853-866