מבנה המילון

 

לדף הראשי

כל קבצי המילון הם קבצי ASCII, הכתובים בתעתיק הלטיני. את פרטי התעתיק ניתן למצוא כאן.

קבצי המילים

המילון מורכב ממספר חלקים:

1. מילון שמות-עצם: במילון זה נמצאים כל שמות-העצם בצורת היחיד שלהם. עבור כל שם-עצם מצויין המין הדקדוקי שלו (זכר, נקבה, זו"נ), וכן מספר המציין את נטיית הריבוי הנכונה של שם-העצם. לדוגמה: עבור שם-העצם "ילד" יופיע מספר 1, שמציין שנטיית הריבוי מתקבלת על-ידי הוספת "ים"; עבור שם-העצם "תאנה" יופיע מספר 2, שמציין שנטיית הריבוי מתקבלת על-ידי הורדת "ה" והוספת "ים"; וכו'. מילון שמות-העצם נמצא בקובץ  lex0e.ma. הכניסות בקובץ זה נראות כך:

                        ·      ILD E1:Z

                        ·      TANH E2:N

(כלומר: הערך 'ילד' הוא שם-עצם עם נטיית ריבוי מס' 1, שמינו הדקדוקי זכר; הערך 'תאנה' הוא שם-עצם עם נטיית ריבוי מס' 2, שמינו הדקדוקי נקבה). הקובץ שמפרט את משמעות התבניות יתואר בהמשך.

שמות-עצם שיש להם נטייה מיוחדת נמצאים בטבלה נפרדת של "שמות-עצם מיוחדים", שנמצאת בקובץ lexmi.ma.

2. מילון פעלים: במילון זה נמצאים כל הפעלים בצורת הבסיס (עבר נסתר) שלהם. אין התייחסות לשורש ולבניין של הפועל, כיוון שמידע זה אינו חיוני לצורך הניתוח הצורני (ע' [אורנן תשנ"ה] ). לדוגמה, הפועל "הנשים" יופיע כערך בפני-עצמו ולא תחת הערך "נשם". גם הפועל "הונשם" יופיע כערך בפני-עצמו ולא כצורת הסביל של הפועל "הנשים". כל פועל מסומן באמצעות שני מספרים - הראשון מציין את נטיית-הבינוני הנכונה של הפועל, והשני מציין את נטיית-המקור הנכונה שלו, שמשמשת ליצירת נטיות העתיד, הציווי ושם-הפועל. לדוגמה: עבור הפועל "שמר" יופיע המספר 11, שמציין שנטיית-המקור הנכונה היא "שמור", ולכן נטיית-העתיד היא "אשמור, תשמור, תשמרי, ישמור, תשמור...". עבור הפועל "לבש" יופיע המספר 12, שמציין שנטיית המקור היא "לבש", ולכן נטיית העתיד היא "אלבש, תלבש, תלבשי, ילבש, תלבש...". מילון הפעלים נמצא בקובץ lex0p.ma. הכניסות בקובץ זה נראות כך:

                        ·      $MR P1:11

                        ·      LB$ P1:12

(כלומר: הערך 'שמר' הוא פועל עם נטיית בינוני מס' 1 ונטיית מקור מס' 11; הערך 'לבש' הוא פועל עם נטיית בינוני מס' 1 ונטיית מקור מס' 12).

פעלים שהנטיות שלהם אינן נגזרות באופן ישיר מנטיית-המקור נמצאים בטבלה נפרדת של "פעלים מיוחדים", שנמצאת בקובץ lexmi.ma .

3. מילון שמות-פרטיים: עבור כל שם-פרטי מצויין המין שלו. מילון זה נמצא גם הוא בקובץ lex0p.ma. הכניסות במילון זה נראות כך:

                        ·      $LMH: pZ

                        ·      ABIBI: pB  

כלומר: הערך 'שלמה' הוא שם-פרטי זכר, והערך 'אביבי' הוא שם-פרטי שיכול להיות גם זכר וגם נקבה (כי זהו שם-משפחה).

4. מילון שמות-תואר: עבור כל שם-תואר מצויין מספר שיכול לשמש להבחנה בין שמות-תואר עם נטיות שונות, אולם כרגע מספר זה אינו בשימוש. מילון זה נמצא גם הוא בקובץ lex0p.ma. הכניסות במילון זה נראות כך:

                        ·      RKRWKI: T1

כלומר: הערך 'רכרוכי' הוא שם-תואר.

5. מילון עבור יתר חלקי-הדיבר (תואר-הפועל, מילת-שאלה, מילת-חיבור, מילית): עבור כל מילה מצויין חלק הדיבר שלה. מילון זה נמצא גם הוא בקובץ lex0p.ma. הכניסות במילון זה נראות כך:

                        ·      $MA: x

                        ·      $WB: t

                        ·      @RWM: m

כלומר: הערך 'שמא' הוא מילת-חיבור, הערך 'שוב' הוא תואר-פועל והערך 'טרום-' הוא מילית. כמה מחלקי-הדיבר במילון זה הינם שנויים במחלוקת. למשל: המילה 'היום' מוגדרת במילון זה כערך מילוני עצמאי שחלק-הדיבר שלו הוא תואר-פועל. מבחינה דקדוקית טהורה, היה נכון יותר להתייחס למילה זו רק כאל נטייה של שם-העצם 'יום'. למרבה המזל, מכיוון שהמילון הוא קובץ טקסט, קל מאד לשנות אותו ולהתאים אותו להגדרות שונות של חלקי-דיבר: פשוט צריך למחוק את השורה שבה מוגדרת המילה 'היום' כתואר-פועל.

5. מילון מילות-יחס, שמות-גוף, שמות-מספר ופעלי-עזר: במילון זה נמצאות כל הנטיות האפשריות של מילים אלו כשהן מנותחות ניתוח מלא. למשל: במילון יופיעו הערכים "לי", "לך", "לכם"... וגם: "שניים", "שניכם", "שתיהן"... השימוש במילון לכל הנטיות האפשריות נועד לחסוך כתיבת כללים מפורטים לניתוח מילים אלו. מילון זה נמצא בקובץ lex10.ma . הפורמט שבו כתובים הניתוחים מוסבר במסמך שנזכר למעלה:

http://www.cs.technion.ac.il/~erelsgl/hmntx/tqstim/readme.doc

6. טבלת מחרוזות יוצאות-דופן: לטבלה זו הוכנסו כ20 מחרוזות, שהמנתח לא הצליח לנתח אותן נכונה מסיבות שונות[1]. עבור כל מחרוזת נשמרים בטבלה זו כל הניתוחים האפשריים עבורה. הטבלה נמצאת בקובץ lexyd.ma.

קובץ התבניות הצורניות

מלבד המילון, משתמש המנתח הצורני גם באוסף של תבניות צורניות. הנה דוגמה לתבנית:

   =>   ?, שם-עצם עם כינוי-שייכות למדבר

התו "?" הוא תו-כללי שמייצג כל רצף של אותיות. לכן התבנית "" מתאימה לכל מילה שמסתיימת באות י. המשמעות של התבנית היא, שמילה שמסתיימת באות י יכולה להיות שם-עצם עם כינוי-שייכות למדבר, והערך המילוני המתאים מתקבל על-ידי הסרת האות י. למשל:

ספרי   =>   ספר, שם-עצם עם כינוי-שייכות למדבר.

התאמת מילה לתבנית זו אינה מעידה בהכרח כי היא אכן שם-עצם עם כינוי שייכות, למשל המילה "יהודי" מסתיימת באות י אך אינה שם-עצם אלא תואר. לפיכך, המנתח הצורני אינו מתאים מילים לתבנית בלבד, אלא גם בודק שהערך המילוני המתקבל אכן מופיע במילון המתאים. במקרה הזה, הערך המילוני שיתקבל מהפעלת התבנית יהיה "יהוד", שאינו מופיע במילון שמות-העצם, ולכן המנתח לא יקבל את הניתוח כשם-עצם עם כינוי-קניין.

דוגמה נוספת לתבנית היא:

י21ו3   =>   321, פועל עתיד נסתר

המספרים 1, 2, 3 מייצגים אותיות כלשהן. תבנית זו מתאימה, למשל, למילה:

ישמור   =>   שמר, פועל עתיד נסתר

במקרה זה לא מספיק לבדוק שהערך המילוני המתקבל אכן מופיע במילון. המילה "ילבוש", למשל, מתאימה לתבנית, והערך המילוני המתקבל "לבש" מופיע במילון, אבל המילה "ילבוש" אינה מילה חוקית. בשל כך, במקרה זה יבדוק המנתח הצורני בנוסף – לפי מילון-הפעלים – שנטיית העתיד של הפועל המתקבל אכן מתאימה לתבנית שהופעלה. עבור הפועל "שמר" הנטייה אכן מתאימה ולכן המנתח יקבל את המילה "ישמור", אבל עבור הפועל "לבש" הנטייה מתאימה לתבנית אחרת – התבנית:

י321   =>   321, פועל עתיד נסתר

ולכן המנתח לא יקבל את המילה "ילבוש". בדיקה דומה מתבצעת עבור תבניות-ריבוי של שמות-עצם, נטיות-בינוני של פעלים ונטיות-מקור (כולל עתיד, ציווי ושם-הפועל) של פעלים. לכל תבנית כזאת יש מספר, שמקשר בינה לבין כל הערכים המילוניים שעשויים לנטות לפיה.

רשימת התבניות הצורניות נמצאת בקובץ tavniot.ma . הסבר מלא יותר על התבניות ניתן למצוא בתיעוד של המנתח הצורני.



[1] למשל, למחרוזת "רוצה" יש שני ניתוחים כפועל-עזר: פועל-עזר זכר ופועל-עזר נקבה. מילון פעלי-העזר מאפשר להתאים לכל מחרוזת רק ניתוח אחד כפועל-עזר, ולכן המנתח לא יצליח למצוא את כל הניתוחים האפשריים עבור מחרוזת זו.

[אורנן תשנ"ה]  עוזי אורנן: "גישה חדשה לתיאור הפועל ולהוראתו והדגמתה בנטיית הבינוני", מקורות 4, עמודים 32 - 43 (תשנ"ה).

This page should be viewed using Microsoft Internet Explorer 4+, with  Hebrew support. If you don't have Hebrew support, or don't read Hebrew, you can read a partial  English translation here.

כתובת האתר: http://www.cs.technion.ac.il/~erelsgl/bxi/hmntx/milon/teud_milon.html

להערות ותגובות: erelsgl @ cs . technion . ac . il