net.nana.co.il
דואר פורומים צ'ט תוכנות חדשות ספורט תרבות מחשבים לימודים בריאות אוכל ג'נענע קניות
  שרותים נוספים בנענע
חיים ברשת
תרבות דיגיטלית
טכנולוגיה ומדע
וירוסים ואבטחה
מולטימדיה ובידור
סלולר, גאדג'טס ופאלם
משפט, כלכלה וממשל
משחקים
2004: שנת האינטרנטלוויזיה

השבוע בניוזלטר חיים ברשת



תוכנות ומשחקים
תמיכה וטיפים
אתר אישי
מדורים קבועים
פורומים
עלון חיים ברשת > גיליון 154 @ 08.03.2004
דרושים: אנשים עם ראש פתוח
20:57 07/12/2003
לשמע צירוף המילים "קוד פתוח", דמיינתם לבטח תמונות של גאוני מחשב, או לפחות סוג של לוחמי חופש ממוחשבים. מי שאשם בזה הם בעיקר אנשי התקשורת (עוד מושג מכליל) שאוהבים להדביק תוויות ומחביאים את האנשים שמאחורי הקלישאות.
הנה ההזדמנות שלכם לראות מבעד לתדמית. נדב הראל הוא מתכנת בקוד פתוח. בחודשים הבאים פרי יצירתו יגיע לאלפי מחשבים בארץ, אם לא הרבה יותר.

כשהגיע לגיל 16 החליט נדב הראל שנמאס לו מהתיכון. בתוך זמן קצר פרש ממסגרת הלימודים הסטנדרטית ועבר רשמית ללמוד בבית. בניגוד להרבה פורשים-אחרי, הראל לא הלך לכלות את זמנו "על הברזלים" או בים. ההיפך הוא הנכון.

כשרובנו עוד התעסקנו בלבחור ערוץ מועדף בממיר, סיים הראל את כל הבגרויות שלו בלימודי-בית והחל ללמוד בטכניון. בגיל 19 סיים את התואר הראשון שלו במתמטיקה. את שירותו הצבאי, בן שש שנים, עשה בתחום המחשוב ב"רפאל". בזמן השירות, הספיק גם לסיים את התואר השני שלו במתמטיקה. היום, בגיל 28, עובד הראל במחלקת המחקר של חברת IBM ובזמנו הפנוי הוא הספיק גם לפתור את אחת הבעיות המציקות ביותר למשתמשי המחשב בעברית.

כפי שכתבנו כאן, לא בגלל תקופת נעוריו יוצאת-הדופן של הראל נקבע הראיון הזה. הסיבה הרשמית היא היותו ההוגה ומחצית מצוות המפתחים של Hspell, תוכנת האיות העברית הראשונה מסוגה בעולם שנכתבה בקוד-פתוח. Hspell היא גם המאיית הרשמי של אופן-אופיס בעברית, המתחרה החדשה (והחינמית) של מיקרוסופט-אופיס, וחלק בלתי נפרד מהמפכה שמתכננת אופן-אופיס לעשות בנתח השוק של מיקרוסופט.

לפני קצת יותר משבועיים התקנתי בעצמי את האופן-אופיס. לא מעט בעיות ותקלות מלווים את השימוש השוטף באופיס הזה. המאיית, מאידך, עובד ללא דופי. כמעט קשה להאמין שעשו אותו שני חבר'ה צעירים, בזמנם החופשי וללא מטרות רווח נראות לעין.
ההתחלה
איך הכל התחיל?
"זה היה לפני שלוש שנים בערך. חשבתי לעצמי מה מונע ממערכת הפעלה כמו לינוקס להצליח בארץ. כל מי ששאלתי אותו לגבי מעבר ללינוקס אמר שהוא זקוק לתמיכה בעברית, שלא הייתה קיימת בה אז. בפועל, זה מנע מאנשים לעבור אליה. הרגשתי שצריך לעשות משהו בשביל לקדם את העניין הזה ולפתור את הבעיה אחת ולתמיד, ולא רק ללינוקס. לעשות עברית שתעבוד עם כל מערכת הפעלה. אחד הדברים הראשוניים שחשבתי עליהם זה עניין המאיית העברי. הפרוייקט הזה הוא דוגמה חיה למשהו שחברה חיצונית לא יכולה לעשות. זה חייב להיות מישהו שדובר עברית ובקיא ברזי השפה.”

אז מה עשית?
"דיברתי עם חבר שלי, דן קניגסברג, על הרעיון, והחלטנו שנעשה את זה ביחד. ישבנו איזה שבועיים על אבטיפוס בסיסי וראינו שזה עובד, לפחות ברמה הכללית. כל זה קרה לפני שלוש שנים.

מה קרה מאז?
"התעייפנו. קצת נמאס היה לנו להתעסק עם זה. שנתיים בערך אחרי שעשינו את האבטיפוס הרעיון נזנח, ואף אחד לא טרח לדחוף את זה קדימה. אישית, זה תמיד נראה לי מעניין אבל קצת מוגבל. בקיצור, לא ממש משך אותי. את מה שעשינו עד אז העלנו לרשת ועזבנו את זה.”

מתי חל המפנה?
"פנה אלינו אחד שראה את מה שהעלינו לרשת, ורצה להשתמש בבסיס של זה לצורך מערכת לניתוח מורפולוגי שהזדקק לה. פתאום הבנתי שזה הרבה יותר מעניין מבודק איות, ואפשר לעשות עם זה עוד הרבה דברים אחרים. תוך זמן קצר החזרתי את דן לעניין, והתחלנו לעשות את זה מחדש. החלוקה הייתה כזאת – אני עובד על שמות העצם, הוא עובד על הפעלים".

נשמע לי שקצת דפקו אותך בחלוקה.
(צוחק) "כן, הא. מכאן פשוט המשכנו עד שהמוצר היה מוכן".

הפיתוח
אז איך זה עובד?
"הרעיון די פשוט. יש לבודק האיות שפיתחנו רשימה של מאות אלפי מילים נכונות בעברית. מילים שלא נמצאות ברשימה הזאת, מסומנות כלא נכונות. הבעיה בעברית שיש בה המון תחיליות, סופיות והטיות שונות. אז בנינו תוכנה שמצטרפת אותן בצורה אוטומטית לשורשים של המילים הנכונות שבמאגר".

מפחיד קצת להתחיל מאפס את המילון העברי.
"חשבנו לקחת הרבה עיתוני אינטרנט ולבדוק מילים נפוצות. אבל קשה להגיע עם זה לרשימה מלאה. יש גם הרבה מילים שנכתבות באופן נפוץ עם שגיאות, והן עלולת להיכנס לרשימה כמילים נכונות. לכן יצרנו רשימה גדולה של מילים בסיסיות, כמו "כלב" או "הלך" באופן ידני, והתוכנה הוסיפה להן לבד את הנטיות. לכל מילה הכנו גם רמז שיעזור לתוכנה להטות אותה נכון. אפשר לאמר שהיא עושה ניחוש-חכם לגבי חלק גדול מההטיות.”

עברית קשה שפה, הא?
"יש במערכת 8,000 שמות עצם,5,000 פעלים ועוד אלפיים מילים שנופלות בין הכסאות (כמו שמות של מקומות, למשל). מלכתחילה, הרעיון בפרוייקט הזה היה לעשות משהו חופשי שאין עליו זכויות יוצרים של חברה אחרת. לא יכולנו גם להעתיק מילים מהספלר של מיקרוסופט או משהו, שלא יבואו אלינו בטענות אח"כ. בקיצור, אספנו מהאינטרנט אתרים, עיתונים, מסמכים גדולים בעברית, ובדקנו איזה מילים הספלר לא מכיר מתוכם. את המילים שבאמת קיימות בעברית – הוספנו לתוכנה. בסופו של דבר, עשיתי אלגוריתם שמכווץ את כל הרשימה (משהו כמו 400,000 מילים) ל-100Kבערך.

כמה זה מפספס?
"פחוד מאחוז אחד פיספוס. הוא עדיין קצת פחות טוב מהספלר של מיקרוסופט, אבל אפשר לומר בלב שלם שהוא מתחרה איתו. לי אישית כבר מאוד קשה למצוא פועל שחסר. אנחנו מנסים למצוא פועל חסר כבר חודש ולא מצליחים.”

איך נערכת בקרת האיכות?
"פשוט מריצים את הבודק על מסמכים גדולים ורואים את כמות השגיאות של התוכנה, כלומר כמה שגיאות שלא היו, מצאה התוכנה. עכשיו הן די נדירות"

מה דעתך על זה של מיקרוסופט?
"בסופו של דבר הבודק של מיקרוסופט הוא לגמרי לא רע. נדמה לי שהם משתמשים במאגר המילים של "רב מילים" אבל אני לא בטוח. התחרות, בכל מקרה, היא לא מול מיקרוסופט. כל עוד מיקרוסופט לא מוכרים את המוצר שלהם ללינוקס או למקינטוש, זה הספלר היחיד שיש למשתמשים של המערכות הללו. אין להם אלטרנטיבה"

לא הייתה דרך אחרת מלבד להמציא את הגלגל, אגב?
"בעברית, לעומת אנגלית, מאגר המילים הוא מעין סוד. לבן אדם הפשוט אין מאיפה להשיג רשימה כזו. ברגע שאנחנו עשינו את העבודה הזאת פעם אחת, יוכל כי מי שירצה להשתמש בזה מעכשיו ועד סוף הדורות. בחינם.”
הפריצה
מתי נוצר המגע עם אופיס-אופיס?
"אני פניתי אליהם. בחודש דצמבר האחרון הוצאנו את הגירסה הראשונה לציבור של ה-Ispell, שפספס באותה תקופה כעשרה אחוזים מהמילים. כבר אז היה ברור לי שמדובר במוצר שיפעל בעברית. שאלתי את החבר'ה של אופן-אופיס אם הם מעוניינים לצרף את זה לחבילה שלהם. בהתחלה הם אמרו לי שהם לא חושבים שיהיה באופיס שלהם בודק איות, אבל אחרי שהראיתי להם מה יש לנו, הם לקחו את קוד הפיתוח של התוכנה, שינו אותו על מנת שיתאים לשאר המערכת שלהם – וצירפו אותו לחבילה. זה מה שיפה בקוד הפתוח, אני אתן לך דוגמה: מישהו התאים את הספלר שלנו למקינטוש. לי אין מושג במקינטוש, והפיתוח שלי עובד עכשיו גם על מקינטוש".

היו בקשות מסחריות?
"כבר פנו אלינו מאיזו חברה שמתעסקת בהודעות, כמו "Call center", שהתעניינו אם אפשר להשתמש באפליקציה שלנו ולשלם לנו תמורת ההתאמה לתוכנה שלהם. כרגע, פשוט אין לי זמן לזה"

אפשר למכור בכלל תוכנה בקוד פתוח?
"התוכנה נמצאת ברישיון חופשי. זה אומר שאסור לשום חברה פרטית לקחת את קוד המקור, לשנות אותו ולמכור אותו. אם חברה מסויימת תרצה להרוויח על המוצר, היא תצטרך רישיון מיוחד ממני ולזה יש ערך כספי"

זה נעשה מתוך שליחות לשמה?
"אחד הדברים זו הרגשת השליחות. יותר מזה, היה פה הרבה עניין. קניתי מילונים וספרים. ישבנו על זה המון שעות. זה התחיל להיות אתגר וכיף. אחד היתרונות היה היעדרו של בוס שישב לנו על הראש. כל אחד עשה מה שבא לו ומתי שבא לו.”

אז בפעם הבאה שאתם שומעים על עוד פיתוח של אנשי קהילת הקוד הפתוח, תקדישו שניית מחשבה לאנשים שעובדים, על חשבונם, כדי ליצור כאן עתיד חופשי, חינם וטוב יותר.
     

עוד בערוץ
מורידים את הזבל
בזמנכם החופשי, ריסטרט
מלחמות הקבצים: לכל כדור יש כתובת
לכתבה זו לא התפרסמו תגובות.
 
 
שימושון
חדשות ומגזינים 
תוכנות מומלצות 
משחקים ברשת 
מנועי חיפוש 
בידור ומולטימדיה 
פירסום בנענע  |  צור קשר  |  דרושים בנענע  |  תנאי שימוש בנענע  |  מדיניות פרטיות  |  הפוך את נענע לדף הבית
כל הזכויות שמורות 104-1999 © נטוויז'ן בע"מ