פרופ' יואב גולדברג
פיתוח, ניתוח ושימוש באלגוריתמים לעיבוד ממוחשב של שפות אנושיות.
CV
פרופ' יואב גולדברג חוקר חוקיות לשונית בייצוגים חישוביים לשפה אנושית, מערכות בינה מלאכותית יוצרת, וממשקי אדם-מכונה מבוססי בינה מלאכותית לאיחזור וארגון של ידע. בעבר, חקר בין היותר ייצוגים וקטוריים למילים, משפטים וטקסטים, הסביר והרחיב אולגוריתמים לשיכוני מילים במרחב וקטורי (word2vec ודומיהם), פיתח וניתח טכניקות לשיכוני מילים רב לשוניים ותלויי הקשר, וכן ומודלים שיכולים להבין ולעבד שפות מרובות.
בשנים האחרונות עסק פרופ' יואב גולדברג גם בחקר הטיות שיטתיות במודלי בינה מלאכותית לשפה ולתמונות, בפרשנות והגינות במערכות AI, במגבלות של מערכות AI, ביסודות לשוניים וחישוביים של מערכות AI. בתחום של ארכיטקטורה ולמידה של רשתות עצביות התמקד פרופ' יואב גולדברג בחקר יכולות חישוביות של רשתות עצביות, בפיתוח טכניקות רשתות עצביות דינאמיות ובחקירת מנגנוני למידה במערכות עצביות מלאכותיות.
כיום, מתמקד פרופ גולדברג בשלושה קווי מחקר מרכזיים: (1) הבנת המנגנונים החישוביים והלשוניים שמאחורי מודלי שפה גדולים, ומיפוי ושיפור גבולות ההבנה הלשונית במודלי שפה גדולים; (2) שימוש במודלי שפה גדולים וטכנולוגיית עיבוד שפה כדי לשפר יכולות של חיפוש, ארגון, הסקת מסקנות והפיכת מידע לידע בסביבה של הצפת מידע; ו-(3) איפיון ופיתוח מערכות לומדות מסוג חדש, המבוססות על מניפולציה של ידע דקלרטיבי בשפה אנושית ולא על עדכוני פרמטרים לפי פונקציות מטרה.
מבין תרומותיו הבולטות של פרופ' יואב גולדברג:
אלגוריתמים מתקדמים לניתוח תחבירי אוטומטי, ניתוח גישות מבוססות רשתות עצביות להבנת שפות פורמליות וטבעיות, טכניקות ניתוח רב לשוני, שיטות לניתוח ושליטה בייצוגים הפנימיים במערכות עיבוד שפה מבוססות רשתות נוירונים, הכללת עיבוד שפה טבעית לשפת סימנים, גישות חישוביות לכתיבה יצירתית (למשל, "Gaiku: Generating Haiku"), חיזוי מבנה שניוני של RNA, ואלגוריתמים לניתוח והסקת תובנות מטקסטים ביו-רפואיים.
לקורות החיים של פרופ' יואב גולדברג הקליקו כאן
Research
Understanding and creating texts in human language, deep learning methods, automatic syntax analysis, machine translation, Hebrew language processing, machine learning and structural prediction.
Courses
כחבר בסגל האקדמי של המחלקה למדעי המחשב, פרופ' יואב גולדברג מרצה בנושאים הבאים:
עיבוד שפה טבעית, שיטות למידה עמוקה, הבנה ויצירת טקסטים בשפה אנושית, ניתוח תופעות לשוניות ותופעות מכניסטיות במודלי שפה גדולים ובינה מלאכותית יוצרת, פיתוח וניתוח מערכות המשתמשות במודלי שפה גדולים, ופיתוח של טכנולוגיות לחיפוש, מציאת וארגון מידע וידע
Publications
פרסומים חשובים של פרופ' יואב גולדברג:
"On the Practical Computational Power of Finite Precision RNNs"
"DyNet: The Dynamic Neural Network Toolkit"
"Thinking like transformers"
"Assessing BERT's Syntactic Abilities"
"oLMpics-on what language model pre-training captures"
"Measuring and improving consistency in pretrained language models"
Media
הוקרה ופרסים:
בשנת 2018 נבחר פרופ' יואב גולדברג להיכלל ברשימת 10 הכוכבים הצעירים העולים בתחום הבינה המלאכותית של IEEE (הארגון המקצועי הטכני הגדול בעולם). פרופ' גולדברג צויין לשבח בזכות תרומתו בתחומי הסמנטיקה הלקסיאלית (הבנת משמעות של מילים), ניתוח תחבירי (ייצוג והשלכה אוטומטית של מבנה משפטים) ולמידה עמוקה לעיבוד שפה.
באותה שנה זכה פרופ' יואב גולדברג גם במענק היוקרתי מטעם ERC (תוכנית הדגל של האיחוד האירופי). במענק זה זוכים מחקרים ייחודיים פורצי דרך והם נבחרים בקפידה.
פרוייקט המחקר התמקד בפיתוח שיטות לקריאה אוטומטית של כמויות גדולות של טקסטים בשפה אנושית, וחילוץ מידע מתוכם. מדובר למעשה בגילוי פורץ דרך של פרופ' יואב גולדברג בתחום הבינה המלאכותית והאלוגריתמים המאפשרים למחשבים לקרוא ולהבין טקסטים בשפה האנושית;
בתחום הביג-דאטה בו המידע מסודר ומאורגן במאגרי נתונים גדולים, קיימים אין ספור כלים המאפשרים לנתח אותו, להפיק ממנו מידע ולהסיק מסקנות. אתגר גדול טמון בכמויות המידע ההולכות וגדלות של טקסטים כתובים. במחקר אותו הוביל, ביקש פרופ' יואב גולדברג למצוא פתרון שיאפשר למחשבים לקרוא ולהבין טקסטים בשפה האנושית.
משמעות מחקרו של פרופ' גולדברג היא שניתן להפוך למשל מידע רפואי טקסטואלי לנתונים ברי עיבוד, לדוגמה בתחום הסוכרת. את המידע שכאמור אינו זמין במסד נתונים, יש ללקט מתוך סיכומי אישפוז, מכתבי שחרור, מאמרים מדעיים ועוד, ולהפוך אותו למידע זמין אותו ניתן לארגן מחדש, לנתח ולהפיק ממנו תובנות לטובת מחקרי מחלת הסוכרת.
למחקרו של פרופ' גולדברג פוטנציאל לגילויים משמעותיים ולשימושים רבים, בין השאר בתחומי מדע רבים.
כמו כן פרופ׳ גולדברג ותלמידיו זכו וזוכים בפרסי ״עבודת הדוקטורט המצטיינת בתחום הבינה המלאכותית בישראל״, וכן במספר פרסי ״המאמר הטוב ביותר״ ו״מאמר ראוי לציון״ בכנסים בינלאומיים מובילים בתחום עיבוד השפה הטבעית ולמידת מכונה.
תאריך עדכון אחרון : 24/12/2024