מחקר בגובה העיניים

מחקר בגובה העיניים

מפעל ייחודי של הקרן הלאומית למדע שמטרתו להנגיש את הישגי המחקרים הממומנים על ידה לציבור הרחב.

עובדות ומספרים

< חזרה למחקרים
פרופ' יהושע שגיב
ביה"ס להנדסה ומדעי המחשב
האוניברסיטה העברית, קמפוס אדמונד י' ספרא
מדעים מדוייקים וטכנולוגיה
תקופת המחקר
2012-2016

תשובות מדויקות לחיפוש לפי מילות מפתח

כיום ניתן לקבל תשובות מדויקות ממסדי נתונים קשיחים, או לחילופין לחלץ בעזרת מילות מפתח תשובות כלליות ממבני נתונים רופפים יותר. מחקר זה נועד לשלב את היכולת לחפש לפי מילות מפתח עם האפשרות לקבל תשובות מדויקות ותמציתיות

נכתב ע''י יהושע שגיב, 15 אוק 2017

במסדי נתונים שומרים מידע בעל מבנה קשיח, ואפשר לקבל בעזרתם תשובות מדויקות, למשל לשאלה: מהי היתרה בחשבון הבנק שלי? אבל הדבר מצריך שימוש בשפת שאילתות שאיננה פשוטה. באינטרנט לעומת זאת יש דפים עם מידע שהוא בעיקר טקסטואלי, והחיפוש הוא לפי מילות מפתח. לכן קשה לקבל מהאינטרנט מידע תמציתי ומדויק. מטרת המחקר היא לשלב את היכולת לחפש לפי מילות מפתח עם הצורך לקבל תשובות מדויקות ותמציתיות שמתארות קשרים ברורים בין פריטי המידע השונים. ההנחה היא שהמידע מיוצג בגרף נתונים, שיש לו מבנה פחות קשיח מזה של מסד נתונים מסורתי. בפרט, חלק מהמידע יכול להיות טקסט חופשי. במסגרת המחקר פותחו אלגוריתמים לחישוב תשובות לחיפוש לפי מילות מפתח על גרף נתונים. התשובות הן תתי-עצים של הגרף שמכילים את מילות המפתח, ולפיכך הקשרים בין חלקי התשובה השונים הינם ברורים ומדויקים. בתורת הגרפים "גרף" הוא ייצוג מופשט של קבוצת עצמים, שחלקם או כולם קשורים זה לזה, בעוד ש"עץ" הוא מקרה פרטי (וחשוב במיוחד) של גרף. היתרון של עץ הוא שאפשר להבין בקלות ובמהירות את המבנה שלו ואת הקשרים שהוא מייצג. בנוסף, פותחו שיטות לדירוג התשובות לפי מידת הרלבנטיות שלהן. האלגוריתמים ושיטות הדירוג מומשו במערכת שמדגימה את היכולות המעשיות של תוצאות המחקר. כמו כן, בוצעו ניסויים רבים כדי להשוות את המערכת שפותחה לעבודות אחרות בתחום. הניסויים הראו שהמערכת טובה במידה ניכרת מהשיטות שהיו קיימות עד היום – הן בהיבט היעילות והן מבחינת איכות התשובות.

פורסם בתאריך - 10-נובמבר-2019 - התכנים נכונים ליום הפרסום

מילות מפתח

מסדי נתונים
איחזור מידע
חיפוש לפי מילות מפתח
גרף נתונים
מניה של תתי עצים בגרף
שיטות דירוג של תשובות
פורסם בתאריך - 10-נובמבר-2019 - התכנים נכונים ליום הפרסום