מפגש פורום מדעי הרוח הדיגיטליים: מיפוי במדעי הרוח
Mapping projects in the Digital Humanities Forum

(English summary of the Talks below)
המפגש הראשון של הפורום למדעי הרוח הדיגיטליים באוניברסיטת חיפה אירח שני פרויקטים העוסקים במיפוי: ״מיפוי התפוצה היהודית בשלהי העת העתיקה 117-650״ של אייל בן אליהו מן החוג לתולדות ישראל, ו״עזה בשלהי התקופה העותמנית״, שיתוף פעולה של יובל בן בסט מן החוג להיסטוריה של המזרח התיכון. ושל יוהן בוסוב מאוניברסיטת טובינגן:

 

The first meeting of the Forum for Digital Humanities at Haifa University hosted two mapping projects: Eyal Ben Eliahu’s “Mapping the Ancient Jewish Diaspora: 117-650 ce” and Yuval Ben Bassat’s Gaza during the Late Ottoman Period, a collaboration with Johann Büssow at the University of Tübingen, funded by a grant from the German-Israeli Foundation for Research and Development (GIF grant 1226; funding period: 2016-2018)

Mapping the Ancient Jewish Diaspora, a project in progress - currently offers three datasets: the first provides an initial mapping of archaeological sites and place for which there there are textual testimonies about Jewish presence, based on TAVO map BVI18 and mapped to the DARE and Pleiades entities. A second map presents identifications of the biblical table of nations related to a Misrashic interpretation of the Genesis source, and two Talmudic versions, documenting also varying degrees of certainty. The third map aims to portray the inhabited world as it emerges from rabbinic literature. Ben Eliahu’s ambition is to expand the project into GIS layered database.

Gaza during the Late Ottoman Period

Gaza during the Late Ottoman Period is a research project on the history of Gaza and the surrounding region in the late Ottoman period, despite the pivotal role it continued to play as the economic, administrative, cultural, social and political center for its hinterland and as a crossroads of trans-regional flows of goods, people and ideas. The research is based on primary sources written in Arabic, Ottoman Turkish, Hebrew and a range of European languages, which are located today in archives in Turkey, Israel, Palestine and other countries . The main sources of the data in the Gaza Historical Database are the Ottoman census registers of the Gaza region from 1905-7. On the basis of the database, the project offers an interactive map to explore locations in late Ottoman Gaza and its region. Historical maps of Gaza and aerial photographs of 1918 are overlapped on the Open Street Map and sites and addresses are located on them. Also connected to the map are a gallery of images of people, landscapes and the architecture of Gaza and the region, such as photographs, architectural drawings and plans.

פרוייקט קוד פתוח מוקדש לכלים ומשאבים לעיבוד ממוחשב בשפה העברית

English Summary: a open source, open data community was launched to share work and resources for Hebrew NLP: NLPH.

 

עיבוד שפה טבעית (באנגלית Natural Language Processing ומכאן גם הקיצור: NLP) הוא תחום הקשור לבלשנות חישובית ושמטרתו להנגיש את השפה בה דוברים בני אדם למחשבים, כביכול לגרום למחשבים ׳להבין׳ אותה, בכדי לאפשר להם לפעול באמצעותה באופן המיטבי. מדובר באחד האתגרים המרכזיים בתחום האינטליגנציה המלאכותית, תחום רחב וחיוני בתעשיית המידע.

בחלק מן היישומים של עיבוד שפה טבעית אלה אנו נתקלים לעתים תכופות - בגילוי ותיקון האיות שבעורך הטקסט בדואר האלקטרוני, בהשלמה האוטומטית המוצעת במנועי החיפוש או כאשר אנחנו כותבים מסרון והטלפון החכם מתקן אותנו. כולנו נחשפים גם לפער הקיים בין הכלים לעיבוד שפה טבעית באנגלית לאלה בעברית, ערבית ושפות אחרות. כמות דוברי השפה הקטנה יחסית וגורמים אחרים הנוגעים להעדר משאבים, פרקטיקות עבודה סגורות או עניין מסחרי מוגבל מביא לפער זה ביכולות הניתוח והעיבוד של שפות נדירות יותר. מעבר לזה, השפה העברית עם הכתיב חסר התנועות שלה, ועם המורפולוגיה העשירה שלה, מציבה אתגרים ייחודיים בפני יישומים מתקדמים הזקוקים לתשתית חישובית רחבה, המבוססת על ידע לשוני. בכדי לענות על צורך זה הקים משרד המדע והטכנולוגיה בשנת 2003 את מרכז מיל"ה, מרכז הידע לשפה העברית. מאז, הצטמצמו המשאבים הממשלתיים שהושקעו בתחום ואילו הטכנולוגיות כמו גם השפה העברית עצמה התחדשה ודורשת משאבים וכלים חדשים. מעבר לכל, תחום משאבי השפה העברית שהיה חלוצי באימוץ טכנולוגיות ממוחשבות הפך למיושן ומפגר אחר מקבילותיו ה׳צעירות׳ ביותר בעולם, משום שהללו נולדו לתוך סטנדרטים חדשים של קוד פתוח וידע פתוח, או מיהרו לאמץ אותן, ואלו מהווים ערובה מרכזית לקיימות ולהתפתחות הדינמית של התחום, לטובת האקדמיה והתעשייה גם יחד.

לאחרונה קמה יוזמה 'מן השטח' של קהילת הקוד הפתוח. שי פלצ'י, סטודנט לתואר שני באוניברסיטה העברית ועובד בחברת זן-סיטי יזם ופתח את קבוצת NLPH בפלטפורמת הגיט-האב: פלטפורמה לעבודה משותפת ולשיתוף תוכנה. דיונים מרתקים וחשובים מתנהלים בקבוצת פייסבוק וברשימת תפוצה, ורשימה ראשונית של משאבים וכלים חישוביים לעיבוד עברית גובשה ומופיעה כאן. שותפים ליוזמה הסדנא לידע ציבורי, ארגון דאטה-האק הישראלי, מעבדתו של יואב גולדברג באוניברסיטת בר אילן ומעבדתה של רעות צרפתי לעיבוד שפה טבעית באוניברסיטה הפתוחה. שותפים נוספים מתקבלים בברכה.

איגום המשאבים והמעבר לסביבת עבודה בקוד פתוח היא צעד חשוב והכרחי קדימה, גם אם אין בו פתרון מספק לצרכים הציבוריים והמחקריים שעולים בנוגע לשימושים ממוחשבים בשפה העברית. משאבי המידע לגבי השפה עדיין מוגבלים מאד מבחינת הסוגה והתקופה, ולאדם מן הציבור, או חוקר ספרות או שפה שאינו מתכנת עדיין אין אפשרות לגשת באופן עצמאי אל הכלים, לנתח את השפה, לתייג טקסט או לחקור, במידה ובאופן שהטכנולוגיה מאפשרת, ובמידה ובאופן שאפשרויות אלה קיימות לגבי שפות אחרות. גופי תשתית בין לאומיים כמו דריה - המוקדשת לתשתיות למחקר במדעי הרוח בכלל, או קלארין - העוסקת במשאבי חקר שפה, אמונים על מתן פתרונות לצרכי תשתית כאלה העומדים בסטנדרטים של פתיחות וקיימות. יש לקוות שהיוזמות ׳מן השטח׳ יושלמו על ידי מימון ממשלתי במסגרת תמיכה ותקנון בינלאומית, כדי להגיע לפתרון המיטבי לעברית בפרט, ולמדעי הרוח בישראל בכלל. 

nlpn NLPH

שנה טובה וברוכים הבאים!

אנו שמחות להשיק את אתר מדעי הרוח הדיגיטליים בישראל, המוגש לכם מטעם פרוייקט דזיר (DESIR) בספריית אוניברסיטת חיפה.

פרוייקט דזיר פועל לקדם את צירוף מדינת ישראל לקהילה האירופאית של דריה (DARIAH), המוקדשת לתשתיות דיגיטליות פתוחות למחקר במדעי הרוח והאמנויות. על גבי אתר זה נספר לכם על אירועים, פרוייקטים ומחקרים בתחום, נשתף עמכם טיפים, משאבים וכלים, נבאר מושגי יסוד, ובעיקר ננסה לעורר דיון בכל הנוגע למדעי הרוח הדיגיטליים ולתשתיות הפתוחות החיוניות להם.  בשבועות הקרובים נספר לכם, בין השאר, על אירועי הקיץ שחלף, שהיה עשיר באירועים והתפתחויות בתחום. עקבו אחרינו דרך אתר זה, דרך דף הפייסבוק של הספרייה או קבוצת הפייסבוק ״רוח דיגיטלית״.