תחשבו על הפאזל הגדול ביותר בעולם. חשבתם? עכשיו תחשבו מה היה קורה אילו הוא היה מורכב ממילים, על דפים וקרעי דפים, ומפוזר בכל מיני מקומות מסביב לגלובוס
זהו המצב שבו נתקלים חוקרי המקרא כיום.
ישנם כ-320 אלף דפים וקרעי דפים הרשומים בעברית, ארמית, ויודו-ערבית (ערבית הכתובה באותיות עבריות) אשר מפוזרים בכ-67 ספריות ואוספים פרטיים מסביב לעולם, ורק חלק קטן מהם נאסף וקוטלג.
החוקרים צריכים לבדוק ולהחליט אם טקסט שנמצא באוניברסיטה באנגליה, תואם טקסט אחר שנמצא באוניברסיטה ברוסיה מבחינת כתב היד, והכול בצורה ידנית המעייפת ומאתגרת את העין והזכרון כל יום מחדש.
במקום זאת, רשת בת 100 מחשבים יושבת בחדר מרתף באוניברסיטת תל אביב, ובאמצעות תוכנה העושה שימוש באינטילגנציה מלאכותית שנכתבה במיוחד למטרה זו, מנתחת ומשווה 500 סמנים ויזואליים לכל אחד מ-157,514 חלקי המגילות, ובודקת סך של 12,405,251,341 צירופים אפשריים.
דגם של עליית הגג המקורית בבית הכנסת בקהיר |
התהליך החל ב-16 למאי, וצפוי להסתיים ב-14 ביוני, על פי צפי באתר הפרוייקט.
"במהלך שעה אחת, המחשב מסוגל להשוות 10 מיליון צירופים – זהו דבר שבן אנוש אינו מסוגל לעשות בתקופת חיים שלמה", כך מספר רוני שווק, אחד ממנהלי הפרוייקט.
"החוקרים כיום ימצאו כאן כלי בעל כוח עצום, שיאפשר להם למצוא חלקים נוספים המתחברים לקרע המגילה עליהם הם עובדים – בתוך שניות. זה כמו למצוא מחט בערימת שחת!"
שם הפרוייקט הוא פרוייקט גנזים, בראשותו של פרופסור יעקב שויקה.
אחד מהדפים מהגנזך שנמצא. הפעם דף שלם | וכאן מגילה קרועה שמהווה חלק ממסמך ארוך |
הפרוייקט החל בעקבות התפזרותו של אוסף ענק של כתבי יד, מסמכים, ספרי קודש ועוד שנמצאו בעליית הגג של בית כנסת עתיק בקהיר במהלך המאה ה-19. מכיוון שעל פי ההלכה היהודית אסור לזרוק לפח את כתבי הקודש שהתבלו, הונחו ונגנזו בעליית הגג, סמוך לעזרת הנשים, כתבי יד של ספרי קודש וספרים אחרים, והרבה פיסות נייר וקרעי מגילות שהכילו אותיות עבריות במהלך מאות שנים. האוסף מתפרש על תקופת זמן ארוכה מהמאה התשיעית ועד המאה ה-19.
מאז שהתגלה האוצר הגנוז של כתבי היד בסוף המאה ה-19, חלק הארי שלו התפזר בעולם – קמברידג', אוקספורד, לונדון, פריז, ירושלים, סנט פטרסבורג, בודפשט, וינה, ג'נבה, ניו יורק, פילדלפיה ועוד. כ-320,000 דפים הנמצאים על גבי כרבע מליון מדפים שונים בספריות הרבות.
בשנת 2006 הוקם צוות "גנזים" שלקח על עצמו להקים ולתחזק את התשתית הטכנולוגית שתהיה אחראית על שימור מחקר הגניזה והעמדתו לרשות החוקרים והציבור הרחב. הם עשו זאת על ידי הקמת מאגר מידע עצום שכלל סריקות (דיגיטציה) מלאות של כל המסמכים שנמצאים ברחבי העולם, והעלאתם לאתר האינטרנט של הספריה הווירטואלית של הגניזה הקהירית.
השלב הבא והמעניין ביותר היה שימוש בטכנולוגיות של ראייה ממוחשבת כדי לבצע עיבוד אוטומטי של התמונות.
הדבר נחוץ ביותר היות ותנאי הגניזה הכתיבו כי לא נשתמר בה אפילו כתב יד אחד שלם. לפעמים מדובר בקטע גניזה של דף אחד בודד, וברוב המקרים קרעי דפים: חצי דף, רבע, או אף מספר שורות קטן בלבד.
העיבוד נדרש כדי להתאים את חלקי המסמכים אחד לשני בנסיון להגיע לאחוז הגבוה ביותר שאפשר של מסמכים שלמים או קרובים לשלמות. המחשב משתמש בפרמטרים של אפיון כתב היד של הסופר בקטעים השונים כגון: גובה שורה ממוצע, רווח בין השורות, צפיפות כתב ועוד. כמו כן נמדדו מאפיינים נוספים כמו אורך ורוחב הקטע, גודל השטח הכתוב ורוחב השוליים מכל צד, מספר השורות בקטע וכן הלאה.
כל הפרמטרים הללו נמדדו לגבי כל קטע וקטע ומשמשים את מחשבי הפרוייקט במשימה העצומה של זיווג קרעי הטקסט שנמצאו לכלל יצירה שלמה.
כבר בשלב זה, כאשר נמצאים כל חלקי הגניזה הקהירית באתר אינטרנט ייעודי, הדבר מאפשר לחוקרים מכל העולם לקבל גישה נוחה ופשוטה לחומרים שבעבר היו נגישים רק באופן ישיר (נסיעה לספרייה המסויימת ועיון בחומר המקורי), או דרך מיקרופילם (צילומים ממוזערים של החומר המקורי) בספריות מאובקות כאלה ואחרות.
אך ב-14 ליוני (לפי הצפי הנוכחי), כל זה ישתנה, כאשר המחשבים יסיימו את מלאכתם והאתר יוכל להציג את המסמכים שהורכבו כפי שהיו במקור. (במידת האפשר)
זהו פרוייקט מרשים בכל קנה מידה, והעובדה שהוא נערך כאן בארץ רק מוסיפה לגאווה שצריכה למלא את כולנו.
אגב, אם היסטוריה ובעיקר מדע בעיני ההיסטוריה מעניינים אתכם, אולי תמצאו עניין בפודקאסט הישראלי "עושים היסטוריה" – תמיד מעניין ומרתק. בעיניי לפחות, אך מומלץ לנסות.
מה דעתכם? האם זהו העתיד הנקי של ספריות וספרי נייר? או שאולי עדיין נמשיך לשמר חלקים מהתרבות האנושית על ניירות ומגילות, ולו רק במוזיאונים? ספרו לנו בתגובות!