לא תקליד, לא תגלוש
מי מאתנו לא נתקל בסעיף המעצבן של כתיבת מילת זיהוי כשאנחנו רוצים להירשם לאתר מסויים, או להוריד תוכן. אותו סעיף מעצבן שגורם לנו לבזבז 10 שניות מהחיים, ולעתים אפילו יותר כשאנחנו לא מצליחים לקלוע למילה שהמערכת זרקה לנו. הסעיף הזה נקרא מערכת קאפצ'ה, או באנגלית Captcha.
מי מאתנו לא נתקל בסעיף המעצבן של כתיבת מילת זיהוי כשאנחנו רוצים להירשם לאתר מסויים, או להוריד תוכן. אותו סעיף מעצבן שגורם לנו לבזבז 10 שניות מהחיים, ולעתים אפילו יותר כשאנחנו לא מצליחים לקלוע למילה שהמערכת זרקה לנו. הסעיף הזה נקרא מערכת קאפצ'ה, או באנגלית Captcha.
המערכת פותחה באוניברסיטת קרנגי-מלון ונועדה לאפשר לרשת לדעת באופן ודאי כי מי שעומד מולם הוא אכן בן אנוש והתשובה אינה מופקת באמצעות מחשב (בוט). במנגנון מעורב בדרך כלל מחשב המייצר שאלה אקראית, כזו שלאדם קל לענות עליה אך למחשב קשה מאוד.
מבחן קאפצ'ה בדרך כלל מבקש מהמשתמש להקליד אותיות או מספרים המופיעים בצורה מעוותת על המסך, משום שהטכנולוגיה הקיימת לא מספיק מפותחת על מנת שמחשב יעבד את התמונה, אך בשביל עין אנושית זוהי משימה פשוטה מאוד.
קאפצ'ות נמצאות בכל מקום ברחבי האינטרנט, ובגלל שרבים האתרים שמשתמשים במערכת הקאפצ'ה, נוצרה תרבות הכוללת כתות שונאים, תמונות FAIL ואפילו בלוגים סביב המערכת המעצבנת.
מי אמר FAIL מקטע בספר פיסיקה ולא קיבל? |
עם הזמן המערכת התקדמה ונוצרה המערכת החדשה שאנחנו מכירים, העונה לשם הלא מפתיע ReCaptcha. גם המערכת החדשה פותחה באוניברסיטת קרנגי-מלון והפכה מהר מאוד לחברת סטארט-אפ קטנה ולא כל כך סוחפת, שנקנתה תוך שנה על ידי לא אחרת מאשר גוגל.
500,000 שעות ביום?!
מה שהוביל לפיתוח ה-ReCaptcha הולך ככה: מסתבר שביום מוזנות 200 מיליון קאפצ'ות כאלה ברחבי האינטרנט כשהזמן הממוצע לרישום המילה הנכונה עומד על כ-10 שניות. בחשבון מהיר– האנושות מבזבזת 500,000 שעות ביום על מילוי קאפצ'ות מעצבנות.
המוחות במכון המחקר בקרנגי-מלון שקדו וחשבו על דרך בה אפשר לתעל את סכום הזמן האסטרונומי הזה, המבוזבז מדי יום על העתקת מילים מעוותות, על מנת לעזור לאנושות. הרעיון שעלה בחכת האוניברסיטה היה לרתום את עשרת השניות בהם המוח חושב כדי לפתור בעיה המחייבת מוח אנושי. כך, ניתן לחלק את הבעיה לפיסות קטנות של 10 שניות וכל פעם שמישהו פותר קאפצ'ה אחת – הרי שהוא פתר גם חלק קטן מהבעיה.
והנה האמת נכון להיום: בכל פעם שאתם פותרים קאפצ'ה, אתם גם מאמתים את זהותכם כבני אדם, וגם עוזרים להפוך ספרים לדיגיטליים.
תחשבו כמה ספרים כבר תירגמתם… |
איך זה עובד?
אבל איך זה עובד? ישנם המון גופים המנסים בימים אלו להפוך ספרים לדיגיטליים: החל מגוגל, דרך ארכיון האינטרנט ועד אמזון, כל אחת והשיטה שלה. השיטה הנפוצה ביותר עובדת תוך סריקת הספרים והפיכתם לתמונה, בשלב השני – מערכת ממוחשבת סורקת את התמונה ומנסה לזהות באיזו אות מדובר.
אבל כמו כל דבר בחיים, לא הכל תמיד עובד כמו שהיינו רוצים שהוא יעבוד, וספרים ישנים בני 50 שנה או יותר, איך נגיד? לא מקלים על עבודת המחשב: הדפים הוכתמו והפכו צהובים, הדיו נמרח והאותיות כבר לא ברורות.
מוכר לכם? |
בדיוק בנקודה בה המחשב לא מסוגל להבין מה כתוב, המוח האנושי מתחיל לפעול, באמצעות אותם המשתמשים שממלאים את ה-ReCaptcha. המערכת של התוכנה "גוזרת" את המילה שהמחשב לא הצליח לזהות ונותן לכם להשלים שתי מילים: האחת – מילה שהמחשב לא מכיר (בגלל שהוא לא מכיר הוא לא יכול לזהות אותך לפיה) והשנייה – המילה שידועה למחשב ולפיה הוא מוודא שבן אדם הוא זה שמתקשר איתו.
המילים מופיעות בצורה אקראית בכדי שלא נדע מה המילה שמאשרת את זהותנו, ומה המילה שלמעשה אותה אנו הופכים לדיגיטלית.
הלכה למעשה
כן, הבנתם נכון, בכל פעם שאתם ממלאים קאפצ'ה אתם למעשה עוזרים לתרגם מילה שהמחשב לא הצליח לזהות, כך נוצר צורך בעין אנושית, וככה הפכנו עוד מילה לדיגיטלית. ושוב נחזור לעשות קצת חשבון – אם ביום אחד בלבד מתורגמות 100 מיליון מילים, אזי שבשנה, שכתבנו כשניים וחצי מליון ספרים!
רציתם ללמוד ערבית? תתרגמו את הקוראן! |
בגלל שהמערכת נותנת לנו קומבינציה של שני מילים, לעיתים נוצרים מקרים בהם מתקבל משפט בעל משמעות. גם ההיבט ההומוריסטי לכל העניין לא איחר לבוא, והדבר כבר הפך לתופעת רשת, בו משתמשים לוקחים את הקומבינציה המוזרה שנוצרה ומציירת ציור שממחיש את הקומבינציה.
בימינו אנו, אותם אנשים אשר שקדו על המערכת הזאת יצרו מערכת לתרגום האינטרנט ובחינם על ידי גולשים שרוצים ללמוד שפה אחרת. האתר נקרא duolingo והוא נעזר במשתמשים שלומדים שפה כאמצעי תרגום למרשתת. איך זה עובד? כמתחילים תקבלו משפטים קלים, ולאט לאט רמת הקושי תעלה באופן בו תלמדו טוב יותר את רזי השפה, וגם תתרגמו את האינטרנט, והכל בחינם!