לא תקליד, לא תגלוש
מי מאתנו לא נתקל בסעיף המעצבן של כתיבת מילת זיהוי כשאנחנו רוצים להירשם לאתר מסויים, או להוריד תוכן. אותו סעיף מעצבן שגורם לנו לבזבז 10 שניות מהחיים, ולעתים אפילו יותר כשאנחנו לא מצליחים לקלוע למילה שהמערכת זרקה לנו. הסעיף הזה נקרא מערכת קאפצ'ה, או באנגלית Captcha.
מי מאתנו לא נתקל בסעיף המעצבן של כתיבת מילת זיהוי כשאנחנו רוצים להירשם לאתר מסויים, או להוריד תוכן. אותו סעיף מעצבן שגורם לנו לבזבז 10 שניות מהחיים, ולעתים אפילו יותר כשאנחנו לא מצליחים לקלוע למילה שהמערכת זרקה לנו. הסעיף הזה נקרא מערכת קאפצ'ה, או באנגלית Captcha.
המערכת פותחה באוניברסיטת קרנגי-מלון ונועדה לאפשר לרשת לדעת באופן ודאי כי מי שעומד מולם הוא אכן בן אנוש והתשובה אינה מופקת באמצעות מחשב (בוט). במנגנון מעורב בדרך כלל מחשב המייצר שאלה אקראית, כזו שלאדם קל לענות עליה אך למחשב קשה מאוד.
מבחן קאפצ'ה בדרך כלל מבקש מהמשתמש להקליד אותיות או מספרים המופיעים בצורה מעוותת על המסך, משום שהטכנולוגיה הקיימת לא מספיק מפותחת על מנת שמחשב יעבד את התמונה, אך בשביל עין אנושית זוהי משימה פשוטה מאוד.
קאפצ'ות נמצאות בכל מקום ברחבי האינטרנט, ובגלל שרבים האתרים שמשתמשים במערכת הקאפצ'ה, נוצרה תרבות הכוללת כתות שונאים, תמונות FAIL ואפילו בלוגים סביב המערכת המעצבנת.
מי אמר FAIL מקטע בספר פיסיקה ולא קיבל? |
עם הזמן המערכת התקדמה ונוצרה המערכת החדשה שאנחנו מכירים, העונה לשם הלא מפתיע ReCaptcha. גם המערכת החדשה פותחה באוניברסיטת קרנגי-מלון והפכה מהר מאוד לחברת סטארט-אפ קטנה ולא כל כך סוחפת, שנקנתה תוך שנה על ידי לא אחרת מאשר גוגל.
500,000 שעות ביום?!
מה שהוביל לפיתוח ה-ReCaptcha הולך ככה: מסתבר שביום מוזנות 200 מיליון קאפצ'ות כאלה ברחבי האינטרנט כשהזמן הממוצע לרישום המילה הנכונה עומד על כ-10 שניות. בחשבון מהיר– האנושות מבזבזת 500,000 שעות ביום על מילוי קאפצ'ות מעצבנות.
המוחות במכון המחקר בקרנגי-מלון שקדו וחשבו על דרך בה אפשר לתעל את סכום הזמן האסטרונומי הזה, המבוזבז מדי יום על העתקת מילים מעוותות, על מנת לעזור לאנושות. הרעיון שעלה בחכת האוניברסיטה היה לרתום את עשרת השניות בהם המוח חושב כדי לפתור בעיה המחייבת מוח אנושי. כך, ניתן לחלק את הבעיה לפיסות קטנות של 10 שניות וכל פעם שמישהו פותר קאפצ'ה אחת – הרי שהוא פתר גם חלק קטן מהבעיה.
והנה האמת נכון להיום: בכל פעם שאתם פותרים קאפצ'ה, אתם גם מאמתים את זהותכם כבני אדם, וגם עוזרים להפוך ספרים לדיגיטליים.
תחשבו כמה ספרים כבר תירגמתם… |
איך זה עובד?
אבל איך זה עובד? ישנם המון גופים המנסים בימים אלו להפוך ספרים לדיגיטליים: החל מגוגל, דרך ארכיון האינטרנט ועד אמזון, כל אחת והשיטה שלה. השיטה הנפוצה ביותר עובדת תוך סריקת הספרים והפיכתם לתמונה, בשלב השני – מערכת ממוחשבת סורקת את התמונה ומנסה לזהות באיזו אות מדובר.
אבל כמו כל דבר בחיים, לא הכל תמיד עובד כמו שהיינו רוצים שהוא יעבוד, וספרים ישנים בני 50 שנה או יותר, איך נגיד? לא מקלים על עבודת המחשב: הדפים הוכתמו והפכו צהובים, הדיו נמרח והאותיות כבר לא ברורות.
מוכר לכם? |
בדיוק בנקודה בה המחשב לא מסוגל להבין מה כתוב, המוח האנושי מתחיל לפעול, באמצעות אותם המשתמשים שממלאים את ה-ReCaptcha. המערכת של התוכנה "גוזרת" את המילה שהמחשב לא הצליח לזהות ונותן לכם להשלים שתי מילים: האחת – מילה שהמחשב לא מכיר (בגלל שהוא לא מכיר הוא לא יכול לזהות אותך לפיה) והשנייה – המילה שידועה למחשב ולפיה הוא מוודא שבן אדם הוא זה שמתקשר איתו.
המילים מופיעות בצורה אקראית בכדי שלא נדע מה המילה שמאשרת את זהותנו, ומה המילה שלמעשה אותה אנו הופכים לדיגיטלית.
הלכה למעשה
כן, הבנתם נכון, בכל פעם שאתם ממלאים קאפצ'ה אתם למעשה עוזרים לתרגם מילה שהמחשב לא הצליח לזהות, כך נוצר צורך בעין אנושית, וככה הפכנו עוד מילה לדיגיטלית. ושוב נחזור לעשות קצת חשבון – אם ביום אחד בלבד מתורגמות 100 מיליון מילים, אזי שבשנה, שכתבנו כשניים וחצי מליון ספרים!
רציתם ללמוד ערבית? תתרגמו את הקוראן! |
בגלל שהמערכת נותנת לנו קומבינציה של שני מילים, לעיתים נוצרים מקרים בהם מתקבל משפט בעל משמעות. גם ההיבט ההומוריסטי לכל העניין לא איחר לבוא, והדבר כבר הפך לתופעת רשת, בו משתמשים לוקחים את הקומבינציה המוזרה שנוצרה ומציירת ציור שממחיש את הקומבינציה.
בימינו אנו, אותם אנשים אשר שקדו על המערכת הזאת יצרו מערכת לתרגום האינטרנט ובחינם על ידי גולשים שרוצים ללמוד שפה אחרת. האתר נקרא duolingo והוא נעזר במשתמשים שלומדים שפה כאמצעי תרגום למרשתת. איך זה עובד? כמתחילים תקבלו משפטים קלים, ולאט לאט רמת הקושי תעלה באופן בו תלמדו טוב יותר את רזי השפה, וגם תתרגמו את האינטרנט, והכל בחינם!
project nigger
פשוט מאוד:
אחרי קצת נסיון עם הקאפצ'ה הזה, ניתן בקלות לזהות את המילה שמתרגמים, מומלץ במקום אותה מילה לרשום את המילה nigger.
טוב לדעת
http://www.google.com/recaptcha/learnmore
יש פה אפשרות למלא והסברים… חלק מהמילה המחשב מבין וחלק המחשב "לא בטוח".
ומתי שלוחצים על הרמקול זה לא משמיע, זה אומר כל מיני מספרים עם רעש ברקע.
טוב לדעת
טוב לדעת שאומנם בוזבזו לי 10 שניות מהחיים אבל עזרתי לתרגם ספר.
כתבה יפה צריך להבין משהו
כתבה יפה אבל לא בדיוק נכון המספור או המילה שצריך לרשום היא בעצם בשביל שלא יהיה רובוט אלא יהיה אדם אנושי שמכתיב וזה בשביל סמפמרים ,רובוטים ,או תולעים. וספירת כניסות ותוכן.
אבל יש מצבים..
שאני מילה אחת בורורה ואני כותב אותה נכון והשניה אני מנחש ותמיד קולע "נכון" השאלה מה זה אומר לגבי זה
לפחות תנו קרדיט לTED
http://www.youtube.com/watch?v=cQl6jUjFjp4
אחד הדברים הישנים
טוב שנזכרתם, זה קיים כבר כמה שנים שטובות וזה דבר ידוע…
כמה כסף אני מקבל על ה
"שיכתוב" הזה?אני עובד אצלהם?למה לא שואלים את הגולש אם הוא רוצה ל"התנדב"?
יפה שזה למטרה טובה
עכשיו אני אפסיק למלא N—- במילה מהספר
גי זה למטרה טובה XD