הטכנולוגיה החדשה של גוגל מרגישה כאילו נשלפה היישר מ-CSI

האם היכולת לבצע "סופר-זום" לתמונות היא לא רק המצאה מגוחכת של עולם הבידור?

אם הזדמן לכם לצפות בכמה פרקים של אחת מהסדרות הרבות שמאוגדות תחת השם CSI (ר"ת Crime Scene Investigation), שעוסקות בחוקרים מתוחכמים אשר מגייסים את כל האמצעים הטכנולוגיים שיש בכדי לפתור מקרי פשיעה מסובכים – סביר להניח שגם אתם גירדתם את הפדחת למראה אדם חמור סבר שמבקש להגדיל חלק כלשהו מתוך תצלום או תיעוד, כשהתוצאה המתקבלת הופכת לפתע מבלתי ברורה ובאיכות ירודה לחדה כמעט כמו תמונת המקור הגדולה, ואולי אף יותר ממנה, במה שמרגיש כמו קסם שאין לו קשר ממשי לצורה בה עיבוד תמונה עובד בחיים האמיתיים.

כעת, מסתבר כי "ההמצאה" של CSI עשויה להיות משהו אמיתי וניתן ליישום בעצם – במסגרת טכנולוגיה בשם RAISR (או Rapid and Accurate Image Super Resolution) שאותה מפתחת גוגל.

Enhance!
משמאל התמונה המקורית, ומימין הגירסה המשופרת באמצעות טכנולוגיית ה-RAISR

הטכנולוגיה החדשה הזו משמשת לביצוע אינטרפולציה (Upsampling) חכמה לתמונות בעלות כמות פיקסלים, או רזולוציה, נמוכה – בשיטה שמתבססת על למידה חישובית לזיהוי הקצוות של העצמים המוצגים בה, והשקעה בחידודם באופן שמעניק תוצאה סופית ברורה ואיכותית הרבה יותר מטכניקות האינטרפולציה הסטנדרטיות הנהוגות, בהן התוצר הסופי יכיל כמות גדולה יותר של פיקסלים אך עם חדות מינימלית, שתתן הרגשה של "מריחת" התמונה המקורית.

השוואה בין RAISR לטכניקות שיפור תמונה קיימות, שאינן מבוססות מנגנונים לומדים

(עדיין) לא מדובר כאן ביכולת לבצע 'זום אינסופי' כלשהו לתמונה, ועדיין לא ממש ברור האם הטכניקה תדע לפעול באופן אפקטיבי עם כל סוגי ומיני התמונות, אך מספר הדוגמאות המצומצם אותו סיפקה גוגל בהחלט מעיד על פוטנציאל משמעותי שיש ל-RAISR לעומת כל מה שראינו עד עכשיו, וכנראה שעוד זמן פיתוח וטיוב והבשלתה נוספת של טכנולוגיות ה-Machine Learning יוכלו לשפר אפילו יותר את התוצרים, ואולי גם לפתור אותנו אחת ולתמיד מכל אותן תמונות מפוקלסות נוראיות שמחזירות אותנו לימיה המוקדמים של רשת האינטרנט.