האם היכולת לבצע "סופר-זום" לתמונות היא לא רק המצאה מגוחכת של עולם הבידור?
אם הזדמן לכם לצפות בכמה פרקים של אחת מהסדרות הרבות שמאוגדות תחת השם CSI (ר"ת Crime Scene Investigation), שעוסקות בחוקרים מתוחכמים אשר מגייסים את כל האמצעים הטכנולוגיים שיש בכדי לפתור מקרי פשיעה מסובכים – סביר להניח שגם אתם גירדתם את הפדחת למראה אדם חמור סבר שמבקש להגדיל חלק כלשהו מתוך תצלום או תיעוד, כשהתוצאה המתקבלת הופכת לפתע מבלתי ברורה ובאיכות ירודה לחדה כמעט כמו תמונת המקור הגדולה, ואולי אף יותר ממנה, במה שמרגיש כמו קסם שאין לו קשר ממשי לצורה בה עיבוד תמונה עובד בחיים האמיתיים.
כעת, מסתבר כי "ההמצאה" של CSI עשויה להיות משהו אמיתי וניתן ליישום בעצם – במסגרת טכנולוגיה בשם RAISR (או Rapid and Accurate Image Super Resolution) שאותה מפתחת גוגל.
משמאל התמונה המקורית, ומימין הגירסה המשופרת באמצעות טכנולוגיית ה-RAISR
הטכנולוגיה החדשה הזו משמשת לביצוע אינטרפולציה (Upsampling) חכמה לתמונות בעלות כמות פיקסלים, או רזולוציה, נמוכה – בשיטה שמתבססת על למידה חישובית לזיהוי הקצוות של העצמים המוצגים בה, והשקעה בחידודם באופן שמעניק תוצאה סופית ברורה ואיכותית הרבה יותר מטכניקות האינטרפולציה הסטנדרטיות הנהוגות, בהן התוצר הסופי יכיל כמות גדולה יותר של פיקסלים אך עם חדות מינימלית, שתתן הרגשה של "מריחת" התמונה המקורית.
השוואה בין RAISR לטכניקות שיפור תמונה קיימות, שאינן מבוססות מנגנונים לומדים
(עדיין) לא מדובר כאן ביכולת לבצע 'זום אינסופי' כלשהו לתמונה, ועדיין לא ממש ברור האם הטכניקה תדע לפעול באופן אפקטיבי עם כל סוגי ומיני התמונות, אך מספר הדוגמאות המצומצם אותו סיפקה גוגל בהחלט מעיד על פוטנציאל משמעותי שיש ל-RAISR לעומת כל מה שראינו עד עכשיו, וכנראה שעוד זמן פיתוח וטיוב והבשלתה נוספת של טכנולוגיות ה-Machine Learning יוכלו לשפר אפילו יותר את התוצרים, ואולי גם לפתור אותנו אחת ולתמיד מכל אותן תמונות מפוקלסות נוראיות שמחזירות אותנו לימיה המוקדמים של רשת האינטרנט.
אנחנו מחזיקים אצבעות לכך שנשמע (ונראה) עוד מהיכולת החדשה הזו של גוגל בהקדם
לא המציאו את הגלגל, האלגוריתמים האלו קיימים בתכנות צד שלישי כפלג-אין עבור פוטושופ.
http://www.benvista.com/photozoompro
הנה אינטרפולציה Eran Hadad
חסין כתב את הקוד של זה ?
איך אפשר לשכוח את הסרטון הבא, חובה לצרף לכתבה 😀
https://www.youtube.com/watch?v=Vxq9yj2pVWk
הקרדיט ל'בלייד ראנר' מ-82', שגם הכניס את המילה ENHANCE במקום ENLARGE.
אוהב את הכתבות שלכם, תודה
נשמע כמו המחקר של מיכל אירני ממכון ויצמן
מדובר על חידוד, הוספה של קווי מתאק (שב70% מהמסה שלהם כבר קיימים).
אבל הוספה של פיקסאלים …. ז"א חיזוי…. הלוואי.
יש מידע שהתמונה המקורית פשוט לא מכילה, ולכן לא ניתן לשחזר אותו משם אם אף טכנולוגיה עכשווית או עתידית…. זה לא פיצ'ר שמוסיף מידע לתמונה, הוא מאפשר לשפר את מה שכבר יש
אלגוריתמים של SUPER RESOLUTION קיימים כבר עשרות שנים. הבעיה העיקרית שלהם היא שהם מאוד איטיים. אז אוליי גוגל פתרו את בעיית הביצועים?
https://github.com/alexjc/neural-enhance