הישג גדול עבור מיקרוסופט: טכנולוגיית הזיהוי הקולי שפיתחה הגיעה לרמת דיוק התואמת את זו של בני האדם
הענקית מרדמונד הכריזה בבלוג שלה כי הגיעה להישג היסטורי בתחום זיהוי הדיבור, וכי המנגנון שפיתחה מזהה מילים בשיחה ברמת דיוק דומה לזו של אדם אמיתי. קבוצת מהנדסים וחוקרי בינה מלאכותית מטעם החברה דיווחה על אחוזי הצלחה דומים או גבוהים מאלה של מתמללים מקצועיים בזיהוי מילים במסגרת מחקר שפורסם בתחילת השבוע. קצב השגיאות (ה-WER, ה-Word Error Rate) של המנגנון שלהם ירד בחודש האחרון מ-6.3 ל-5.9 אחוזים, הנמוך ביותר שתועד עד כה.
https://www.youtube.com/watch?v=v33fVIIuTWI
מיקרוסופט טוענת כי להישג הזה יהיו משמעויות רחבות היקף מבחינת שיפור הזיהוי הקולי במוצרים כמו קונסולת ה-Xbox One שלה, העוזרת האישית קורטנה וכלי הנגישות שמצורפים לגרסאות חלונות. "קורטנה תהפוך לעוצמתית יותר", אומר החוקר הארי שאם, "תהיה אפשרות ליצור עוזרת אישית אינטליגנטית לחלוטין".
המנגנון של מיקרוסופט עושה שימוש במודל רשתות עצביות, אשר מדמות את תהליך החשיבה האנושי כדי להשלים מילים שאינן ברורות ולחברן למשפט הגיוני. ג'פרי זוויג, חוקר נוסף, מסביר שיש עוד לאן לשאוף: "השלב הבא הוא לעבור מזיהוי להבנה". שאם מוסיף כי "תידרש עוד דרך ארוכה כדי להגיע למצב שמחשבים יבינו את המשמעות האמיתית של מה שמוצג בפניהם או נאמר להם".