אפליקציית Google AI Edge Eloquent מציגה מנוע תמלול מקומי המבוסס על מודל Gemma, אשר מנקה גמגומים ומנסח מחדש משפטים בזמן אמת, והכל מבלי לדרוש מנוי תשלום או חיבור לשרתים חיצוניים
חברות טכנולוגיה קטנות וגדולות מנסות כבר שנים לפתור את בעיית ההכתבה הקולית, לרוב באמצעות מנויים חודשיים יקרים או חיבור הכרחי לשירותי ענן. השבוע, ללא שום הודעה לעיתונות או אירוע הכרזה, גוגל העלתה לחנות האפליקציות של אפל את Google AI Edge Eloquent. מדובר בכלי חינמי לחלוטין שמבצע תמלול קולי על גבי המכשיר עצמו, והוא מצליח להדגים איך בינה מלאכותית מקומית צריכה לעבוד בפועל. המטרה כאן היא לא רק להמיר קול לטקסט, אלא להפוך דיבור אותנטי למסמך קריא באופן מיידי.

עורכת טקסט במקום להקליט תמלול יבש
בניגוד לכלים המובנים במערכות ההפעלה שמקלידים כל מילה בנאמנות עיוורת, Eloquent תוכננה לתפקד כעורכת. כאשר משתמשים מכתיבים משפט, האפליקציה משתמשת במודל המקומי כדי להבין את ההקשר ולהעלים מילות חיבור מיותרות, גמגומים ותיקונים עצמיים שקורים באופן טבעי. התוצאה היא טקסט נקי שמוכן להעתקה לכל יישום אחר. עבור מי שמוכן לשחרר מעט את חבל הפרטיות, האפליקציה מאפשרת הפעלה של מודל Gemini לטובת פונקציות שכתוב מתקדמות. בלחיצת כפתור ניתן לקצר את הטקסט, להפוך אותו לרשמי יותר או לחלץ מתוכו נקודות מרכזיות, כאשר פונקציה זו דורשת באופן טבעי תקשורת מול שרתי גוגל.

פרטיות מובנית לצד התאמה אישית
היתרון הטכני של האפליקציה נמצא בארכיטקטורה המקומית שמריצה את מודלי Gemma ישירות על המעבד של האייפון. העיבוד הזה מבטיח זמן תגובה מהיר, מאפשר עבודה שוטפת במקומות ללא קליטה, ומוודא שהקלטות קוליות אינן משודרות החוצה כל עוד מצב הענן כבוי. בנוסף, גוגל שילבה באפליקציה אפשרות לבניית מילון אישי שאותו ניתן להזין באופן ידני או לחבר לחשבון הג'ימייל. החיבור הזה סורק הודעות דואל קודמות ולומד עגה מקצועית, שמות אנשי קשר או מונחים טכניים שהמשתמש נוטה להקליד, מה שחוסך תסכולים רבים בניסיונות הכתבה עתידיים.

אסטרטגיה עסקית שדוחקת את המתחרים
השוק רווי כיום בסטארטאפים שמציעים אפליקציות הכתבה הדורשות מהמשתמשים תשלומים שנתיים גבוהים. ההחלטה של גוגל לשחרר מוצר יציב ללא עלות וללא הגבלת שימוש היא מהלך שנועד קודם כל לקדם את סביבת הפיתוח AI Edge שלה, אבל על הדרך היא חותכת את המודל העסקי של לא מעט מתחרות. מעניין לראות שהאפליקציה הושקה בלעדית למערכת ההפעלה iOS, סביר להניח כניסוי כלים לאיסוף נתוני שימוש לפני הטמעה עמוקה יותר במקלדת Gboard באנדרואיד. עם זאת, התוכנה אינה מציעה כרגע תמיכה בשפה העברית, והנטייה שלה להשלים ולערוך כוונות במקום מילים הופכת אותה לבלתי שמישה עבור אנשי מקצוע שזקוקים לתיעוד מילולי מדויק כמו ברפואה או במשפטים.



