OpenAI משיקה את GPT-4o – מודל בינה מלאכותית שמתחרה ישירות ב-Assistant וב-Siri
OpenAI ערכה היום אירוע בשידור חי כדי להכריז על מודל בינה מלאכותית חדש בשם GPT-4o. האות "o" מייצגת את המילה "omni" – כל יכול, ומתייחס ליכולת של המודל לטפל בטקסט, דיבור ווידאו. GPT-4o יוטמע במוצרי החברה עבור מפתחים וצרכנים במהלך השבועות הקרובים. לצד השקת המודל החדש, החברה חשפה גם גרסת שולחן עבודה חדשה של ChatGPT עם ממשק משתמש מעודכן.
מנכ"לית הטכנולוגיה הראשית של OpenAI, מירה מוראטי, אמרה כי GPT-4o מספק "רמת בינה מלאכותית כמו GPT-4" אך משפר את ביצועיו באופן משמעותי ומאפשר יכולות נוספות: "GPT-4o מסיק מסקנות קוליות, טקסטואליות וחזותיות", אמרה מוראטי במהלך מצגת שזרמה ממשרדי OpenAI בסן פרנסיסקו. "וזה חשוב להפליא, מכיוון שאנחנו מסתכלים על עתיד האינטראקציה בינינו לבין מכונות."
GPT-4 Turbo, המודל המוביל והמתקדם ביותר הקודם של OpenAI, אומן על שילוב של תמונות וטקסט, ויכול היה לנתח תמונות וטקסט כדי לבצע משימות כמו חילוץ טקסט מתמונות או אפילו תיאור התוכן של תמונות אלו. אבל GPT-4o מוסיף גם יכולות דיבור.
מה זה מאפשר? מגוון דברים:
GPT-4o משפר מאוד את החוויה בצ'אטבוט המופעל על ידי בינה מלאכותית של OpenAI, שכולם מכירים כ-ChatGPT. הפלטפורמה מציעה כבר היום מצב קול שמתמלל את תגובות הצ'אטבוט באמצעות מודל טקסט לדיבור, אך GPT-4o מחזק זאת, ומאפשר למשתמשים לנהל אינטראקציה עם ChatGPT יותר כמו עוזר וירטואלי.
לדוגמה, משתמשים יכולים לשאול את ChatGPT המופעל על ידי GPT-4o שאלה, ולהפריע ל-ChatGPT בזמן שהוא עונה. לדברי OpenAI, המודל מספק תגובתיות "בזמן אמת" ויכול אפילו לזהות ניואנסים בקול של המשתמש, ולהגיב תוך יצירת קולות ב"מגוון סגנונות רגשיים שונים" (כולל שירה).
יכולות הראייה של ChatGPT גם משתדרגות עם GPT-4o. בהינתן תמונה – או מסך מחשב – ChatGPT יכול כעת לענות במהירות על שאלות קשורות, בנושאים הנעים בין "מה קורה בקוד התוכנה הזה?" לבין "איזה מותג חולצה האדם הזה לובש?"
תכונות אלו יתפתחו עוד יותר בעתיד, אומרת מוראטי. בעוד שהיום GPT-4o יכול להסתכל על תמונה של תפריט בשפה אחרת ולתרגם אותה, בעתיד, המודל יוכל לאפשר ל-ChatGPT, למשל, "לצפות" במשחק ספורט חי ולהסביר לכם את החוקים.
"אנחנו יודעים שהמודלים האלה הופכים מורכבים יותר ויותר, אבל אנחנו רוצים שחווית האינטראקציה תהפוך למעשה טבעית יותר, קלה יותר, ושלא תתמקדו בממשק המשתמש בכלל, אלא פשוט תתמקדו בשיתוף הפעולה עם ChatGPT", אמרה מוראטי.
OpenAI טוענת ש-GPT-4o גם רב לשוני יותר, עם ביצועים משופרים בכ-50 שפות שונות. האם עברית כלולה בשיפורים? עדיין לא ידוע.