ענקית הטכנולוגיה מכריזה על הדור הבא של מודל הבינה המלאכותית שלה, המציג יכולות מהפכניות בהבנה והפקה של תוכן מסוגים שונים, לצד סוכנים חכמים ויכולות מתקדמות
גוגל הרימה אתמול (11.12) את המסך מעל Gemini 2.0, המודל החדש בסדרת הבינה המלאכותית המתקדמת של החברה, המסמן מעבר משמעותי מעיבוד טקסט בסיסי למערכת רב-חושית מתקדמת. המודל החדש, שכבר משרת יותר מ-2 מיליארד משתמשים בשבעה מוצרי גוגל שונים, מביא עמו שורה של חידושים טכנולוגיים שעשויים לשנות את האופן בו אנחנו מתקשרים עם מערכות בינה מלאכותית.
במסגרת ההשקה, החברה חושפת תחילה את Gemini 2.0 Flash – הגרסה הקומפקטית של המודל החדש. למרות היותו המודל הקטן במשפחה, הוא מציג ביצועים מרשימים: לפי נתוני גוגל, הוא מהיר פי שניים ממודל ה-Gemini 1.5 Pro הקודם, תוך שיפור משמעותי במרבית מדדי הביצועים.
יכולות מתקדמות וממשקים חדשים
Gemini 2.0 Flash מביא עמו יכולות חדשות משמעותיות, כולל תמיכה בקלט ופלט מולטימודליים. המודל מסוגל לא רק לעבד תמונות, וידאו ואודיו, אלא גם ליצור תוכן משולב הכולל טקסט ותמונות, ולהפיק אודיו רב-לשוני בעזרת טכנולוגיית Text-to-Speech מתקדמת. בנוסף, המערכת משתלבת באופן טבעי עם כלים כמו Google Search ומציעה יכולות מתקדמות להרצת קוד ושימוש בפונקציות מותאמות אישית.
החברה גם הכריזה על ממשק Multimodal Live API חדש, המאפשר קלט בזמן אמת של אודיו וסטרימינג וידאו, לצד היכולת לשלב מספר כלים במקביל – תכונה שתאפשר למפתחים ליצור אפליקציות דינמיות ואינטראקטיביות.
סוכנים חכמים: המהפכה הבאה
אחד החידושים המשמעותיים ביותר ב-Gemini 2.0 הוא התמיכה המובנית בסוכני AI חכמים. פרויקט Astra, העוזר האישי המשודרג של גוגל, מציג כעת יכולות משופרות הכוללות:
- שיחה במספר שפות ובשפות מעורבות, כולל הבנה משופרת של מבטאים ומילים נדירות
- שימוש אינטגרטיבי ב-Google Search, Lens ו-Maps
- זיכרון שיחה של עד 10 דקות ויכולת לזכור שיחות קודמות לצורך התאמה אישית
- מהירות תגובה המדמה שיחה אנושית טבעית
לצד Astra, גוגל חשפה את פרויקט מרינר – תוסף ניסיוני לדפדפן כרום המציג תוצאות מרשימות של 83.5% הצלחה במשימות גלישה מורכבות. המערכת מסוגלת להבין ולנתח מידע מהמסך, כולל טקסט, קוד, תמונות וטפסים, ולבצע פעולות עבור המשתמש תחת פיקוח.
"בטיחות תחילה": המענה לאתגרי העידן החדש
גוגל מציבה את הבטיחות והאחריות בחזית פיתוח Gemini 2.0, עם מערך הגנה מקיף שפותח במיוחד עבור עידן הסוכנים החכמים. ועדת האחריות והבטיחות של החברה (RSC) מובילה את תהליכי זיהוי והערכת הסיכונים, כשבאופן ייחודי, יכולות החשיבה המתקדמות של Gemini 2.0 עצמו משמשות לשיפור מערכות הבטיחות.
החברה פיתחה מערכות הגנה ייעודיות עבור תוכן מולטימדיה, כולל מנגנונים למניעת שיתוף מידע רגיש והתגוננות מפני הונאות. במקרה של פרויקט מרינר, למשל, המערכת מוגבלת לפעולות בטאב הפעיל בלבד ומחייבת אישור משתמש לפעולות רגישות, תוך זיהוי והתגוננות מפני ניסיונות הונאה ודיוג.
זמינות והטמעה
הגרסה הניסיונית של Gemini 2.0 Flash כבר זמינה למפתחים דרך ממשק API ב-Google AI Studio ו-Vertex AI, כאשר הגרסה המלאה צפויה להגיע לציבור בינואר 2025, יחד עם מודלים נוספים. משתמשי אפליקציית Gemini יכולים כבר עכשיו להתנסות בגרסה מותאמת צ'אט של המודל החדש דרך הדפדפן, עם תמיכה באפליקציה הניידת בקרוב.
עם השקת Gemini 2.0, גוגל לא רק משפרת את יכולות הבינה המלאכותית שלה, אלא גם מסמנת את תחילתו של עידן חדש – עידן בו AI לא רק מגיב למשתמשים, אלא פועל באופן אקטיבי ואינטליגנטי לסיוע במשימות מורכבות, תוך שמירה על סטנדרטים גבוהים של בטיחות ואחריות.