חברת OpenAI הודיעה היום על השקת סדרת המודלים החדשה שלה, o1, המציגה יכולות חסרות תקדים, עד כדי כך שיתכן שהממשל האמריקאי מעורב גם הוא
כשסם אלטמן, מנכ"ל OpenAI, צייץ "אני אוהב את הקיץ בגינה" בליווי תמונה של שיח תותים, הוא לא סתם שיתף את אהבתו לגינון. הציוץ התמים לכאורה היה למעשה רמז מתוחכם על התקדמות משמעותית בפרויקט סטרוברי (Strawberry) – אחד הפרויקטים המסקרנים והמסתוריים ביותר של OpenAI בעת האחרונה.
פרויקט סטרוברי, שכעת ידוע רשמית כ-OpenAI o1, הוא חלק ממאמץ רחב יותר של החברה לפתח בינה מלאכותית מתקדמת. לצד o1 קיים גם פרויקט אוריון (Orion), שנחשב אפילו יותר מסתורי ומבטיח. שני הפרויקטים הללו מבטיחים לחולל מהפכה בעולם הבינה המלאכותית, עם יכולות שנראות כמעט בלתי אפשריות.
חברת OpenAI הודיעה היום על השקת סדרת המודלים החדשה שלה, o1, המציגה יכולות חסרות תקדים בתחומי המדע, המתמטיקה, והתכנות. מדובר בשדרוג משמעותי ליכולות מערכות הבינה המלאכותית, כש-o1 נועד לפתור בעיות מורכבות בצורה אפקטיבית ומדויקת יותר. זהו צעד חשוב בעידן שבו פתרונות מבוססי AI נעשים יותר ויותר חלק מחיי היומיום של מדענים, מפתחים, וצרכנים רגילים.
איך נוצר o1? – תהליך של למידה ופיתוח
המוטיב המרכזי ב-o1 הוא תהליך החשיבה המבוסס על שרשרת מחשבה (Chain of Thought). הדבר מאפשר למודל לפרק שאלות מורכבות לשלבים נפרדים, ולהתמודד עם כל שלב בצורה מדורגת ומעמיקה. יכולת זו הופכת את המודל למדויק יותר, כשהוא מתמודד עם בעיות המצריכות ניתוח רב-שלבי, כמו חישובים מתמטיים מורכבים או משימות תכנות מאתגרות.
במהלך הפיתוח של o1, המודל פיתח יכולות למידה מבוססות חיזוקים, כלומר, המודל מקבל משוב על כל פעולה שהוא מבצע ומתקן את עצמו בהתאם. במילים פשוטות, o1 לומד מתוך תוצאות קודמות שלו, משפר את הדיוק שלו ומבצע אופטימיזציה לתשובות הבאות.
תהליך הלמידה: מחשבה לפני תשובה
מאפיין ייחודי ב-o1 הוא הזמן שהוא משקיע בלחשוב לפני מתן תשובה. במקום לספק תשובות מיידיות ולא תמיד מדויקות, המודל עובר על כל חלקי השאלה באופן מקיף יותר. התהליך הזה מאפשר למודל לנתח את השאלה, להבין אותה לעומק ולנסות להימנע מטעויות נפוצות שמערכות AI קודמות עשויות היו לבצע.
הפילוסופיה שמאחורי o1: יותר מאינטליגנציה רגילה
הקונספט של OpenAI o1 מתבסס על היכולת "לחשוב" כמו אדם, דרך פירוק משימות מורכבות ליחידות קטנות יותר, ושיפור יכולות התשובה. בהשוואה למודלים קודמים כמו GPT-4, המודל החדש o1 לוקח בחשבון כל היבט של הבעיה לפני שמספק פתרון. למעשה, o1 לא רק מנסה לפתור בעיות פשוטות – הוא מצטיין במתן פתרונות לתחומים בעלי אופי לוגי מורכב יותר, כמו מתמטיקה גבוהה ותכנות.
היכולת לבדוק את עצמו
אחת התכונות החשובות ב-o1 היא יכולת הבדיקה העצמית. זהו מנגנון שבו המודל לא רק מספק תשובה לשאלה, אלא גם בודק את עצמו כדי לוודא שהתשובה מדויקת ונכונה. תהליך זה מתרחש בצורה אוטומטית בכל פעם שהמודל עונה על שאלה מורכבת.
מבחנים קשים, תוצאות מרשימות
כדי להעריך את הביצועים של o1, אנשי OpenAI ביצעו שורת מבחנים בתחומי מדע, מתמטיקה ותכנות:
- מתמטיקה: במבחן הכניסה לאולימפיאדת המתמטיקה הבינלאומית, o1 הצליח לפתור 83% מהבעיות. לשם השוואה, המודל הקודם GPT-4 הצליח לפתור רק 13% מאותן בעיות.
- מדעים מדויקים: o1 השיג תוצאות מפתיעות בתחומים כמו פיזיקה, כימיה וביולוגיה, כשהוא מתמודד ברמה שוות ערך לזו של דוקטורנטים.
- תכנות: במבחני Codeforces, המשמשים למדידת מיומנויות תכנות, o1 הגיע לאחוזון ה-89 – תוצאה שמעידה על יכולותיו לפתור בעיות תכנות מורכבות.
מבחן התות – הדגמת היכולות
אחת הדוגמאות המרשימות ליכולות של o1 היא פתרון "מבחן התות". החידה מתארת מצב בו תות מונח בתוך כוס, שמונחת הפוך על שולחן. מישהו מרים את הכוס ושם אותה במיקרוגל. השאלה היא: איפה התות עכשיו?
בעוד שמודלים מתקדמים אחרים כמו GPT-4o וקלוד 3.5 סונטה נכשלו בפתרון החידה, o1 הצליח לפתור אותה בצורה מדויקת. זאת הודות לתהליכי ההסקה הרב-שלביים שלו, המאפשרים לו להבין את המרחב הפיזי ואת רצף האירועים בצורה מדויקת יותר.
כל אדם שיקדיש מעט זמן מחשבה לפתרון החידה הזו, יבין מיד שעם הרמת הכוס, התות נשאר על השולחן. והכוס, שהולכת למיקרוגל, נותרת ריקה ויתומה מתותים. אבל מודלי שפה מתקשים עד מאוד לפצח את הלך המחשבה הזה.
הנה דוגמאות לתשובות של מודלים אחרים:
GPT-4o:
קלוד 3.5 סונטה:
לעומתם, o1 הצליח לתת תשובה נכונה:
מגבלות קיימות ותכונות עתידיות
למרות היכולות המרשימות, o1 אינו חף ממגבלות. נכון להיום, המודל אינו יכול לבצע משימות כמו גלישה באינטרנט או ניתוח קבצים, שכן קיימות בגירסה הקודמת GPT-4o, אך ב-OpenAI מצהירים כי תכונות אלו יתווספו בגרסאות עתידיות. נכון לעכשיו, הגישה למודל מלווה במגבלות שימוש שבועיות. המשתמשים יכולים לנצל כמות מוגבלת של בקשות לפני שהגישה נחסמת עד לשבוע הבא.
למי יש גישה למודל o1?
הגישה למודל תלויה במסלול המנוי של המשתמש:
- משתמשי ChatGPT Plus ו-Team: יכולים להשתמש ב-o1 עם מגבלת הודעות שבועית.
- משתמשי ChatGPT Enterprise ו-Edu: יקבלו גישה למודל החדש במהלך השבוע הקרוב.
- מפתחים (API): יכולים לגשת למודל עם מגבלת בקשות לדקה.
- משתמשי ChatGPT Free: יקבלו גישה ל-o1-mini, גרסה פחות חזקה, בהמשך.
פגיעה בביטחון הלאומי של ארה"ב?
אתר Information דיווח כי בכירים ב-OpenAI קיימו פגישה חשאית עם נציגים מהביטחון הלאומי האמריקאי, בה הציגו בפניהם את היכולות של המערכת החדשה. הפגישה עוררה מיד גל של השערות ופרשנויות, ביניהן האפשרות ש-OpenAI עומדת לחתום על עסקה עם הממשל האמריקאי, או שמא הממשל עצמו ישלוט בפיתוח ה-AI. אך ישנה פרשנות אחת ברורה: היכולות של סטרוברי הן כה מתקדמות, שהן עשויות להשפיע על הביטחון הלאומי של ארה"ב – וזה כבר אומר לא מעט לגבי העתיד.
סיכום
ההשקה של OpenAI o1 מייצגת מהפכה של ממש בתחום הבינה המלאכותית. המודל החדש, שבנוי בצורה שמאפשרת לו לחשוב בצורה לוגית ומעמיקה, שובר שיאים בביצועים ופותח דלתות לפתרון בעיות מורכבות יותר במגוון תחומים, ממדעים מדויקים ועד תכנות מתוחכם. o1 אינו רק התקדמות טכנולוגית נוספת, אלא שינוי גישה בעולם ה-AI, כשעתיד המודלים הללו טמון ביכולת שלהם לחשוב כמו בני אדם ולהעניק תשובות מהימנות ואיכותיות יותר מאי פעם.
או שפשוט אימנו את הגרסה הזאת ספציפית ל"בעיית התות" …