קשה להאמין, אבל רק לפני 3 חודשים, פרסמתי את הפוסט על שחרור מודל o1 וכבר מודל o3 הוצג! (על o2 OpenAI פשוט דילגה)

קצת רקע:

מודל o1 הוא מודל שהציגה Openai לפני מספר חודשים, המודל עובד בשיטה חדשה המכונה COT = שרשרת חשיבה. השיטה עובדת כך שהמודל חושב זמן מסויים (בין מספר שניות למספר דקות) עד שהוא עונה תשובה, מה שמקפיץ את ביצועי המודל בתחומים כמו מתמטיקה ותכנות.

בשלב הראשון הציגה החברה את מודל o1, אבל שחררה לציבור (למנויים בלבד) מודל חכם פחות, בשם o1 preview, אם כי גם הוא הציג ביצועים מדהימים כשלעצמו, כפי שניתן לראות בפרויקטים שונים שנוצרו באמצעותו.

ההתפתחויות האחרונות:

לפני שבועיים בלבד, היא שחררה את מודל o1 המלא ואת מודל o1 pro (בעלות של 200$ לחודש, אבל זה כבר נושא אחר) - שהציגו ביצועים אפילו טובים יותר!

ממש בסוף השבוע האחרון, גוגל שחררה גם היא מודל חשיבה כזה בגרסת בטא, כחלק מהתחרות הגוברת בתחום שהתחמם עם מודלים כמו Gemini 1.5 Pro. הוא נקרא בשם gemini-2.0-flash-thinking, וניתן לנסות אותו בחינם ב-AI Studio

וכעת לתכלס’:

אתמול, הציגה החברה את מודל o3 שמציג קפיצת מדרגה מדהימה במבחנים הקשים ביותר

המודל עוד לא שוחרר לציבור, וכפי הנראה גם כשזה יקרה, הוא יעלה כסף. הרבה כסף. מכיוון שהמודל דורש כח עיבוד מטורף עבור כל שאלה.

לא כל הנתונים פורסמו, וגם אני עצמי לא הספקתי לעבור על כולם. אבל הגרף הבא די מספק. מדובר על אחד המדדים הקשים ביותר בתחום, וכדי לסבר את האוזן שימו לב לעובדה הבאה: ל-ARC-AGI-1 לקח 4 שנים לעבור מ-0% עם GPT-3 ב-2020 ל-5% ב-2024 עם GPT-4o.

במילים אחרות - אנחנו נמצאים בתוך עלייה אקספוננציאלית, בקו כמעט ישר כלפי מעלה! במילים אחרות - מהירות ההכפלה של אינטליגנציה מלאכותית היא ההתפתחות הטכנולוגית המהירה ביותר אי פעם משחר ההיסטוריה!

ההכרזה על o3 היתה רק יריית הפתיחה, וכפי שראינו מאוחר יותר, היכולות הללו החלו לחלחל גם למוצרים נגישים יותר עם שחרורו של o3 mini לקהל הרחב.

לטעמי, הגרף הזה אמנם לא נותן את התמונה המלאה על התחום, אבל מראה מצויין לאן פנינו מועדות!

arc-agi-o3.png

פרטים נוספים בפוסט הרשמי של מדד ARC:

https://arcprize.org/blog/oai-o3-pub-breakthrough

להתראות מתכנתים! 😑