משפחת מודלי ה-o3 של OpenAI מתמקדת בשיקול דעת

לוגו OpenAI

חברת OpenAI הכריזה על משפחת מודלי הבינה המלאכותית o3, גרסה משופרת של מודלי ה-o1, הממוקדת בתחום "שיקול הדעת" והיכולת לנמק את התשובות, בדגש על בעיות מסובכות ומרובות שלבים וכתיבת קוד, מודל שיהיה זמין גם בגרסת o3-mini זעירה ומהירה יותר.

מודלי ה-o3 החדשים של OpenAI מגיעים כדור ההמשך למשפחת מודלי ה-o1 שהוכרזו בחודש ספטמבר השנה כמודלים בעלי יכולת שיקול דעת ונימוק גבוהים יותר מסדרת מודלי ה-GPT של החברה, כאשר החברה בחרה לדלג על השם o2 הנמצא בשימוש על ידי חברת תקשורת.

על פי ההכרזה שלה, מודל ה-o3 החדש מציג התקדמות מרשימה לכיוון הגדרות כמודל "בינה מלאכותית כללית" AGI (ר"ת artificial general intelligence), ה"גביע הקדוש" של תחום הבינה המלאכותית, עם ביצועים של 87.5% במבחן ARC-AGI.

מבחן ביצועים AGI (מקור OpenAI)
מבחן ביצועים AGI (מקור OpenAI)

בדומה ל-o1, משפחת ה-o3 תכלול את מודל ה-o3 הראשי ולצידו גרסת o3-mini זעירה, זולה ומהירה יותר בהשוואה למודל ה-o3 הרגיל.

ניתן יהיה להפעיל אותם בשלוש הגדרות רמות שימוש שונות: נמוכה (low), בינונית (medium) וגבוהה (high), רמות המגדירות את הזמן שמשקיע המודל ב"מחשבה" על התשובה, עם אפשרות לקבלת מענה מהיר, אך פחות מדויק, או מענה איטי, אך מדויק יותר.

ביצועי o3-mini ברמות שימוש שונות (מקור OpenAI)
ביצועי o3-mini ברמות שימוש שונות (מקור OpenAI)

בתחרות כתיבת הקוד Codeforces, מודל o3 החדש מציג שיפור ביצועים של מעל 20% בתכנות בהשוואה למודל ה-o1 עם תוצאה של 2727 נקודות לעומת 1891 ל-o1.

ניתן לראות שיפור גם במבחני הביצועים המתמטיים עם ציון של 96.7 במבחן ה-AIME 2024 לעומת 83.3 ובמבחן ה-GPQA Diamond, שנועד לענות שאלות מדעיות ברמה של דוקטורט, עם ציון של 87.7 לעומת 78.0 של מודל ה-o1.

זמינות

מודלי ה-o3 החדשים של OpenAI אינם זמינים בשלב הנוכחי לציבור הרחב ונמצאים בשלבי בדיקה ובטיחות עם זמינות לחוקרים.

החברה צפויה להשיק את ה-o3-mini בחודש ינואר 2025 ואת מודל o3 זמן מה לאחר מכן.

הכרזת ה-OpenAI o3/o3-mini:


חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.

הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.

השוואת מפרטים