חברת OpenAI הכריזה על משפחת מודלי בינה מלאכותית חדשה בשם o1, מודלי AI עם דגש גדול על “שיקול דעת” ויכולת לנמק את התשובות, בדגש על בעיות מסובכות ומרובות שלבים וכתיבת קוד, זאת בהשוואה למודל ה-GPT-4o הקיים של החברה.
המשפחה החדשה תכלול בשלב הראשון את גרסת ההדגמה o1-preview ואת גרסת ה-o1-mini הזעירה והזולה יותר בהשוואה למודל הרגיל, כאשר המודל מסוגל לתת מענה טוב יותר על שאלות מסובכות ברמה אקדמית.
בזמן ש-OpenAI החלה את מירוץ ה-AI הגדול בו אנו נמצאים כיום עם הצגת צ’אטבוט ה-ChatGPT ומשפחת מודלי ה-GPT, בהם ה-GPT-4o העדכני, המודלים הללו התמקדו בעיקר במהירות ורב-תכליתיות בדור האחרון.
בניגוד להם, מודלי ה-o1 עברו אימון באמצעות מערך מידע חדש שהותאם במיוחד לשימוש שלהם עם דגש על ספרות מקצועית, בנוסף לשימוש באלגוריתם אופטימיזציה חדש על מנת להתמחות במענה על בעיות מרובות שלבים, מענה על שאלות בתחום המדע, בריאות, טכנולוגיה וכתיבת קוד.
בעוד שמודלי ה-GPT הקודמים למדו על ידי “חיקוי דפוסים” (mimic patterns) במידע עליהם הם אומנו, מודלי ה-o1 החדשים אומנו על פתרון בעיות מרובות שלבים בשיטה של “למידת חיזוק” (reinforcement learning) עם שרשרת מחשבה הדומה לאופן בו בני אדם מעבדים בעיות מסובכות – שלב אחרי שלב.
שיטה זו גורמת למודלים החדשים להיות איטיים יותר מ-GPT, אך הם צפויים לספק תשובות טובות ומדויקות יותר בהשוואה אליהם. עם זאת, המודל לא כולל בשלב הנוכחי יכולות מתקדמות כמו גישה לרשת או עיבוד תמונות הקיימים במודלי ה-GPT.
We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.
These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu
— OpenAI (@OpenAI) September 12, 2024
ביצועי ויכולות מודלי ה-o1
את היכולות החדשות של מודל ה-o1 ניתן לראות במבחני מתמטיקה דוגמת AIME 2024, בהם הוא השיג תוצאה של 83.3% במענה על שאלות בהשוואה ל-13.4% בלבד של מודל ה-GPT-4o.
הבדל זה נשמר גם בבדיקת המודל בתחרות כתיבת הקוד Codeforces עם תוצאה של 89 לעומת 11, פער שמצטמצם במבחן ה-GPQA Diamond, שנועד לענות שאלות מדעיות ברמה של דוקטורט עם ציון של 78 לעומת 56.1 של מודל ה-GPT-4o, זאת בזמן שמומחה אנושי שבחנה החברה הציג תוצאות של 69.7 בלבד.
בין הדוגמאות השונות ליכולת ההיגיון של מודל ה-o1 החדש, OpenAI הציגה לדוגמה את המענה של המודל לחידה לוגית הבאה:
A princess is as old as the prince will be when the princess is twice as old as the prince was when the princess’s age was half the sum of their present age. What is the age of prince and princess? Provide all solutions to that question
על החידה הלוגית ענה מודל ה-o1 החדש לאחר כ-30 שניות, זמן ארוך במיוחד בהשוואה למודלי AI אחרים, אך עם מענה נכון ומלא יותר לחידה בצורה בה בן-אדם היה עונה עליה.
OpenAI o1 solves a complex logic puzzle. pic.twitter.com/rpJbh8FkAg
— OpenAI (@OpenAI) September 12, 2024
זמינות ומחירים
מודל ה-o1 החדש של OpenAI לא נועד להחליף את ChatGPT, אלא לתת מענה לשימושים ספציפיים תוך כדי שהוא מגיע בעלות קלט גבוהה פי 3 מ-GPT-4o של 15 דולר לכל מיליון טוקני קלט ועלות פלט גבוהה פי 4 של 60 דולר לכל מיליון טוקני פלט, כאשר מיליון טוקנים שווים בערך לכ~750 אלף מילים.
עם זאת, מודל ה-o1-mini הזעיר צפוי להיות זמין בעתיד בחינם בעבור כלל משתמשי ChatGPT, אם כי החברה לא מסרה צפי זמינות למודל זה עבור משתמשי ChatGPT שאינם משלמים.
מודלי ה-o1-preview ו-o1-mini זמינים מהיום למשתמשי ה-ChatGPT Plus בתשלום, כאשר הם מגיעים עם מגבלת שימוש של 30 ו-50 הודעות יומיות נכון לעכשיו.
חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.
הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.