חברת OpenAI חשפה במהלך “עדכון האביב” (Spring Update) שנערך השבוע את GPT-4o (ה-o מייצג Omni או “הכל”), מודל הבינה המלאכותית החדש והמשופר שלה, המיועד לספק חווית שימוש הדומה יותר לשיחה עם בן אדם בזכות תמיכה בקלט טקסטואלי, ויזואלי וקולי ואפשרות לפלט דומה.
המודל החדש מיועד לשמש כעוזר וירטואלי עם זמן תגובה נמוך במיוחד לשמע של עד 232 מילי-שניות, קצב שיחה הדומה יותר לבן אדם, זאת כאשר הוא מציע מהירות גבוהה פי 2 בחצי מהעלות בהשוואה ל-GPT-4 Turbo.
הכירו את GPT-4o
לאחר שהחלה את מירוץ החימוש הגדול בתחום הבינה המלאכותית עם הצגת מודל ה-GPT וצ’אטבוט ה-ChatGPT, נראה כי OpenAI מצליחה לפתוח פער חדש על המתחרות הרבות שלה כיום עם מודל ה-GPT-4o החדש, אותו אפשר לתאר בשלב הנוכחי כגרסה החיה והאמיתית למדי של העוזרת הקולית מהסרט “היא” (Her), כאשר החברה מתכננת לאפשר למשתמשים לנהל שיחות וידאו עם ChatGPT על מנת לתת למודל אפשרות להבין את הסביבה שלו ואת המשתמש עצמו.
אחד השיפורים הגדולים ביותר של מודל ה-GPT-4o הוא ביכולת שלו לדבר עם המשתמש. OpenAI הציגה פיצ’ר שיחה קולית (Voice Mode) שהיה זמין עם מודלי ה-GPT-3.5 ו-GPT-4 הקודמים שלה, שהציגו זמני שיהוי ארוכים למדי של 2.8 ו-5.4 שניות, בהתאמה, לאור הצורך להמיר שמע לטקסט וטקסט לשמע.
לעומתם, מודל ה-GPT-4o החדש מציג זמן שיהוי נמוך במיוחד של עד 232 מילי-שניות, עם ממוצע של 320 מילי-שניות לקבלת רצף דיבור “אנושי” יותר.
עם זאת, היכולות של המודל לא מוגבלות לשיחות אודיו בלבד והוא תומך גם בקלט ויזואלי, דבר המאפשר לו להבין את העולם שסביבו ואף לשמש כעיניים וירטואליות בעבור משתמשים בעלי מוגבלויות ראיה עם האפשרות לתאר את העולם הסובב אותם, זאת לצד יכולות ויזואליות נוספות כמו יצירת תמונות באיכות גבוהה בהתאם לקלט של המשתמש כחלק מאותה השיחה איתו.
ביצועי מודל ה-GPT-4o
על פי המידע הרשמי של החברה, מודל ה-GPT-4o החדש מציג רף ביצועים חדש בעבור מודלי AI לא רק בהשוואה למודלי ה-GPT-4 ו-GPT-4 Turbo של OpenAI עצמה, אלא גם בהשוואה למודלים הגדולים של החברות האחרות, בהם ה-Gemini Pro 1.5 ו-Gemini Ultra 1.0 של גוגל, מודל ה-Llama3 של מטא ומודל ה-Claude 3 Opus של Anthropic, שגם מצליח להיות המודל היחיד עם יתרון קל עליו במבחן ה-MGSM.
להלן טבלת השוואת הביצועים שסיפקה OpenAI:
אפליקציית ChatGPT למחשב
אחרי שהשיקה אפליקציות ChatGPT יעודיות לאנדרואיד ו-iOS, חברת OpenAI עושה את הצעד הבא עם הבאת ה-ChatGPT גם למחשבים עם אפליקציה יעודית חדשה למחשבי ה-MacOS של אפל בשלב הראשון.
האפליקציה החדשה תאפשר לעבוד עם ChatGPT ישירות מהמחשב ללא צורך להשתמש באתר החברה, כאשר היא מאפשרת למשתמשים לבצע פעולות בהתאם לתוכן המוצג על מסך המחשב (באישור המשתמש בלבד)’ דוגמת תמצות מסמכי טקסט הפתוחים על המסך ועוד.
אפליקציית ה-ChatGPT למחשב תהיה זמינה בשלב הראשון בעבור משתמשי MacOS עם מנויי ה-ChatGPT Plus בתשלום, אך תהפוך להיות זמינה גם בעבור משתמשים חינמיים במהלך השבועות הקרובים, כאשר מאוחר יותר השנה החברה תציג גרסה יעודית גם בעבור מחשבי ווינדוס.
גישה ל-GPT-4o בחינם
מודל ה-GPT-4o החדש יהיה זמין בחינם עבור כלל המשתמשים ללא גישה גישה למצבי השמע והשיחה בשלב הראשוני, זאת לאור האפשרות לשימוש לרעה בתמיכת המודל בשמע, פיצ’ר שיהיה זמין במהלך השבועות הקרובים בגרסת אלפא למשתמשי ה-ChatGPT Plus בתשלום, שיזכו גם למגבלת שימוש גבוהה פי חמש לעומת משתמשים חינמיים. החברה לא ציינה את גודל המגבלה, אלא רק כי לאחר שמשתמש חינמי יגיע אליה הוא יועבר לשימוש ב-GPT-3.5.
ניתן לראות את כלל ההדגמות של מודל ה-GPT-4o החדש באתר הרשמי, ואת אירוע האביב המלא של OpenAI בסרטון הבא:
חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.
הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.