סוכן AI חכם לפיתוח תוכנה: OpenAI משיקה את Codex

Codex (מקור OpenAI) Codex (מקור OpenAI)

OpenAI הכריזה על Codex, סוכן תכנות מבוסס בינה מלאכותית המתמחה בפיתוח תוכנה ופועל בסביבת ענן. בניגוד למודלים הקודמים של החברה, Codex מסוגל לעבוד על מספר משימות במקביל, כאשר כל משימה רצה בסביבת ענן נפרדת המוטענת מראש עם מאגר הקוד של המשתמש.

סוכן ה-Codex החדש מגיע כמענה של OpenAI לסוכני תכנות מתחרים דוגמת AlphaEvolve של גוגל, כאשר הוא מבוסס על codex-1, גרסה מותאמת של מודל ה-o3 שעברה אופטימיזציה ייעודית לפיתוח תוכנה.

המודל אומן באמצעות למידת חיזוק על משימות קידוד אמיתיות במגוון סביבות, במטרה לייצר קוד שמתאים לסגנון האנושי, נצמד להוראות בדייקנות, ומסוגל להריץ בדיקות באופן חוזר עד לקבלת תוצאה תקינה.

יכולות מתקדמות מעבר למודלים רגילים

בעוד שמודלי AI רגילים לכתיבת קוד מסוגלים להציע קטעי קוד או לענות על שאלות פשוטות, Codex מציע מספר יתרונות משמעותיים:

  • עבודה על מאגרי קוד מלאים – בניגוד למודלים רגילים המוגבלים לקטעי קוד קצרים, Codex יכול לעבוד עם מאגרי קוד שלמים, לקרוא ולערוך קבצים, ולהריץ פקודות.
  • ביצוע משימות מורכבות – כתיבת פיצ'רים חדשים, תיקון באגים, והגשת בקשות משיכה (pull requests) לסקירה.
  • הרצת בדיקות ותיקונים – הרצת סביבות בדיקה, בודקי תחביר (linters) ובודקי טיפוסים.
  • שקיפות מלאה – מספק ראיות לפעולותיו באמצעות ציטוטים מלוגים של הטרמינל ופלט הבדיקות.
ממשק ה-Codex (מקור OpenAI)
ממשק ה-Codex (מקור OpenAI)

אופן הפעולה של Codex

משתמשים יכולים לגשת ל-Codex דרך הסרגל הכלים הצדדי ב-ChatGPT ולהקצות משימות קידוד חדשות על ידי הקלדת הנחיה ולחיצה על "Code". לשאלות על בסיס הקוד, ניתן ללחוץ על "Ask". משך השלמת המשימה נע בין דקה ל-30 דקות, בהתאם למורכבות.

ניתן לספק הנחיות ל-Codex באמצעות שילוב קבצי AGENTS.md בתוך מאגר הקוד, קבצים המספקים מידע כיצד לנווט בבסיס הקוד, אילו פקודות להריץ לבדיקות, וכיצד לעמוד בפרקטיקות הסטנדרטיות של הפרויקט בדומה לקבצי README.md המספקים מידע.

ביצועים מרשימים בהשוואה למודלים אחרים

במבחני ביצועים, codex-1 מציג תוצאות מרשימות גם ללא קבצי AGENTS.md או סביבות מותאמות אישית.

במבחן ה-SWE-Bench המודל משיג דיוק של כ~72%, לעומת כ~69% של מודל ה-o3-high, כאשר במבחנים פנימיים של OpenAI ה- codex-1 משיג ביצועים גבוהים יותר מכל מודלי החברה האחרים.

מבחני ביצועים Codex (מקור OpenAI)
מבחני ביצועים Codex (מקור OpenAI)

זמינות

Codex מושק כעת בגרסת תצוגה מוקדמת למשתמשי ChatGPT Pro, Enterprise ו-Team, עם תמיכה למשתמשי Plus ו-Edu שתגיע בקרוב.

בשבועות הקרובים, המשתמשים ייהנו מגישה ל-Codex ללא עלות נוספת, כאשר לאחר מכן תיושם גישה מוגבלת ואפשרויות תמחור גמישות.

סרטון השקת ה-Codex:

השוואת מפרטים