אנתרופיק משיקה את Claude 4: הדור הבא של מודלי הבינה המלאכותית

Claude 4 (מקור anthropic) Claude 4 (מקור anthropic)

אנתרופיק (Anthropic) הכריזה היום (ה', 25.5) על השקת הדור הרביעי של מודל הבינה המלאכותית שלה Claude עם מודלי ה-Claude Opus 4 ו-Claude Sonnet 4, שמציבים סטנדרטים חדשים בעולם הקידוד, החשיבה המתקדמת ומערכות AI אוטונומיות ומגיעים כשדרוג משמעותי לדברי החברה לעומת מודל ה-Claude Sonnet 3.7 הקודם.

לצד שני המודלים החדשים, Anthropic מכריזה השקה רחבה של Claude Code, סוכן כתיבת הקוד הראשון של החברה שהושק בצורה מוגבלת לצד מודל ה-Claude 3.7 Sonnet מוקדם יותר השנה.

מודלי Claude 4

שני מודלי ה-Claude החדשים מציעים מבנה היברידי חדשני עם שני מצבי פעולה – תגובות כמעט מיידיות לצד חשיבה עמוקה יותר:

  • Claude Opus 4 מתמחה בביצועים מתמשכים במשימות ארוכות טווח ומורכבות שדורשות מיקוד וכמה אלפי שלבים, עם יכולת לעבוד באופן רציף למשך מספר שעות. החברה מציינת כי המודל מנצח בבמחני ביצועים קריטיים כמו SWE-bench עם ציון של 72.5% ו-Terminal-bench עם 43.2%.
  • Claude Sonnet 4 משפר משמעותית את היכולות המובילות של גרסה 3.7, עם התמחות בקידוד וציון מרשים של 72.7% ב-SWE-bench. המודל מספק איזון אופטימלי בין ביצועים ויעילות עם שליטה משופרת בביצוע הוראות מורכבות.
מודלי Claude 4 (תמונה: Anthropic)
מודלי Claude 4 (תמונה: Anthropic)

זיכרון ויכולות חיפוש ברשת

המודלים החדשים מגיעים בנוסף עם פיצ'ר בטא של "חשיבה מורחבת עם שימוש בכלים" (Extended thinking with tool use), המאפשר למודלים למודלים להשתמש בכלים כמו חיפוש אינטרנט במהלך תהליכי החשיבה המורחבת. התכונה מאפשרת ל-Claude לחלופין מודל חשיבה לשימוש בכלים לקבלת תוצאות משופרות.

שני המודלים מסוגלים לעקוב בצורה טובה יותר אחר הוראות המשתמש עם אפשרות לשיפור הזיכרון של המודלים במידה והמשתמש מעניק למודלים גישה לקבצים המקומיים.

לבסוף, החברה הציגה "תקצירי חשיבה" (Thinking summaries) המעניקים תמצית לתהליך החשיבה של המודל במקום קבלת כל המידע המורחב להבנה טובה יותר של תהליך החשיבה שלו.

יכולות ביצועים ובמחנים

נתוני הביצועים של Claude 4 מרשימים במיוחד בתחומי הקידוד והחשיבה המתקדמת. המודלים מצליחים להציג שיפור ביצועים במבחן ה-SWE-bench Verified בהשוואה למודל ה-Sonnet 3.7, מדד ביצועים לביצוע משימות הנדסת תוכנה אמיתיות, ומציגים ביצועים חזקים לרוחב קידוד, חשיבה, יכולות מולטימודליות ומשימות אוטונומיות.

בנוסף לשיפורים בביצועים, שני המודלים מפחיתים ב-65% את הנטייה להשתמש בקיצורי דרך או פרצות לביצוע משימות בהשוואה ל-Sonnet 3.7, במשימות אוטונומיות שרגישות במיוחד לסוג זה של התנהגות.

מבחני ביצועים Claude 4 (מקור anthropic)
מבחני ביצועים Claude 4 (מקור anthropic)

Claude Code: פלטפורמת פיתוח מתקדמת

לאחר שקיבל משוב חיובי נרחב במהלך תקופת הבטא, Claude Code זמין כעת באופן כללי ומרחיב את האפשרויות לפתחים לשתף פעולה עם Claude.

השירות כולל תמיכה במשימות רקע דרך GitHub Actions ואינטגרציות עם VS Code ו-JetBrains, המציגות עריכות ישירות בקבצים לחוויית תכנות חלקה.

הפלטפורמה כוללת גם SDK להרחבה המאפשר למפתחים לבנות מערכות אוטונומיות ואפליקציות משלהם באמצעות אותה ליבה של Claude Code, לצד דוגמה ל-Claude Code על GitHub שמאפשרת תיוג של Claude Code ב-PRs לתגובה על משוב של סוקרים, תיקון שגיאות CI או שינוי קוד.

תמחור וזמינות

שני מודלי ה-Claude 4 החדשים זמינים במסגרת התוכניות Pro, Max, Team ו-Enterprise של Claude ופלטפורמות נוספות, בהן Vertex AI של גוגל, Amazon Bedrock ועוד. מודל ה-Sonnet 4 זמין גם למשתמשים החינמיים של החברה.

מבחינת תמחור בשימוש ב-API, מחיר השימוש במודל ה-Opus 4 עומד על 15/75 דולר לכל מיליון טוקני קלט/פלט ואילו מחיר השימוש ב-Sonnet 4 עומד על 3/15 דולר בהתאמה.


חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.

הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.

השוואת מפרטים