מטא (Meta) הציגה אמש (ג', 23.7) את מודל ה-Llama 3.1, גרסה משודרגת של מודל הבינה המלאכותית Llama 3, שתהיה זמינה בגרסת 405 מיליארד פרמטרים ענקית חדשה.
מודל הבינה המלאכותית הוצג בקוד פתוח ומסוגל להציג ביצועים קרובים ובחלק מהמקרים אף טובים יותר ממודלים של חברות מתחרות כמו OpenAI ואנתרופיק.
מודלי ה-AI השונים הזמינים כיום מתחלקים לשני סוגים:
- מודלים "סגורים" דוגמת GPT-4/4o של OpenAI או Claude 3.5 Sonnet של אנתרופיק, בהם יש צורך לשלם על השימוש.
- מודלים "פתוחים" כמו Llama של מטא, המאפשרים שימוש חופשי ונגיש יותר, כאשר החברה עובדת עם ענקיות טכנולוגיה דוגמת AWS של אמזון, מיקרוסופט, Google Cloud, אנבידיה ועוד על מנת להנגיש את המודל למשתמשים השונים.
מודל ה-Llama 3.1 מגיע כעדכון למודל ה-Llama 3 המקורי שהוצג בחודש אפריל, כאשר לצד גרסאות של 8 ו-70 מיליארד פרמטרים, המודל החדש יהיה זמין גם בגרסה "ענקית" של 405 מיליארד פרמטרים, גרסה שאומנה על בסיס של 15 טריליון טוקנים של מידע פומבי ומעל 25 מיליון דוגמאות סינטטיות עם מידע המעודכן עד דצמבר 2023.
לפי מבחני הביצועים השונים שערכה החברה, מודל ה-Llama 3.1 החדש מציג ביצועים קרובים או טובים יותר מול מודלי ה-AI הסגורים בכל הקשור לידע כללי, מתמטיקה, יכולות היגוי, שימוש בכלים ותרגום רב-לשוני.
לצד מבחני הביצועים הרגילים בתחום הבינה המלאכותית, מטא הציגה השוואה מעניינת יותר בהתבסס על חוות דעת אנושית על התגובות של מודלי ה-AI השונים, עם השוואה של מודל ה-Llama 3.1 405B החדש למודלי ה-GPT-4-0125, GPT-4o ו-Claude 3.5 Sonnet.
בשלושת המקרים, כ~50% מהמשתמשים הגדירו לפי מטא את המענה כדומה עם "שיוויון" בין המודלים, כאשר למודל החדש שלה יש יתרון קל על ה-Claude וחיסרון קל מול מודלי ה-GPT, ועדיין צריך לזכור את הדבר החשוב ביותר, בניגוד אליהם ה-Lama 3.1 הוא מודל קוד פתוח.
ניתן לבקש גישה למודל ה-Llama 3.1 החדש של מטא דרך האתר הרשמי של החברה, כאשר הוא זמין ב-GitHub ו-Hugging Face.