חברת Stability AI, המוכרת בזכות מחולל התמונות Stable Diffusion, הכריזה על StableLM, מודל שפה גדול LLM (ר"צ large language models) הנמצא בשלב אלפא ראשוני ואומן באמצעות 3 ו-7 מיליארד פרמטרים.
מודל השפה החדש זמין לשימוש חופשי תחת רישיון ה-CC BY-SA-4.0, כאשר הוא כולל למעשה גם מספר תתי-מודולים יעודיים לשימושים מדעיים ספציפיים.
StableLM מבית Stability AI
קשה שלא להתפעל ממהירות הפיתוח בתחום הבינה המלאכותית, ובעוד שהתחום החם הקודם היה מחוללי תמונות דוגמת ה-Stable Diffusion של Stability AI, התחום הגדול הבא בעבור הבינה המלאכותית הוא מודלי שפה גדולים דוגמת ה-GPT-4 של OpenAI, המוכר יותר באמצעות הצ'אטבוט ChatGPT שהספיק למצוא את דרכו ללא מעט מוצרים טכנולוגיים, בהם מנוע החיפוש בינג של מיקרוסופט.
אחרי פיתוח מחולל התמונות המוצלח של החברה, Stability AI עושה את הצעד הבא ונכנסת לתחום מודלי השפה עם המודל StableLM, שעבר אימון באמצעות הדאטהסט (dataset) הפתוח The Pile וזמין בגרסה שאומנה על 3 מיליארד פרמטרים וגם בגרסה של 7 מיליארד פרמטרים. לשם השוואה, GPT-3, המודל הקודם של OpenAI, אומן על ידי 165 מיליארד פרמטרים.
בהמשך, החברה צפויה להציג גרסאות מתקדמות יותר שמבוססות על אימון עם 15 עד 65 מיליארד פרמטרים, דבר שצפוי לשפר את הביצועים של המודל החדש, המציג לפי החברה ביצועים טובים כבר היום על היותו בגרסת אלפא מוקדמת.
קוד המקור של מודל ה-StableLM זמין דרך אתר GitHub, כאשר ניתן להתנסות בגרסת האלפא 7B של המודל דרך אתר Hugging Face Space.
חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.
הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.