חברת Stability AI נכנסת לתחום מודלי השפה ומציגה את StableLM

מודל ה-StableLM (מקור Stability AI) מודל ה-StableLM (מקור Stability AI)

חברת Stability AI, המוכרת בזכות מחולל התמונות Stable Diffusion, הכריזה על StableLM, מודל שפה גדול LLM (ר”צ large language models) הנמצא בשלב אלפא ראשוני ואומן באמצעות 3 ו-7 מיליארד פרמטרים.

מודל השפה החדש זמין לשימוש חופשי תחת רישיון ה-CC BY-SA-4.0, כאשר הוא כולל למעשה גם מספר תתי-מודולים יעודיים לשימושים מדעיים ספציפיים.

StableLM מבית Stability AI

קשה שלא להתפעל ממהירות הפיתוח בתחום הבינה המלאכותית, ובעוד שהתחום החם הקודם היה מחוללי תמונות דוגמת ה-Stable Diffusion של Stability AI, התחום הגדול הבא בעבור הבינה המלאכותית הוא מודלי שפה גדולים דוגמת ה-GPT-4 של OpenAI, המוכר יותר באמצעות הצ’אטבוט ChatGPT שהספיק למצוא את דרכו ללא מעט מוצרים טכנולוגיים, בהם מנוע החיפוש בינג של מיקרוסופט.

אחרי פיתוח מחולל התמונות המוצלח של החברה, Stability AI עושה את הצעד הבא ונכנסת לתחום מודלי השפה עם המודל StableLM, שעבר אימון באמצעות הדאטהסט (dataset) הפתוח The Pile  וזמין בגרסה שאומנה על 3 מיליארד פרמטרים וגם בגרסה של 7 מיליארד פרמטרים. לשם השוואה, GPT-3, המודל הקודם של OpenAI, אומן על ידי 165 מיליארד פרמטרים.

בהמשך, החברה צפויה להציג גרסאות מתקדמות יותר שמבוססות על אימון עם 15 עד 65 מיליארד פרמטרים, דבר שצפוי לשפר את הביצועים של המודל החדש, המציג לפי החברה ביצועים טובים כבר היום על היותו בגרסת אלפא מוקדמת.

דוגמת שימוש למודל ה-StableLM (מקור Stability AI)
דוגמת שימוש למודל ה-StableLM (מקור Stability AI)

קוד המקור של מודל ה-StableLM זמין דרך אתר GitHub, כאשר ניתן להתנסות בגרסת האלפא 7B של המודל דרך אתר Hugging Face Space.


חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.

הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.

השוואת מפרטים