חברת Stability AI הכריזה על ה-Stable Diffusion 3, הגרסה החדשה ביותר של מחולל התמונות Stable Diffusion אותו יצרה, המגיע במספר רמות אימון של עד 8 מיליארד פרמטרים. המודל החדש מסוגל לייצר תמונות באיכות ודיוק גבוהים יותר, עם יכולת התמודדות טובה יותר באוביקטים מרובים ובשילוב טקסט בתמונות.
על אף שהחברה הציגה מוקדם יותר החודש את מודל ה-Stable Cascade המתבסס על ארכיטקטורת ה-Würstchen, היא אינה זונחת את מודל ה-Stable Diffusion הוותיק יותר ומציגה את מודל ה-Stable Diffusion 3, המגיע כמודל החמישי במשפחת ה-Stable Diffusion שלה.
מודל ה-Stable Diffusion 3 מסוגל לייצר תמונות באיכות, דיוק ומהירות גבוהים יותר בהשוואה לגרסאות ה-SD הקודמות, עם דגש על ריבוי אובייקטים בתמונה ושילוב טקסט.
המודל הוא למעשה "משפחת מודלים" בגדלים שונים, החל מ-800 מיליון (פחות ממודל ה-SD 1.5) ועד 8 מיליארד פרמטרים (יותר ממודל ה-SDXL), כאשר הוא משלב את ארכיטקטורות ה-Diffusion Transformer ו-Flow Matching לקבלת תוצאות משופרות, בדומה למחולל הוידאו Sora החדש והמרשים במיוחד של Open AI.
דוגמאות לתמונות במחולל ה-Stable Diffusion 3:
תמונה קולנועית של תפוח אדום על שולחן בכיתה, כשעל הלוח מופיעות המילים "לך בגדול או לך הביתה" כתובות בגיר.
ציור של אסטרונאוט רוכב על חזיר לובש חצאית "טוטו" ומחזיק מטריה ורודה. על הקרקע ליד החזיר ציפור אדום-החזה ("רובין") חובשת כובע צילינדר, ובפינה המילים "דיפוזיה יציבה".
מודל ה-Stable Diffusion 3 מוגדר כעת כגרסת הדגמה מוקדמת (Preview) בטרם יושק בצורה פומבית, כאשר החברה מאפשרת למשתמשים לבצע הרשמה מוקדמת על מנת לקבל גישה לגרסת ההדגמה באתר הרשמי.
חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.
הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.