הכירו את Stable Cascade – מחולל התמונות החדש של Stability AI

Stable Cascade (מקור stability.ai) Stable Cascade (מקור stability.ai)

חברת Stability AI, המוכרת בזכות מחולל התמונות Stable Diffusion, הכריזה על Stable Cascade, מחולל תמונות חדש המגיע בעיצוב משופר ומסוגל לייצר תמונות באיכות ודיוק גבוהים יותר, לצד שימוש בפחות משאבים ומהירות יצירה גבוהה יותר.

לצד מודלי השפה הגדולים המוכרים לרובנו כצ’אטבוטים, אחד מהתחומים הגדולים ביותר בנושא הבינה המלאכותית הוא זה של מחוללי התמונות, דוגמת DALL·E 3 של OpenAI או Imagen 2 של גוגל וכמובן מודל ה-Stable Diffusion של החברה עצמה.

מודל ה-Stable Cascase החדש מצליח לייצר תמונות באיכות גבוהה יותר לעומת מודלים מתחרים, עם תאימות גבוהה יותר של התמונה לקלט הטקסטואלי ורמה גבוהה יותר של איכות אסתטית בהשוואה למודלי ה-SDXL ו-SDXL Turbo הקודמים של החברה, לצד מהירות יצירת תמונות גבוהה יותר.

דוגמאות Stable Cascade (מקור stability.ai)
דוגמאות Stable Cascade (מקור stability.ai)

בניגוד למודל ה-Stable Diffusion הקודם של החברה, Stable Cascase מבוסס על ארכיטקטורת ה-Würstchen (הסבר על הארכיקטורה) שנועדה להיות יעילה יותר בעבור מחוללי טקסט לתמונה, עם מבנה Cascade (“מפל”) המחבר בין שלושה מודלים שונים עם צמד מודלי Diffusion.

החלק הראשון במודל (Stage C) לוקח את הקלט הטקסטואלי של המשתמש ודוחס אותו לפיסות קוד קטנות יותר (Latent), שעוברות לשני השלבים האחרים (Stage A/B) על מנת לייצרת את התמונה עצמה בהתאם לקלט.

הפירוק לחלקים קטנים יותר מאפשר למחולל לעבוד יותר מהר, כאשר קלט שדרש 22 שניות ליצירה במודל ה-SDXL הקודם נוצר תוך 10 שניות בלבד במודל החדש.

מבנה מודל ה-Cascade Diffusion (מקור stability.ai)
מבנה מודל ה-Cascade Diffusion (מקור stability.ai)

לצד האפשרויות הרגילות ליצירת תמונות מטקסט, מודל ה-Stable Cascade תומך ביצירת תמונות על בסיס תמונות קיימות ושינוי תמונות קיימות בהתאם לקלט טקסטואלי עם אפשרויות אימון והתאמה טובות יותר בהשוואה לדור הקודם.

החברה הציגה מספר דוגמאות:

  • יצירת תמונה על בסיס תמונה קיימת, כאשר התמונה השמאלית ביותר היא המקורית:
יצירת תמונה על בסיס תמונה קיימת (מקור stability.ai)
יצירת תמונה על בסיס תמונה קיימת (מקור stability.ai)
  • מילוי חלל (Inpainting / Outpainting) בתמונות על בסיס טקסט:
מילוי
מילוי “חוסר” בתמונה (מקור stability.ai)
  • יצירת תמונה חדשה על ידי מעקב אחרי קווי מתאר (Canny Edge):
מעקב אחרי קווי מתאר (מקור stability.ai)
מעקב אחרי קווי מתאר (מקור stability.ai)
  • הכפלת רזולוציה (2x Super Resolution), שיפור של תמונות 1024×1024 ל-2048×2048, לדוגמה:
הכפלת רזולוציה (מקור stability.ai)
הכפלת רזולוציה (מקור stability.ai)

מודל ה-Stable Cascade זמין כעת בהדגמת מחקר מוקדמת לשימוש לא מסחרי, וניתן ללמוד עליו עוד באתר ה-GitHub הרשמי.


חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.

הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.

השוואת מפרטים