חברת Stability AI, המוכרת במיוחד בזכות מחולל התמונות Stable Diffusion, הכריזה על Stable Audio Open, מחולל אודיו מטקסט המאפשר למשתמשים ליצור דגימות שמע קצרות באורך של 47 שניות בלבד, אותן יכולים המשתמשים לשלב ביצירות שלהם באופן חינמי ופתוח.
למרות שרובנו מכירים את Stability AI ממודל ה-Stable Diffusion, שעודכן בתחילת השנה לגרסת Stable Diffusion 3, החברה מציעה מגוון מודלים אחרים, דוגמת StableLM, Stable Video 3D, Stable Cascade, בהם גם מחולל האודיו המסחרי Stable Audio עליו בוסס מודל ה-Stable Audio Open הפתוח והבסיסי יותר.
המודל החדש לא מאפשר ליצור שירים או מנגינות שלמות, אלא מיועד ליצירת דגימות שמע קצרות ("סמפלים") של תופים וכלי נגינה שונים, צלילי סביבה ועוד באורך של עד 47 שניות בלבד ובאיכות של 44.1kHz, זאת על ידי הזנת טקסט המתאר את המנגינה שתבקשו לייצר.
בקטעים שנוצרו ניתן להשתמש באופן חופשי וחינמי לאחר שהמודל החדש אומן על ספריות השמע FreeSound ו-Free Music Archive.
דוגמאות
החברה הציגה שלוש דוגמאות לקטעי אודיו אותן יצר המודל החדש (בתרגום חופשי לעברית):
- "ארפג'יו חמים על סינתיסייזר אנלוגי עם חתך פילטר שעולה בהדרגה וזנב הדהוד"
- "קצב רוק מנוגן באולפן מטופל, סשן תיפוף על ערכה אקוסטית"
- "שיר ציפורי שחור, קיץ, בין ערביים ביער"
מודל ה-Stable Audio Open 1.0 החדש זמין דרך אתר Hugging Face.
בנוסף, החברה חשפה מוקדם יותר בתעורכת Computex 2024 כי מודל מחולל התמונות Stable Diffusion 3 שהוכרז בתחילת השנה יהיה זמין בצורה פומבית החל מה-12 ביוני.
חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.
הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.