הכירו את MusicGen – מחולל המוזיקה מבוסס הטקסט של מטא

לוגו מטא

חוקרי הבינה המלאכותית של חברת מטא (Meta) יצרו את מודל ה-MusicGen, מחולל מוזיקה חדש המאפשר ליצור קטעים מוזיקליים בתבסס על קלט טקסטואלי ומסוגל לקחת קטעי מוזיקה קיימים ולהתאים אותם בהתאם לקלט של המשתמש.

בינה מלאכותית נחשבת לתחום החם והגדול הבא בעולם הטכנולוגיה וחברות רבות, בהן מטא, מציגות באופן תדיר פיתוחים חדשים אותם ניתן לחלק לתתי-תחומים שונים כמו פתרונות Generative AI, בהם מחוללי תמונות רבים, מחוללי וידאו דוגמת Make-A-Video של מטא ואף מחוללי מוזיקה דוגמת MusicLM של גוגל.

עכשיו מטא מציגה את MusicGen, מחולל מוזיקה חדש המגיע כפרויקט קוד פתוח (GitHub) המבוסס על מודל טרנספורמר (Transformer model) שאומן על 20 אלף שעות של מוזיקה ברישיון, מהם 10 אלף שעות של מוזיקה באיכות גבוהה וקבצי מוזיקה מ-ShutterStock ו-Pond5.

המחולל MusicGen מסוגל לייצר קטעי מוזיקה בהתאם לקלט טקסטואלי רגיל, אך גם לקבל כקלט גם קטעי מוזיקה אחרים ולשנות אותם בהתאם לטקסט אותו מכניס המשתמש כפי שאפשר לראות בקטע ההדגמה הבא.

החוקרים פרסמו את המחקר שלהם בנוגע למחולל המוזיקה החדש, כאשר באופן מעניין ניתן לקרוא במחקר כי מבדיקות שנערכו על 3 גרסאות של מודל ה-MusicGen עם 300 מיליון, 1.5 מיליארד ו-3.3 מיליארד פרמטרים, המודלים הגדולים יותר יצרו מוזיקה באיכות טובה יותר, אך מודל ה-1.5 מיליארד זכה להעדפה גדולה יותר מצד אנשים, בעוד מודל ה-3.3 מיליארד דייק יותר ביצירת המוזיקה בהתאם לטקסט.

ניתן להתנסות בדמו של מחולל ה-MusicGen החדש של מטא באתר Hugging Face.


חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.

הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.

השוואת מפרטים