מטא מציגה את Make-A-Video: מחולל וידאו מבוסס טקסט

לוגו מטא

חברת מטא (Meta) הכריזה על מערכת בינה מלאכותית חדשה בשם Make-A-Video, המגיעה כחלק ממחקר ה-Generative AI (“יצירה מבוססת בינה מלאכותית”) של החברה.

כפי שהשם שלה רומז, המערכת משמשת כמחולל וידאו מבוסס טקסט ומסוגלת לייצר כיום סרטוני וידאו קצרים באורך של 5 שניות על בסיס טקסט אותו מזינים המשתמשים.

בזמן שהספקנו להתרגל כבר למחוללי תמונות מבוססי טקסט דוגמת DALL·E של חברת OpenAI או Imagen של גוגל, מודל הבינה המלאכותית החדש של מטא, Make-A-Video, לוקח את את הצעד הנדרש הבא ומצליח לייצר קטעי וידאו שלמים על בסיס קלט טקסטואלי בלבד, תוך כדי שהוא מתבסס על מחולל התמונות Make-A-Scene של החברה.

נכון לרגע זה, מחולל ה-Make-A-Video מסוגל לייצר סרטונים קצרים באורך של 5 שניות בלבד ללא אודיו, המבוססים על 16 פריימים ברזולוציית 64×64 פיקסלים המשודרגים על ידי אלגוריתם נפרד לרזולוציית 768×768.

בעוד שקשה לומר כי מדובר על סרטוני וידאו באיכות גבוהה, הם גם רחוקים מלהיות “גרועים”, כפי שאפשר לראות מארבע הדוגמאות שיצר מחולל ה-Make-A-Video על סמך הטקסטים הבאים (בתרגום חופשי לעברית):

  • כלב בתלבושת גיבור על עם גלימה אדומה עף בשמיים.
  • חללית היפר-ריאליסטית נוחתת על המאדים.
  • אמן מצייר תמונה עם מכחול במבט מקרוב.
  • סוס שותה מים.

תחום מחולל התמונות ועכשיו גם מחוללי הוידאו מבוססי הטקסט הפך להיות אחד הדברים החמים ביותר בכל הנוגע לבינה מלאכותית כיום, כאשר סביר להניח שנזכה לראות בקרוב גרסאות משופרת של מודל ה-Make-A-Video באופן הדומה לזה בו השתדרגו מחוללי התמונות האחרים בשוק.


חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.

הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.

השוואת מפרטים