Alibaba Cloud, זרוע הענן של קבוצת עליבאבא (Alibaba) הסינית, הכריזה על Wan2.1, גרסה חדשה למודל מחולל הוידאו Wan של החברה, המגיע בדור הנוכחי כמודל קוד פתוח בגודל של עד 14 מיליארד פרמטרים, המסוגל לייצר וידאו מטקסט או תמונות באיכות של עד 720p.
לאחר שהציגה בחודש הקודם את מודל ה-Qwen 2.5-Max, שהגיע כמודל "מומחים מעורבים" MoE (ר"ת Mixture of Experts), עליבאבא מיישרת קו אל מול המתחרים, בהם בייטדאנס (ByteDance) הסינית עם מחולל הוידאו Goku שהוצג בתחילת החודש, ומחוללי וידאו נוספים, בהם Movie Gen של מטא, Lumiere של גוגל או Gen-3 של Runway.
המודל החדש מסוגל לייצר וידאו מטקסט או תמונות, לערוך סרטוני וידאו ואף לחולל תמונות, כאשר הוא זמין למעשה ב-4 גרסאות שונות:
- Wan2.1-T2V-1.3B – מודל טקסט לוידאו של 1.3 מיליארד פרמטרים.
- Wan2.1-T2V-14B – מודל טקסט לוידאו של 14 מיליארד פרמטרים.
- Wan2.1-I2V-14B-720p – מודל תמונה לוידאו של 14 מיליארד פרמטרים המסוגל לייצר וידאו 720p.
- Wan2.1-I2V-14B-480p – מודל תמונה לוידאו של 14 מיליארד פרמטרים המסוגל לייצר וידאו 480p.
במקרה של מודל ה-T2V-1.3B, הוא נועד להיות פתרון ייעודי למשתמשים ביתיים, כאשר הוא זקוק לנפח אחסון גרפי של 8.19GB בלבד, דבר המאפשר לו לעבוד על כמעט כל כרטיס מסך גרפי ולייצר לדוגמה וידאו ברזולוציית 480p באורך של 5 שניות בתוך כ-4 דקות בלבד על כרטיס RTX 4090 ללא שימוש במיטוב.
🌟 Big News from @alibaba_cloud! 🌟
Meet WanX – our next-gen AI model redefining video generation !🚀 Presenting mind-blowing demos from WanX 2.1!
🔥 Even more exciting:
WanX 2.1 will be OPEN-SOURCE !
Coming soon …#AIart #OpenSource pic.twitter.com/R1laOyJYAL— Wan (@Alibaba_Wan) February 20, 2025
בין הדוגמאות השונות לוידאו אותו מסוגל לייצר מודל ה-Wan2.1 החדש ניתן למצוא את הסרטון שיראה מוכר למשתמשים ממודל ה-Sora של OpenAI או Goku של ByteDance, ומגיע כחלק מסט הפרומפטים של מבחן ה-MovieGenBench:
אישה מסוגננת הולכת ברחוב בטוקיו. הרחוב מלא בשלטי נאון זוהרים וחמים עם שילוט מונפש של העיר. היא לובשת ז'קט עור שחור, שמלה אדומה ארוכה ומגפיים שחורים ונושאת ארנק שחור. היא לובשת משקפי שמש ושפתון אדום. היא הולכת בביטחון ונינוחות. הרחוב לח ומשקף, יוצר אפקט מראה של האורות הצבעוניים. הולכי רגל רבים מסתובבים.
מודלי ה-Wan2.1 החדשים זמינים להורדה ושימוש חופשי מאתר Hugging Face ו-GitHub, כאשר ניתן להתנסות במחולל הוידאו דרך אתר wan21 בהרשמה מראש (צפוי לזמני המתנה ארוכים).
חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.
הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.