גוגל מציגה את Imagen Video: מחולל וידאו מבוסס טקסט

מחולל הוידאו Imagen Video (מקור Imagen) מחולל הוידאו Imagen Video (מקור Imagen)

גוגל (Google) הכריזה על Imagen Video, מחולל הוידאו מבוסס הטקסט החדש של החברה המסוגל לייצר סרטונים קצרים על סמך תיאור טקסטואלי המתבסס בתורו על Imagen, מחולל התמונות מבוסס הטקסט שלה.

הכרזה זו מסמנת למעשה את השלב הבא בתחום הבינה המלאכותית, כאשר המחולל מגיע כמענה ישיר לזה של חברת מטא, שהכריזה בחודש הקודם על מחולל ה-Make-A-Video.

מחקר בתחום הבינה המלאכותית נחשב לדבר הגדול הבא בעבור חברות רבות, כאשר בתוכו אפשר למצוא את תחום מחוללי התמונות מבוססי הטקסט ש"התפוצץ" עם הצגת מחולל ה-DALL·E אותו פיתחה OpenAI, מחולל שהפך לאחרונה לזמין לכלל הציבור, כאשר חברות נוספות הציעו מחוללים משלהן, דוגמת Stable Diffusion, Midjourney ו-Imagen של גוגל.

אלגוריתם יצירת הוידאו של Imagen Video מתבסס על יצירת "וידאו בסיס" הכולל 16 פריימים ברזולוציית 24×48 פיקסלים ומהירות של 3 פריימים בשניה בלבד.

הוידאו עובר שיפור דרך מספר מודולי דיפוזיה מסוג TSR (ר"ת Temporal Super-Resolution) ו-SSR (ר"ת Spatial Super-Resolution), המייצרים סרטון וידאו הכולל 128 פריימים ברזולוציית 1280×768 פיקסלים ב-24 פריימים לשניה לאורך סופי של 5.3 שניות, כפי שאפשר לראות בסרטון הבא שנוצר מהטקסט "דובי רץ בעיר ניו-יורק".

עם הצגת מחוללי הוידאו Make-A-Video וה-Imagen Video, ניתן להניח בקלות כי עד סוף 2022 נזכה לראות לפחות מחולל וידאו נוסף שיצטרף למירוץ החדש בתחום יצירת הוידאו מבוסס הטקסט, כאשר אפשר לצפות גם בשדרוג משמעותי באיכות ובאורך סרטוני הוידאו הנוצרים בצורה דומה לשיפור שהיה ניתן לראות באיכות התמונות הרגילות אותן יצרו המחוללים.


חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.

הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.

השוואת מפרטים