חברת הבינה המלאכותית OpenAI הכריזה על מודל ה-Sora החדש שלה, מחולל וידאו המסוגל לייצר סרטונים פוטוריאליסטיים באורך של עד דקה מתוך תיאור טקסט שתזינו עבורו, כשאת סרטוני הוידאו שהוא יוצר ניתן לתאר כלא פחות ממרהיבים בהתחשב כי הם יוצרו מטקסט בלבד.
אחרי שהזניקה את מירוץ החימוש בתחום ה-AI עם צ’אטבוט ה-ChatGPT, אליו הצטרף בשלב מאוחר יותר גם מחולל התמונות מטקסט DALL·E, חברת OpenAI עושה את הצעד הבא בתחום הבינה המלאכותית הגנרטיבית ומציגה את מחולל הוידאו מטקסט Sora, המציג תוצאות מרשימות במיוחד בהשוואה למחוללי וידאו אחרים, בהם Lumiere של גוגל.
לפי החברה, Sora מסוגל לייצר סרטונים עם סצנות מורכבות הכוללות מספר דמויות, סוגים ספציפיים של תנועה ודיוק גבוה בפרטים על האובייקט והרקע, כאשר המודל אינו מתייחס רק לקלט שמתקבל מהמשתמש, אלא מתחשב באופן בו הדברים הללו מתרחשים במציאות.
המודל אינו מושלם, וב-OpenAI מודים שיש לו חולשות כמו סימולציה מדויקת של חוקי הפיזיקה בסצנות מורכבות, בלבול בין צד ימין ושמאל, קושי בהבנת תיאורים מדוייקים לאורך זמן וחוסר הבנה בין סיבה ותוצאה במקרים מסוימים, כמו למשל ‘אדם נוגס בעוגיה’ אך לאחר מכן אין סימן נגיסה בעוגיה.
אם תמונה אחת שווה אלף מילים, אפשר רק לנחש כמה מילים היינו צריכים על מנת לתאר את אוסף דוגמאות הוידאו אותו הציגה OpenAI עם ההכרזה על Sora – הנה כמה מתוכם:
אישה מסוגננת הולכת ברחוב בטוקיו. הרחוב מלא בשלטי נאון זוהרים וחמים עם שילוט מונפש של העיר. היא לובשת ז’קט עור שחור, שמלה אדומה ארוכה ומגפיים שחורים ונושאת ארנק שחור. היא לובשת משקפי שמש ושפתון אדום. היא הולכת בביטחון ונינוחות. הרחוב לח ומשקף, יוצר אפקט מראה של האורות הצבעוניים. הולכי רגל רבים מסתובבים.
סצנת אנימציה הכוללת תקריב של מפלצת קטנה ורכה הכורעת ברך ליד נר אדום נמס. סגנון האמנות הוא תלת מימדי וריאליסטי, עם התמקדות בתאורה ובמרקם. מצב הרוח של הציור הוא של פליאה וסקרנות, כשהמפלצת מביטה בלהבה בעיניים פעורות ופה פעור. הפוזה והבעת הפנים שלה משדרים תחושה של תמימות ושובבות, כאילו היא חוקרת את העולם סביבה בפעם הראשונה. השימוש בצבעים חמים ובתאורה דרמטית משפר עוד יותר את האווירה הנעימה של התמונה.
תקריב קיצוני על גבר זקן בשנות ה-60 לחייו עם שיער אפור. הוא שקוע במחשבות ומהרהר על ההיסטוריה של היקום כשהוא יושב בבית קפה בפריז. עיניו מתמקדות באנשים מחוץ למסך כשהם הולכים והוא יושב לרוב ללא תנועה. הוא לבוש בחליפת צמר עם חולצה מכופתרת, הוא חובש כומתה חומה ומשקפיים ויש לו מראה פרופסורי מאוד, ובסוף הוא מחייך חיוך עדין בפה סגור כאילו מצא את התשובה לתעלומת החיים. התאורה מאוד קולנועית עם האור הזהוב והרחובות והעיר הפריזאיים ברקע, עומק שדה, סרט קולנועי 35 מ”מ.
מודל ה-Sora החדש של OpenAI אינו זמין בשלב הזה לציבור הרחב והחברה העניקה עבורו גישה ל”צוות אדום” שנועד לבחון סיכונים ופגיעות במודל, בנוסף למספר מצומצר של יוצרי תוכן ויזואלי, מעצבים ויוצרי קולנוע לקבלת פידבק על המודל החדש.
אחרי שרואים את הדוגמאות השונות ש-Sora מסוגל לייצר, ובמיוחד סרטון הוידאו בו אישה הולכת בלילה ברחוב בטוקיו עם כל הפרטים הקטנים שבו, ובמיוחד ההשתקפות מהשלוליות במדרכה… סביר להניח שרובנו לא היינו מנחשים כי מדובר בוידאו שיוצר על ידי כלי AI.
Sora מהווה קפיצת מדרגה בכל הנוגע למחוללי וידאו מבוססי טקסט, וניתן להניח שיוצרים בתחום הוידאו יתחילו לחשוש מהרגע שכלים דוגמת Sora יחליפו אותם לכל הפחות ביצירת סרטונים קצרים.
חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.
הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.