חברת הבינה המלאכותית OpenAI הציגה את מחולל האודיו החדש של החברה בשם Voice Engine (“מנוע קול”), שמגיע כהדגמה בלבד בשלב הנוכחי ומאפשר להשתמש בדוגמת קול של משתמש באורך של 15 שניות בלבד על מנת לייצר שמע ריאליסטי ובעל רגשות בדומה לקול של המשתמש עצמו.
מחולל השמע החדש הוא בעל מגוון אפשרויות שימוש, אך בו בזמן בעל פוטנציאל גבוה במיוחד לשימוש זדוני והתחזות לבני אדם.
לאחר שהציגה את מחולל הוידאו SORA, שהצליח לייצר קטעי וידאו פוטוריאליסטיים באורך של עד דקה, OpenAI מדגימה את הדור האחרון של מחולל האודיו Voice Engine, אותו החלה לפתח מסוף 2022, שנמצא למעשה כבר היום בשימוש כחלק מפיצ’רי ה-ChatGPT Voice ו-Real Aloud.
בעוד שכבר היום ניתן למצוא לא מעט מחוללי שמע מבוססי טקסט, ה-Voice Engine עושה את הצעד הבא ומסוגל לייצר שמע טבעי הדומה לקול של הדובר המקורי באמצעות דגימת אודיו באורך 15 שניות בלבד.
למחוללי אודיו המבוססים על קטעי שמע של המשתמשים עצמם יש שימושים רבים ומגוונים. בין הדוגמאות הרבות של OpenAI ניתן למצוא תרגום קטעי שמע לשפות אחרות תוך שמירה על אופן הדיבור והמבטא של הדובר המקורי, דבר שיוצר התאמה טובה יותר של השמע לדובר עצמו. פיצ’ר הנמצא בשימוש מוקדם על ידי HeyGen, המייצרת אווטארים אנושיים למגוון תכנים שונים כמו שיווק והדגמות שונות.
- קטע השמע המקורי באנגלית –
- קטע השמע מתורגם ביפנית –
דוגמא נוספת היא האפשרות להחזיר לאנשים את הקול המקורי לאחר שהדיבור שלהם נפגע בעקבות מחלה מסויימת. בדוגמה של OpenAI מדובר על חולה שאיבדה את יכולת הדיבור הרגילה שלה לאחר שהתגלה לה גידול מוחי, קול ששוחזר בשיתוף פעולה עם Lifespan, מוסד רפואי ללא כוונת רווח, בהתבסס על קטע וידאו של החולה מפרויקט בית ספר ישן.
- הקול הנוכחי של החולה –
- קטע האודיו עליו התבסס המחולל –
- קטע שמע שנוצר באמצעות המחולל –
לצד כל השימושיים החיוביים אותם ניתן לעשות עם מחולל ה-Voice Engine, ניתן להניח כי יהיו לא מעט משתמשים שיבחרו לנצל את מחולל ה-Voice Engine גם לשימושים זדוניים.
היכולת לזייף את הקול של המשתמש באמצעות קטע קול מקורי שלו באורך 15 שניות בלבד יוכל לאפשר לגורמים זדוניים להונות אנשים בצורה הרבה יותר פשוטה מכפי שניתן לעשות עם טכנולוגיות מקבילות, כאשר כבר היום ניתן לשמוע על לא מעט הונאות שהשתמשו בטכנולוגיית AI על מנת לרמות אנשים.
חברת OpenAI מודעת לסכנות הגדולות שטמונות במחולל ה-Voice Engine ועובדת עם ממשלת ארה”ב ושותפים בינלאומיים נוספים על מנת להפוך את הטכנולוגיה לבטוחה יותר, כאשר השותפים הקיימים של OpenAI בעלי גישה ל-Voice Engine משתמשים בו תחת הגבלות שונות, ובראשן איסור על התחזות לאדם ספציפי או ארגונים שונים וצורך בהסכמה מפורשת של הדוברים המקוריים להשתמש בקול שלהם במחולל.
לטוב ולרע, טכנולוגיות הבינה המלאכותית לא הולכות להיעלם בעתיד הנראה לעין, כאשר ה-Voice Engine מציג יתרונות רבים, אך גם סכנות רבות, כך שנותר להמתין כדי להבין כיצד המודל החדש, שעדיין אינו זמין לציבור הרחב, ישמע בהמשך.
חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.
הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.