דיפסיק (DeepSeek) הסינית ממשיכה להכות גלים בשוק ה-AI העולמי עם השקת ה-Janus Pro, מודל ויזואלי חדש הזמין בגרסת 1 או 7 מיליארד פרמטרים ומסוגל להבין תוכן ויזואלי ולחולל תמונות עם ביצועים טובים יותר בהשוואה למודלים של OpenAI ו-Stability AI.
החברה זעזעה את שוק הבינה המלאכותית העולמית עם מודלי ה-DeepSeek-V3 ו-DeepSeek-R1, שגרמו לחברת מטא לפתוח "חדר מלחמה" על מנת להתמודד על השפעות המודלים החדשים על השוק ולירידה של כ~17% בשווי השוק של אנבידיה אתמול, נתון המתורגם לירידת ערך של כ~600 מיליארד דולר!
מודל ה-Janus Pro החדש מוגדר על ידי החברה כמודל "מולטי-מודאלי משולב להבנה ויצירה" (Unified Multimodal Understanding and Generation), או במילים אחרות, מודל ויזואלי המסוגל לחולל תמונות בהתאם לקלט מהמשתמש, אך גם להבין תמונות אותן מספק לו המשתמש על מנת לתת מענה על התוכן המופיע בהן.
מודל זה אומן לדברי החברה על 90 מיליון תמונות, מתוכן 72 מיליון תמונות סינטטיות, ויהיה זמין בגרסת 1 או 7 מיליארד פרמטרים.
ביצועי המודל
על פי מבחני הביצועים אותם פרסמה החברה, מודל ה-Janus-Pro-7B החדש מצליח להציג ביצועים העדיפים על מחוללי ה-DALL-E 3 של OpenAI ו-Stable Diffusion XL/Stable Diffusion 1.5 של Stable Diffusion מבית Stability AI ביצירת תמונות וגבוהים יותר ממודלים ויזואלים דוגמת ה-LLaVA v1.5 7B.
נתונים אלו צפויים צפויים לזעזע הפעם גם את חברות הטכנולוגיה העוסקות בפיתוח מודלים ויזואלים ומחוללי תמונות, באופן דומה להשפעה של מודלי ה-R1 ו-V3 על השוק כולו.
קוד המקור של משפחת מודלי ה-Janus Pro זמינים באתר GitHub, כאשר ניתן להתנסות במחולל התמונות החדש ב-Hugging Face.
חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.
הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.