הכירו את Phi-3 – מודלי שפה קטנים של מיקרוסופט עם ביצועים גדולים

שלט לוגו מיקרוסופט צילום: רונן מנדזיצקי

מיקרוסופט (Microsoft) הכריזה על Phi-3, משפחת מודלי שפה קומפקטיים ויעילים במיוחד שיכולים לעבוד בצורה מקומית, עם גרסה בינונית, קטנה ומיני עם 14, 7 ו-3.8 מיליארד פרמטרים וביצועים דומים ואף טובים יותר ממודלי שפה גדולים יותר.

מודלי ה-Phi-3 החדשים נועדו להחליף את מודל ה-Phi-2 הקודם של החברה כפתרון מודל שפה קטן SLM (ר”ת small language models), זאת בניגוד למודלי השפה הגדולים LLM (ר”ת Large Language Model) המוכרים יותר.

המודלים הקומפקטיים יכולים לעבוד בצורה מקומית על מכשירים בעלי עוצמת עיבוד נמוכה יותר, והמודל החדש נועד להתחרות במודלי ה-Gemma של גוגל, Llama 3 של מטא, Claude 3 של Anthropic ועוד.

בשלב הראשון, מיקרוסופט משחררת את מודל ה-Phi-3-Mini, הזעיר ביותר במשפחה החדשה, שאומן על 3.8 מיליארד פרמטרים וזמין בגרסת 4K ו-128K טוקנים בהתייחס לגודל חלון הקלט שלהם, כאשר בהמשך החברה תציע גם את מודלי ה-Phi-3-Small ו-Phi-3-Medium הגדולים יותר, עם 7 ו-14 מיליארד פרמטרים, בהתאמה.

השוואת ביצועי מודלי ה-Phi-3 (מקור מיקרוסופט)
השוואת ביצועי מודלי ה-Phi-3 (מקור מיקרוסופט)

לפי מבחני הביצועים שפרסמה מיקרוסופט, מודל ה-Phi-3-Mini מצליח להציג תוצאות טובות יותר ממודלים מתחרים גדולים יותר, כאשר מודלי ה-Phi-3-Small ו-Phi-3-Medium מציגים שיפור ביצועים ניכר בהשוואה למודלים מתחרים גדולים בהרבה במבחני ביצועים רבים, עם יתרון בהסקת מסקנות והבנה כללית, אך חיסרון בכל הקשור לידע הכללי המובנה לאור גודלם הקטן (פחות פרמטרים, פחות עובדות ידועות).

טבלת השוואה מפורטת על מודלי ה-Phi-3 (מקור מיקרוסופט)
טבלת השוואה מפורטת על מודלי ה-Phi-3 (מקור מיקרוסופט)

ניתן לקרוא עוד על המחקר מאחורי מודל ה-Phi-3 באתר arxiv ולהוריד את מודל ה-Phi-3-mini מאתר .


חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.

הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.

השוואת מפרטים