אפל מציגה את OpenELM: מודלי שפה קטנים שיוכלו לרוץ על האייפון

שלט אפל צילום: רונן מנדזיצקי

חוקרי אפל (Apple) הציגו את OpenELM (ר”ת Open source Efficient Language Models), משפחת מודלי שפה יעילים בקוד פתוח, שנועדו לעבוד על גבי מכשירים בעלי משאבים מוגבלים דוגמת האייפון, מודל שיהיה זמין בארבע גרסאות שונות של החל מ-270 מיליון ועד 3 מיליארד פרמטרים.

אחרי המתנה ארוכה במיוחד, אפל צפויה לשלב במוצריה פתרונות AI חדשים כחלק מהשקת מערכת ההפעלה iOS 18 הבאה של החברה בכנס המפתחים WWDC 2024 שיתקיים בחודש יוני הקרוב.

פתרונות ה-AI של אפל צפויים לכלול על פי הדיווחים את מודל ה-Gemini של גוגל, אך גם מגוון מודלי AI יעודיים של אפל עצמה, דוגמת Keyframer, MGIE, וכעת גם את משפחת מודלי השפה OpenELM.

מודל ה-OpenELM החדש של אפל מציג ביצועים טובים יותר ב-2.36% לעומת מודל ה-OLMo הקודם תוך כדי צריכה של חצי מהמשאבים בהשוואה אליו, כאשר משפחת המודלים אמורה לתת מענה למודלי AI דוגמת Phi-3 של מיקרוסופט, Gemma של גוגל, Llama 3 של מטא, Claude 3 של Anthropic ועוד, מודלים שנועדו לעבוד בצורה מקומית על מכשיריהם של המשתמשים.

המודל החדש יהיה זמין בארבע גרסאות שונות עם 270 מיליון, 450 מיליון, 1.1 מיליארד ו-3 מיליארד פרמטרים מספריית ה-CoreNet של אפל.

המודלים הם קטנים מספיק על מנת להיות מופעלים באופן מקומי על מכשירים “חלשים” דוגמת האייפון, זאת בהשוואה לשרתי AI יעודיים, בזכות התמיכה בטכנולוגיית ה-MLX של אפל.

נקודה מעניינת למדי שצריך לציין בהקשר ל-OpenELM היא העובדה שבניגוד לפתרונות קוד פתוח אחרים המשתמשים ברישיונות מוכרים כמו Apache, BSD או GNU, ה-OpenELM משתמש ברישיון “פתוח” יעודי של אפל עצמה.

ניתן לקרוא את מחקר מודל ה-OpenELM ב-arxiv ולהוריד אותו דרך אתר Hugging Face.


חלק מהפוסטים באתר כוללים קישורי תכניות שותפים, עבורם נקבל עמלה עם ביצוע רכישה בפועל של מוצרים. עמלה זו לא מייקרת את העלות הסופית של המוצרים עבורכם.

הסקירות והתכנים המופיעים באתר מהווים המלצה בלבד, וכך יש להתייחס אליהם. כל המחירים המופיעים באתר נכונים ליום הפרסום בלבד והאחריות לקניית מוצר או שירות כזה או אחר מוטלת עליך בלבד – השימוש באתר בהתאם לתנאי השימוש והפרטיות.

השוואת מפרטים