חזרה

שיחה על ההשקה האחרונה של WWDC24 - Siri עם Apple Intelligence

By Sean Chen, 11 ביוני 2024

wwdc24

אפל השיקה זה עתה את ה-Apple Intelligence החדש, הכולל תכונות כמו כתיבה, המרת דיבור לטקסט וסיכום, תגובות חכמות, כלי כתיבה, יצירת תמונות או יצירת אימוג'ים, והכי חשוב, הפיכת Siri לעוזרת קולית אמיתית יותר.

בהצגת הכלים הראשונים, נראה כאילו אפל שוב מציגה תכונות שכבר קיימות באנדרואיד ולא מרגשות במיוחד.

אבל כשמגיעים לדור הבא של Siri, מרגישים שוב את העוצמה בעיצוב ובאינטגרציה של אפל למוצריה.

לא כפי שהשמועות טענו - שימוש ב-GPT-4o בלבד

מה-Keynote והמידע באתר הרשמי, נראה שלא מדובר בשימוש ב-GPT-4o בלבד כמודל של Apple Intelligence. מהחומרה הנתמכת A17 Pro וסדרת M, נראה שאפל שילבה מודלים קטנים או מודלים ליצירת תמונות לשימושים ספציפיים במכשירים. בנוסף, היא משתמשת בטכנולוגיית Private Cloud Compute החדשה שלה, שמאפשרת ל-Apple Intelligence או Siri להשתמש במודלים גדולים בענן תוך שמירה על פרטיות.

נראה שהמודל הלשוני שנוצר הוא מותאם במיוחד לשימושים נפוצים במכשירים ניידים. המודל GPT-4o, בשיתוף עם OpenAI, משמש רק למצבים מתקדמים יותר, כמו שאלות לוגיות מורכבות. זה מאפשר ל-AI שמאחורי Siri להתמקד בשיפור חוויית השימוש במוצרי אפל, מה שהופך את המודל לממוקד וקל יותר. השילוב של שירותים שונים מפחית את הלחץ על אפל במרדף אחרי GenAI, ומאפשר לה להתמודד ישירות עם Microsoft Copilot שמשלב GenAI Chatbot במערכת ההפעלה.

בפיתוח מודלים לשוניים גדולים, נראה שאפל לא מתמקדת במרדף אחרי Benchmark של LLM, אלא חוזרת למוצר עצמו, ומאפשרת ל-LLM לשרת את המוצר ולא רק לשפר את הביצועים והיכולות הרב-מודאליות של LLM.

עם זאת, עד סוף 2024, נראה שניתן יהיה להשתמש ב-AI Siri רק באנגלית, ומשתמשים במכשירים ישנים או שאינם דוברי אנגלית ימשיכו להשתמש בגרסה הישנה של Siri ללא תמיכה ב-LLM. במירוץ המודלים הלשוניים הגדולים, אפל עדיין מאחור ביחס ל-OpenAI, Microsoft או Google, ונראה שיש עוד דרך עד שתתמוך בשפות אחרות או תשפר את הדיוק בשפות אחרות.

אבל באופן כללי, בחוויית השימוש היא עדיין תוביל על המתחרים הנוכחיים.

מ-"ChatBot" ל-"ChatBot+" ועד "חוויית משתמש"

בקרב השחקנים המרכזיים בשוק ה-LLM: ChatGPT של OpenAI נשאר ברמת ה-"ChatBot", ולצאת מהמצב הזה הוא יכול רק על ידי מכירת API למפתחים לשילוב. Gemeni של Google ו-Copilot של Microsoft במחשבים אישיים נמצאים ברמת ה-"ChatBot+", כלומר ChatBot עם שילוב נוסף של פונקציות חיצוניות, אך עדיין הם השחקנים הסבירים ביותר לשילוב עמוק של LLM. יצרניות חומרה אחרות כמו סמסונג ואסוס נראות כעדיין בשלב ה"פונקציות", כמו חיפוש תמונות, תרגום בזמן אמת, עריכת תמונות או חיפוש תמונות.

עם Apple Intelligence של אפל, נראה שהשירותים של LLM עלו לרמת "חוויית משתמש", מה שמאפשר ל-AI להיות באמת "רלוונטי", ובתנאי שיש "רלוונטיות", מספר המצבים או הפונקציות שהמשתמש יכול להשתמש בהם יגדל משמעותית, אפילו עד אינסוף, וזה יאפשר לממש את האידיאל של עוזר AI. לסיכום, תחת האקוסיסטם החזק של אפל, מודלים לשוניים אחרים, חזקים ככל שיהיו, יתקשו לערער את התחרותיות של אפל ב"שילוב עמוק של LLM בחיי המשתמשים", ויש לקוות שבעתיד כל מודל לשוני ישתלב עמוק יותר בחיי המשתמשים.

עוד מהבלוג שלנו

צור קשר

צור קשר

בוא נדבר על הרעיונות שלך!

התחל את העסק שלך עם שותף דיגיטלי חדשני. נחזור אליך תוך יום עסקים אחד. (GMT+8)