Späť

Diskusia o práve vydanom WWDC24 - Siri s Apple Intelligence

By Sean Chen, 11. jún 2024

wwdc24

Apple práve vydal najnovší Apple Intelligence, ktorý zahŕňa funkcie ako písanie, prevod reči na text a zhrnutie, inteligentné odpovede, nástroje na písanie, generovanie obrázkov alebo emotikonov a najdôležitejšie je, že Siri sa stáva skutočným hlasovým asistentom.

Pri predstavení niekoľkých nástrojov na prvý pohľad vyzerá, že Apple opäť predstavil funkcie, ktoré Android už dávno má.

Avšak pri pohľade na ďalšiu generáciu Siri je zrejmé, že Apple má silný dizajn a schopnosť integrácie svojich produktov.

Nie je to len o použití GPT-4o

Podľa informácií z Keynote a oficiálnej stránky to nevyzerá, že by Apple Intelligence používal len GPT-4o ako model. Z pohľadu zariadení A17 Pro a M série hardvéru sa zdá, že Apple vložil malé jazykové modely alebo špecifické modely na generovanie obrázkov priamo do zariadenia. Súčasne využíva najnovšiu technológiu Private Cloud Compute, ktorá umožňuje Apple Intelligence alebo Siri používať veľké jazykové modely v cloude pri zachovaní súkromia.

Zdá sa, že tento generatívny jazykový model je špeciálne trénovaný pre bežné situácie na telefóne. Model GPT-4o, vyvinutý v spolupráci s OpenAI, sa používa len v pokročilejších situáciách, ako sú zložité logické otázky. To umožňuje AI za Siri viac sa sústrediť na zlepšenie „používateľskej skúsenosti s Apple produktmi“, čím sa model stáva viac zameraným a ľahším. Kombinácia rôznych služieb znižuje tlak na Apple pri dobiehaní GenAI a zároveň priamo čelí Microsoft Copilot, ktorý integruje GenAI Chatbot priamo do OS.

Na ceste vývoja veľkých jazykových modelov sa zdá, že cieľom Apple nie je dosiahnuť rôzne LLM Benchmarky, ale vrátiť sa k samotnému produktu, aby LLM slúžili produktu, a nie len slepo sledovať výkon a multimodálne schopnosti LLM.

Do konca roka 2024 bude dostupná len anglická verzia AI Siri, zatiaľ čo staršie zariadenia alebo neanglickí používatelia budú musieť používať staršiu verziu Siri bez podpory LLM. V tomto ohľade Apple stále zaostáva za hlavnými hráčmi ako OpenAI, Microsoft alebo Google, a zdá sa, že podpora iných jazykov (alebo dosiahnutie presnosti v iných jazykoch) je ešte ďaleko.

Celkový používateľský zážitok však stále vedie pred konkurenciou.

Od „ChatBot“ k „ChatBot+“ k „zážitku“

V súčasnosti hlavní hráči na trhu LLM: OpenAI s ChatGPT zostáva na úrovni „ChatBot“, a na rozšírenie ChatGPT sa spolieha na predaj API vývojárom na integráciu. Google Gemeni a Microsoft Copilot na PC sú na úrovni „ChatBot+“, čo znamená, že ChatBot je viac integrovaný s externými funkciami, ale stále sú to najpravdepodobnejší hráči, ktorí môžu dosiahnuť hlbokú integráciu LLM. Ostatní výrobcovia hardvéru ako Samsung a Asus sa zdajú byť stále na úrovni „funkcie“, ako sú vyhľadávanie obrázkov, okamžitý preklad, AI úprava fotografií alebo vyhľadávanie obrázkov.

Apple Intelligence sa zdá, že už posunul LLM služby na úroveň „zážitku“, čo umožňuje AI dosiahnuť skutočnú „relevantnosť“. Pri dosiahnutí „relevantnosti“ sa počet situácií alebo funkcií, ktoré môžu používatelia využívať, výrazne zvýši, dokonca sa priblíži k nekonečnu, a tak môže skutočne naplniť ideál AI asistenta. V súhrne, v rámci silného ekosystému Apple, aj keď sú iné jazykové modely silné, je ťažké narušiť konkurencieschopnosť Apple v „hlbokej integrácii LLM do života používateľov“, a tešíme sa na budúce hlboké integrácie LLM do životných situácií používateľov.

VIAC Z NÁŠHO BLOGU

Kontaktujte nás

KONTAKTUJTE NÁS

Porozprávajme sa o vašich nápadoch!

Naštartujte svoje podnikanie s vaším inovatívnym digitálnym partnerom. Odpovieme do jedného pracovného dňa. (GMT+8)