By Sean Chen, 11. jún 2024
Apple práve vydal najnovší Apple Intelligence, ktorý zahŕňa funkcie ako písanie, prevod reči na text a zhrnutie, inteligentné odpovede, nástroje na písanie, generovanie obrázkov alebo emotikonov a najdôležitejšie je, že Siri sa stáva skutočným hlasovým asistentom.
Pri predstavení niekoľkých nástrojov na prvý pohľad vyzerá, že Apple opäť predstavil funkcie, ktoré Android už dávno má.
Avšak pri pohľade na ďalšiu generáciu Siri je zrejmé, že Apple má silný dizajn a schopnosť integrácie svojich produktov.
Podľa informácií z Keynote a oficiálnej stránky to nevyzerá, že by Apple Intelligence používal len GPT-4o ako model. Z pohľadu zariadení A17 Pro a M série hardvéru sa zdá, že Apple vložil malé jazykové modely alebo špecifické modely na generovanie obrázkov priamo do zariadenia. Súčasne využíva najnovšiu technológiu Private Cloud Compute, ktorá umožňuje Apple Intelligence alebo Siri používať veľké jazykové modely v cloude pri zachovaní súkromia.
Zdá sa, že tento generatívny jazykový model je špeciálne trénovaný pre bežné situácie na telefóne. Model GPT-4o, vyvinutý v spolupráci s OpenAI, sa používa len v pokročilejších situáciách, ako sú zložité logické otázky. To umožňuje AI za Siri viac sa sústrediť na zlepšenie „používateľskej skúsenosti s Apple produktmi“, čím sa model stáva viac zameraným a ľahším. Kombinácia rôznych služieb znižuje tlak na Apple pri dobiehaní GenAI a zároveň priamo čelí Microsoft Copilot, ktorý integruje GenAI Chatbot priamo do OS.
Na ceste vývoja veľkých jazykových modelov sa zdá, že cieľom Apple nie je dosiahnuť rôzne LLM Benchmarky, ale vrátiť sa k samotnému produktu, aby LLM slúžili produktu, a nie len slepo sledovať výkon a multimodálne schopnosti LLM.
Do konca roka 2024 bude dostupná len anglická verzia AI Siri, zatiaľ čo staršie zariadenia alebo neanglickí používatelia budú musieť používať staršiu verziu Siri bez podpory LLM. V tomto ohľade Apple stále zaostáva za hlavnými hráčmi ako OpenAI, Microsoft alebo Google, a zdá sa, že podpora iných jazykov (alebo dosiahnutie presnosti v iných jazykoch) je ešte ďaleko.
Celkový používateľský zážitok však stále vedie pred konkurenciou.
V súčasnosti hlavní hráči na trhu LLM: OpenAI s ChatGPT zostáva na úrovni „ChatBot“, a na rozšírenie ChatGPT sa spolieha na predaj API vývojárom na integráciu. Google Gemeni a Microsoft Copilot na PC sú na úrovni „ChatBot+“, čo znamená, že ChatBot je viac integrovaný s externými funkciami, ale stále sú to najpravdepodobnejší hráči, ktorí môžu dosiahnuť hlbokú integráciu LLM. Ostatní výrobcovia hardvéru ako Samsung a Asus sa zdajú byť stále na úrovni „funkcie“, ako sú vyhľadávanie obrázkov, okamžitý preklad, AI úprava fotografií alebo vyhľadávanie obrázkov.
Apple Intelligence sa zdá, že už posunul LLM služby na úroveň „zážitku“, čo umožňuje AI dosiahnuť skutočnú „relevantnosť“. Pri dosiahnutí „relevantnosti“ sa počet situácií alebo funkcií, ktoré môžu používatelia využívať, výrazne zvýši, dokonca sa priblíži k nekonečnu, a tak môže skutočne naplniť ideál AI asistenta. V súhrne, v rámci silného ekosystému Apple, aj keď sú iné jazykové modely silné, je ťažké narušiť konkurencieschopnosť Apple v „hlbokej integrácii LLM do života používateľov“, a tešíme sa na budúce hlboké integrácie LLM do životných situácií používateľov.
Pojmy „URL“ a „doména“ vyzerajú podobne, ale nie sú rovnaké! Čo sa deje v pozadí, keď zadáte google.com do prehliadača? Ako to súvisí s doménou a URL? Tento článok vám to jasne a prakticky vysvetlí!
ČÍTAŤ VIACAk patríte k tým, ktorí si na cestách do zahraničia nikdy nepamätajú, koľko minuli, a sú príliš leniví na to, aby si zapisovali výdavky, určite by ste mali vyskúšať túto super užitočnú aplikáciu — „SaySay Accounting“.
ČÍTAŤ VIACSamoobslužné objednávanie sa stalo prvým krokom pri vstupe do reštaurácie a dôležitou súčasťou našej stravovacej skúsenosti. Ak pridáme niektoré zaujímavé prvky, ako napríklad AI hlasového asistenta, objednávanie môže byť intuitívnejšie, zábavnejšie a dokonca ľudskejšie!
ČÍTAŤ VIACKONTAKTUJTE NÁS
Porozprávajme sa o vašich nápadoch!
Naštartujte svoje podnikanie s vaším inovatívnym digitálnym partnerom. Odpovieme do jedného pracovného dňa. (GMT+8)