By Sean Chen, 11 июня 2024 г.
Apple только что выпустила новейшую Apple Intelligence, функции которой включают написание, преобразование речи в текст и резюме, интеллектуальные ответы, инструменты для письма, генерацию изображений или эмодзи и многое другое, а самое главное, Siri становится ближе к настоящему голосовому помощнику.
На первый взгляд, при представлении первых нескольких инструментов, кажется, что Apple снова использует метод «выдавливания зубной пасты», представляя функции, которые уже давно есть на Android и не вызывают особого интереса.
Но когда вы видите следующее поколение Siri, вы снова ощущаете мощный дизайн и интеграционные возможности Apple для своих продуктов.
Судя по информации с Keynote и официального сайта, это не просто использование GPT-4o в качестве модели для Apple Intelligence, как предполагалось ранее. Судя по совместимым устройствам A17 Pro и аппаратуре серии M, похоже, что Apple внедрила небольшие языковые модели или модели генерации изображений для конкретных целей на устройствах. Одновременно используется новейшая технология Private Cloud Compute, которая позволяет Apple Intelligence или Siri использовать облачные большие языковые модели при условии обеспечения конфиденциальности.
Похоже, что эта генеративная языковая модель специально обучена для часто используемых сценариев на телефоне. Модель GPT-4o, разработанная в сотрудничестве с OpenAI, используется только в более сложных сценариях, например, для решения сложных логических вопросов. Это также позволяет AI за Siri сосредоточиться на улучшении «опыта использования продуктов Apple», делая модель более сфокусированной и легковесной. Смешивание различных сервисов снижает давление на Apple в гонке за GenAI и одновременно противостоит интеграции Microsoft Copilot в ОС с функцией GenAI Chatbot.
На пути разработки больших языковых моделей Apple, похоже, не стремится к достижению различных LLM Benchmark, а возвращается к самому продукту, позволяя LLM обслуживать продукт, а не просто стремиться к производительности LLM и мультимодальным возможностям.
Однако до конца 2024 года мы увидим только AI Siri, поддерживающую английский язык, а старые устройства или пользователи, не говорящие на английском, по-прежнему будут использовать старую версию Siri без поддержки LLM. В этом отношении в гонке больших языковых моделей Apple все еще отстает от таких основных игроков, как OpenAI, Microsoft или Google, и, похоже, потребуется время, чтобы поддержать другие языки (или, по крайней мере, достичь точности для других языков).
Тем не менее, в целом, в плане «опыта использования» Apple все равно будет лидировать среди конкурентов.
На данный момент другие основные игроки на рынке LLM: OpenAI с ChatGPT остается на уровне «ChatBot», и чтобы выйти за пределы ChatGPT, они могут только продавать API для интеграции разработчикам. Google с Gemeni и Microsoft с Copilot на ПК также находятся на уровне «ChatBot+», то есть ChatBot с дополнительной интеграцией внешних функций, но они по-прежнему являются наиболее вероятными игроками, которые могут достичь глубокой интеграции LLM. Другие крупные производители оборудования, такие как Samsung и Asus, похоже, все еще находятся на стадии «функций», таких как поиск по изображению, мгновенный перевод, AI-редактирование фотографий или поиск изображений.
Что касается Apple Intelligence, похоже, что она уже подняла LLM-сервисы на уровень «опыта», позволяя AI стать действительно «релевантным», и при условии достижения «релевантности» количество сценариев или функций, доступных пользователю, значительно увеличится, даже приближаясь к бесконечности, что позволит действительно реализовать идеал AI-помощника. В целом, в мощной экосистеме Apple другие языковые модели, какими бы мощными они ни были, вряд ли смогут поколебать конкурентоспособность Apple в «глубокой интеграции LLM в жизнь пользователей», и мы надеемся, что в будущем все LLM смогут глубже интегрироваться в жизненные сценарии пользователей.
Термины «URL» и «домен» выглядят похоже, но это не одно и то же! Что происходит, когда вы вводите google.com в браузере? Как это связано с доменом и URL? Эта статья поможет вам разобраться в этом простым и практичным способом!
ЧИТАТЬ ДАЛЕЕЕсли вы из тех, кто во время путешествий за границу всегда забывает, сколько потратил, и ленится записывать расходы, обязательно попробуйте это суперполезное приложение — «Говори и записывай расходы».
ЧИТАТЬ ДАЛЕЕСамообслуживание при заказе стало первым шагом при посещении ресторана и важной частью нашего опыта питания. Если добавить немного интересных элементов, таких как AI голосовой помощник, возможно, заказ станет более интуитивным, интересным и даже более человечным!
ЧИТАТЬ ДАЛЕЕСВЯЗАТЬСЯ С НАМИ
Давайте обсудим ваши идеи!
Запустите свой бизнес с вашим инновационным цифровым партнером. Мы ответим в течение одного рабочего дня. (GMT+8)