• Николай

Google представила свой ответ ChatGPT

Как утверждают в компании, модель Gemini чуть ли не во всем превосходит любую из других нейросетей. Что известно о новом участнике гонки ботов?

Фото: Zuma/ТАСС

Gemini — созвездие Близнецы по-латински — новый и, быть может, последний шанс Google вырваться в лидеры многообещающего рынка искусственного интеллекта. Модель способна работать сразу с пятью «модальностями»: от традиционных для нейросетей текста и картинок до компьютерного кода, аудио и даже видео. Компания хвастает, что Gemini обгоняет новейшую GPT-4 от OpenAI почти по всем возможным бенчмаркам компьютерного мышления и немного уступает разве что по одному тесту на понимание повседневных задач.

В проморолике модель нахваливают глава Google Сундар Пичаи и другие специалисты компании:

«Крайне редко удается на фундаментальном уровне работать над технологией, которая способна изменить все наши продукты».

***

«Обычно мультимодальные модели делаются посредством сшивания нескольких моделей, ориентированных только на текст, изображения или звук. Gemini — это единственная модель, которая с самого начала создавалась как мультимодальная, то есть она может одновременно перерабатывать информацию на всех уровнях и давать наилучший ответ».

***

«Это поразительно, насколько хорошо Gemini выполняет целый спектр задач. Ближе к концу обучения мы обнаружили, что наша модель по массе ключевых бенчмарков обходит любого из конкурентов. Например, при тестировании по 50 различным сферам знания наша модель обогнала лучших из лучших специалистов-людей».

Самый впечатляющий элемент пиара Gemini, тут же разлетевшийся по TikTok и другим соцсетям, — ролик, где тестировщик играет с моделью через камеру. Нейросеть на лету определяет рисуемые на бумаге картинки, придумывает и запускает игру с определением страны на карте по эмодзи, находит ассоциации между случайными предметами и предлагает идеи для макраме под цвет пряжи, сразу же генерируя картинки готовых изделий.

Можно ли говорить о том, что на кремниевом троне новый король? Не торопятся с выводами опрошенные Business FM специалисты:

Основатель компании Promobot Олег Кивокурцев:

«Во всех презентациях всех чат-ботов, всех голосовых помощников, всех подобных систем сказано, что они лучше, чем GPT, у них больше база данных, у них лучше поисковые модели. Тем не менее уже на протяжении длительного периода никто не может обогнать продукты компании OpenAI ни по количеству пользователей, ни по частоте обращений, ни по другим параметрам. Возможно, действительно есть ряд тонкостей, которые у Gemini лучше, чем у GPT, но для простого пользователя разницы не будет».

СЕО Студии искусственного интеллекта и преподаватель НИУ ВШЭ Дарья Фокина:

«Самое крутое преимущество Gemini в том, что она мультимодальна. Она создает единую модель, которая может воспринимать и изучать различные виды информации, голос, изображения. Именно поэтому у модели суперкачественная система распознавания изображений. Это выводит на новый уровень. Это логичный шаг развития моделей, который должен сделать Google, чтобы оставаться в гонке ИИ. Посмотрим, что будет происходить дальше. Но пока ощущения глобального изменения здесь нет».

Базовая версия Gemini уже подключена к чат-боту Google Bard, так что пользователи могут поиграться с моделью самостоятельно. На территории России сервис не работает, но доступ можно получить с помощью VPN.

Межтекстовые Отзывы
Посмотреть все комментарии
guest