Google представила свои новые модели искусственного интеллекта Gemini Pro и Gemini Ultra, которые призваны конкурировать с моделью GPT-4 от OpenAI. Gemini Pro, уже доступная в чат-боте Bard, представляет собой уменьшенную версию с ограниченными возможностями. Gemini Ultra, более мощная модель, планируется к выпуску в начале 2024 года и ожидается, что она превзойдет GPT-4 по популярным бенчмаркам.
Gemini Pro считается конкурентом модели GPT-3.5 от OpenAI и, по утверждениям Google, превосходит ее в шести из восьми бенчмарков. Еще более компактные версии, Nano, оптимизированы для разработки приложений для Android. Эти модели Nano являются упрощенными версиями более крупных моделей Gemini.
Pro и Nano будут доступны через Google Cloud с 13 декабря и работают на собственных ИИ-чипах TPU от Google. Компания не уточняет параметры более крупных моделей. Как и другие модели LLM, Gemini все еще сталкивается с проблемой “галлюцинаций”.
Gemini Ultra, самая крупная версия модели, ожидается, что превзойдет GPT-4 OpenAI по популярным бенчмаркам для понимания текста и изображений, а также генерации кода. Ultra будет выпущена в начале 2024 года и также будет интегрирована в “продвинутую” версию чат-бота Bard.
Gemini является мультимодальной моделью, способной обрабатывать текст, изображения, аудио, видео и код. В настоящее время Gemini не предлагает генерацию изображений, но, согласно технической документации, эта функция доступна и, вероятно, будет введена со временем. Gemini может быть активирована изображениями, текстом или их комбинацией.
Google интегрирует Gemini с Bard в два этапа. Начиная с сегодняшнего дня, Bard будет использовать настроенную версию Gemini Pro English, предлагающую расширенные функции для понимания, суммирования, планирования и кодирования. Gemini Pro English доступна более чем в 170 странах и территориях, согласно Google.
Второй этап обновления Bard включит Bard Advanced в начале следующего года, предоставляя пользователям доступ к самым передовым моделям и функциям, начиная с Gemini Ultra. Неизвестно, будет ли Google взимать плату за это, как OpenAI делает для ChatGPT Plus.
В течение следующего года модели Gemini будут внедрены в другие продукты Google, такие как поиск, реклама и приложение для повышения производительности Workspace.
Модель Nano для смартфонов будет использоваться в Pixel 8 Pro. Например, она будет создавать резюме голосовых заметок.