Основатель компании Deepmind утверждает, что его новейшая модель Inflection-2 является второй лучшей в мире

24.11.2023 16:16

Стартап Inflection утверждает, что их новая языковая модель Inflection-2 превосходит своих прямых конкурентов, таких как Google PaLM-2 и Claude 2, и уступает только GPT-4. Эта модель значительно мощнее своего предшественника, Inflection-1, и, по словам компании, демонстрирует улучшенные фактические знания, лучший контроль стиля и значительно улучшенные способности к рассуждению.

Inflection-1 была выпущена в июле и была примерно наравне с GPT-3.5 и PaLM-540B. Теперь же Inflection-2, по утверждениям компании, должна догнать GPT-4. Inflection-2 обучалась на 5,000 графических процессорах NVIDIA H100 с точностью смешивания fp8, что составляет около 10²⁵ FLOP. Это ставит её в один ряд с флагманской моделью Google PaLM 2 Large, которая вскоре будет заменена на Gemini.

Однако Inflection-2 превосходит PaLM 2 Large в большинстве стандартных тестов на производительность ИИ, включая широко используемый тест MMLU, который охватывает широкий спектр задач, связанных с языком, от уровня средней школы до профессионального, а также другие языковые тесты, такие как TriviaQA, HellaSwag и GSM8k.

По сравнению с GPT-4, Inflection-2 набрала 89,0 баллов в тесте HellaSwag 10-shot, приближаясь к результату GPT-4, равному 95,3. Кроме того, Inflection заявляет, что их последняя модель LLM превосходит Claude 2 в цепочечном рассуждении, то есть в уже оптимизированном процессе подсказок.

Inflection-2 значительно уступает GPT-4 в задачах по программированию и математике, но показывает лучшие результаты, чем, например, Llama 2 от Meta. Inflection-2 не оптимизирована для программирования, поэтому в будущих моделях есть пространство для улучшения.

Скоро чат-бот Pi компании будет работать на Inflection-2. Инфраструктура обновляется с графических процессоров Nvidia A100 на H100, что должно ускорить вывод, то есть обработку ввода моделью ИИ. Несмотря на свой большой размер (175 миллиардов параметров), Inflection-2 должна быть дешевле и быстрее, чем Inflection-1.

Inflection уже планирует обучать ещё более крупные модели на полной мощности кластера из 22,000 графических процессоров. Следующая модель ИИ будет примерно в десять раз больше и будет выпущена примерно через шесть месяцев, сообщает компания. Вы можете протестировать Pi на pi.ai/talk.

В плане безопасности и ответственности Inflection добровольно подписалась на обязательства Белого дома от июля 2023 года.

У Inflection в команде есть известные имена. Компания вышла на публику в марте 2022 года. Основателями стали основатель LinkedIn Рид Хоффман, сооснователь Deepmind Мустафа Сулейман и бывший исследователь Deepmind Карен Симонян. Стартап специализируется на использовании естественного языка в качестве личного интерфейса к компьютерам.

В мае 2022 года Inflection AI закрыла инвестиционный раунд на сумму 225 миллионов долларов, а в июне 2023 года компания объявила о другом инвестиционном раунде, в котором участвовали Microsoft, Рид Хоффман, Билл Гейтс, Эрик Шмид и Nvidia, вложив в общей сложности 1,3 миллиарда долларов. На тот момент компания оценивалась в 4 миллиарда долларов.

С момента объявления стартапа к Inflection AI присоединились такие исследователи ИИ, как Хайнрих Куттлер из Meta* AI и Маартен Босма и Ревон Чайлд, ранее работавшие в Google Brain. Бывший менеджер продуктов Deepmind и Google Джо Фентон помогает Inflection AI разрабатывать свои продукты и бизнес-модель.

* – компания Meta признана экстремистской в РФ

Автор:
SEO-специалист, автор новостей по ИИ

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

telegram
Обратная связь
Свяжитесь с нами
Реквизиты

ИНН: 772578776588
ОГРН: 315774600103615
ОКПО: 0194004627
ОКТМО: 45914000000
ОКАТО: 45296559000
р/с: 40802810300310000244
в АКБ «БАНК МОСКВЫ» (ОАО) отделение «Перовское»
к/с: 30101810500000000219
БИК: 044525219

Фактический адрес: г. Москва, шоссе Энтузиастов, дом 56, строение 26, офис 304

Юридический адрес: 115191, г. Москва, 4-й Рощинский проезд д.7/16