Исследователи из университета Беркли представили модель ИИ Starling-7B с открытым исходным кодом

28.11.2023 22:18

Команда исследователей из Калифорнийского университета в Беркли представила Starling-7B – открытую большую языковую модель (LLM), обученную с помощью подкреплённого обучения от обратной связи ИИ (reinforcement learning from AI feedback, RLAIF).

RLAIF использует обратную связь от моделей ИИ для обучения других моделей ИИ и улучшения их возможностей. Для Starling-7B RLAIF был применён для улучшения полезности и безопасности ответов чат-бота. Модель основана на дообученной Openchat 3.5, которая в свою очередь базируется на Mistral-7B.

Если RLAIF кажется знакомым, то скорее всего вы слышали о нём в контексте ChatGPT. Однако есть одно важное отличие: для моделей GPT-3.5 и GPT-4 компании OpenAI люди улучшали производительность, оценивая вывод модели – это процесс называется подкреплённым обучением от человеческой обратной связи (reinforcement learning from human feedback, RLHF). Это и был тот самый “секретный ингредиент”, который сделал взаимодействие с ChatGPT таким естественным.

По сравнению с человеческой обратной связью, обратная связь от ИИ потенциально может быть дешевле, быстрее, прозрачнее и масштабируемее – если она работает. И Starling-7B показывает, что это может сработать.

Чтобы обучить Starling-7B, исследователи использовали подход, который они назвали “ИИ даёт советы ИИ”. Они обучили модель-консультанта давать обратную связь целевой модели (в данном случае – Starling) о том, как улучшить ответы на вопросы пользователей. Модель-консультант была обучена на данных, собранных от людей-экспертов, которые оценивали ответы модели по полезности и безопасности.

Затем исследователи использовали эту обратную связь для обучения Starling с помощью подкреплённого обучения – поощряя ответы, которые модель-консультант оценила как более полезные и безопасные.

Результаты показали, что RLAIF действительно улучшил качество ответов Starling. Ответы стали более подробными и полезными, модель лучше понимала контекст диалога. Кроме того, модель стала реже давать опасные, вредные или сбивающие с толку ответы.

Исследователи надеются, что их работа вдохновит других разработчиков ИИ использовать обратную связь от ИИ для улучшения больших языковых моделей. Этот подход может помочь сделать ИИ более полезным и безопасным.

Автор:
SEO-специалист, автор новостей по ИИ

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

telegram
Обратная связь
Свяжитесь с нами
Реквизиты

ИНН: 772578776588
ОГРН: 315774600103615
ОКПО: 0194004627
ОКТМО: 45914000000
ОКАТО: 45296559000
р/с: 40802810300310000244
в АКБ «БАНК МОСКВЫ» (ОАО) отделение «Перовское»
к/с: 30101810500000000219
БИК: 044525219

Фактический адрес: г. Москва, шоссе Энтузиастов, дом 56, строение 26, офис 304

Юридический адрес: 115191, г. Москва, 4-й Рощинский проезд д.7/16