Компания Anthropic выпустила Claude 2 — усовершенствованную модель большого языка (LLM), которая отлично справляется с задачами написания кода, математики и рассуждения.
Claude 2 предназначена для имитации разговора с полезным коллегой или персональным ассистентом. Последняя версия была доработана с целью улучшения пользовательского опыта: расширены возможности общения, более четкие объяснения, уменьшено количество вредных результатов и увеличена память.
По уровню написанию кода Claude 2 превосходит своего предшественника и набирает большее количество баллов в тесте Codex HumanEval Python programming. Заметно улучшилось и его мастерство в решении математических задач школьного уровня, оцениваемое с помощью GSM8k.
“Когда речь идет о написании кода с использованием ИИ, разработчикам необходим быстрый и надежный доступ к контексту их уникальной кодовой базы и мощный LLM с большим контекстным окном и сильными возможностями общего рассуждения”, — говорит Куинн Слэк, генеральный директор и соучредитель компании Sourcegraph.
Самые медленные и раздражающие части рабочего процесса разработчика становятся быстрее и приятнее”. Благодаря Claude 2, Cody помогает большему числу разработчиков создавать больше программного обеспечения, которое продвигает мир вперед”.
В Claude 2 расширены возможности ввода и вывода информации, что позволяет обрабатывать запросы длиной до 100 000 лексем. Это позволяет модели анализировать объемные документы, такие как технические руководства или целые книги, и генерировать более длинные композиции в качестве выходных данных.
“Мы очень рады одними из первых предложить Claude 2 нашим заказчикам. Это улучшенная семантика, обучение современным знаниям, улучшенное обоснование сложных подсказок и возможность без труда переделывать существующий контент с помощью увеличенного в 3 раза контекстного окна”, — сказал Грег Ларсон, вице-президент Jasper по техническим вопросам.
“Мы гордимся тем, что помогаем нашим клиентам быть впереди всех благодаря партнерству с Anthropic”.
Компания Anthropic сосредоточилась на минимизации генерации вредных или оскорбительных результатов работы Claude 2. Хотя измерить такие качества довольно сложно, внутренняя оценка показала, что Claude 2 в два раза эффективнее в обеспечении безвредных ответов по сравнению со своим предшественником Claude 1.3.
Anthropic признает, что, хотя Claude 2 может анализировать сложные произведения, необходимо признать ограниченность языковых моделей. Пользователям следует проявлять осторожность и не полагаться на них как на фактические справочники. Вместо этого Claude 2 следует использовать для обработки данных, предоставленных пользователями, которые уже разбираются в предмете и могут подтвердить полученные результаты.
Используя возможности Claude 2, пользователи должны понимать его ограничения и ответственно подходить к решению задач, соответствующих его сильным сторонам, таким как обобщение и организация информации.
Пользователи могут бесплатно ознакомиться с Claude 2 здесь.