Компания Meta* представила новую модель под названием SeamlessM4T, которая обеспечивает бесшовный перевод и транскрибацию как текста, так и речи. Этот инновационный продукт призван улучшить мультиязычное взаимодействие в интернете, мобильных устройствах и социальных сетях.
Основные характеристики SeamlessM4T:
- Распознавание речи на почти 100 языках.
- Перевод речи в текст на почти 100 языках.
- Перевод речи в речь для почти 100 входных языков и 35 выходных.
- Перевод текста на почти 100 языках.
- Перевод текста в речь для почти 100 входных языков и 35 выходных.
Модель будет доступна для исследователей и разработчиков по лицензии CC BY-NC 4.0, что отражает принципы открытой науки. Кроме того, Meta* выпустила метаданные SeamlessAlign – самого большого набора данных для мультимодального перевода, состоящего из 270 000 часов выделенной речи и текстовых выравниваний.
SeamlessM4T решает давнюю проблему в области мультиязычной коммуникации. В отличие от предыдущих систем, новая модель объединяет все задачи перевода в одной платформе. Основой архитектуры является модель UnitY, которая эффективно генерирует переведенный текст и речь.
Михаил Парахин, генеральный директор Bing, поделился своими мыслями: “Мы провели обширные исследования по снижению токсичности и устранению предвзятости, что привело к созданию модели, которая лучше осведомлена о потенциальных проблемах. Выпуск модели SeamlessM4T стимулирует совместные исследования и разработки в сообществе ИИ.”
Этот важный шаг в развитии ИИ позволит преодолевать языковые барьеры, делая мир более открытым и понимающим.
Ранее мы сообщали, что исследование показывает влияние демографических факторов на обучение искусственного интеллекта
* – компания Meta признана экстремистской в РФ