OpenAI готовится к запуску DALL·E 3 и показал примеры изображений

25.09.2023 19:17

OpenAI готовится к запуску DALL·E 3, новой версии своей модели, способной преобразовывать текстовые подсказки в изображения с внимательностью к деталям. Эта модель демонстрирует значительные улучшения по сравнению с предыдущими версиями, обеспечивая более точное и креативное визуализирование идей.

Новые возможности DALL·E 3

DALL·E 3 может не только создавать изображения на основе текстовых подсказок, но и самостоятельно формулировать эти подсказки благодаря интеграции с ChatGPT. Это позволяет пользователям предоставлять идеи для изображений в словах, а модель затем сама формулирует подсказки и создает изображения. Это уменьшает необходимость в “инженерии подсказок”, делая процесс более творческим и менее техническим.

Примеры и внимание к деталям

Примеры, представленные разработчиками и пользователями OpenAI, демонстрируют поразительное внимание к деталям DALL·E 3. Одним из примеров является изображение, на котором шторм за окном отражается в чашке кофе, с миниатюрными молниями и волнами внутри чашки. Это подчеркивает способность модели воспроизводить сложные идеи и детали, указанные в подсказке.

Еще несколько примеров:

DALL-E 3 хорошо умеет наносить текст на изображения

Потенциал для создателей контента

Исследователи OpenAI, такие как Andrej Karpathy, представляют новые потенциальные рабочие процессы для создателей контента, используя DALL·E 3 для генерации изображений, которые затем можно анимировать с помощью других инструментов. Это может позволить автоматически преобразовывать истории в аудиовизуальные форматы.

Технологические основы и конкуренция

Хотя OpenAI пока не комментировала технологии, стоящие за DALL·E 3, предполагается, что новые модели согласованности заменят использовавшиеся ранее модели диффузии. Конкурент DALL·E, Midjourney, также работает над обновлением своей модели, чтобы улучшить понимание текста.

Заключение

DALL·E 3 обещает стать новым лидером в области генерации изображений, предоставляя улучшенное качество и внимание к деталям. Несмотря на некоторые неточности, общий прогресс кажется значительным, и эта модель может предложить новые возможности для творчества и создания контента.

Автор:
SEO-специалист, автор новостей по ИИ

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

telegram
Обратная связь
Свяжитесь с нами
Реквизиты

ИНН: 772578776588
ОГРН: 315774600103615
ОКПО: 0194004627
ОКТМО: 45914000000
ОКАТО: 45296559000
р/с: 40802810300310000244
в АКБ «БАНК МОСКВЫ» (ОАО) отделение «Перовское»
к/с: 30101810500000000219
БИК: 044525219

Фактический адрес: г. Москва, шоссе Энтузиастов, дом 56, строение 26, офис 304

Юридический адрес: 115191, г. Москва, 4-й Рощинский проезд д.7/16