Новые модели искусственного интеллекта продолжают удивлять нас своими возможностями. Одним из ярких примеров является американский стартап Suno, который специализируется на генерации аудио из текста. Их последняя модель, Chirp v1, предлагает поразительные возможности в создании музыки.
Что такое Chirp v1?
В начале сентября Suno представила свою новую модель текста в песню, Chirp v1. Эта модель способна генерировать музыку, включая вокал, на основе стиля и текста песни. Одним из наиболее значимых улучшений является возможность конвертации различных жанров, таких как рок, поп, K-pop, а также описаний типа “мелодичный” или “быстрый” в музыку.
“Текст песни теперь можно разбить на части с помощью команд вроде [verse] и [chorus], что придает сгенерированным песням больше структуры.”
Интеграция с Discord и возможности
Chirp полностью интегрирован с Discord. Для каждого запроса в Chirp модель генерирует две вариации, обычно длительностью от 20 до 40 секунд. Если вам понравилась одна из вариаций, вы можете продолжить генерацию, добавив до 30 секунд к уже существующему фрагменту.
Suno предлагает 250 бесплатных кредитов в месяц на Discord, что эквивалентно 25 chirps. Также доступен Pro-план за $10 в месяц, предлагающий до 1000 кредитов.
Ограничения и будущее
Стоит отметить, что модель не поддерживает запросы с упоминанием конкретных артистов, вероятно, чтобы избежать юридических проблем с авторскими правами. Но уже сейчас можно сказать, что темпы развития генеративного ИИ таковы, что скоро мы можем услышать настоящие хиты, созданные исключительно машинами.
Заключение
Suno и их модель Chirp v1 открывают новые горизонты в мире музыки, делая процесс ее создания доступным и интересным как для профессионалов, так и для обычных пользователей. С учетом того, что модель поддерживает более 50 языков и разнообразные музыкальные стили, будущее выглядит весьма обещающим.