Google разработала новую нейросеть MusicLM, которая умеет генерировать музыку в любых жанрах по текстовому описанию. Ее обучали на наборе данных из 280 тысяч часов записей.
Можно задать настроение, темп и прочие уточняющие параметры, указав даже абстрактные понятия. Например, алгоритмы способны создать «динамичный саундтрек для аркадной игры», «мелодию для медитации» или композицию, которая вызывает «ощущение, что вы затерялись в космосе».
Все доступные примеры можно послушать на сайте проекта. Вот один из них:
Сейчас у MusicLM есть ряд недостатков. Нейросеть плохо справляется с вокалом, а примерно 1% сгенерированных мелодий слишком похож на песни, загруженные в базу для обучения. Из-за возможных проблем с авторскими правами доступ к нейросети простым пользователям пока не предоставляется.