Nvidia анонсировала новую ИИ-модель под названием Fugatto, предназначенную для создания и изменения музыки и аудио. Эта технология может генерировать звуки по запросу и изменять уже существующие аудиозаписи. Она ориентирована на использование в области создания фильмов, музыки и видеоигр.
Технология позволяет генерировать сложные звуковые эффекты, такие как «лающая труба» или звук «грохочущих басов с высокочастотным цифровым щебетом». Возможность изменения существующего звука, например, преобразование пианино в голос, является одной из ключевых функций технологии.
Вице-президент Nvidia по глубокому обучению Брайан Катандзаро отмечает, что генеративный ИИ предлагает новые возможности в создании музыки и других аудио-продуктов. Однако он также предупреждает о возможных рисках, связанных с использованием этой технологии.
Отметим, что параллельно Google DeepMind также разрабатывает ИИ для генерации саундтреков к видео, что подчеркивает интерес индустрии к таким решениям.