Meta* wprowadziła AudioCraft, generator muzyki i dźwięku oparty na opisie tekstowym
Miscellanea / / August 03, 2023
Neurosyntezator do każdego zadania: od prostego szumu po złożone melodie.
Meta* udostępniła nowe narzędzie open source o nazwie AudioCraft. Pozwala użytkownikom tworzyć muzykę i dźwięki w całości za pomocą generatywnej sztucznej inteligencji.
AudioCraft składa się z trzech modeli, z których każdy dotyczy różnych obszarów generowania dźwięku:
- MusicGen pozwala tworzyć melodie za pomocą podpowiedzi tekstowych. Została przeszkolona w zakresie „20 000 godzin muzyki należącej do Meta* lub licencjonowanej specjalnie do tego celu”.
- AudioGen tworzy określone dźwięki z podpowiedzi tekstowych, imitując np. szczekanie psów czy kroki człowieka.
- kodek pozwala przetwarzać dźwięki, zmniejszając liczbę artefaktów.
Firma umożliwiła członkom mediów odsłuchanie niektórych próbek audio utworzonych za pomocą AudioCraft. Generowany gwizd i dźwięk syren brzmiał całkiem naturalnie, ale dźwięk strun gitary nadal wydawał się sztuczny, odnotowany w The Verge.
Rozwój Meta* nie jest jedynym w swoim rodzaju. Google już to zrobił
wprowadzony MusicLM, duży model języka, który generuje również dźwięki na podstawie podpowiedzi tekstowych.Wytwórnie płytowe i artyści nie docenili takich innowacji. Wielu z nich już wypowiedziało się na temat niebezpieczeństw związanych ze sztuczną inteligencją, ponieważ niektóre modelki mogą wykorzystywać do treningu materiały chronione prawem autorskim.
AudioCraft na GitHubie →
*Działalność Meta Platforms Inc. i jego sieci społecznościowe Facebook i Instagram są zabronione na terytorium Federacji Rosyjskiej.
Przeczytaj także🧐
- 105 usług opartych na sieciach neuronowych do różnorodnych zadań