Nowa sieć neuronowa Stable Audio generuje muzykę na podstawie opisu tekstowego
Miscellanea / / September 14, 2023
Od twórców Stable Diffusion.
Stabilność AI, znana głównie z sieci neuronowych do generowania obrazów (Stabilna dyfuzja, Stabilny Doodle i nie tylko), wydany nowa sieć neuronowa Stable Audio. Jak sama nazwa wskazuje, generuje klipy audio.
Wszystko działa na podobnej zasadzie jak generatory obrazów bazujące na opisach tekstowych. Użytkownik określa słowa kluczowe (na przykład „melodyczny hip-hop lo-fi, melodyjny, 85 BPM” lub „death metal z potężnymi gitarowymi riffami i szybką perkusją”), żądany czas trwania i czeka na wynik.
Jako podstawę wykorzystaliśmy ten sam model, co w Stable Diffusion, ale trenowaliśmy go na kompozycjach muzycznych, a nie na obrazach. W sumie pobrano z serwisu muzycznego AudioSparx około 800 tysięcy utworów, czyli około 19 500 godzin różnych dźwięków.
Twórcy zauważają, że główną cechą Stable Audio jest możliwość generowania kompozycji o zadanej długości. Wcześniej sieci neuronowe działały tylko przez ustalony czas: jeśli były trenowane na 30-sekundowych klipach audio, mogły generować jedynie 30-sekundowe kompozycje. Aby móc dostosować czas trwania utworu, twórcy musieli zmienić model i dodać metadane na początku i na końcu kompozycji.
Stable Audio jest oferowane w trzech modelach. Wersja darmowa pozwala na wygenerowanie nie więcej niż 20 utworów trwających do 45 sekund miesięcznie. Dostępna jest również subskrypcja Professional, która umożliwia utworzenie do 500 utworów o długości do 90 sekund w cenie 12 USD za sztukę miesięcznie (≈1200 rubli) oraz opcja Enterprise dla firm z możliwością indywidualnego doboru wielkości generacji i ceny OK. Bez płatnej subskrypcji nie można wykorzystywać wygenerowanej muzyki do celów komercyjnych.
Podobnie jak w przypadku innych podobnych sieci neuronowych, Stable Audio jest skierowane bardziej do twórców treści niż do profesjonalnych muzyków. Takie narzędzia nadają się do szybkiego tworzenia podkładu muzycznego do podcastów i filmów, gdy nie masz czasu ani budżetu na współpracę z kompozytorem. Może również zastąpić standardowe dźwięki, jeśli chcesz mieć niepowtarzalny śmiech lub odgłosy tłumu.
Możesz wypróbować Stable Audio na oficjalnej stronie internetowej. Musisz się zarejestrować lub zalogować na konto Google. Na początku mogą wystąpić przerwy w dostępie ze względu na duże obciążenie serwera.
Stabilny dźwięk →
Więcej nowych sieci neuronowych🦾✨
- Wirtualny asystent AIDA firmy Sber będzie diagnozował pacjentów w moskiewskich klinikach
- Nowa aplikacja Artisse generuje fajne zdjęcia z twarzą użytkownika
- Stability AI wprowadziło chatbota Stable Chat - darmowy odpowiednik ChatGPT