NVIDIA wprowadziła sieć neuronową do generowania wideo według opisu
Miscellanea / / April 20, 2023
Jeśli chcesz zobaczyć imperialnego szturmowca odkurzającego plażę.
Firma NVIDIA ogłoszony nowy model VideoLDM AI, który tworzy krótkie filmy na podstawie tekstu. Został opracowany we współpracy z naukowcami z Cornell University.
VideoLDM bierze pod uwagę do 4,1 miliarda parametrów, z czego 2,7 miliarda jest trenowanych na wideo. Wygenerowane klipy mogą mieć rozmiar do 2048×1280 pikseli przy 24 klatkach i trwać do 4,7 sekundy.
Sieć neuronowa jest w stanie stworzyć zarówno proste sceny z kilkoma słowami w żądaniu, jak i coś bardziej złożonego. Kilka przykładów:
- Fajerwerki.
- Szturmowiec odkurza plażę.
- Podróżnik spaceruje samotnie w mglistym lesie o zachodzie słońca.
Więcej przykładów jest włączonych strona internetowa projektu.
Ta sieć neuronowa NVIDIA nie jest jeszcze dostępna publicznie. Został on zaprezentowany jako artykuł naukowy w ramach konferencji Conference on Machine Vision and Pattern Recognition.
Twórcy odnotowali imponujący i szybki postęp w nauce, ale nie rozmawiali o możliwej przyszłości sieci neuronowej. Niemniej jednak możemy założyć, że wkrótce otrzymamy pełnoprawny analog wideo
w połowie podróży.Przeczytaj także🧐
- 10 usług sieci neuronowych do tworzenia wideo
- 7 narzędzi sieci neuronowych do poprawy jakości wideo
- Runway uruchamia nowy model sieci neuronowej do tworzenia filmów z opisu tekstowego