Jak korzystać z sieci neuronowej DALL-E 2
Miscellanea / / July 26, 2023
Rozumiemy, jakie są plusy i minusy systemu oraz co należy wskazać w prośbach.
Co to jest DALL‑E
DALL-E to sieć neuronowa z OpenAI, która generuje obrazy na podstawie zapytań tekstowych, a także może tworzyć wariacje obrazów na podstawie sugerowanych przez użytkowników przykładów.
Narzędzie jest projektowane na podstawie modelu GPT‑3, który został dodatkowo przeszkolony do tworzenia graficznego ludzi, zwierząt, a także dużej liczby innych obiektów. Ponadto usługa jest w stanie łączyć niepowiązane koncepcje, tworząc nowe pomysły.
Pierwsza wersja DALL‑E została wydana w 2021 roku, a rok później twórcy wprowadzili ulepszoną wersję DALL‑E 2, który obsługuje wyższą jakość obrazu i zaawansowane opcje konwersji gotowych kino.
System definiuje zapytania w setkach języków, w tym rosyjskim. Ale głównym językiem skutecznych poleceń jest angielski. Sieć neuronowa najpierw rozpoznaje wprowadzony przez użytkownika tekst i generuje z niego prosty szkic, następnie konwertuje go do ostatecznej wersji o małej rozdzielczości, a następnie skaluje, dodając szczegóły.
Co potrafi sieć neuronowa DALL‑E 2
Jak wspomniano powyżej, model z OpenAI może nie tylko generować obrazy na żądanie, ale także tworzyć projekty, mieszając różne koncepcje. Sieć neuronowa łączy dwie ramki i tworzy z nich kolejną.
Korzystając z funkcji Outpainting, możesz rysować tło Obrazy. Ciekawie jest uzupełniać gotowe obrazy czy fotografie, rozwijając na ich podstawie nowe historie. Możliwa jest również zmiana kompozycji, edycja cieni i faktury obrazu, dodawanie i usuwanie obiektów w kadrze.
Jedną z funkcji DALL‑E 2 jest praca z pobranymi plikami. Korzystając z przyjaznego dla użytkownika, minimalistycznego interfejsu, można łatwo dodawać elementy do zdjęć, generować fantastyczne krajobrazy lub zwiększać szczegółowość zdjęć.
Jakie są wady DALL‑E 2
W tej chwili DALL‑E 2 nie jest instrumentem idealnym. Aby uzyskać dobre wyniki, musisz eksperymentować, próbować różnych zapytań i dostosowywać parametry. Sieć neuronowa okresowo generuje zabawne, a nawet przerażające klatki ze zniekształconymi obiektami i nieprawidłowym ułożeniem elementów.
System jest szczególnie często mylony, jeśli podajesz go długo upraszanie i podawanie zbyt wielu szczegółowych informacji. Niezbyt dobrze definiuje terminy zawodowe, a także myli się, stosując negacje lub wykluczenia zamiast bezpośrednich wskazań, co powinno znaleźć się w kadrze.
Jak korzystać z DALL-E 2
Możesz zacząć korzystać z systemu na stronie OpenAI pod adresem sekcja DALL E 2naciskając przycisk Wypróbuj DALL‑E 2. Jeśli nie masz jeszcze konta w serwisie, możesz je założyć za pośrednictwem swojego adresu e-mail lub istniejących profili Google lub Microsoft.
Jeśli próbujesz połączyć się z Rosji, będziesz potrzebować VPN i numeru wirtualnego, aby założyć konto. Możesz przeczytać więcej o tworzeniu konta na stronie OpenAI w materiał o ChatGPT.
Po zalogowaniu powinieneś mieć 35 darmowych kredytów na generowanie obrazów przez miesiąc. W każdym następnym miesiącu podaje się 15 prób. Możesz uzupełnić saldo na swoim koncie osobistym za pomocą przycisku Kup kredyty. Będziesz musiał zapłacić co najmniej 15 USD za 115 żądań. Niestety użytkownicy z Rosji nie mogą teraz bezpośrednio uzupełnić salda.
Istnieje kilka opcji rozwiązania problemu: poproś znajomego z odpowiednim dostępem do systemu płatności o opłacenie rachunku lub załóż konto na chwilę, znajdź i kup gotowy profil OpenAI za pośrednictwem internetowych platform transakcyjnych lub skorzystaj z innych usług na Podstawa DALL‑E.
Najwygodniejsza alternatywa Generator obrazów Microsoftu. To narzędzie działa na algorytmach DALL-E 2 i daje prawie takie same wyniki za darmo. Ale nie ma trybu. edycja obrazu, uzupełnienie ramki i inne przydatne funkcje. Analogu można użyć tylko do generowania obrazów, a następnie korygowania wyniku innymi programami. Będziesz potrzebować konta Microsoft i VPN, aby z niego korzystać.
Prośbę o generację lepiej złożyć zarówno na stronie internetowej DALL‑E 2, jak iw Generatorze obrazów w języku angielskim, ale po rosyjsku system daje również dobre wyniki. Przycisk Zaskocz mnie, który znajduje się obok linii wprowadzania, automatycznie wystawi nietypowe żądanie przetestowania sieci neuronowej.
Aby uzyskać wynik wysokiej jakości, użyj zapytań, które jasno opisują pożądaną ramkę, ale bez zbędnych szczegółów. Wprowadź typ obrazu w wierszu wprowadzania. Może to być portret, obraz akwarelowy, szkic ołówkiem i tym podobne.
Określ także opcję oświetlenia w ramce i stylu. Na przykład realistyczna ekspozycja, jak w komiksie, lub specyficzny styl znanego artysty. Pożądane jest uzupełnienie tego o przybliżony poziom jasności.
Na końcu linii możesz dodać kontekst tego, co się dzieje. Na przykład, że kadr zawiera nie tylko łazik księżycowy, ale także moment, w którym porusza się on na tle Ziemi. Albo scenę, w której pluszowe zające walczą z kosmitami.
Żądanie nie musi zawierać wszystkich elementów, wynik może być nadal interesujący, ale wskaźnik sukcesu będzie zauważalnie niższy. Pomóż zbudować odnoszący sukcesy zespół specjalistyczne narzędzia, takich jak Promptomania.
Przeczytaj także🖼️🤖💬
- Jak korzystać z ChatGPT w Telegramie i szybko uzyskiwać odpowiedzi na wszelkie pytania bez przeglądarki
- Ponad 100 usług opartych na sieciach neuronowych do różnorodnych zadań
- 7 narzędzi sieci neuronowych do poprawy jakości wideo
- 6 usług opartych na sieciach neuronowych w celu poprawy jakości dźwięku
- 10 przydatnych wtyczek do ChatGPT