10 promocji Stable Diffusion, które pomogą Ci stworzyć oryginalne zdjęcia

Miscellanea / by admin / October 15, 2023

click fraud protection

Zaoszczędzą Twój czas i pomogą odkryć nowe pomysły.

Jak pisać zapytania dotyczące stabilnego rozproszenia

Podczas pracy z siecią neuronową Stable Diffusion i innymi podobnymi systemami najbardziej pomyślne wyniki można uzyskać, tworząc szczegółowe instrukcje. Oto jak zrobić to dobrze.

Uwzględnij wszystkie ważne szczegóły

Najpierw musisz ustalić cel prośby i przybliżony wynik, w jakim stylu ma zostać przedstawiona, a czego nie da się przedstawić na zdjęciu.

Prawidłowy element musi zawierać temat lub przedmiot, który chcemy zobaczyć na obrazku. Musisz określić, czym zajmuje się temat, jego lokalizację, a następnie wszelkie dodatkowe słowa kluczowe. Złożona prośba może zawierać także szczegółowy opis rodzaju obrazu: rysunek, fotografia realistyczna, pejzaż. Często tę właściwość można aktywować w ustawieniach usługi.

Im bliżej początku żądania, tym większą ma moc w generowaniu obrazu. Dla każdego elementu możesz ręcznie określić jego ważność lub „wagę”. Zwykle jest to zapisywane po dwukropku bez spacji, na przykład: waga: 1,5, waga: 0,4.

instagram viewer

W szczegółowych zapytaniach warto zastosować dodatkowe słowa, które pomogą sieci neuronowej wybrać najskuteczniejszą opcję. Opisz wszystkie cechy, które przychodzą Ci na myśl w przypadku konkretnego zadania.

Odpowiednie słowa kluczowe możesz znaleźć, eksperymentując samodzielnie lub korzystając z pomocy projektanta produktu. W drugim przypadku można od razu uwzględnić większość dostępnych parametrów i modyfikatorów wyniku końcowego.

Zarejestruj niepotrzebne elementy i cechy

Podpowiedź negatywna może również pomóc przy tworzeniu prośby. To jest lista wszystkich właściwości, które nie powinny znajdować się na obrazku. Często wskazuje punkty zależne od kontekstu.

Konieczne może być wykluczenie zdeformowanych części ciała, drugiej osoby w kadrze, rozmycia, złej jakości i innych podobnych rzeczy. Negatywny promt pomoże Ci zebrać klatki z mniejszą liczbą artefaktów. Ale nie musisz tworzyć ogromnej listy wykluczeń – wystarczą podstawowe słowa kluczowe.

Weź pod uwagę główne parametry w ustawieniach żądania

Ustawienia sieci neuronowej zawsze zawierają kilka ważnych parametrów: kroki generacji, ziarno, rozdzielczość, próbnik.

Kroki - wskazuje liczbę kroków, jakie sieć neuronowa wykona podczas generowania obrazu. Im jest ich więcej, tym zwykle wyższa jest jakość wyniku.
Nasionko - jest to punkt odniesienia, na podstawie którego system generuje obraz. Początkowo określany jest „losowy” parametr spośród miliardów opcji. Pomaga to uzyskać różne wyniki dla tego samego zapytania. Jeśli użyjesz określonej wartości, po zmianie monitu zawartość obrazu pozostanie w przybliżeniu taka sama.
Próbnik - oznacza procesy mające wpływ na wynik końcowy. W przypadku prostych ujęć wystarczy 5-10 kroków, w przypadku innych potrzeba 60-90.
Rezolucja jest rozmiar obrazu. Model Stable Diffusion XL generuje maksymalnie 2048 x 2048 pikseli.

Dla początkującego lepiej zacząć od konstruktora promtu. Najpopularniejszą opcją z dużą liczbą ustawień jest Promptomania. Nadaje się do różnych sieci neuronowych, w tym sekcji stabilnej dyfuzji.

Jakie polecenia mogą się przydać?

W tej chwili najnowszym modelem sieci neuronowej jest Stable Diffusion XL (SDXL). Zapewnia wysoką jakość obrazów i ma znaczące ulepszenia w stosunku do poprzednich wersji. Opcje działające w SDXL mogą różnić się od wcześniejszych modeli.

Aby przetestować żądania w tym przypadku, skorzystaliśmy z usługi online Studio marzeń oparty na Stable Diffusion XL 1.0. Następnie spójrzmy na przykłady promtów do generowania obrazów w różnych stylach i formach.

1. Dla fotorealistycznych obrazów

1 / 0

2 / 0

Stable Diffusion XL może generować obrazy w szerokiej gamie stylów. Jednym z najważniejszych jest fotorealizm. Jest mało prawdopodobne, że uzyskasz idealny wynik za pierwszym razem, ale po serii prób możesz wygenerować imponujące obrazy.

Przykłady możliwych zapytań:

Metalowy niebieski długopis firmy Parker, pióro wieczne, odblaskowe, pozycjonowane na stole roboczym. Pióro znajduje się na wierzchu papierowego notesu z czarno-złotą okładką. Słoneczny, jasny obraz. Ogromna przestrzeń do kopiowania na górze obrazu, przestrzeń negatywna, hd, 8k, rozmyte marzycielskie tło, piękne zdjęcia.
Młoda kobieta w bajecznej sukni, fotorealizm, ciemne włosy, wyśrodkowane w kadrze, twarz symetryczna, 50 mm obiektyw, aparat skierowany w stronę kamery, ciemne tło, naturalne światło, nieostre góry w tle, ultra-szczegóły, 16K.

Odpowiednie negatywne szczegóły do zapytań: (zdeformowane, zniekształcone, zniekształcone: 1.3), źle narysowane, poza ramka, znak wodny, podpis, odcięty, niski kontrast, niedoświetlony, prześwietlony, zła grafika, początkujący, amator.

2. Do animowanych obrazów

1 / 0

2 / 0

3 / 0

Sieć neuronowa pozwala tworzyć animowane obrazy o dowolnej złożoności, ale aby uzyskać dobry wynik, będziesz musiał majstrować przy zestawie zapytań.

Przykładowe żądania:

Mężczyzna w czarnym hełmie kosmicznym, długim ciemnym płaszczu, portret ciała, czerwone światło na klatce piersiowej, pokaz mody buty koncepcyjne, ostra ostrość, czarny szalik, wietrzny, bardzo szczegółowy, czerwone oczy, malarstwo cyfrowe, ilustracja sztuki.
Kot w butach siedzący w restauracji, jedzący makaron z serem i oglądający występ piosenkarza, nierealny silnik, przytulne oświetlenie wewnętrzne, stacja artystyczna, szczegółowe, malarstwo cyfrowe, kino, ilustracja.
Ilustracja przedstawiająca wielkiego smoka ziejącego ogniem i modlących się wokół niego małych ludzi. Intensywny i mocny ognisty oddech, wolumetryczny. Podkreśl jego przenikliwe spojrzenie, ostre zęby i potężną postawę. Artstation, szczegółowe, cyfrowe malowanie, kinowe.

Negatywne szczegóły wniosków: (zdeformowane, zniekształcone, zniekształcone: 1.3), źle narysowane, zła anatomia, zła anatomia, dodatkowa kończyna, brakująca kończyna, pływające kończyny, (zmutowane dłonie i palce: 1.4), odłączone kończyny, mutacja, zmutowane, brzydkie, obrzydliwe, zamazane, amputacja, źle narysowane stopy, źle narysowana twarz, poza rama, dodatkowe kończyny, zniekształcone, zdeformowane, ciało poza kadrem, zła anatomia, znak wodny, podpis, odcięte, niski kontrast, niedoświetlone, prześwietlone, zła grafika, początkujący, amator.

3. Do artystycznych krajobrazów

1 / 0

2 / 0

3 / 0

4 / 0

Stable Diffusion generuje doskonałe krajobrazy, na przykład jesienny las w promieniach zachodzącego słońca, fantastyczny zamki, plaże czy futurystyczne miasta.

Przykładowe żądania:

Duży las z żółtymi, zielonymi i czerwonymi liśćmi o zachodzie słońca, małe miasteczko z kościołem i wieżą radiową w tle, fantazja, profesjonalne płótno, triadyczne kolory, głęboki kolor, oświetlenie wolumetryczne, cieniowanie z ciemnymi krawędziami, bogactwo szczegółów, matowe tło, styl render oktanowy.
Środowisko w fantastycznym świecie Tolkiena, gotycki duży zamek, ultraszczegółowe, dzienne, grafika koncepcyjna filmu, epicka, malowanie matowe, mgła, światło wolumetryczne, 16k, artstation.
Obraz przedstawiający skalistą plażę z rozbijającymi się o nią wielkimi falami i grzmotem w tle z rezydencją na wzgórzu, niezwykle szczegółowy obraz olejny, światło wolumetryczne, 16k, artstation.
Futurystyczny wieżowiec, światło błyskowe, epicka kompozycja, film, ilustracja krajobrazu, szczegółowe malowanie, obróbka końcowa 8k, nierealny silnik, stacja artystyczna.

4. Do portretów

1 / 0

2 / 0

3 / 0

Stable Diffusion XL radzi sobie nieźle z generowaniem portretów, ale superrealizm nadal jest trudny do osiągnięcia. Ale sieć neuronowa przydaje się do testowania opcji prawdziwego strzelania lub na przykład komiksów.

Przykładowe żądania:

Młoda kobieta z zielonymi wstążkami we włosach, siedząca przed kawiarnią w Paryżu, zielone oczy, ubrana w stylową sukienkę, światło boczne, fotorealistyczna
Pan w czarnym garniturze, ultrarealistyczne, kinowe ujęcie, najwyższa jakość, (szczegóły twarzy i oczu: 1.1), krótki włosy, wnętrze starej rezydencji, rozproszenie podpowierzchniowe, (skóra szczegółowa: 1.1), błyszcząca skóra, profesjonalne zdjęcie, wolumetryczne oświetlenie
Stylowa kobieta, zdjęcie uliczne, długie blond włosy, uchwycona jej odbicie w szklanych drzwiach księgarni, kadrowanie górnej części ciała, na paryskiej ulicy, oświetlenie neonowe, ujęcie z niskiego kąta, (efekt bokeh: 1.2), ultra realistyczny

Negatywne szczegóły zapytań: (zdeformowane, zniekształcone, zniekształcone: 1.3), źle narysowane, zła anatomia, zła anatomia, dodatkowa kończyna, brakująca kończyna, pływające kończyny, (zmutowane ręce i palce: 1.4), odłączone kończyny, mutacja, zmutowana, brzydka, obrzydliwa, zamazana, amputacja, źle narysowane stopy, źle narysowana twarz, poza kadrem, dodatkowe kończyny, zniekształcone, zdeformowane, ciało poza ramą, zła anatomia, znak wodny, podpis, odcięte, niski kontrast, niedoświetlone, prześwietlone, zła grafika, początkujący, amator, zniekształcony twarz.

5. Aby wygenerować znaki

1 / 0

2 / 0

3 / 0

Dzięki Stable Diffusion XL możesz tworzyć piękne i zabawne ujęcia znanych osób postacie. Możesz łączyć kilka różnych stylów jednocześnie.

Przykładowe żądania:

Filmowe ujęcie Batmana, nakręcone kamerą Red V-Raptor 8K, 50 mm, f/1.4, reżyser David Fincher, światłocień, całe ciało, futurystyczny kostium cyberpunkowy, realizm magiczny.
Szczegółowy obraz 8K przedstawiający One-Punch Mana siedzącego nocą na metalowym tronie pośród japońskiej architektury. Ilustracja, realistyczne, anime, oświetlenie wolumetryczne.
Zdjęcie Vault Boya z Fallouta jako gladiatora na dużej arenie walki, zamglone powietrze, ilustracja.

6. Do tworzenia obiektów architektonicznych

1 / 0

2 / 0

3 / 0

SDXL jest przydatny dla projektantów. Można go na przykład wykorzystać do tworzenia koncepcyjnych obrazów budynków w dowolnym stylu. Sieć neuronowa często popełnia błędy w liniach i kształtach skomplikowanych obiektów, proces generowania trzeba będzie powtarzać, aż do uzyskania pomyślnego wyniku.

Przykładowe żądania:

Plan projektu architektonicznego pensjonatu uchwycony z zewnątrz, duże stalowe okna z widokiem na miasto, wysoki sufit, wysoka jakość, 8k, ultrarealizm, fotografia w wysokiej rozdzielczości
Zewnętrzne ujęcie willi w Mykonos, z widokiem na morze, nastrojem w biało-niebieskich kolorach, oświetleniem wolumetrycznym, wysokiej jakości, 8k, ultrarealizm, fotografia w wysokiej rozdzielczości
Rustykalny dom w stylu hiszpańskim, wykonany z kamienia, z biało-niebieskimi dekoracjami. oświetlenie wolumetryczne, wysoka jakość, 8k, ultrarealizm, fotografia w wysokiej rozdzielczości

7. Do projektowania wnętrz

1 / 0

2 / 0

3 / 0

Sieć neuronowa nadaje się również do przygotowania projektu wnętrz lokali. Użyj SDXL, jeśli chcesz znaleźć nietypowe opcje projektu swojego domu lub mieszkanie.

Przykładowe żądania:

Futurystyczny salon z odblaskowym sufitem, wysokimi metalowymi oknami, (futurystyczny wystrój: 1.2), w oddali przyszły pejzaż miejski nocą, wysoka jakość, 8k, ultrarealizm
Kuchnia w stylu Sou Fujimoto, szeroki kąt widzenia tętniącego życiem miasta w oknach, architektura wnętrz, renderowana w oktanie, fotorealistyczna, bardzo szczegółowa
Projekt wnętrza w nowoczesnym, organicznym stylu, pokój z sofą, dywanem, stołem z czasopismami, żyrandolem i fotelem, neutralne kolory, jasne otoczenie, realistyczny, renderer V-Ray, bardzo szczegółowy

Negatywne szczegóły wniosków: (zdeformowane, zniekształcone: 1.3), źle narysowane, obrzydliwe, rozmazane, ludzie, człowiek, podpis, znak wodny, znak.

8. Aby stworzyć obrazy odzieży

1 / 0

2 / 0

3 / 0

SDXL oferuje dobry materiał filmowy odzież, ale będziesz musiał poeksperymentować z zapytaniami i powtórzyć proces wiele razy, aby uzyskać udane zdjęcia.

Przykładowe żądania:

Ubrania Techwear i modny wygląd, stopy do głowy, złote proporcje, futurystyczne, bardzo szczegółowe, Errolson Hugh, Yohji Yamamoto, Nike ACG, hipermaksymalista.
Modna sukienka i modny wygląd, stopy do głowy, złoty stosunek, bardzo szczegółowe, pastelowe kolory, Miu Miu, Prada, luksus, wysoka jakość, 8k, ultra realizm.

Negatywne szczegóły zapytań: (zdeformowane, zniekształcone, zniekształcone: 1.3), zła anatomia, zła anatomia, ekstra kończyna, brakująca kończyna, pływające kończyny, (zmutowane dłonie i palce: 1.4), odłączone kończyny, zmutowane, zamazane.

9. Do tworzenia logo

Sieć neuronowa przyda się także podczas kształtowania tożsamości organizacji. Dzięki SDXL możesz testować różne pomysły na logo w dowolnym stylu. Bądź przygotowany na ciągłe dostosowywanie żądań.

Przykładowe żądania:

Minimalistyczne logo przedstawiające retrofuturystyczne UFO. Logo przedstawia UFO przelatujące nad drapaczami chmur i świecącymi światłami miast. Paleta barw to mieszanka barw ciemnych i intensywnych, w tym odcieni czerni i czerwieni. Ilustracja, grafika wektorowa, projekt logo.
Logo firmy technologicznej, biało-niebieskie, latająca mewa, symetryczne, ilustracja, grafika wektorowa, projekt logo.

Negatywne szczegóły żądań: (zdeformowane, zniekształcone, zniekształcone: 1.3), źle narysowane, obrzydliwe, rozmazane, ludzie, człowiek, podpis, znak wodny.

10. Do złudzeń optycznych

Stable Diffusion pozwala na generowanie iluzji optycznych – obrazów opartych na odniesieniach lub obrazów z „wszytymi” w nie słowami. Tworzone są przy użyciu wtyczki sieci neuronowej ControlNet. Pozwala uzyskać zdjęcia na podstawie innych obrazów, zachowując elementy z oryginalnych klatek.

Sieć neuronowa tworzy obraz na żądanie użytkownika i uwzględnia zaproponowane odniesienie. Na przykład krajobraz łączy się z formą gwiazdy lub trawa tworzy słowo, które jest widoczne po oddaleniu się od obrazu.

Aby korzystać ze Stable Diffusion z wtyczką ContolNet, będziesz potrzebować wydajnego komputera. Alternatywnie możesz skorzystać z usług online o tych samych możliwościach. Więcej o dostępnych narzędziach i sposobie z nimi pracy przeczytasz w artykuł Haker życia.

Nauka pracy z AI📝🤖💬

Jak korzystać z ChatGPT w Telegramie i szybko uzyskać odpowiedzi na wszelkie pytania bez przeglądarki
3 usługi oparte na sieciach neuronowych, które pomogą stworzyć iluzje optyczne
10 najlepszych sieci neuronowych do rysowania online
7 narzędzi opartych na sieci neuronowej poprawiających jakość wideo
15 podpowiedzi dotyczących ChatGPT, które mogą Ci się przydać

Tagi chmura

Miscellanea

Ocena

widoki

Komentarze