Jak pisać prompty do generatorów obrazów AI

Q: Chcesz opanować AI od podstaw?

Ten poradnik to dopiero początek. W naszym kursie "Praktyczna AI" nauczysz się korzystać z ChatGPT, Claude i innych narzędzi AI w sposób systematyczny - od zera do zaawansowanego poziomu. Sprawdź kurs →

Patrzysz na puste okienko Midjourney, DALL-E albo Stable Diffusion i myślisz: "co tu wpisać, żeby wyszło coś sensownego?". Wpisujesz "piękny krajobraz" - dostajesz generyczną pocztówkę. Próbujesz "cyberpunkowe miasto" - wychodzi chaos.

Problem nie leży w AI. Leży w tym, że nikt Cię nie nauczył, jak z nim rozmawiać o obrazach.

Promptowanie obrazów to nie magia - to rzemiosło. Konkretne zasady, sprawdzone struktury i parametry, które działają niezależnie od tego, czy używasz Midjourney, DALL-E czy Stable Diffusion. Poznasz je wszystkie w tym przewodniku.

Zanim zaczniesz - co musisz wiedzieć

Ten poradnik zakłada, że masz już dostęp do przynajmniej jednego generatora obrazów AI. Nie musisz być ekspertem - wystarczy, że wiesz, jak wpisać prompt i kliknąć "Generate". Jeśli jeszcze nie wybrałeś narzędzia, sprawdź porównanie Midjourney, DALL-E i Stable Diffusion.

Czego potrzebujesz:

Konto w Midjourney, DALL-E 3 (przez ChatGPT Plus) lub Stable Diffusion (lokalne/online)
Podstawowa znajomość angielskiego (większość generatorów działa lepiej po angielsku)
15-30 minut na testy i eksperymenty

Trzy najpopularniejsze generatory obrazów AI - każdy interpretuje ten sam prompt nieco inaczej

Anatomia skutecznego promptu - 5 warstw opisu

Dobry prompt to nie jedno zdanie. To uporządkowana struktura, która prowadzi AI od ogółu do szczegółu. Oto pięć warstw, które zawsze działają:

1. Przedmiot główny - co ma być na obrazie

Zacznij od tego, co najważniejsze. Nie "scena", nie "kompozycja" - konkretny obiekt lub postać.

Przykłady:

❌ Słabo: "beautiful scene" (co to w ogóle znaczy?)
✅ Dobrze: "elderly woman reading a book by the window"
✅ Dobrze: "steampunk airship hovering above Victorian London"

Im bardziej konkretny przedmiot, tym mniej miejsca na interpretację AI. "Kobieta" to za mało. "Starsza kobieta w okularach, czytająca przy oknie" - to już coś.

2. Szczegóły wizualne - jak to ma wyglądać

Teraz dodajesz detale: kolory, oświetlenie, tekstury, emocje.

Struktura:

Oświetlenie: "soft morning light", "dramatic backlighting", "neon glow"
Kolory: "warm golden tones", "muted pastel palette", "vibrant saturated colors"
Tekstury: "weathered wood", "polished metal", "soft fabric"
Atmosfera: "melancholic mood", "energetic vibe", "serene atmosphere"

Przykład kompletny: "elderly woman reading a book by the window, soft afternoon sunlight streaming through lace curtains, warm sepia tones, peaceful atmosphere"

3. Styl artystyczny - w jakiej estetyce

Tutaj decydujesz, czy obraz ma wyglądać jak fotografia, obraz olejny, ilustracja czy render 3D.

Popularne style:

Fotorealizm: "photorealistic", "DSLR photo", "shot on Canon EOS R5"
Malarstwo: "oil painting", "watercolor", "acrylic on canvas"
Ilustracja: "digital illustration", "concept art", "anime style"
3D: "Unreal Engine render", "octane render", "3D model"
Vintage: "1970s film photography", "polaroid", "daguerreotype"

Możesz też odwołać się do konkretnych artystów: "in the style of Studio Ghibli", "inspired by Moebius", "like a Wes Anderson film still". Uważaj tylko - niektóre generatory blokują nazwiska żyjących artystów.

Ten sam przedmiot w różnych stylach artystycznych - zmiana stylu to najprostszy sposób na kontrolę estetyki

4. Parametry techniczne - jakość i kompozycja

Tutaj wchodzą kwestie techniczne: rozdzielczość, kadrowanie, głębia ostrości.

Typowe parametry:

Jakość: "highly detailed", "8K resolution", "sharp focus"
Kadrowanie: "close-up portrait", "wide angle shot", "bird's eye view"
Głębia ostrości: "shallow depth of field", "bokeh background", "everything in focus"
Proporcje: w Midjourney: "--ar 16:9", w DALL-E wybierasz z menu

Przykład: "close-up portrait, shallow depth of field, blurred background, 85mm lens, highly detailed"

5. Negatywne prompty - czego NIE chcesz

Najbardziej niedoceniana warstwa. Negatywne prompty mówią AI, czego unikać. Szczególnie ważne w Stable Diffusion, mniej w Midjourney (który ma wbudowane filtry jakości).

Typowe negatywy:

"blurry, low quality, pixelated, artifacts"
"deformed hands, extra fingers, missing limbs" (przy portretach)
"oversaturated, garish colors, neon" (jeśli chcesz stonowanych barw)
"text, watermark, signature" (jeśli nie chcesz napisów)

W Stable Diffusion wpisujesz negatywy w osobne pole. W Midjourney używasz parametru "--no": "--no blurry, low quality".

Jak łączyć warstwy - gotowe szablony promptów

Teoria to jedno, praktyka to drugie. Oto trzy sprawdzone szablony, które możesz skopiować i dostosować:

Szablon 1: Fotorealistyczny portret

Struktura:
[przedmiot główny], [szczegóły wyglądu], [oświetlenie], [tło], [parametry kamery], [styl]

Przykład:
"Portrait of a middle-aged man with grey beard, wearing a wool sweater, soft window light from the left, blurred bookshelf background, shot on Canon EOS R5 with 85mm f/1.4 lens, shallow depth of field, photorealistic, highly detailed"

Negatywy (Stable Diffusion):
"blurry, low quality, deformed face, extra fingers, cartoon, illustration"

Szablon 2: Konceptowy krajobraz fantasy

Struktura:
[scena główna], [elementy świata], [atmosfera], [oświetlenie], [styl artystyczny], [jakość]

Przykład:
"Ancient floating islands connected by rope bridges, waterfalls cascading into clouds below, mystical glowing crystals, ethereal mist, golden hour lighting, in the style of Studio Ghibli, digital painting, highly detailed, 8K resolution"

Negatywy:
"photorealistic, modern buildings, people, text"

Szablon 3: Produktowa fotografia komercyjna

Struktura:
[produkt], [kąt ujęcia], [tło], [oświetlenie], [kontekst], [parametry techniczne]

Przykład:
"Minimalist white ceramic coffee mug, 45-degree angle view, clean white background, soft diffused studio lighting, small succulent plant beside the mug, product photography, sharp focus, commercial quality, 4K"

Negatywy:
"cluttered background, shadows, reflections, low quality"

Różnica między promptem "coffee mug" a kompletnym opisem z parametrami - to nie to samo narzędzie, to lepszy prompt

Parametry specjalne - kontrola zaawansowana

Każdy generator ma własne parametry, które dają Ci dodatkową kontrolę. Oto najważniejsze:

Midjourney - parametry w linii poleceń

W Midjourney parametry dodajesz na końcu promptu, po dwóch myślnikach:

--ar 16:9 - proporcje obrazu (aspect ratio)
--v 6 - wersja modelu (6 to najnowsza, czerwiec 2026)
--style raw - mniej "upiększania", bardziej surowy rezultat
--chaos 50 - losowość (0-100, im wyżej tym bardziej nieprzewidywalne)
--no - negatywny prompt (np. "--no text, watermark")
--seed 12345 - powtarzalność (ten sam seed + prompt = ten sam obraz)

Przykład kompletny:
"/imagine a cyberpunk street market at night, neon signs, rain-soaked pavement, crowded with vendors --ar 16:9 --v 6 --style raw --no text"

DALL-E 3 - praca przez ChatGPT

DALL-E 3 nie ma parametrów w stylu Midjourney. Zamiast tego piszesz prompt w naturalnym języku do ChatGPT, a model sam go rozbudowuje.

Jak to działa:

Otwierasz ChatGPT (musisz mieć Plus)
Piszesz: "Wygeneruj obraz: starsza kobieta czytająca przy oknie, miękkie światło, ciepłe tony, styl malarstwa olejnego"
ChatGPT rozbudowuje Twój prompt do około 200 słów (widzisz to w podglądzie)
DALL-E generuje obraz

Możesz poprosić ChatGPT: "Pokaż mi dokładny prompt, który wysłałeś do DALL-E" - zobaczysz, jak AI interpretuje Twoje polecenie. Jeśli coś Ci nie pasuje, koregujesz: "Zmień oświetlenie na bardziej dramatyczne" albo "Usuń tło, zostaw tylko postać".

Stable Diffusion - pełna kontrola techniczna

Stable Diffusion (szczególnie przez interfejsy jak Automatic1111 czy ComfyUI) daje najwięcej parametrów:

Sampling steps: 20-50 (im więcej, tym dłużej, ale dokładniej)
CFG Scale: 7-12 (jak mocno AI trzyma się promptu; 7 = balans, 15 = sztywne)
Sampler: Euler a, DPM++ 2M Karras (różne algorytmy generowania)
Seed: numer (powtarzalność)
Negative prompt: osobne pole tekstowe

Stable Diffusion to narzędzie dla osób, które chcą kontrolować każdy piksel. Jeśli dopiero zaczynasz, zacznij od Midjourney lub DALL-E - są prostsze.

Typowe błędy i jak ich unikać

Widziałem setki promptów, które nie działają. Oto najczęstsze pułapki:

Błąd 1: Zbyt ogólny opis

❌ "Beautiful landscape"
✅ "Mountain valley at sunrise, mist over a lake, pine trees in foreground, golden light, photorealistic"

AI nie wie, co "piękne" znaczy dla Ciebie. Musisz powiedzieć konkretnie: jakie kolory, jakie światło, jaki nastrój.

Błąd 2: Sprzeczne polecenia

❌ "Photorealistic anime character"
✅ "Anime character, Studio Ghibli style" LUB "Photorealistic portrait of a young woman"

Fotorealizm i anime to dwa przeciwne style. AI próbuje połączyć - wychodzi dziwnie. Wybierz jedno.

Błąd 3: Zbyt długi prompt bez struktury

❌ "A cat sitting on a windowsill looking outside at the rain with a sad expression and there's a plant next to it and the window is old and wooden and the light is soft and it's evening and..."

✅ "Tabby cat on wooden windowsill, looking at rain outside, melancholic expression, small potted plant beside, soft evening light, cozy atmosphere"

Długie prompty działają, ale muszą być uporządkowane. Użyj przecinków, podziel na warstwy (przedmiot, szczegóły, światło, styl).

Błąd 4: Brak negatywów przy trudnych tematach

Jeśli generujesz portrety ludzi, ZAWSZE dodaj negatywy: "deformed hands, extra fingers, missing limbs, blurry face". AI ma problem z dłońmi - negatywy pomagają.

Negatywne prompty eliminują typowe artefakty AI - szczególnie ważne przy portretach

Jak testować i iterować - metoda 3 wersji

Pierwszy prompt rzadko daje idealny rezultat. Profesjonaliści testują warianty. Oto sprawdzona metoda:

Wersja bazowa: Wpisujesz podstawowy prompt, generujesz 4 obrazy (większość generatorów daje 4 warianty)
Analiza: Patrzysz, co działa, a co nie. Za jasne? Za ciemne? Zły kąt? Nieodpowiedni styl?
Wersja 2: Poprawiasz JEDNĄ rzecz (np. dodajesz "soft lighting" zamiast "dramatic lighting")
Wersja 3: Jeśli wersja 2 jest lepsza - poprawiasz kolejną rzecz. Jeśli gorsza - wracasz do wersji 1 i zmieniasz coś innego

Przykład iteracji:

V1: "Portrait of a woman, studio lighting"
→ Za sztywne, za jasne

V2: "Portrait of a woman, soft window light, warm tones"
→ Lepiej, ale tło rozprasza

V3: "Portrait of a woman, soft window light, warm tones, blurred background, close-up"
→ Dokładnie to, czego chciałem

Zapisuj działające prompty. Twórz bibliotekę - za miesiąc nie będziesz pamiętać, jak uzyskałeś ten konkretny efekt.

Słownik stylistyczny - 50 fraz, które zmieniają wszystko

Oto konkretne frazy, które możesz wkleić do promptu, by kontrolować konkretne aspekty obrazu:

Oświetlenie

soft diffused light, golden hour, blue hour, harsh midday sun
rim lighting, backlighting, side lighting, Rembrandt lighting
volumetric lighting, god rays, cinematic lighting

Nastrój i atmosfera

melancholic, serene, energetic, ominous, whimsical
cozy atmosphere, tense mood, dreamlike quality
nostalgic feel, futuristic vibe, timeless elegance

Jakość i detal

highly detailed, intricate details, sharp focus
8K resolution, 4K, ultra HD, crisp
professional photography, award-winning, masterpiece

Kompozycja i kąt

rule of thirds, centered composition, symmetrical
bird's eye view, worm's eye view, Dutch angle
close-up, medium shot, wide shot, extreme close-up

Tekstury i materiały

weathered, polished, matte, glossy, metallic
rough texture, smooth surface, fabric folds
rust, patina, aged wood, pristine metal

Kopiuj te frazy i testuj. Jedna zmiana - "soft light" na "golden hour" - może całkowicie zmienić obraz.

Kiedy używać którego generatora

Nie ma "najlepszego" narzędzia. Każde ma swoje mocne strony:

Midjourney: Najlepszy do sztuki konceptowej, ilustracji, fantasy, sci-fi. Automatycznie "upiększa" obrazy - świetne dla osób bez doświadczenia artystycznego. Wymaga Discorda (co niektórych irytuje).

DALL-E 3: Najlepszy do precyzyjnego wykonania poleceń tekstowych. Jeśli napiszesz "czerwona kula PO LEWEJ, niebieska PO PRAWEJ" - zrobi to. Midjourney często ignoruje takie detale. Świetny do grafik z tekstem (napisy, logo). Dostępny przez ChatGPT Plus.

Stable Diffusion: Najlepszy do pełnej kontroli technicznej, customizacji (własne modele, LoRA), generowania bez cenzury, pracy offline. Wymaga więcej wiedzy technicznej. Darmowy (jeśli masz komputer z kartą NVIDIA) lub tani (przez RunPod, Replicate).

Jeśli dopiero zaczynasz - zacznij od DALL-E 3 przez ChatGPT. Najprostszy w obsłudze. Potem Midjourney (jeśli chcesz piękniejszych obrazów). Stable Diffusion zostaw na później, gdy poczujesz, że brakuje Ci kontroli.

Więcej szczegółów w porównaniu generatorów obrazów AI.

Chcesz opanować AI od podstaw?

Ten poradnik to dopiero początek. W naszym kursie "Praktyczna AI" nauczysz się korzystać z ChatGPT, Claude i innych narzędzi AI w sposób systematyczny - od zera do zaawansowanego poziomu.

Sprawdź kurs →

Najczęstsze pytania

Czy prompty muszą być po angielsku?

Nie muszą, ale angielski daje lepsze rezultaty. Midjourney i DALL-E były trenowane głównie na angielskich opisach obrazów. Możesz pisać po polsku w DALL-E 3 przez ChatGPT (model tłumaczy prompt wewnętrznie), ale w Midjourney i Stable Diffusion angielski jest obowiązkowy dla najlepszej jakości.

Ile czasu zajmuje nauczenie się promptowania?

Podstawy opanujesz w 2-3 godziny testów. Zaawansowane techniki (kontrola kompozycji, mieszanie stylów, inpainting) to 2-3 tygodnie regularnej praktyki. Kluczowa jest iteracja - generujesz, analizujesz, poprawiasz. Po miesiącu będziesz pisać prompty intuicyjnie.

Czy mogę użyć wygenerowanych obrazów komercyjnie?

Zależy od generatora. Midjourney: tak, jeśli masz płatny plan (nie darmowy trial). DALL-E 3: tak, masz pełne prawa. Stable Diffusion: tak, bez ograniczeń (to open source). Zawsze sprawdź aktualne Terms of Service - zasady się zmieniają.

Dlaczego AI źle rysuje dłonie?

Dłonie to najtrudniejszy element dla AI. Mają skomplikowaną strukturę (5 palców, stawy, różne pozycje) i w zbiorach treningowych często są częściowo zakryte lub rozmazane. Rozwiązanie: używaj negatywnych promptów ("deformed hands, extra fingers") i generuj kilka wersji - jedna będzie dobra. W Midjourney v6 problem jest mniejszy niż w starszych wersjach.

Jak uzyskać spójny styl w serii obrazów?

Trzy metody: (1) Używaj tego samego promptu + parametru --seed w Midjourney (ten sam seed = powtarzalny styl). (2) W Stable Diffusion trenuj własny model LoRA na swoich obrazach. (3) W DALL-E 3 proś ChatGPT: "Wygeneruj kolejny obraz w tym samym stylu co poprzedni" - model pamięta kontekst rozmowy.

Od chaosu do kontroli

Promptowanie to nie zgadywanka. To system: pięć warstw opisu (przedmiot, szczegóły, styl, parametry, negatywy), sprawdzone szablony i iteracyjne testowanie. Zacznij od prostych promptów, dodawaj warstwy, zapisuj to, co działa.

Najważniejsze: AI nie czyta Twoich myśli. Musisz powiedzieć konkretnie, czego chcesz. Nie "ładny obraz" - "portret kobiety, miękkie światło z okna, ciepłe tony, styl malarstwa olejnego, rozmyte tło". Im bardziej precyzyjny, tym lepszy rezultat.

Jeden krok na start: Otwórz generator, wybierz jeden szablon z tego poradnika, zamień przedmiot główny na swój pomysł i wygeneruj 4 wersje. Przeanalizuj, co działa. Popraw jedną rzecz. Wygeneruj ponownie. To wszystko, czego potrzebujesz, żeby zacząć.

Na podstawie: Materiały szkoleniowe SukcesAI, dokumentacja Midjourney, DALL-E i Stable Diffusion