Gemini generuje zdjęcia produktów. Testuję, czy zastąpi studio
Źródło: Link
Źródło: Link
118 lekcji od zera do eksperta. Bez kodowania.
Koleżanka z marketingu pokazała mi wczoraj zdjęcie świecy, którą sprzedaje przez Instagram. Telefon, okno, białe tło z kartki. Pytanie brzmiało: "Dlaczego nikt nie klika?" Odpowiedź była prosta – bo zdjęcie wygląda dokładnie tak, jak zostało zrobione: telefonem przy oknie na białej kartce.
Nie każdy ma budżet na fotografa produktowego, studio z softboxami i edycję w Photoshopie. Gemini od Google obiecuje rozwiązanie: generowanie realistycznych zdjęć produktów na podstawie opisu tekstowego. Bez sprzętu, bez studia, bez fotografa. Przetestowałem, jak to działa i czy faktycznie może zastąpić tradycyjną sesję zdjęciową.

Gemini nie czyta w myślach. Jeśli wpiszesz "zrób mi ładne zdjęcie świecy", dostaniesz coś generycznego – może ładnego, ale niekoniecznie pasującego do Twojego produktu. Kluczowa jest struktura promptu. Zawiera pięć elementów:
Materiał i wykończenie. Nie "świeca", tylko "świeca sojowa w szklanym słoiku z matowym wykończeniem, etykieta minimalistyczna w kolorze beżowym". Im więcej szczegółów fizycznych, tym lepiej model rozumie, co ma wygenerować.
Oświetlenie. To różnica między zdjęciem produktowym a snapchatem. Określ typ światła: "miękkie naturalne światło z lewej strony, subtelne cienie, brak ostrych refleksów". Gemini radzi sobie z tym zaskakująco dobrze – o ile mu powiesz, czego oczekujesz.
Kąt i kadrowanie. "Widok z góry pod kątem 45 stopni" to coś innego niż "zbliżenie na etykietę" czy "pełny widok z boku". Każdy kąt sprzedaje inaczej. Testuj kilka wariantów, zanim zdecydujesz, który działa najlepiej.
Tło i kontekst. Białe tło działa dla Amazona, ale Instagram lubi kontekst. "Świeca na drewnianym blacie obok otwartej książki i filiżanki kawy, w tle rozmyte okno z zielenią" – to buduje narrację, nie tylko pokazuje produkt. Generowanie obrazów AI działa najlepiej, gdy dajesz modelowi pełny obraz sceny.
Styl wizualny. "Fotografia produktowa w stylu lifestyle, ciepłe tony, estetyka skandynawska" – to kierunek dla modelu. Możesz też dodać "realistyczna fotografia, bez efektów artystycznych" jeśli zależy Ci na czystym, komercyjnym ujęciu.

Testowałem generowanie dla trzech kategorii produktów: świeca (jak wyżej), butelka oliwy i torba skórzana. Wyniki były nierówne, ale pokazały wyraźny wzorzec.
Gemini radzi sobie świetnie z produktami o prostej geometrii i jednolitych materiałach. Świeca w słoiku, butelka, kubek, pudełko – to działa. Model rozumie, jak światło odbija się od szkła, jak wygląda wosk, jak renderować cienie. Dla takich produktów wygenerowane zdjęcia są wystarczająco realistyczne, by użyć ich w sklepie online czy social mediach.
Problemy zaczynają się przy skomplikowanych teksturach i detalach. Torba skórzana z przeszyciami, zamkami i metalowymi elementami – tutaj Gemini generował artefakty. Przeszycia były nierówne, zamki miały dziwną geometrię, skóra wyglądała miejscami jak plastik. Możesz to poprawić iteracją (kolejne próby z doprecyzowanym promptem), ale to już nie jest "szybkie rozwiązanie".
Największa przewaga: możliwość testowania kontekstów. Chcesz zobaczyć, jak Twój produkt wygląda na drewnianym blacie? Marmurze? W minimalistycznym wnętrzu? Na plaży? Gemini wygeneruje wszystkie warianty w kilka minut. Fotograf musiałby zmienić lokalizację albo budować scenografię. Tutaj klikasz "Generate" i masz kolejną wersję.
Gdzie fotograf wygrywa? Konsystencja. Jeśli masz 20 produktów i potrzebujesz, żeby wszystkie miały identyczne oświetlenie, kąt i tło – Gemini będzie generował subtelne różnice między ujęciami. Fotograf z szablonem studia da Ci perfekcyjną spójność. Również Adobe Firefly z Custom Models może pomóc w utrzymaniu spójnego stylu wizualnego (choć to inne narzędzie z innym zastosowaniem).
Gemini obniża próg wejścia dla osób, które wcześniej w ogóle nie miały dostępu do profesjonalnych wizualizacji.
Małe biznesy i start-upy. Jeśli sprzedajesz 5-10 produktów przez Instagram lub Shopify i nie masz budżetu na sesję za 1500-3000 zł – Gemini daje Ci narzędzie do stworzenia zdjęć, które wyglądają lepiej niż telefon przy oknie. To nie będzie poziom kampanii reklamowej, ale będzie wystarczające do sprzedaży online.
Testowanie przed inwestycją. Planujesz sesję produktową, ale nie wiesz, jaki styl wizualny wybrać? Wygeneruj 10 wariantów w Gemini (minimalistyczne tło, lifestyle, industrial, vintage) i zobacz, co działa najlepiej w Twoim feedzie. Potem idź do fotografa z konkretnym briefem, nie z "zróbcie coś ładnego".
Szybkie mockupy dla klientów. Pracujesz w agencji i klient pyta, jak będzie wyglądał produkt w kampanii? Zamiast opisywać słowami, generujesz wizualizację w 2 minuty. To nie finalna wersja, ale konkretny punkt odniesienia do rozmowy.
Kiedy NIE używać Gemini: produkty premium wymagające perfekcji detali (biżuteria, zegarki, elektronika z wieloma elementami), kampanie reklamowe dla dużych marek (gdzie każdy piksel jest audytowany), sytuacje wymagające konsystencji wizualnej na dużą skalę (katalogi z setkami produktów). Tutaj fotograf i postprodukcja są niezbędne.

Gemini nie jest magią. Ma konkretne ograniczenia, o których warto wiedzieć przed pierwszym promptem.
Brak kontroli nad szczegółami. Nie możesz powiedzieć "przesuń cień 2 cm w lewo" ani "zmień odcień etykiety na Pantone 448C". Dostajesz to, co model wygeneruje. Możesz iterować promptem, ale precyzyjna kontrola jak w Photoshopie – nie ma.
Artefakty przy złożonych obiektach. Tekst na etykietach często wychodzi nieczytelny lub zniekształcony. Gemini (jak większość modeli generatywnych) ma problem z renderowaniem liter. Jeśli etykieta z nazwą produktu jest kluczowa – będziesz musiał dodać ją w edycji postprodukcyjnej.
Losowość wyników. Ten sam prompt może dać różne rezultaty przy kolejnych generacjach. Czasem trzeba kliknąć "Generate" 5-10 razy, żeby dostać wersję, która działa. To nie jest bug – to cecha modeli generatywnych. Stable Diffusion działa podobnie (choć daje więcej kontroli przez parametry techniczne).
Prawa autorskie i licencje. Google twierdzi, że obrazy wygenerowane w Gemini możesz używać komercyjnie, ale warto sprawdzić aktualne warunki usługi. Jeśli planujesz kampanię dla dużej marki, skonsultuj to z prawnikiem. Dla małych biznesów ryzyko jest minimalne, ale świadomość tematu nie zaszkodzi.
Nie musisz spędzać tygodnia na testach, żeby dostać pierwsze użyteczne zdjęcie. Oto konkretny plan na pierwsze 30 minut:
Krok 1: Zrób listę cech produktu. Materiał, kolor, wykończenie, rozmiar, kształt. Nie w głowie – na kartce lub w notatniku. To będzie szkielet Twojego promptu.
Krok 2: Wybierz kontekst. Białe tło (bezpieczne, uniwersalne) czy lifestyle (bardziej angażujące, ale trudniejsze do trafienia)? Zacznij od białego tła – łatwiej ocenić, czy produkt wygląda realistycznie.
Krok 3: Napisz pierwszy prompt według struktury z sekcji wyżej. Materiał + oświetlenie + kąt + tło + styl. Przykład: "Świeca sojowa w matowym szklanym słoiku z beżową etykietą, miękkie naturalne światło z lewej, widok z góry pod kątem 45 stopni, białe tło, realistyczna fotografia produktowa".
Krok 4: Wygeneruj 3-5 wersji. Kliknij "Generate" kilka razy. Modele generatywne dają różne wyniki – czasem trzecia próba jest lepsza niż pierwsza.
Krok 5: Iteruj. Jeśli cienie są za ostre – dodaj "bardzo miękkie oświetlenie, brak ostrych cieni". Jeśli produkt wygląda za mały – dodaj "zbliżenie, produkt wypełnia 70% kadru". Każda iteracja to nauka, jak model rozumie Twoje instrukcje.
Nie oczekuj perfekcji za pierwszym razem. Gemini to narzędzie, które wymaga nauki – ale krzywą uczenia się mierzysz w godzinach, nie tygodniach. Po 3-4 sesjach będziesz wiedział, jakie frazy działają dla Twoich produktów.
Gemini nie zastąpi fotografa produktowego w kampanii dla Rolex. Nie da Ci perfekcyjnej kontroli nad każdym pikselem. Nie zagwarantuje konsystencji wizualnej w katalogu z 200 produktami.
Daje Ci coś innego: możliwość stworzenia zdjęć produktowych, które wyglądają profesjonalnie, bez studia, sprzętu i budżetu na fotografa. Dla małych biznesów, start-upów i osób testujących nowe produkty – to różnica między amatorskim zdjęciem z telefonu a wizualizacją, która faktycznie sprzedaje.
Jeśli Twoje obecne zdjęcia produktów wyglądają jak zrobione przy oknie na białej kartce – Gemini da Ci skok jakościowy za zero złotych (w darmowej wersji). Jeśli już masz profesjonalne sesje – możesz użyć go do szybkich mockupów i testowania konceptów przed inwestycją w pełną produkcję.
Narzędzie jest dostępne. Pytanie: czy jesteś gotów przetestować, zanim Twoja konkurencja zacznie generować lepsze zdjęcia niż Ty robisz telefonem?
Na podstawie: Canaltech
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar