Google Omni: deepfake pluszaków i wakacji

Rok temu dzienniarka The Verge deepfake'owała pluszowego jelenia swojego dziecka. Miało wyglądać, jakby maskotka była na wakacjach. Eksperyment sprawdzał, czy da się odtworzyć scenę z reklamy Google Gemini. Filmików nie pokazała czterolatkowi. Granica między niewinną zabawą a cyfrowym śmieciem okazała się cieńsza niż myślała.

Teraz Google wypuścił Omni - nową rodzinę modeli generatywnych, które zamieniają wszystko we wszystko. Zdjęcie w wideo, tekst w obraz, dźwięk w animację. Na razie działa tylko konwersja obrazów i tekstu na wideo. Ale obietnica jest jasna: przyszłość to totalna elastyczność formatów.

Pluszowy jeleń Buddy w wersji deepfake - od Google Gemini do Omni

Jak Omni radzi sobie z deepfake'owaniem pluszaków?

Allison Johnson z The Verge postanowiła sprawdzić, jak nowy model wypada w porównaniu z zeszłorocznym Gemini. Wzięła te same zdjęcia pluszowego jelenia Buddy'ego i poprosiła Omni o stworzenie filmików z wakacji.

Rezultat? Buddy spływa kajakiem po rzece. Buddy stoi przed Wieżą Eiffla. Buddy ma czas swojego życia - przynajmniej w wersji AI. Jakość? Zaskakująco dobra. Wystarczająco realistyczna, żeby czterdziestoparoletnia osoba musiała się zastanowić, czy to prawdziwe zdjęcie, czy wygenerowane.

Johnson sama przyznaje: narzędzia do tworzenia realistycznych filmów są zaskakująco dobre i wymagają zaskakująco niewielkiego wysiłku. Nie trzeba być programistą. Nie trzeba znać się na montażu wideo. Wystarczy aplikacja i pomysł.

Co jeszcze potrafi Omni?

Omni to nie tylko pluszaki na wakacjach. Model zamienia dowolny input - zdjęcie, wideo, tekst - w dowolny output. Na razie Google uruchomił tylko część funkcji: konwersję obrazów i promptów tekstowych na krótkie filmy.

Obietnica jest szersza. W przyszłości Omni ma obsługiwać dźwięk, animacje, może nawet modele 3D. To część szerszego trendu w AI - modele multimodalne, które nie są ograniczone do jednego typu danych. ByteDance pokazał podobne podejście z Seedance 2.0, który również łączy różne modalności w jednym systemie.

Prawdziwe zdjęcie vs deepfake wygenerowany przez Omni - różnica coraz mniej widoczna

Czy to już singularność?

Nie. Johnson jest w tym wyraźna - Omni to nie punkt zwrotny w historii AI. To kolejny krok w ewolucji narzędzi, które już istnieją. Runway od dawna pozwala zamieniać bazgroły w filmy, a Luma AI wypełnia luki między klatkami wideo.

Różnica? Google ma skalę. Ma dystrybucję. Ma miliardy użytkowników, którzy mogą dostać dostęp do Omni przez zwykłą przeglądarkę - bez instalowania dodatkowych aplikacji czy płacenia za API.

To nie jest rewolucja technologiczna. To rewolucja dostępności. Narzędzia, które jeszcze rok temu wymagały wiedzy technicznej i budżetu, teraz są w zasięgu ręki każdego z kontem Google.

Co to oznacza dla deepfake'ów?

Johnson nie pokazała filmików z Buddym swojemu synowi. I to chyba najważniejszy fragment całej historii. Pytanie nie brzmi "czy można stworzyć realistycznego deepfake'a" - odpowiedź to zdecydowane "tak". Pytanie brzmi: "co z tym zrobisz?".

Omni nie jest pierwszym narzędziem, które pozwala tworzyć deepfake'i. Alibaba wypuściła AI klonujące twarz i głos, a Google Gemini próbuje rozpoznawać fałszywe wideo - z mieszanymi rezultatami.

Różnica między niewinną zabawą a cyfrowym śmieciem? Intencja. I świadomość, że to, co tworzysz, może być użyte w sposób, którego nie przewidziałeś. Johnson nie pokazała filmików dziecku, bo wiedziała, że granica między "fajnym trickiem" a "kłamstwem" jest cienka. Szczególnie dla czteroletniego mózgu.

Cienka granica między zabawą a dezinformacją - pytanie o etykę AI

Czy Omni jest dostępny w Polsce?

Google nie podał jeszcze szczegółów dotyczących globalnej dostępności Omni. Model został zaprezentowany na konferencji Google I/O 2026, ale informacje o rollout'ie dla poszczególnych krajów nie są jeszcze jasne.

Jeśli Omni będzie działał podobnie jak inne usługi Google AI, prawdopodobnie pojawi się najpierw w USA, a potem stopniowo w innych regionach. Sprawdzaj co jakiś czas, czy funkcja pojawiła się w Twoim koncie.

Co dalej z modelami anything-to-anything?

Omni to część szerszego trendu. OpenAI ma swoje multimodalne GPT-5, Anthropic rozwija Claude z obsługą obrazów i tekstu, a Google Gemini 2026 wprowadza Nano Banana i Veo 3 - modele, które mają działać lokalnie na urządzeniach mobilnych.

Przyszłość to nie osobne narzędzia do tekstu, obrazu i wideo. To jeden model, który rozumie wszystko i generuje wszystko. Pytanie tylko, czy jako użytkownicy jesteśmy gotowi na świat, w którym każdy może stworzyć realistyczne wideo w kilka minut.

Johnson kończy swój artykuł bez jednoznacznej odpowiedzi. I to chyba najuczciwsze podejście. Omni nie jest ani cudem, ani apokalipsą. To narzędzie. A narzędzia są neutralne - liczy się, kto je trzyma i co z nimi robi.

Najczęstsze pytania

Czym jest Google Omni?

Google Omni to nowa rodzina modeli AI, które zamieniają dowolny typ danych (tekst, obraz, wideo) w inny. Na razie dostępna jest konwersja obrazów i tekstu na krótkie filmy, ale Google planuje rozszerzyć funkcjonalność o dźwięk i inne modalności.

Czy Omni może tworzyć deepfake'i?

Tak. Omni potrafi generować realistyczne filmy na podstawie zdjęć i promptów tekstowych. Dzienniarka The Verge użyła go do stworzenia filmików z pluszowym jeleniem na wakacjach - rezultaty były zaskakująco przekonujące.

Czy Omni jest dostępny w Polsce?

Google nie podał jeszcze szczegółów dotyczących globalnej dostępności. Model został zaprezentowany na Google I/O 2026, ale informacje o rollout'ie dla poszczególnych krajów nie są jasne. Prawdopodobnie pojawi się najpierw w USA.

Czy to już singularność AI?

Nie. Omni to kolejny krok w rozwoju multimodalnych modeli AI, ale nie punkt zwrotny. Podobne narzędzia już istnieją - różnica polega na skali dystrybucji i dostępności dla zwykłych użytkowników Google.

Na podstawie: The Verge - Google's new anything-to-anything AI model is wild

Google Omni: deepfake'owanie pluszaków i wakacji. Co może pójść nie tak?

Powiązane tematy

Jak Omni radzi sobie z deepfake'owaniem pluszaków?

Co jeszcze potrafi Omni?

Czy to już singularność?

Co to oznacza dla deepfake'ów?

Czy Omni jest dostępny w Polsce?

Co dalej z modelami anything-to-anything?