Google Omni: deepfake'owanie pluszaków i wakacji. Co może pójść nie tak?
Źródło: Link
Źródło: Link
90 minut praktyki na żywo. Pokazuję krok po kroku, jak zacząć z AI bez kodowania.
Rok temu dzienniarka The Verge deepfake'owała pluszowego jelenia swojego dziecka. Miało wyglądać, jakby maskotka była na wakacjach. Eksperyment sprawdzał, czy da się odtworzyć scenę z reklamy Google Gemini. Filmików nie pokazała czterolatkowi. Granica między niewinną zabawą a cyfrowym śmieciem okazała się cieńsza niż myślała.
Teraz Google wypuścił Omni - nową rodzinę modeli generatywnych, które zamieniają wszystko we wszystko. Zdjęcie w wideo, tekst w obraz, dźwięk w animację. Na razie działa tylko konwersja obrazów i tekstu na wideo. Ale obietnica jest jasna: przyszłość to totalna elastyczność formatów.
Allison Johnson z The Verge postanowiła sprawdzić, jak nowy model wypada w porównaniu z zeszłorocznym Gemini. Wzięła te same zdjęcia pluszowego jelenia Buddy'ego i poprosiła Omni o stworzenie filmików z wakacji.
Rezultat? Buddy spływa kajakiem po rzece. Buddy stoi przed Wieżą Eiffla. Buddy ma czas swojego życia - przynajmniej w wersji AI. Jakość? Zaskakująco dobra. Wystarczająco realistyczna, żeby czterdziestoparoletnia osoba musiała się zastanowić, czy to prawdziwe zdjęcie, czy wygenerowane.
Johnson sama przyznaje: narzędzia do tworzenia realistycznych filmów są zaskakująco dobre i wymagają zaskakująco niewielkiego wysiłku. Nie trzeba być programistą. Nie trzeba znać się na montażu wideo. Wystarczy aplikacja i pomysł.
Omni to nie tylko pluszaki na wakacjach. Model zamienia dowolny input - zdjęcie, wideo, tekst - w dowolny output. Na razie Google uruchomił tylko część funkcji: konwersję obrazów i promptów tekstowych na krótkie filmy.
Obietnica jest szersza. W przyszłości Omni ma obsługiwać dźwięk, animacje, może nawet modele 3D. To część szerszego trendu w AI - modele multimodalne, które nie są ograniczone do jednego typu danych. ByteDance pokazał podobne podejście z Seedance 2.0, który również łączy różne modalności w jednym systemie.
Nie. Johnson jest w tym wyraźna - Omni to nie punkt zwrotny w historii AI. To kolejny krok w ewolucji narzędzi, które już istnieją. Runway od dawna pozwala zamieniać bazgroły w filmy, a Luma AI wypełnia luki między klatkami wideo.
Różnica? Google ma skalę. Ma dystrybucję. Ma miliardy użytkowników, którzy mogą dostać dostęp do Omni przez zwykłą przeglądarkę - bez instalowania dodatkowych aplikacji czy płacenia za API.
To nie jest rewolucja technologiczna. To rewolucja dostępności. Narzędzia, które jeszcze rok temu wymagały wiedzy technicznej i budżetu, teraz są w zasięgu ręki każdego z kontem Google.
Johnson nie pokazała filmików z Buddym swojemu synowi. I to chyba najważniejszy fragment całej historii. Pytanie nie brzmi "czy można stworzyć realistycznego deepfake'a" - odpowiedź to zdecydowane "tak". Pytanie brzmi: "co z tym zrobisz?".
Omni nie jest pierwszym narzędziem, które pozwala tworzyć deepfake'i. Alibaba wypuściła AI klonujące twarz i głos, a Google Gemini próbuje rozpoznawać fałszywe wideo - z mieszanymi rezultatami.
Różnica między niewinną zabawą a cyfrowym śmieciem? Intencja. I świadomość, że to, co tworzysz, może być użyte w sposób, którego nie przewidziałeś. Johnson nie pokazała filmików dziecku, bo wiedziała, że granica między "fajnym trickiem" a "kłamstwem" jest cienka. Szczególnie dla czteroletniego mózgu.
Google nie podał jeszcze szczegółów dotyczących globalnej dostępności Omni. Model został zaprezentowany na konferencji Google I/O 2026, ale informacje o rollout'ie dla poszczególnych krajów nie są jeszcze jasne.
Jeśli Omni będzie działał podobnie jak inne usługi Google AI, prawdopodobnie pojawi się najpierw w USA, a potem stopniowo w innych regionach. Sprawdzaj co jakiś czas, czy funkcja pojawiła się w Twoim koncie.
Omni to część szerszego trendu. OpenAI ma swoje multimodalne GPT-5, Anthropic rozwija Claude z obsługą obrazów i tekstu, a Google Gemini 2026 wprowadza Nano Banana i Veo 3 - modele, które mają działać lokalnie na urządzeniach mobilnych.
Przyszłość to nie osobne narzędzia do tekstu, obrazu i wideo. To jeden model, który rozumie wszystko i generuje wszystko. Pytanie tylko, czy jako użytkownicy jesteśmy gotowi na świat, w którym każdy może stworzyć realistyczne wideo w kilka minut.
Johnson kończy swój artykuł bez jednoznacznej odpowiedzi. I to chyba najuczciwsze podejście. Omni nie jest ani cudem, ani apokalipsą. To narzędzie. A narzędzia są neutralne - liczy się, kto je trzyma i co z nimi robi.
Google Omni to nowa rodzina modeli AI, które zamieniają dowolny typ danych (tekst, obraz, wideo) w inny. Na razie dostępna jest konwersja obrazów i tekstu na krótkie filmy, ale Google planuje rozszerzyć funkcjonalność o dźwięk i inne modalności.
Tak. Omni potrafi generować realistyczne filmy na podstawie zdjęć i promptów tekstowych. Dzienniarka The Verge użyła go do stworzenia filmików z pluszowym jeleniem na wakacjach - rezultaty były zaskakująco przekonujące.
Google nie podał jeszcze szczegółów dotyczących globalnej dostępności. Model został zaprezentowany na Google I/O 2026, ale informacje o rollout'ie dla poszczególnych krajów nie są jasne. Prawdopodobnie pojawi się najpierw w USA.
Nie. Omni to kolejny krok w rozwoju multimodalnych modeli AI, ale nie punkt zwrotny. Podobne narzędzia już istnieją - różnica polega na skali dystrybucji i dostępności dla zwykłych użytkowników Google.
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar