OpenAI Codex kontroluje Twój komputer. Claude Code ma konkurencję
Źródło: Link
Źródło: Link
Szkolenia, warsztaty i wdrożenia AI. Dopasowane do Twojego zespołu.
OpenAI właśnie pokazało, że nie zamierza oddać pola w wyścigu agentów AI do kodowania. Codex – system, który od miesięcy konkuruje z Claude Code – dostał pakiet aktualizacji, które zmieniają go z asystenta w pełnoprawnego agenta. Może kontrolować aplikacje na Twoim komputerze, generować obrazy i uczyć się z poprzednich sesji. Przykład? Uruchamia grę w kółko i krzyżyk i gra sam ze sobą.
To nie drobny update. To sygnał, że OpenAI traktuje segment narzędzi programistycznych poważnie i nie zamierza zostawić Anthropic samego na podium.

Najważniejsza zmiana? Codex może teraz wchodzić w interakcję z aplikacjami zainstalowanymi na Twoim komputerze. W praktyce oznacza to, że system nie tylko pisze kod – uruchamia go, testuje i reaguje na wyniki. OpenAI pokazało to na przykładzie gry w kółko i krzyżyk: Codex uruchomił aplikację, rozegrał partię i dostosował strategię w czasie rzeczywistym.
To zmiana jakościowa. Dotychczas agenci AI do kodowania działali w izolacji – pisali kod, ale nie widzieli, co się dzieje po jego uruchomieniu. Teraz Codex może zamknąć pętlę: napisać funkcję, przetestować ją w działającej aplikacji, zobaczyć błąd i naprawić go. Bez Twojej interwencji.
Dla programistów oznacza to mniej przełączania się między edytorem, terminalem i przeglądarką. Dla osób nietechnicznych – możliwość zlecenia zadania, które wymaga interakcji z interfejsem graficznym, nie tylko z kodem.
Codex używa API do kontrolowania aplikacji na macOS (na razie tylko Mac, Windows i Linux w planach). System dostaje dostęp do interfejsu aplikacji – może klikać przyciski, wpisywać tekst, czytać wyniki. Podobny mechanizm do tego, który Adobe testuje w Creative Cloud – tylko że OpenAI skupia się na narzędziach deweloperskich, nie kreatywnych.
Ograniczenia? Tak, są. Codex nie ma pełnego dostępu do systemu operacyjnego (ze względów bezpieczeństwa). Działa w sandboxie – kontrolowanym środowisku, które izoluje go od krytycznych funkcji systemowych. Możesz mu pozwolić na uruchomienie gry, ale nie na zmianę ustawień firewall.

Oprócz kontroli aplikacji, Codex dostał dwie dodatkowe funkcje: generowanie obrazów i pamięć z poprzednich sesji.
Generowanie obrazów to integracja z DALL-E 3. Jeśli piszesz aplikację, która potrzebuje grafik – Codex może je wygenerować w locie. Tworzysz prototyp aplikacji mobilnej i potrzebujesz ikon? Zamiast szukać ich w stockach, mówisz Codexowi "wygeneruj ikonę ustawień w stylu minimalistycznym" – i dostajesz PNG gotowy do wklejenia.
Pamięć kontekstu to funkcja, która pozwala Codexowi zapamiętywać informacje z poprzednich rozmów. Jeśli wczoraj pracowałeś nad funkcją logowania, a dziś wracasz do projektu – Codex pamięta, na jakim etapie skończyłeś. Nie musisz powtarzać kontekstu. Szczególnie przydatne w długich projektach, gdzie sesje kodowania rozciągają się na dni lub tygodnie.
Claude Code od Anthropic ma podobne funkcje – z jedną kluczową różnicą. Claude działa głównie w przeglądarce i edytorach tekstu (VS Code, Cursor). Nie ma natywnej integracji z aplikacjami desktopowymi. OpenAI stawia na głębszą kontrolę nad środowiskiem – Codex może wyjść poza edytor i terminal.
Z drugiej strony, Claude Code ma przewagę w analizie kodu: jego okno kontekstu (200K tokenów w wersji Opus 4.6) jest większe niż u Codex (128K tokenów w GPT-5.3-Codex). Jeśli pracujesz z dużą bazą kodu, Claude radzi sobie lepiej z utrzymaniem spójności w długich sesjach.
Który wybrać? Zależy od Twojego workflow. Potrzebujesz agenta, który będzie testował aplikacje w czasie rzeczywistym? Codex. Analizujesz legacy code i potrzebujesz dużego kontekstu? Claude. (Jeśli chcesz wiedzieć więcej o tym, jak działają API OpenAI i Codex, mamy osobny artykuł na ten temat.)

Codex jest dostępny w Polsce przez API OpenAI – wymaga subskrypcji ChatGPT Plus lub dostępu do API (płatność za tokeny). Interfejs jest po angielsku, ale system rozumie polskie prompty (choć z mniejszą precyzją niż angielskie).
Jeśli pracujesz w polskiej firmie IT, która używa agentów AI w procesach deweloperskich, Codex może zastąpić część manualnych testów. Nie wszystkie – te powtarzalne, które dotychczas zjadały czas juniora. Testowanie formularzy, sprawdzanie responsywności, generowanie danych testowych.
Ograniczenia? Tak. Codex nie zna specyfiki polskiego rynku – nie wie, jak działa system PESEL, nie zna polskich standardów księgowych, nie rozumie niuansów RODO w polskiej implementacji. Jeśli Twoja aplikacja operuje na polskich danych wrażliwych – musisz to uwzględnić w promptach i weryfikować wyniki ręcznie.
OpenAI podkreśla, że Codex działa w sandboxie – izolowanym środowisku, które nie ma dostępu do krytycznych funkcji systemowych. Nie może modyfikować plików systemowych, nie ma dostępu do haseł, nie może instalować oprogramowania bez Twojej zgody.
Ale – i to duże "ale" – musisz mu dać dostęp do aplikacji, z którymi ma pracować. Chcesz, żeby testował Twoją aplikację webową? Musisz mu dać dostęp do przeglądarki. Ma pracować z bazą danych? Musisz podać credentials. To nie jest problem techniczny. To problem zaufania.
Dla firm oznacza to konieczność polityki dostępu: kto może używać Codex, do jakich aplikacji, z jakimi uprawnieniami. OpenAI oferuje enterprise tier z dodatkowymi kontrolami – to koszt i dodatkowa warstwa administracji.
Codex to kolejny krok w kierunku, który zarysował się w 2025 roku: agenci AI przestają być asystentami, a stają się współpracownikami. Nie czekają na Twoje polecenia – wykonują zadania autonomicznie, w tle. Zgłaszają się tylko wtedy, gdy napotkają problem.
Za 6-12 miesięcy możemy spodziewać się integracji Codex z narzędziami CI/CD (Jenkins, GitHub Actions). Agent, który nie tylko pisze kod, ale też deployuje go na staging, uruchamia testy, analizuje logi i proponuje poprawki. To nie science fiction – to logiczny następny krok.
Pytanie nie brzmi "czy agenci AI zastąpią programistów". Pytanie brzmi: które zadania programistyczne przestaną wymagać człowieka? Odpowiedź – na razie – to: te nudne, powtarzalne, które i tak nikt nie lubi robić. Reszta? Nadal Twoja.
Na podstawie: The Verge AI
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar