Claude Opus 4.5 pokonał ludzi w kodowaniu. I jest 2x tańszy

Anthropic właśnie pokazał, jak wygląda prawdziwy game changer. Claude Opus 4.5 — najnowszy model AI firmy — nie tylko koduje lepiej niż większość programistów, ale kosztuje 66% mniej niż poprzednik. Dla OpenAI i Google to nie najlepszy poniedziałek.

Wydany w poniedziałek model to bezpośrednia odpowiedź na rosnącą presję rynkową. Anthropic, startup z ambicjami giganta, musiał udowodnić, że potrafi konkurować nie tylko jakością, ale i ceną.

I udowodnił.

Koduje lepiej niż większość z nas

Claude Opus 4.5 osiągnął wyniki, które jeszcze rok temu brzmiałyby jak science fiction. W testach SWE-bench Verified — benchmarku oceniającym zdolność AI do rozwiązywania rzeczywistych problemów programistycznych — model uzyskał wynik przewyższający ludzkich inżynierów.

Nie chodzi tu o proste skrypty. To zadania wymagające zrozumienia kontekstu, debugowania i pisania kodu produkcyjnego. Gemini 3.1 Pro? Został w tyle. GPT-5? Też.

SWE-bench Verified to jeden z najbardziej wymagających testów w branży. Zawiera setki rzeczywistych zgłoszeń błędów z popularnych repozytoriów open source na GitHubie — model musi nie tylko zidentyfikować problem, ale też napisać poprawkę, która przejdzie testy automatyczne. To zdecydowanie bliższe codziennej pracy inżyniera niż klasyczne zadania algorytmiczne.

Anthropic twierdzi, że Opus 4.5 radzi sobie szczególnie dobrze w zadaniach agentycznych — tych, gdzie AI musi samodzielnie planować działania, iterować rozwiązania i dostosowywać strategię. To kluczowa różnica: nie asystent, lecz współpracownik.

W praktyce oznacza to, że model potrafi przejąć złożony ticket z Jiry, przeanalizować istniejący kod, zaproponować kilka podejść do rozwiązania, wybrać najlepsze i dostarczyć gotowy pull request — bez prowadzenia za rękę. Dla zespołów z ograniczonymi zasobami inżynierskimi to potencjalnie ogromna zmiana w sposobie pracy.

Cena, która zmienia zasady gry

Prawdziwy cios dla konkurencji to wycena. Anthropic obciął koszty użycia modelu o około dwie trzecie w porównaniu do wcześniejszych wersji Opus.

Dla firm korzystających z AI na masową skalę to różnica między eksperymentem a wdrożeniem produkcyjnym.

Żeby lepiej zrozumieć skalę tej zmiany: wiele startupów i średnich przedsiębiorstw rezygnowało z modeli klasy Opus właśnie ze względu na koszt. Wdrożenie agenta AI, który przetwarza tysiące zapytań dziennie, przy poprzednich cenach generowało rachunki trudne do uzasadnienia przed zarządem. Teraz ten argument traci na sile.

I jeszcze jedno: nielimitowane konwersacje. Wcześniej długie sesje czatu mogły być problematyczne — modele traciły kontekst lub ograniczały liczbę wymian. Opus 4.5 ma to gdzieś. Możesz prowadzić nieskończenie długie rozmowy bez utraty wątku.

Dla programistów oznacza to jedno: możesz debugować, refaktoryzować i konsultować kod przez godziny, a model nie "zapomni", o czym rozmawialiście 200 wiadomości temu.

Presja, którą czuć w całej branży

Premiera Opus 4.5 wpisuje się w szerszy trend, który obserwujemy od początku 2025 roku — radykalne obniżanie cen modeli przy jednoczesnym podnoszeniu ich możliwości. Wcześniej podobny ruch wykonało OpenAI, obniżając koszty API dla wybranych modeli, a DeepSeek pokazał, że można trenować konkurencyjne systemy za ułamek dotychczasowych budżetów.

Anthropic odpowiedział własną kartą. I zagrał ją w momencie, gdy rynek coraz głośniej domaga się nie tylko imponujących benchmarków, ale realnej opłacalności wdrożeń.

Warto też zauważyć, że Opus 4.5 to model z wyższej półki w portfolio Anthropic. Firma oferuje równolegle tańsze warianty z rodziny Claude — Sonnet i Haiku — skierowane do zastosowań wymagających mniejszej złożoności. Strategia wielopoziomowa pozwala Anthropic obsługiwać zarówno klientów szukających maksymalnej wydajności, jak i tych, którzy optymalizują przede wszystkim pod kątem kosztu.

Kto skorzysta najbardziej

Zespoły inżynierskie — możliwość delegowania żmudnych zadań: przeglądu kodu, pisania testów jednostkowych, dokumentowania funkcji
Startupy budujące produkty AI — niższy koszt API bezpośrednio przekłada się na marżę i możliwość skalowania bez rundy finansowania
Firmy z długiem technicznym — model, który rozumie kontekst przez całą sesję, może pomóc w systematycznym refaktoryzowaniu starszych baz kodu
Freelancerzy i niezależni programiści — dostęp do narzędzia klasy enterprise bez enterprise'owego budżetu

Jeśli kodujesz — masz nowego partnera, który nie narzeka na nadgodziny i nie potrzebuje kawy. Jeśli zarządzasz zespołem — możesz przyspieszyć prototypowanie i redukcję długu technicznego. Jeśli obserwujesz rynek AI — widzisz, jak Anthropic odgryza kawałek tortu OpenAI.

Czy Opus 4.5 to definitywny lider? Pewnie przez kilka tygodni. Potem Google odpowie nowym Gemini, OpenAI wypuści GPT-5, a my znów będziemy porównywać benchmarki.

Jedno jest pewne: poprzeczka właśnie poszła w górę.

I spadła w dół — jeśli chodzi o cenę.

Przeczytaj też:

Claude Opus 4.5 pokonał ludzi w kodowaniu. I jest 2x tańszy

AI dla Twojej firmy

Powiązane tematy

Koduje lepiej niż większość z nas

Cena, która zmienia zasady gry

Presja, którą czuć w całej branży

Kto skorzysta najbardziej

Źródła

Ten temat omawiam szerzej na webinarze

Jan Gajos

Claude Opus 4.5 pokonał ludzi w kodowaniu. I jest 2x tańszy

AI dla Twojej firmy

Powiązane tematy

Koduje lepiej niż większość z nas

Cena, która zmienia zasady gry

Presja, którą czuć w całej branży

Kto skorzysta najbardziej

Źródła

Ten temat omawiam szerzej na webinarze

Jan Gajos

Może Cię zainteresować

OpenAI odpala GPT-5.5. Cel: odebrać tron Claude i Gemini

DeepSeek V4: chiński model AI, który nie prosi o pozwolenie

OpenAI płaci $25 000 za złamanie zabezpieczeń GPT-5.5