Claude Opus 4.5 pokonał ludzi w kodowaniu. I jest 2x tańszy
Źródło: Link
Źródło: Link
Audyty, wdrożenia, szkolenia sprzedażowe i AI. Dopasowane do zespołu i procesów.
Anthropic właśnie pokazał, jak wygląda prawdziwy game changer. Claude Opus 4.5 — najnowszy model AI firmy — nie tylko koduje lepiej niż większość programistów, ale kosztuje 66% mniej niż poprzednik. Dla OpenAI i Google to nie najlepszy poniedziałek.
Wydany w poniedziałek model to bezpośrednia odpowiedź na rosnącą presję rynkową. Anthropic, startup z ambicjami giganta, musiał udowodnić, że potrafi konkurować nie tylko jakością, ale i ceną.
I udowodnił.
Claude Opus 4.5 osiągnął wyniki, które jeszcze rok temu brzmiałyby jak science fiction. W testach SWE-bench Verified — benchmarku oceniającym zdolność AI do rozwiązywania rzeczywistych problemów programistycznych — model uzyskał wynik przewyższający ludzkich inżynierów.
Nie chodzi tu o proste skrypty. To zadania wymagające zrozumienia kontekstu, debugowania i pisania kodu produkcyjnego. Gemini 3.1 Pro? Został w tyle. GPT-5? Też.
SWE-bench Verified to jeden z najbardziej wymagających testów w branży. Zawiera setki rzeczywistych zgłoszeń błędów z popularnych repozytoriów open source na GitHubie — model musi nie tylko zidentyfikować problem, ale też napisać poprawkę, która przejdzie testy automatyczne. To zdecydowanie bliższe codziennej pracy inżyniera niż klasyczne zadania algorytmiczne.
Anthropic twierdzi, że Opus 4.5 radzi sobie szczególnie dobrze w zadaniach agentycznych — tych, gdzie AI musi samodzielnie planować działania, iterować rozwiązania i dostosowywać strategię. To kluczowa różnica: nie asystent, lecz współpracownik.
W praktyce oznacza to, że model potrafi przejąć złożony ticket z Jiry, przeanalizować istniejący kod, zaproponować kilka podejść do rozwiązania, wybrać najlepsze i dostarczyć gotowy pull request — bez prowadzenia za rękę. Dla zespołów z ograniczonymi zasobami inżynierskimi to potencjalnie ogromna zmiana w sposobie pracy.
Prawdziwy cios dla konkurencji to wycena. Anthropic obciął koszty użycia modelu o około dwie trzecie w porównaniu do wcześniejszych wersji Opus.
Dla firm korzystających z AI na masową skalę to różnica między eksperymentem a wdrożeniem produkcyjnym.
Żeby lepiej zrozumieć skalę tej zmiany: wiele startupów i średnich przedsiębiorstw rezygnowało z modeli klasy Opus właśnie ze względu na koszt. Wdrożenie agenta AI, który przetwarza tysiące zapytań dziennie, przy poprzednich cenach generowało rachunki trudne do uzasadnienia przed zarządem. Teraz ten argument traci na sile.
I jeszcze jedno: nielimitowane konwersacje. Wcześniej długie sesje czatu mogły być problematyczne — modele traciły kontekst lub ograniczały liczbę wymian. Opus 4.5 ma to gdzieś. Możesz prowadzić nieskończenie długie rozmowy bez utraty wątku.
Dla programistów oznacza to jedno: możesz debugować, refaktoryzować i konsultować kod przez godziny, a model nie "zapomni", o czym rozmawialiście 200 wiadomości temu.
Premiera Opus 4.5 wpisuje się w szerszy trend, który obserwujemy od początku 2025 roku — radykalne obniżanie cen modeli przy jednoczesnym podnoszeniu ich możliwości. Wcześniej podobny ruch wykonało OpenAI, obniżając koszty API dla wybranych modeli, a DeepSeek pokazał, że można trenować konkurencyjne systemy za ułamek dotychczasowych budżetów.
Anthropic odpowiedział własną kartą. I zagrał ją w momencie, gdy rynek coraz głośniej domaga się nie tylko imponujących benchmarków, ale realnej opłacalności wdrożeń.
Warto też zauważyć, że Opus 4.5 to model z wyższej półki w portfolio Anthropic. Firma oferuje równolegle tańsze warianty z rodziny Claude — Sonnet i Haiku — skierowane do zastosowań wymagających mniejszej złożoności. Strategia wielopoziomowa pozwala Anthropic obsługiwać zarówno klientów szukających maksymalnej wydajności, jak i tych, którzy optymalizują przede wszystkim pod kątem kosztu.
Jeśli kodujesz — masz nowego partnera, który nie narzeka na nadgodziny i nie potrzebuje kawy. Jeśli zarządzasz zespołem — możesz przyspieszyć prototypowanie i redukcję długu technicznego. Jeśli obserwujesz rynek AI — widzisz, jak Anthropic odgryza kawałek tortu OpenAI.
Czy Opus 4.5 to definitywny lider? Pewnie przez kilka tygodni. Potem Google odpowie nowym Gemini, OpenAI wypuści GPT-5, a my znów będziemy porównywać benchmarki.
Jedno jest pewne: poprzeczka właśnie poszła w górę.
I spadła w dół — jeśli chodzi o cenę.
Przeczytaj też:
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar