Darmowy model AI do kodu dorównuje płatnym gigantom
Źródło: Link
Źródło: Link
90 minut praktyki na żywo. Pokazuję krok po kroku, jak zacząć z AI bez kodowania.
Mistral AI wypuścił Devstral 2. Model do pisania kodu, który osiągnął 72% w SWE-bench Verified – branżowym teście pokazującym, jak AI radzi sobie z prawdziwymi problemami programistycznymi.
Przetłumaczmy: to jak egzamin dla programistów, tylko że zdaje go sztuczna inteligencja. I właśnie darmowy model dorównał płatnym rozwiązaniom od gigantów.
Devstral 2 to model "open-weights". Nie, to nie błąd w tłumaczeniu.
przepis na ciasto. "Open source" to sytuacja, gdy dostajesz pełny przepis ze wszystkimi krokami. "Open-weights" to moment, gdy dostajesz gotowe ciasto i listę składników – ale bez dokładnej instrukcji, jak je upiec.
W praktyce? Możesz pobrać model, uruchomić go na swoim komputerze i używać bez opłat. Ale nie zobaczysz pełnego kodu, który go stworzył.
Dla przedsiębiorcy czy freelancera to świetna wiadomość. Żadnych miesięcznych subskrypcji. Żadnego wysyłania kodu firmowego do chmury obcej firmy.
SWE-bench Verified to test, w którym AI dostaje prawdziwe zgłoszenia błędów z GitHuba. Musi je zrozumieć, znaleźć problem w kodzie i zaproponować poprawkę.
Devstral 2 rozwiązał 72% takich zadań.
Rok temu najlepsze modele ledwo przekraczały 30%. Pół roku temu 50% wydawało się nieosiągalne. Teraz darmowy model osiąga wyniki, które jeszcze niedawno były domeną płatnych gigantów jak GitHub Copilot czy Claude.
I tu pojawia się pytanie: po co płacić, skoro open-weights dogania liderów?
Mistral wprowadził coś, co nazywa "vibe coding". Nazwa przypomina żart, ale koncept jest poważny.
Chodzi o autonomicznego agenta AI, który nie tylko pisze kod. On planuje, testuje, poprawia błędy i iteruje – bez ciągłego nadzoru człowieka.
Normalnie prosisz AI: "Napisz mi funkcję do sortowania listy". Dostajesz kod. Wklejasz. Czasem działa, czasem nie.
Agent w stylu "vibe coding" działa inaczej. Mówisz: "Potrzebuję systemu do zarządzania zamówieniami". A on:
To już działa. Mistral pokazał demo, w którym agent samodzielnie budował funkcje bez mikromanagementu ze strony programisty.
Jeśli prowadzisz biznes i myślałeś o automatyzacji, ale bałeś się kosztów programisty – ta zmiana jest dla Ciebie.
Devstral 2 możesz uruchomić lokalnie. Nie musisz płacić za API. Nie wysyłasz danych wrażliwych do zewnętrznej firmy. I dostajesz narzędzie, które potrafi pisać kod na poziomie zbliżonym do komercyjnych rozwiązań.
Przykład? Masz sklep internetowy i chcesz dodać automatyczne generowanie opisów produktów na podstawie zdjęć. Zamiast zatrudniać programistę na kilka tygodni, możesz poprosić agenta AI o zbudowanie takiego systemu. On to zrobi, przetestuje i poprawi – w godziny, nie tygodnie.
Albo prowadzisz małą firmę i potrzebujesz prostego CRM-a dopasowanego do Twoich procesów. Zamiast kupować gotowe rozwiązanie za tysiące złotych rocznie, agent może stworzyć coś szytego na miarę.
Devstral 2 to nie magiczna różdżka. Model jest otwarty, ale nie dla każdego.
Żeby go uruchomić, potrzebujesz sprzętu. Nie laptopa za 3 tysiące, ale serwera z mocną kartą graficzną. Albo chmury, która i tak kosztuje.
Druga sprawa: 72% to nie 100%. Co czwarty problem model nie rozwiąże. Albo rozwiąże źle. I tu potrzebny jest człowiek, który to sprawdzi.
Dla programisty to błogosławieństwo – automatyzacja nudnych zadań, więcej czasu na kreatywną pracę. Dla laika to wciąż narzędzie wymagające nauki.
Kierunek jest jasny: bariera wejścia spada. To, co rok temu wymagało zespołu programistów, dziś robi jeden człowiek z AI. A to, co dziś robi jeden człowiek z AI, za rok zrobi sam AI.
OpenAI trzyma swoje modele za zamkniętymi drzwiami. Anthropic (twórca Claude) podobnie. Mistral idzie w drugą stronę.
Dlaczego? Bo rynek się zmienia.
Firmy boją się vendor lock-in – sytuacji, gdy uzależniają się od jednego dostawcy. Jeśli Twój biznes opiera się na API OpenAI, a oni nagle podnoszą ceny albo zmieniają zasady – jesteś w pułapce.
Open-weights daje kontrolę. Pobierasz model raz, uruchamiasz u siebie i masz spokój. Nikt Ci go nie zabierze. Nikt nie podniesie cen.
Mistral zakłada, że w długim terminie firmy wybiorą bezpieczeństwo i kontrolę nad wygodą chmury. I może mieć rację.
Devstral 2 to jeden z sygnałów większego trendu. Open-source AI dogania zamknięte modele. I robi to szybciej, niż ktokolwiek się spodziewał.
Rok temu eksperci mówili, że otwarte modele zawsze będą w tyle. Pół roku temu mówili "może kiedyś". Dziś mówią "wow, to już tu jest".
Dla Ciebie – czy jesteś przedsiębiorcą, freelancerem czy po prostu osobą ciekawą technologii – to oznacza jedno: narzędzia, które jeszcze niedawno były domeną wielkich korporacji, stają się dostępne. I tanie. I coraz lepsze.
Pytanie nie brzmi "czy AI zmieni Twoją branżę". Pytanie brzmi: "kiedy zaczniesz to wykorzystywać, zanim zrobi to konkurencja?"
Przeczytaj też:
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar