Baidu wypuszcza open-source'owy model AI, który ma bić GPT-4o

Baidu Inc., największa chińska wyszukiwarka, wypuściła w poniedziałek nowy multimodalny model sztucznej inteligencji. I od razu postawiła poprzeczkę wysoko. Według wewnętrznych testów ich rozwiązanie przewyższa GPT-5 od OpenAI i Gemini 3.1 Pro od Google w zadaniach wizyjnych. A to wszystko przy znacznie mniejszym zużyciu mocy obliczeniowej.

Ogłoszenie to pojawia się w momencie, gdy rynek modeli multimodalnych przeżywa prawdziwy rozkwit. Zdolność do przetwarzania nie tylko tekstu, ale również obrazów, dźwięku i wideo staje się standardem, a nie dodatkiem. Baidu wyraźnie chce zaistnieć w tej przestrzeni jako poważny gracz globalny, nie tylko chiński.

Model open-source z ambicjami

Nowy model Baidu został udostępniony jako open-source. Każdy programista może go pobrać, zmodyfikować i wdrożyć we własnych projektach. To istotna różnica w porównaniu z zamkniętymi rozwiązaniami OpenAI czy Google, które oferują dostęp wyłącznie przez API (i oczywiście za opłatą).

Chiński gigant twierdzi, że ich model osiąga lepsze wyniki w kilku benchmarkach związanych z przetwarzaniem obrazów i rozumieniem kontekstu wizualnego. Szczególnie imponujące mają być rezultaty w zadaniach wymagających analizy złożonych scen i rozpoznawania obiektów w trudnych warunkach.

Decyzja o udostępnieniu modelu jako open-source to strategia, która może przynieść Baidu znaczące korzyści długoterminowe. Otwarte modele budują społeczność deweloperów, którzy nie tylko testują rozwiązanie w różnorodnych scenariuszach, ale również aktywnie je ulepszają. To podejście sprawdziło się już w przypadku modeli takich jak LLaMA od Meta czy Mistral od europejskiego startupu o tej samej nazwie. Społeczność open-source potrafi znaleźć zastosowania, o których twórcy modelu nawet nie pomyśleli.

Mniej mocy, lepsze wyniki?

Najbardziej intrygujące w ogłoszeniu Baidu jest twierdzenie o efektywności zasobowej. Firma przekonuje, że ich model wymaga "ułamka mocy obliczeniowej" w porównaniu z konkurencją. Jeśli to prawda, może to oznaczać przełom w demokratyzacji dostępu do zaawansowanych modeli AI – zwłaszcza dla mniejszych firm i deweloperów, którzy nie dysponują budżetami tech gigantów.

Efektywność obliczeniowa to obecnie jeden z najważniejszych frontów walki w rozwoju AI. Podczas gdy zachodnie firmy często rzucają na problem coraz więcej mocy obliczeniowej i większe klastry GPU, chińscy producenci – częściowo z konieczności, ze względu na ograniczenia w dostępie do najnowszych chipów – skupiają się na optymalizacji. To zmusza ich do innowacyjności w architekturze modeli i technikach trenowania.

W praktyce niższe wymagania sprzętowe oznaczają, że model można uruchomić na słabszym sprzęcie, a nawet lokalnie na komputerach deweloperskich. To otwiera drzwi do zastosowań, gdzie wysyłanie danych do chmury jest niemożliwe lub niepożądane – na przykład w medycynie, gdzie prywatność danych pacjentów jest kluczowa, czy w aplikacjach przemysłowych wymagających przetwarzania w czasie rzeczywistym.

Oczywiście, jak to bywa z benchmarkami, diabeł tkwi w szczegółach. Producenci modeli AI często wybierają testy, w których ich rozwiązania wypadają najlepiej. Prawdziwa weryfikacja przyjdzie dopiero wtedy, gdy niezależni badacze i deweloperzy przetestują model w rzeczywistych zastosowaniach.

Geopolityka AI i wyścig technologiczny

Wypuszczenie tego modelu przez Baidu to również wyraźny sygnał w trwającym technologicznym wyścigu między Chinami a Zachodem. Podczas gdy amerykańskie regulacje ograniczają eksport zaawansowanych chipów do Chin, tamtejsze firmy odpowiadają innowacjami w architekturze modeli i algorytmach. To klasyczny przykład tego, jak ograniczenia mogą stymulować kreatywność.

Chińskie firmy technologiczne mają również dostęp do ogromnych zbiorów danych i silne wsparcie rządowe dla rozwoju AI. Baidu, jako lider w dziedzinie wyszukiwarek internetowych w Chinach, dysponuje zasobami porównywalnymi do Google'a na swoim rynku. To daje im solidną podstawę do trenowania i rozwijania zaawansowanych modeli.

Co to oznacza dla rynku AI

Ruch Baidu wpisuje się w szerszy trend otwierania modeli AI. Podczas gdy OpenAI coraz bardziej zamyka swoje rozwiązania (mimo nazwy sugerującej coś przeciwnego), chińskie firmy jak Baidu czy Alibaba stawiają na open-source jako sposób na budowanie ekosystemu i pozyskiwanie deweloperów.

Dla Ciebie jako użytkownika lub dewelopera to dobra wiadomość. Więcej otwartych modeli oznacza większą konkurencję, niższe koszty i możliwość eksperymentowania bez uzależnienia od jednego dostawcy. Pytanie tylko, jak długo zachodnie firmy będą mogły ignorować ten trend.

Rynek AI ewoluuje w kierunku dwóch równoległych ścieżek: zamkniętych, komercyjnych rozwiązań oferowanych jako usługa oraz otwartych modeli, które każdy może uruchomić we własnej infrastrukturze. Obie mają swoje miejsce – pierwsze oferują wygodę i wsparcie, drugie dają kontrolę i elastyczność. Pojawienie się kolejnego silnego gracza w segmencie open-source tylko wzmacnia tę drugą ścieżkę.

Przeczytaj też:

Źródła

VentureBeat AI - Baidu just dropped an open-source multimodal AI

Baidu open-source model AI do bicia GPT-4o

Kurs AI Evolution — od zera do eksperta

Powiązane tematy

Model open-source z ambicjami

Mniej mocy, lepsze wyniki?

Geopolityka AI i wyścig technologiczny

Co to oznacza dla rynku AI

Źródła

Ten temat omawiam szerzej na webinarze

Jan Gajos

Baidu open-source model AI do bicia GPT-4o

Kurs AI Evolution — od zera do eksperta

Powiązane tematy

Model open-source z ambicjami

Mniej mocy, lepsze wyniki?

Geopolityka AI i wyścig technologiczny

Co to oznacza dla rynku AI

Źródła

Ten temat omawiam szerzej na webinarze

Jan Gajos

Może Cię zainteresować

OpenAI odpala GPT-5.5. Cel: odebrać tron Claude i Gemini

DeepSeek V4: chiński model AI, który nie prosi o pozwolenie

OpenAI płaci $25 000 za złamanie zabezpieczeń GPT-5.5