Baidu open-source model AI do bicia GPT-4o
Źródło: Link
Źródło: Link
118 lekcji bez kodowania. ChatGPT, Claude, Gemini, automatyzacje. Notatnik AI i AI Coach w cenie.
Baidu Inc., największa chińska wyszukiwarka, wypuściła w poniedziałek nowy multimodalny model sztucznej inteligencji. I od razu postawiła poprzeczkę wysoko. Według wewnętrznych testów ich rozwiązanie przewyższa GPT-5 od OpenAI i Gemini 3.1 Pro od Google w zadaniach wizyjnych. A to wszystko przy znacznie mniejszym zużyciu mocy obliczeniowej.
Ogłoszenie to pojawia się w momencie, gdy rynek modeli multimodalnych przeżywa prawdziwy rozkwit. Zdolność do przetwarzania nie tylko tekstu, ale również obrazów, dźwięku i wideo staje się standardem, a nie dodatkiem. Baidu wyraźnie chce zaistnieć w tej przestrzeni jako poważny gracz globalny, nie tylko chiński.
Nowy model Baidu został udostępniony jako open-source. Każdy programista może go pobrać, zmodyfikować i wdrożyć we własnych projektach. To istotna różnica w porównaniu z zamkniętymi rozwiązaniami OpenAI czy Google, które oferują dostęp wyłącznie przez API (i oczywiście za opłatą).
Chiński gigant twierdzi, że ich model osiąga lepsze wyniki w kilku benchmarkach związanych z przetwarzaniem obrazów i rozumieniem kontekstu wizualnego. Szczególnie imponujące mają być rezultaty w zadaniach wymagających analizy złożonych scen i rozpoznawania obiektów w trudnych warunkach.
Decyzja o udostępnieniu modelu jako open-source to strategia, która może przynieść Baidu znaczące korzyści długoterminowe. Otwarte modele budują społeczność deweloperów, którzy nie tylko testują rozwiązanie w różnorodnych scenariuszach, ale również aktywnie je ulepszają. To podejście sprawdziło się już w przypadku modeli takich jak LLaMA od Meta czy Mistral od europejskiego startupu o tej samej nazwie. Społeczność open-source potrafi znaleźć zastosowania, o których twórcy modelu nawet nie pomyśleli.
Najbardziej intrygujące w ogłoszeniu Baidu jest twierdzenie o efektywności zasobowej. Firma przekonuje, że ich model wymaga "ułamka mocy obliczeniowej" w porównaniu z konkurencją. Jeśli to prawda, może to oznaczać przełom w demokratyzacji dostępu do zaawansowanych modeli AI – zwłaszcza dla mniejszych firm i deweloperów, którzy nie dysponują budżetami tech gigantów.
Efektywność obliczeniowa to obecnie jeden z najważniejszych frontów walki w rozwoju AI. Podczas gdy zachodnie firmy często rzucają na problem coraz więcej mocy obliczeniowej i większe klastry GPU, chińscy producenci – częściowo z konieczności, ze względu na ograniczenia w dostępie do najnowszych chipów – skupiają się na optymalizacji. To zmusza ich do innowacyjności w architekturze modeli i technikach trenowania.
W praktyce niższe wymagania sprzętowe oznaczają, że model można uruchomić na słabszym sprzęcie, a nawet lokalnie na komputerach deweloperskich. To otwiera drzwi do zastosowań, gdzie wysyłanie danych do chmury jest niemożliwe lub niepożądane – na przykład w medycynie, gdzie prywatność danych pacjentów jest kluczowa, czy w aplikacjach przemysłowych wymagających przetwarzania w czasie rzeczywistym.
Oczywiście, jak to bywa z benchmarkami, diabeł tkwi w szczegółach. Producenci modeli AI często wybierają testy, w których ich rozwiązania wypadają najlepiej. Prawdziwa weryfikacja przyjdzie dopiero wtedy, gdy niezależni badacze i deweloperzy przetestują model w rzeczywistych zastosowaniach.
Wypuszczenie tego modelu przez Baidu to również wyraźny sygnał w trwającym technologicznym wyścigu między Chinami a Zachodem. Podczas gdy amerykańskie regulacje ograniczają eksport zaawansowanych chipów do Chin, tamtejsze firmy odpowiadają innowacjami w architekturze modeli i algorytmach. To klasyczny przykład tego, jak ograniczenia mogą stymulować kreatywność.
Chińskie firmy technologiczne mają również dostęp do ogromnych zbiorów danych i silne wsparcie rządowe dla rozwoju AI. Baidu, jako lider w dziedzinie wyszukiwarek internetowych w Chinach, dysponuje zasobami porównywalnymi do Google'a na swoim rynku. To daje im solidną podstawę do trenowania i rozwijania zaawansowanych modeli.
Ruch Baidu wpisuje się w szerszy trend otwierania modeli AI. Podczas gdy OpenAI coraz bardziej zamyka swoje rozwiązania (mimo nazwy sugerującej coś przeciwnego), chińskie firmy jak Baidu czy Alibaba stawiają na open-source jako sposób na budowanie ekosystemu i pozyskiwanie deweloperów.
Dla Ciebie jako użytkownika lub dewelopera to dobra wiadomość. Więcej otwartych modeli oznacza większą konkurencję, niższe koszty i możliwość eksperymentowania bez uzależnienia od jednego dostawcy. Pytanie tylko, jak długo zachodnie firmy będą mogły ignorować ten trend.
Rynek AI ewoluuje w kierunku dwóch równoległych ścieżek: zamkniętych, komercyjnych rozwiązań oferowanych jako usługa oraz otwartych modeli, które każdy może uruchomić we własnej infrastrukturze. Obie mają swoje miejsce – pierwsze oferują wygodę i wsparcie, drugie dają kontrolę i elastyczność. Pojawienie się kolejnego silnego gracza w segmencie open-source tylko wzmacnia tę drugą ścieżkę.
Przeczytaj też:
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar