Chińczycy obniżyli koszt AI do 50 groszy. Sprawdzam
Źródło: Link
Źródło: Link
118 lekcji bez kodowania. ChatGPT, Claude, Gemini, automatyzacje. Notatnik AI i AI Coach w cenie.
Inspur Information – chiński gigant technologiczny – właśnie ogłosił coś, co przypomina przełom. Nowy serwer AI o nazwie YuanNao HC1000 ma obniżyć koszt inferencji do 1 juana za milion tokenów. To około 50 groszy polskich.
Dla porównania: milion tokenów to mniej więcej 750 tysięcy słów. Cała trylogia "Władca Pierścieni" to około 480 tysięcy słów. Za 50 groszy możesz więc – teoretycznie – przetworzyć więcej tekstu niż Tolkien napisał w całym swoim życiu.
Brzmi za pięknie, żeby było prawdziwe?
Pewnie tak. Ale diabeł tkwi w szczegółach.
Inferencja to moment, gdy AI "myśli" – przetwarza Twoje zapytanie i generuje odpowiedź. To nie jest trenowanie modelu (co kosztuje miliony), ale codzienne użytkowanie.
I tu jest problem.
Dzisiaj koszt inferencji to główna bariera dla masowego wdrażania AI. Firmy chcą używać agentów AI – programów, które automatycznie odpowiadają na maile, analizują dokumenty, prowadzą rozmowy z klientami. Ale jeśli każda interakcja kosztuje kilka centów, to przy skali tysięcy zapytań dziennie rachunki rosną do absurdu.
Inspur twierdzi, że rozwiązał ten problem.
To serwer zaprojektowany specjalnie pod inferencję. Nie pod trenowanie modeli, nie pod eksperymenty – pod masowe, codzienne użycie AI w firmach.
Kluczowe cechy:
Inspur nie podaje wszystkich szczegółów technicznych. Nie wiemy dokładnie, jakie chipy są w środku, jak wygląda chłodzenie, ile prądu zżera. Ale wiemy jedno: jeśli te liczby są prawdziwe, to zmienia zasady gry.
Bo koszt inferencji to nie abstrakcja. To coś, co bezpośrednio wpływa na to, jakie narzędzia AI są dla Ciebie dostępne.
Wszystko to istnieje już dzisiaj. Problem? Koszty. Firmy liczą każdy cent, więc te funkcje są albo drogie, albo ograniczone do kilku zapytań dziennie.
Jeśli Inspur rzeczywiście obniżył koszty 10-krotnie (a może i więcej), nagle te narzędzia stają się opłacalne dla małych firm. I dla Ciebie.
Bo to Chiny. I nie chodzi o rasizm technologiczny, tylko o historię.
Chińskie firmy mają tendencję do ogłaszania "przełomów", które po bliższym przyjrzeniu okazują się... cóż, marketingiem. Pamiętasz chiński "kwantowy komputer", który miał być szybszy od wszystkiego? Albo "autonomiczne samochody", które jeździły tylko na zamkniętych trasach?
Tu może być podobnie.
Inspur podaje koszt "tak niski jak 1 juan". Zwróć uwagę na sformułowanie: "tak niski jak". To nie jest "średnio", nie jest "zazwyczaj". To "w idealnych warunkach, przy maksymalnym obciążeniu, jeśli wszystko gra".
W praktyce? Pewnie drożej.
Jeśli – i to duże "jeśli" – te liczby są realne, to mamy trzy scenariusze:
Scenariusz 1: Inspur ma rację. Koszt inferencji spada radykalnie. Firmy zaczynają masowo wdrażać agentów AI. Rynek eksploduje. Nvidia dostaje ataku serca, bo nagle ich chipy nie są jedyną opcją.
Scenariusz 2: To marketing. Koszt jest niski tylko w bardzo specyficznych warunkach. W praktyce niewiele się zmienia. Inspur sprzedaje kilka serwerów, robi szum medialny i wraca do cienia.
Scenariusz 3: To prawda, ale tylko w Chinach. Serwer działa świetnie z chińskimi modelami (Qwen, Baichuan), ale zachodnie firmy nie mogą go używać – albo przez sankcje, albo przez brak kompatybilności.
Który scenariusz jest najbardziej prawdopodobny.
Pewnie 2 albo 3.
Co wtedy.
Wtedy mamy problem. Bo jeśli Chiny mogą produkować serwery AI 10 razy tańsze niż Zachód, to wyścig technologiczny właśnie się skończył. Nie chodzi o to, kto ma lepszy model – chodzi o to, kto może go uruchomić taniej.
I tu pojawia się pytanie polityczne: czy Zachód pozwoli na import takich serwerów? Czy USA nałożą kolejne sankcje? Czy Unia zacznie subsydiować własne firmy hardware'owe.
Bo AI to nie tylko software. To infrastruktura. I kto kontroluje infrastrukturę, ten kontroluje przyszłość.
Jeśli jesteś przedsiębiorcą: obserwuj. Inspur to nie startup z garażu – to poważna firma z kontraktami rządowymi. Jeśli ich serwer rzeczywiście zadziała, pojawią się alternatywy. I wtedy warto sprawdzić, czy Twoje narzędzia AI mogą być tańsze.
Jeśli jesteś użytkownikiem: to Cię nie dotyczy bezpośrednio. Ale pośrednio – jak najbardziej. Bo jeśli firmy zaczną oszczędzać na inferencji, nagle darmowe plany ChatGPT, Gemini czy Claude mogą stać się bardziej hojne. Albo pojawią się nowe narzędzia, które wcześniej były nieopłacalne.
Jeśli jesteś geekiem: czekaj na testy. Ktoś w Chinach na pewno już zamówił ten serwer i za miesiąc-dwa pojawią się pierwsze benchmarki. I wtedy zobaczymy, czy to przełom, czy ściema.
Inspur twierdzi, że obniżył koszt AI do 50 groszy za milion tokenów. Jeśli to prawda, zmienia wszystko. Jeśli to marketing, nic się nie zmienia.
Która opcja jest bardziej prawdopodobna? Historia podpowiada, że ta druga. Ale historia też pokazuje, że Chiny potrafią zaskoczyć.
Zobaczymy.
Przeczytaj też:
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar