Alibaba wypuściła Qwen-Robot. AI, które widzi i działa

Koleżanka z działu HR zapytała mnie wczoraj, czy robot kiedyś będzie potrafił znaleźć wolną łazienkę w biurowcu. Nie wiedziałem, co odpowiedzieć. Dzisiaj wiem: Alibaba właśnie pokazała, że tak.

We wtorek firma wypuściła Qwen-Robot - pierwszą rodzinę modeli AI zaprojektowanych do sterowania fizycznymi robotami. Nie chodzi tu o chatbota, który odpowiada na pytania. Chodzi o system, który widzi, rozumie i działa w prawdziwym świecie.

Trzy modele, trzy zadania

Qwen-Robot to nie jeden model, tylko trzy osobne narzędzia. Każde odpowiada za inny kawałek problemu.

Qwen-RobotNav zajmuje się nawigacją. Robot dostaje polecenie głosowe ("idź do kuchni"), widzi otoczenie przez kamerę i znajduje drogę. Nie potrzebuje mapy ani GPS. Model został wytrenowany na 15,6 miliona próbek - od śledzenia obiektów po autonomiczną jazdę.

Robot Unitree Go2 porusza się po nieznanym mieszkaniu, używając tylko jednej kamery

Qwen-RobotManip odpowiada za manipulację - chwytanie, podnoszenie, przekładanie rzeczy. Bazuje na modelu wizyjno-językowym Qwen3.5-4B VL i został wytrenowany na ponad 38 100 godzinach danych operacyjnych. Wszystkie dane pochodzą z otwartych źródeł.

Qwen-RobotWorld to model świata. Przewiduje, co się stanie, jeśli robot wykona konkretną akcję. Działa w scenariuszach manipulacji, jazdy i nawigacji. Interfejs? Naturalny język. Mówisz "podnieś kubek", a model pokazuje, jak fizyka zareaguje.

Jeden pies, jedna kamera, zero map

Najciekawszy test? Alibaba wzięła robota Unitree Go2 - czworonożnego psa z hardware'm NVIDIA Jetson Thor - i wypuściła go w nieznane mieszkanie.

Robot miał jedną kamerę o niskiej rozdzielczości. Żadnych wcześniejszych map. Żadnych sensorów laserowych.

Dostał polecenie głosowe: przejdź przez kilka pokoi. I przeszedł. Krok po kroku, bez zgubienia się. Opóźnienie inferencji? 196 milisekund. To mniej niż czas reakcji człowieka.

Model Qwen-RobotManip został wytrenowany na ponad 38 000 godzinach danych manipulacyjnych

Agent, który planuje na bieżąco

Alibaba pokazała też Qwen-RobotClaw - framework, który łączy modele Qwen-Robot z agentami językowymi. Agent zarządza długoterminowym kontekstem i pamięcią.

W praktyce: robot szuka wolnej łazienki, znajduje ją, widzi tabliczkę "nieczynna", zmienia plan i idzie dalej. Bez interwencji człowieka.

To dokładnie scenariusz, o który pytała moja koleżanka. I działa.

Open source i platforma testowa

Alibaba udostępniła też Chat2Robot - przeglądarkową platformę do testowania robotów. Możesz pogadać z robotem i zobaczyć, jak reaguje w czasie rzeczywistym. Na razie obsługuje Qwen-RobotManip wytrenowany na 50 zadaniach z datasetu RoboTwin-Clean.

Platforma jest otwarta. Możesz wejść, sprawdzić, jak model radzi sobie z konkretnymi poleceniami. To nie jest demo marketingowe - to narzędzie do walidacji.

Platforma Chat2Robot pozwala testować roboty przez przeglądarkę w czasie rzeczywistym

Rynek, który dopiero się rozkręca

Alibaba wchodzi na rynek, który analitycy szacują na kilka miliardów dolarów w ciągu najbliższych trzech lat. Chodzi o fizyczną inteligencję - AI, które nie tylko myśli, ale działa.

Konkurencja? Firmy takie jak SynapX uczą roboty od ludzi. 2025 był rokiem, w którym roboty zaczęły naprawdę działać. Alibaba pokazuje, że 2026 to rok, w którym przestają potrzebować przygotowania.

Polska perspektywa

Dla polskich firm przemysłowych to sygnał: roboty z AI przestają być science fiction. Qwen-Robot działa na otwartych danych i można go testować przez przeglądarkę.

Bariera wejścia spada. Pytanie nie brzmi "czy to zadziała", tylko "kiedy zaczniemy testować".

Co to zmienia

Qwen-Robot to kolejny krok. Konkretny krok.

Robot, który widzi przez jedną kamerę i nawiguje bez map, to nie demo - to narzędzie, które można wdrożyć. Opóźnienie 196 milisekund to czas reakcji, z którym da się pracować.

Alibaba nie mówi "kiedyś to zadziała". Pokazuje działający system. I udostępnia go do testów. Reszta zależy od tego, kto pierwszy zacznie eksperymentować.

Najczęstsze pytania

Czy Qwen-Robot jest dostępny w Polsce?

Tak, platforma Chat2Robot działa przez przeglądarkę i jest dostępna globalnie. Modele są open source, więc można je testować i wdrażać lokalnie. Hardware (Unitree Go2, NVIDIA Jetson Thor) jest dostępny przez międzynarodowych dystrybutorów.

Ile kosztuje wdrożenie Qwen-Robot?

Alibaba nie podała cen licencji. Modele są open source, więc główny koszt to hardware - robot Unitree Go2 to około 1600 USD, NVIDIA Jetson Thor to kilka tysięcy dolarów. Koszt wdrożenia zależy od skali i integracji z istniejącymi systemami.

Czy Qwen-Robot może pracować w fabryce?

Model Qwen-RobotManip został wytrenowany na ponad 38 000 godzinach danych manipulacyjnych, więc teoretycznie tak. Alibaba pokazała działanie w scenariuszach nawigacji i manipulacji, ale nie podała konkretnych case'ów przemysłowych. To dopiero początek testów.

Jak Qwen-Robot radzi sobie z bezpieczeństwem?

Alibaba nie podała szczegółów dotyczących protokołów bezpieczeństwa. Model Qwen-RobotClaw potrafi replanning (zmiana planu po napotkaniu przeszkody), ale nie wiadomo, jak reaguje na sytuacje awaryjne. To kluczowe pytanie przed wdrożeniem w środowisku z ludźmi.

Na podstawie: Pandaily

Alibaba wypuściła Qwen-Robot. AI, które widzi i działa

Darmowy webinar - AI od zera

Powiązane tematy

Trzy modele, trzy zadania