Alibaba wypuściła Qwen-Robot. AI, które widzi i działa
Źródło: Link
Źródło: Link
90 minut praktyki na żywo. Pokazuję krok po kroku, jak zacząć z AI bez kodowania.
Koleżanka z działu HR zapytała mnie wczoraj, czy robot kiedyś będzie potrafił znaleźć wolną łazienkę w biurowcu. Nie wiedziałem, co odpowiedzieć. Dzisiaj wiem: Alibaba właśnie pokazała, że tak.
We wtorek firma wypuściła Qwen-Robot - pierwszą rodzinę modeli AI zaprojektowanych do sterowania fizycznymi robotami. Nie chodzi tu o chatbota, który odpowiada na pytania. Chodzi o system, który widzi, rozumie i działa w prawdziwym świecie.
Qwen-Robot to nie jeden model, tylko trzy osobne narzędzia. Każde odpowiada za inny kawałek problemu.
Qwen-RobotNav zajmuje się nawigacją. Robot dostaje polecenie głosowe ("idź do kuchni"), widzi otoczenie przez kamerę i znajduje drogę. Nie potrzebuje mapy ani GPS. Model został wytrenowany na 15,6 miliona próbek - od śledzenia obiektów po autonomiczną jazdę.
Qwen-RobotManip odpowiada za manipulację - chwytanie, podnoszenie, przekładanie rzeczy. Bazuje na modelu wizyjno-językowym Qwen3.5-4B VL i został wytrenowany na ponad 38 100 godzinach danych operacyjnych. Wszystkie dane pochodzą z otwartych źródeł.
Qwen-RobotWorld to model świata. Przewiduje, co się stanie, jeśli robot wykona konkretną akcję. Działa w scenariuszach manipulacji, jazdy i nawigacji. Interfejs? Naturalny język. Mówisz "podnieś kubek", a model pokazuje, jak fizyka zareaguje.
Najciekawszy test? Alibaba wzięła robota Unitree Go2 - czworonożnego psa z hardware'm NVIDIA Jetson Thor - i wypuściła go w nieznane mieszkanie.
Robot miał jedną kamerę o niskiej rozdzielczości. Żadnych wcześniejszych map. Żadnych sensorów laserowych.
Dostał polecenie głosowe: przejdź przez kilka pokoi. I przeszedł. Krok po kroku, bez zgubienia się. Opóźnienie inferencji? 196 milisekund. To mniej niż czas reakcji człowieka.
Alibaba pokazała też Qwen-RobotClaw - framework, który łączy modele Qwen-Robot z agentami językowymi. Agent zarządza długoterminowym kontekstem i pamięcią.
W praktyce: robot szuka wolnej łazienki, znajduje ją, widzi tabliczkę "nieczynna", zmienia plan i idzie dalej. Bez interwencji człowieka.
To dokładnie scenariusz, o który pytała moja koleżanka. I działa.
Alibaba udostępniła też Chat2Robot - przeglądarkową platformę do testowania robotów. Możesz pogadać z robotem i zobaczyć, jak reaguje w czasie rzeczywistym. Na razie obsługuje Qwen-RobotManip wytrenowany na 50 zadaniach z datasetu RoboTwin-Clean.
Platforma jest otwarta. Możesz wejść, sprawdzić, jak model radzi sobie z konkretnymi poleceniami. To nie jest demo marketingowe - to narzędzie do walidacji.
Alibaba wchodzi na rynek, który analitycy szacują na kilka miliardów dolarów w ciągu najbliższych trzech lat. Chodzi o fizyczną inteligencję - AI, które nie tylko myśli, ale działa.
Konkurencja? Firmy takie jak SynapX uczą roboty od ludzi. 2025 był rokiem, w którym roboty zaczęły naprawdę działać. Alibaba pokazuje, że 2026 to rok, w którym przestają potrzebować przygotowania.
Dla polskich firm przemysłowych to sygnał: roboty z AI przestają być science fiction. Qwen-Robot działa na otwartych danych i można go testować przez przeglądarkę.
Bariera wejścia spada. Pytanie nie brzmi "czy to zadziała", tylko "kiedy zaczniemy testować".
Qwen-Robot to kolejny krok. Konkretny krok.
Robot, który widzi przez jedną kamerę i nawiguje bez map, to nie demo - to narzędzie, które można wdrożyć. Opóźnienie 196 milisekund to czas reakcji, z którym da się pracować.
Alibaba nie mówi "kiedyś to zadziała". Pokazuje działający system. I udostępnia go do testów. Reszta zależy od tego, kto pierwszy zacznie eksperymentować.
Tak, platforma Chat2Robot działa przez przeglądarkę i jest dostępna globalnie. Modele są open source, więc można je testować i wdrażać lokalnie. Hardware (Unitree Go2, NVIDIA Jetson Thor) jest dostępny przez międzynarodowych dystrybutorów.
Alibaba nie podała cen licencji. Modele są open source, więc główny koszt to hardware - robot Unitree Go2 to około 1600 USD, NVIDIA Jetson Thor to kilka tysięcy dolarów. Koszt wdrożenia zależy od skali i integracji z istniejącymi systemami.
Model Qwen-RobotManip został wytrenowany na ponad 38 000 godzinach danych manipulacyjnych, więc teoretycznie tak. Alibaba pokazała działanie w scenariuszach nawigacji i manipulacji, ale nie podała konkretnych case'ów przemysłowych. To dopiero początek testów.
Alibaba nie podała szczegółów dotyczących protokołów bezpieczeństwa. Model Qwen-RobotClaw potrafi replanning (zmiana planu po napotkaniu przeszkody), ale nie wiadomo, jak reaguje na sytuacje awaryjne. To kluczowe pytanie przed wdrożeniem w środowisku z ludźmi.
Na podstawie: Pandaily
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar