Robotyka
Robotyka · 5 min czytania · 23 listopada 2025

Roboty grają w kółko i krzyżyk. Na komendę głosową

Roboty grają w kółko i krzyżyk. Na komendę głosową

Źródło: Link

Kurs AI Evolution

118 lekcji od zera do eksperta. Bez kodowania.

Sprawdź kurs →

Kółko i krzyżyk. Gra, którą każdy zna od dzieciństwa. Tyle że tym razem zamiast kartki i długopisu – dwa roboty, plansza i model językowy, który tłumaczy Twoje słowa na ruchy.

Efekt? RoboTic-Tac-Toe, projekt AWS, który łączy AI z fizyką w sposób, który jeszcze rok temu brzmiałby jak science fiction.

I nie, to nie jest kolejna gra w chmurze. To pokazanie, jak LLM-y mogą orkiestrować rzeczywiste obiekty. W czasie rzeczywistym.

Mówisz – robot wykonuje

"Postaw X w środkowym polu". Robot słucha. Model językowy przetwarza komendę. Fizyczna maszyna wykonuje ruch na planszy.

I to wszystko.

Pod spodem dzieje się sporo. AWS wykorzystało tu kilka swoich usług AI – od rozpoznawania mowy po przetwarzanie języka naturalnego i sterowanie robotami. Żadnych skomplikowanych interfejsów. Żadnego programowania ruchów. Po prostu mówisz, a system rozumie kontekst gry i tłumaczy to na konkretne akcje.

Dwa roboty. Jedna plansza. Zero joysticków.

Kluczowe w tym wszystkim jest właśnie rozumienie kontekstu. Tradycyjne systemy sterowania wymagają precyzyjnych, z góry zdefiniowanych komend. Jeśli powiesz coś nieznacznie inaczej niż przewiduje skrypt, system się gubi. Tutaj działa inaczej – model językowy interpretuje intencję, nie literalną składnię. Możesz powiedzieć "daj X na środek", "środkowe pole" albo "zagraj w sam środek planszy" i system zrozumie to samo polecenie.

Jak to technicznie działa

Projekt RoboTic-Tac-Toe opiera się na kilku warstwach, które współpracują ze sobą w czasie rzeczywistym. Pierwsza warstwa to rozpoznawanie mowy – zamiana głosu na tekst za pomocą usług AWS. Druga warstwa to model językowy, który analizuje polecenie, uwzględnia aktualny stan planszy i decyduje, jaki ruch jest możliwy i oczekiwany. Trzecia warstwa to przekładanie tej decyzji na sygnały sterujące fizycznymi ramionami robotów.

To, co sprawia, że ten system jest nietrywialny, to właśnie środkowa warstwa. LLM nie tylko tłumaczy słowa na współrzędne. On rozumie, że plansza ma dziewięć pól, że pewne pola są już zajęte, że niektóre polecenia mogą być nieprecyzyjne i wymagają doprecyzowania. Innymi słowy – zachowuje się jak gracz, który rozumie zasady, a nie jak parser, który rozumie tylko kod.

Kółko i krzyżyk to tylko pretekst

Prawdziwa wartość tkwi gdzie indziej – w pokazaniu, jak naturalny język może stać się interfejsem do sterowania fizycznymi obiektami. Dziś to gra. Jutro? Magazyn, w którym mówisz "przesuń paletę z A3 do B7" i robot wykonuje polecenie bez dodatkowego kodu.

RoboTic-Tac-Toe to proof of concept. Demonstracja, że LLM-y nie muszą być zamknięte w chatbotach – mogą być mostem między człowiekiem a maszyną. I to mostem, który rozumie kontekst, nie tylko sztywne komendy.

Warto też zauważyć, że tego rodzaju projekty obniżają barierę wejścia. Do tej pory sterowanie robotami wymagało wiedzy o protokołach komunikacyjnych, znajomości języków programowania dedykowanych robotyce albo kosztownych systemów SCADA. Teraz wystarczy mówić po ludzku. To fundamentalna zmiana w tym, kto może pracować z robotami i w jaki sposób.

Gdzie jeszcze to ma sens?

Edukacja. Dzieci uczą się programowania, widząc efekty swoich poleceń w realnym świecie, nie tylko na ekranie.

Prototypowanie. Inżynierowie testują scenariusze bez pisania linijek kodu.

Automatyzacja. Operatorzy sterują maszynami głosem, bez dotykania paneli.

Każdy z tych przykładów opiera się na tym samym – na przekładaniu intencji na akcję.

Do tej listy warto dołożyć jeszcze jeden obszar: dostępność. Interfejsy głosowe otwierają robotykę dla osób, które ze względu na ograniczenia ruchowe nie mogą obsługiwać tradycyjnych paneli sterowania. Głos jako interfejs to nie tylko wygoda – to czasem jedyna dostępna opcja.

Kontekst rynkowy

AWS nie jest jedynym graczem, który zmierza w tym kierunku. Integracja modeli językowych z robotyką to jeden z gorętszych tematów w branży. Google DeepMind pracuje nad modelami, które uczą roboty rozumieć polecenia w naturalnym języku i generalizować je na nowe zadania. Microsoft inwestuje w podobne podejścia w ramach swojego ekosystemu Azure. Startup Figure AI buduje humanoidalne roboty, które mają rozumieć mowę i działać w ludzkich środowiskach pracy.

RoboTic-Tac-Toe wpisuje się w ten szerszy trend, ale wyróżnia się jedną rzeczą: jest gotowym, działającym demo, które można zobaczyć i dotknąć. Nie obietnicą za pięć lat, ale działającym systemem teraz. I to zbudowanym z usług, które AWS udostępnia komercyjnie – co oznacza, że firmy mogą zacząć eksperymentować z podobnymi rozwiązaniami bez czekania na przełom technologiczny.

Co to znaczy dla Ciebie?

Pracujesz z robotyką, automatyką czy IoT? To sygnał, że interfejsy głosowe przestają być gadżetem. Stają się narzędziem. I to narzędziem, które AWS właśnie udostępnia w formie gotowych usług.

Śledzisz rozwój AI? To kolejny przykład na to, jak modele językowe wychodzą poza ekran. Przestają być tylko asystentami tekstowymi. Zaczynają sterować światem fizycznym.

A jeśli po prostu lubisz ciekawe projekty? Cóż, roboty grające w kółko i krzyżyk to dopiero początek.

Historia zatoczyła koło – od gier planszowych do gier z AI. Tylko że teraz AI nie tylko gra. Ono też porusza pionki.

Źródła

Informacje o artykule

Podoba Ci się ten artykuł?

Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!

Ten temat omawiam szerzej na webinarze

90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.

Zapisz sie na webinar
Udostępnij:
Jan Gajos

Ekspert AI & Founder, AI Evolution

Pasjonat sztucznej inteligencji, który od ponad 15 lat działa z sukcesem biznesowo i szkoleniowo. Wprowadzam AI do swoich firm oraz codziennego życia. Fascynują mnie nowe technologie, gry wideo i składanie klocków Lego – tam też widzę logikę i kreatywność, które AI potrafi wzmacniać. Wierzę, że dobrze użyta sztuczna inteligencja to nie ogłupiające ułatwienie, lecz prawdziwy przełom w sposobie, w jaki myślimy, tworzymy i pracujemy.