Spirit AI wypuścił model dla robotów. I pokonał wszystkich
Źródło: Link
Źródło: Link
118 lekcji od zera do eksperta. Bez kodowania.
Spirit AI właśnie udostępnił kod swojego modelu Spirit v1.5. I nie byłoby w tym nic nadzwyczajnego, gdyby nie jedno: ten model właśnie wygrał globalny benchmark testów na prawdziwych robotach.
Nie w symulacji. Nie w laboratorium. Na prawdziwym sprzęcie.
Embodied AI — czyli "AI wcielone" — to sztuczna inteligencja, która nie tylko myśli, ale też działa. Nie odpowiada na pytania jak ChatGPT. Steruje robotem, który musi chwycić kubek, otworzyć drzwi czy złożyć pranie.
Różnica? ChatGPT może Ci powiedzieć, jak ugotować jajko. Embodied AI musi to zrobić — rękami robota, w prawdziwej kuchni, gdzie kubek może być mokry, a talerz stoi w niewygodnym miejscu.
I tu zaczyna się problem.
Większość modeli AI trenuje się na tekstach i obrazach. Embodied AI musi rozumieć fizykę, przestrzeń trójwymiarową, ciężar przedmiotów. Musi przewidzieć, że szklanka się przewróci, jeśli ją źle chwyci. Że drzwi trzeba najpierw pociągnąć, zanim się otworzą.
To jak różnica między teorią jazdy a siedzeniem za kierownicą w deszczu.
Spirit AI nie jest gigantem. Nie ma budżetu Google'a ani zasobów OpenAI. A mimo to ich model Spirit v1.5 pokonał konkurencję w globalnym benchmarku testów na prawdziwym sprzęcie.
Jak to możliwe?
Po pierwsze: trening na różnorodności. Zamiast uczyć robota jednego zadania w jednym środowisku, Spirit v1.5 trenowano na setkach scenariuszy. Różne przedmioty, różne pomieszczenia, różne warunki oświetlenia. Robot musiał nauczyć się improwizować.
Po drugie: architektura modelu. Spirit v1.5 nie próbuje przewidzieć każdego ruchu z góry. Zamiast tego analizuje sytuację w czasie rzeczywistym i dostosowuje się na bieżąco. Jak kierowca, który reaguje na nagłe hamowanie samochodu przed sobą.
Po trzecie: open source. Spirit AI udostępnił cały kod. Każdy może go pobrać, przetestować, ulepszyć. Setki badaczy na całym świecie może teraz budować na tym fundamencie.
I tu jest sedno.
Większość przełomowych modeli AI jest zamknięta. GPT-4o? Zamknięte. Claude? Zamknięte. Gemini 2.0? Zamknięte. Firmy trzymają kod dla siebie, bo to ich przewaga konkurencyjna.
Problem w tym, że robotyka potrzebuje eksperymentów. Potrzebuje testów w tysiącach różnych środowisk. Fabryka w Niemczech ma inne wymagania niż magazyn w Chinach. Restauracja w Tokio potrzebuje czegoś innego niż dom opieki w Polsce.
Jeden zespół — nawet z nieograniczonym budżetem — nie ogarnie wszystkich przypadków użycia.
Spirit v1.5 zmienia zasady gry. Teraz każdy producent robotów, każdy badacz, każda firma może wziąć ten model i dostosować go do swoich potrzeb. Nie musi zaczynać od zera. Nie musi wydawać milionów na własny zespół AI.
To jak różnica między tym, że każdy musi sam wynaleźć koło, a tym, że koło jest dostępne dla wszystkich i każdy może budować na nim swój wózek.
Robotyka przemysłowa to wciąż nisza. Widziałeś kiedyś robota w restauracji? W hotelu? W swoim biurze? Większość ludzi — nie.
Powód? Koszt i złożoność. Zaprogramowanie robota do konkretnego zadania to miesiące pracy i setki tysięcy złotych. I jak tylko coś się zmieni — nowe menu w restauracji, przemeblowanie magazynu — trzeba zacząć od nowa.
Spirit v1.5 może to zmienić. Bo robot z tym modelem nie musi być programowany dla każdego zadania z osobna. Uczy się generalnych zasad: jak chwytać przedmioty, jak poruszać się w przestrzeni, jak reagować na przeszkody.
Przykład? robota w restauracji. Dziś musi nosić talerze z kuchni do stolików. Jutro kelner prosi go o przyniesienie dodatkowych sztućców. Za tydzień trzeba posprzątać po imprezie. Robot z Spirit v1.5 nie potrzebuje nowego programowania — dostosowuje się.
To nie science fiction. To już działa.
Spirit v1.5 wygrał globalny benchmark testów na prawdziwym sprzęcie. Co to konkretnie znaczy?
Benchmark to zestaw standardowych zadań, które każdy model musi wykonać. Coś jak egzamin na prawo jazdy — wszyscy dostają te same zadania, w tych samych warunkach. Można porównać wyniki.
Jest jednak haczyk. Większość benchmarków AI odbywa się w symulacji. Robot wirtualny w wirtualnym świecie. Tam wszystko jest przewidywalne. Fizyka działa idealnie. Nie ma kurzu, wilgoci, nieoczekiwanych przeszkód.
Ten benchmark był inny. Prawdziwe roboty, prawdziwe przedmioty, prawdziwe pomieszczenia. I tam Spirit v1.5 pokonał konkurencję.
W grze każdy może być mistrzem. Na prawdziwej drodze liczy się doświadczenie.
Magazyny i centra logistyczne. Amazon, DHL, Allegro — wszyscy testują roboty do sortowania paczek. Spirit v1.5 może przyspieszyć wdrożenia, bo robot szybciej uczy się nowych układów magazynu.
Produkcja. Fabryki potrzebują robotów, które nie tylko powtarzają jeden ruch przez 10 godzin, ale potrafią się dostosować, gdy coś pójdzie nie tak. Brakuje śrubki? Robot znajdzie zamiennik. Linia produkcyjna się zmieniła? Robot się przestawi.
Usługi. Hotele, restauracje, szpitale. Miejsca, gdzie każdy dzień jest inny. Gdzie robot musi obsługiwać ludzi, nie tylko przedmioty. Spirit v1.5 daje podstawy do budowania takich systemów.
I — co może najważniejsze — startupy. Bo teraz nie potrzebujesz dziesiątek milionów na stworzenie własnego modelu AI. Możesz wziąć Spirit v1.5, dostosować go do swojej niszy i wejść na rynek.
To obniża barierę wejścia. I oznacza, że za rok, dwa, zobaczymy dziesiątki nowych zastosowań robotów, o których dziś nawet nie myślimy.
Spirit AI nie zatrzymał się na v1.5. Już pracują nad kolejnymi wersjami. A ponieważ kod jest otwarty, pracują nad nim też setki innych zespołów.
To początek czegoś większego. Robotyka przez lata była domeną wielkich korporacji z gigantycznymi budżetami. Teraz staje się dostępna dla wszystkich.
I to zmienia wszystko.
Przeczytaj też:
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar