AWS: agenci AI klikają za Ciebie w przeglądarce
Źródło: Link
Źródło: Link
Vivomeal — działający produkt zbudowany na AI. Przykład tego, co wyjdzie po kursie.
Pracownicy w korporacjach przeskakują między ośmioma różnymi aplikacjami webowymi dziennie. Kopiują dane z CRM do Excela. Logują się do portalu HR. Sprawdzają coś w systemie księgowym. Wracają do CRM.
AWS właśnie pokazał rozwiązanie: agenta AI, który robi to wszystko automatycznie.
Nie kolejny chatbot. System, który faktycznie porusza się po stronach, klika przyciski i wypełnia formularze — dokładnie tak, jak Ty byś to zrobił.
asystenta, który dostaje zadanie: "Pobierz wszystkie faktury z ostatniego miesiąca i wpisz kwoty do arkusza".
Tradycyjne oprogramowanie potrzebowałoby API — specjalnego "wejścia" do każdej aplikacji. Problem? Większość firmowych systemów takich wejść nie ma. Albo są przestarzałe. Albo nikt nie wie, jak z nich korzystać.
Agent od AWS działa inaczej.
Otwiera przeglądarkę. Widzi to samo co Ty — przyciski, pola tekstowe, menu. I nawiguje przez nie samodzielnie.
Technologia nazywa się browser automation — automatyzacja przeglądarki. Tyle że w wersji sterowanej przez AI, nie przez sztywny skrypt.
Stare rozwiązania do automatyzacji (Selenium, UiPath) działały według scenariusza: "Kliknij tutaj, potem tam, wpisz to".
Zmienił się układ strony? Bot przestawał działać.
Pojawiło się okienko z ciasteczkami? Bot nie wiedział, co zrobić.
Agent AI od AWS wykorzystuje model językowy (LLM — ten sam typ "mózgu" co ChatGPT), żeby rozumieć kontekst. Widzi przycisk "Zaloguj się" i wie, że to ten przycisk, nawet jeśli zmienił kolor albo pozycję.
Może też podejmować decyzje. "Jeśli faktura przekracza 10 tysięcy złotych, wyślij ją do zatwierdzenia menedżerowi" — to nie jest IF-THEN z kodu. To rozumowanie.
Zespół finansowy w firmie spędza 3 godziny dziennie na przepisywaniu danych między systemami. Agent robi to w 15 minut.
Dział HR musi sprawdzić status wniosków urlopowych w starym portalu, który nie ma eksportu do Excela. Agent loguje się, przechodzi przez wszystkie zakładki, zbiera dane.
Compliance officer musi co tydzień weryfikować, czy wszystkie faktury mają odpowiednie zatwierdzenia w trzech różnych systemach. Agent robi audyt automatycznie i wysyła raport.
To nie science fiction — AWS publikuje konkretną architekturę. Używają Amazon Bedrock (ich platformy do AI), łączą z narzędziami do kontrolowania przeglądarki i dodają warstwę bezpieczeństwa.
Pytanie, które pojawia się natychmiast: co jeśli agent zrobi coś nie tak?
AWS podkreśla trzy rzeczy.
Po pierwsze: agent działa w kontrolowanym środowisku. Nie ma dostępu do całego internetu — tylko do wskazanych aplikacji firmowych.
Po drugie: każda akcja jest logowana. Można dokładnie zobaczyć, co agent kliknął, kiedy i dlaczego.
Po trzecie: można ustawić wymagania zatwierdzenia. Agent przygotowuje akcję (np. "Wyślij fakturę do zapłaty"), ale człowiek musi ją zaakceptować, zanim się wykona.
To odpowiedź na największy strach firm: utratę kontroli.
Nie dla każdego.
Jeśli Twoja firma ma nowoczesne systemy z API i wszystko jest zintegrowane — prawdopodobnie nie potrzebujesz agenta przeglądarkowego.
Ma to sens tam, gdzie:
Używasz starych systemów (legacy software), które nie mają API.
Pracujesz z wieloma zewnętrznymi portalami — dostawców, klientów, urzędów.
Masz procesy, które wymagają "ludzkiego osądu", ale są powtarzalne.
Przykład z życia: firma logistyczna musi codziennie sprawdzać statusy przesyłek u 15 różnych przewoźników. Każdy ma inny portal. Żaden nie ma API. Pracownik spędza na tym 2 godziny. Agent robi to w 10 minut.
To przypomina zagrożenie dla stanowisk administracyjnych?
Niekoniecznie. Raczej zmiana ról.
Zamiast ręcznie kopiować dane, pracownik nadzoruje agenta i zajmuje się wyjątkami. Zamiast klikać, analizuje wyniki i podejmuje strategiczne decyzje.
To jak przejście od ręcznego liczenia w Excelu do pisania formuł. Nikt nie płacze za czasami, gdy wszystko trzeba było liczyć na kalkulatorze.
Ale — i to duże "ale" — wymaga to przekwalifikowania. Osoby, które dziś wykonują repetytywne zadania, będą musiały nauczyć się zarządzać automatyzacją.
AWS publikuje to jako case study i architekturę referencyjną — nie jako gotowy produkt do kupienia z półki.
Oznacza to, że firmy z zespołami technicznymi mogą to zbudować już teraz. Dla reszty — pewnie pojawią się wkrótce gotowe rozwiązania od partnerów AWS.
Trend jest wyraźny: po chatbotach przychodzi czas na agentów, którzy faktycznie działają w Twoim imieniu.
I nie tylko rozmawiają.
Klikają.
Przeczytaj też:
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar