OpenAI kupuje Sky – asystenta AI, który widzi Twój ekran
Źródło: Link
Źródło: Link
90 minut praktyki na żywo. Pokazuję krok po kroku, jak zacząć z AI bez kodowania.
OpenAI właśnie kupiło startup, który stworzył coś, o czym większość użytkowników marzy od lat – asystenta AI, który naprawdę rozumie, co dzieje się na ekranie komputera. Software Applications, Inc., firma stojąca za Sky, dołącza do portfolio giganta z San Francisco.
Sky to interfejs AI dla macOS wykorzystujący przetwarzanie języka naturalnego do kontrolowania aplikacji. Nie musisz uczyć się specjalnych komend ani skryptów. Po prostu mówisz (lub piszesz) co chcesz zrobić, a Sky analizuje zawartość ekranu i wykonuje odpowiednie akcje w Twoich programach.
Transakcja ta wpisuje się w szerszy trend przejęć startupów AI przez największych graczy rynku. OpenAI, znane dotychczas głównie z modeli językowych, wyraźnie rozszerza swoją strategię o praktyczne narzędzia działające bezpośrednio w systemie operacyjnym. Kwota transakcji nie została ujawniona, ale analitycy szacują, że może sięgać dziesiątek milionów dolarów, biorąc pod uwagę zaawansowanie technologii i potencjał rynkowy.
Kluczowa różnica między Sky a tradycyjnymi asystentami? Możliwość analizy tego, co aktualnie wyświetla się na ekranie. To nie jest kolejny chatbot – to narzędzie rozumiejące kontekst Twojej pracy. Pracujesz w arkuszu kalkulacyjnym i prosisz o utworzenie wykresu na podstawie konkretnych danych? Sky wie, gdzie te dane się znajdują i jak je przetworzyć.
technologia opiera się na wizyjnych modelach AI (computer vision) połączonych z możliwościami wykonywania akcji na poziomie systemu operacyjnego. Sky może klikać przyciski, wypełniać formularze, przenosić pliki między aplikacjami – wszystko na Twoje polecenie.
W praktyce oznacza to, że możesz poprosić Sky o zadania typu: "Wyślij ten raport do Marka i zapisz kopię w folderze projekty", a asystent sam otworzy klienta pocztowego, załączy odpowiedni plik widoczny na ekranie, wypełni adresata i wykona całą sekwencję działań. Albo: "Stwórz prezentację z tych trzech obrazków i dodaj nagłówki" – Sky rozpozna pliki graficzne, uruchomi odpowiednią aplikację i zbuduje podstawową strukturę slajdów.
System działa w czasie rzeczywistym, co oznacza, że może reagować na zmiany zachodzące na ekranie. Jeśli podczas pracy pojawi się powiadomienie lub zmieni się zawartość okna, Sky dostosowuje swoje działania do nowej sytuacji. To poziom kontekstowej świadomości, którego brakowało dotychczasowym rozwiązaniom automatyzacji.
Przejęcie Sky to jasny sygnał, że OpenAI poważnie traktuje rozwój agentów AI – systemów, które nie tylko rozmawiają, ale faktycznie działają w imieniu użytkownika. Dotychczas firma koncentrowała się głównie na modelach językowych i chatbotach. Teraz wchodzi na pole automatyzacji zadań na poziomie systemu operacyjnego.
Wybór macOS jako platformy startowej nie jest przypadkowy. Użytkownicy Mac to często profesjonaliści z sektorów kreatywnych i technologicznych – grupa, która może najbardziej skorzystać z zaawansowanej automatyzacji (i która płaci za premium narzędzia bez mrugnięcia okiem).
MacOS oferuje też bardziej zunifikowane środowisko programistyczne niż Windows, co ułatwia budowanie narzędzi działających spójnie w różnych aplikacjach. Apple od lat rozwija API dostępności, które Sky wykorzystuje do interakcji z systemem. To solidny fundament techniczny, który pozwala na głębszą integrację bez naruszania bezpieczeństwa systemu.
Dodatkowo ekosystem Mac charakteryzuje się mniejszą fragmentacją – mniej wersji systemu w użyciu, bardziej przewidywalne zachowania aplikacji. Dla startupu budującego skomplikowane narzędzie AI to ogromna zaleta. Dopiero po opanowaniu jednej platformy ma sens ekspansja na Windows czy Linux.
Na razie trudno powiedzieć, jak szybko OpenAI zintegruje technologię Sky ze swoimi produktami. Możliwe scenariusze? Funkcje kontroli systemu w ChatGPT, dedykowana aplikacja desktop z głębszą integracją z macOS, albo całkowicie nowe narzędzie dla biznesu.
Najbardziej prawdopodobny wydaje się wariant hybrydowy – rozszerzenie ChatGPT o możliwości agentowe, dostępne początkowo dla subskrybentów planów Plus i Enterprise. OpenAI może też zdecydować się na osobny produkt pozycjonowany jako narzędzie produktywności dla profesjonalistów, konkurujące bezpośrednio z rozwiązaniami typu Zapier czy Make, ale działające lokalnie na komputerze użytkownika.
Kwestie prywatności będą kluczowe. Sky musi widzieć zawartość ekranu, co oznacza dostęp do potencjalnie wrażliwych danych. OpenAI będzie musiało przekonać użytkowników, że przetwarzanie odbywa się bezpiecznie – prawdopodobnie lokalnie na urządzeniu, bez wysyłania zrzutów ekranu do chmury. To techniczne wyzwanie, ale możliwe dzięki mniejszym modelom wizyjnym, które można uruchomić na współczesnych procesorach Apple Silicon.
Jedno jest pewne – granica między rozmową z AI a zlecaniem mu konkretnych zadań właśnie się zaciera. Zamiast przełączać się między aplikacjami i ręcznie kopiować dane, będziesz mógł po prostu powiedzieć, co ma się wydarzyć. Czy to koniec nudnych, powtarzalnych zadań? Czas pokaże, jak OpenAI wykorzysta swoje najnowsze zakupy.
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar