Modele AI
Modele AI · 2 min czytania · 26 listopada 2025

ChatGPT połączył głos z tekstem. W jednym oknie

ChatGPT połączył głos z tekstem. W jednym oknie

Źródło: Link

Pamiętasz to irytujące przełączanie między trybem tekstowym a głosowym w ChatGPT?

No więc — koniec z tym.

OpenAI właśnie to zlikwidowało. Od teraz głos i tekst działają w tym samym oknie. Mówisz — widzisz odpowiedź na ekranie. W czasie rzeczywistym. Razem z grafiką, kodem, czy czymkolwiek innym, co AI akurat generuje.

Koniec z przełączaniem ekranów

Do tej pory tryb głosowy w ChatGPT był osobnym bytem. Klikałeś ikonę, interfejs się zmieniał, traciłeś kontekst wizualny. Chciałeś coś zobaczyć? Wracałeś do tekstu.

Teraz wszystko dzieje się równolegle.

Zadajesz pytanie głosowo, a odpowiedź pojawia się na ekranie — słyszysz ją i widzisz jednocześnie. ChatGPT generuje wykres? Widzisz go od razu. Kod? Też. Obrazek? Analogicznie.

Może brzmieć jak drobnostka. Zmienia jednak sposób interakcji. Bo nagle rozmowa z AI staje się... naturalniejsza. Mniej klikania, więcej płynności.

Multimodalność wreszcie w interfejsie

OpenAI od miesięcy chwali się multimodalnością GPT-4. Tekst, obraz, dźwięk — wszystko w jednym modelu.

Problem? Interfejs nie nadążał za możliwościami.

Teraz nadążył.

Przykład: pytasz głosowo o analizę danych. ChatGPT odpowiada — słyszysz wyjaśnienie, widzisz tabelę i wykres. Bez przerywania, bez przełączania widoków. Kontekst zostaje. Uwaga też.

Dla użytkowników mobilnych to jeszcze większa zmiana. Telefon w kieszeni, słuchawki w uszach, a na ekranie — pełna transkrypcja i wizualizacje. Idealne do nauki, burzy mózgów czy szybkiego researchu w drodze.

Co to zmienia w praktyce?

Przede wszystkim — sposób pracy.

Wcześniej tryb głosowy był dla "rozmów". Tekst — do "poważnych" zadań. Teraz granica znika. Możesz dyktować prompt, widzieć efekt, poprawiać głosowo, znowu patrzeć na wynik. Bez wychodzenia z flow.

Dla osób z dysleksją, problemami wzrokowymi czy po prostu preferujących audio — to game changer. Dostępność AI nagle staje się... dostępniejsza.

I jeszcze jedno: konkurencja nie śpi. Google Gemini, Claude od Anthropic — wszyscy pracują nad płynniejszymi interfejsami. OpenAI właśnie podbił stawkę.

Czy to wystarczy?

Pewnie nie.

Użytkownicy już pytają o kolejne rzeczy: współdzielenie ekranu podczas rozmowy głosowej, adnotacje na obrazach w czasie rzeczywistym, lepsze wsparcie dla języków poza angielskim.

To jednak dobry krok. Bo najlepsze technologie to te, o których przestajesz myśleć — po prostu działają. I właśnie w tym kierunku idzie ChatGPT.

Sprawdź sam — jeśli masz dostęp do trybu głosowego (Plus, Team, Enterprise), zaktualizuj aplikację. Nowy interfejs czeka.

Źródła

Informacje o artykule

Ten temat omawiam szerzej na webinarze

90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.

Zapisz sie na webinar
Udostępnij:
Jan Gajos

Ekspert AI & Founder, AI Evolution

Pasjonat sztucznej inteligencji, który od ponad 15 lat działa z sukcesem biznesowo i szkoleniowo. Wprowadzam AI do swoich firm oraz codziennego życia. Fascynują mnie nowe technologie, gry wideo i składanie klocków Lego – tam też widzę logikę i kreatywność, które AI potrafi wzmacniać. Wierzę, że dobrze użyta sztuczna inteligencja to nie ogłupiające ułatwienie, lecz prawdziwy przełom w sposobie, w jaki myślimy, tworzymy i pracujemy.