ChatGPT połączył głos z tekstem. W jednym oknie
Źródło: Link
Źródło: Link
Pamiętasz to irytujące przełączanie między trybem tekstowym a głosowym w ChatGPT?
No więc — koniec z tym.
OpenAI właśnie to zlikwidowało. Od teraz głos i tekst działają w tym samym oknie. Mówisz — widzisz odpowiedź na ekranie. W czasie rzeczywistym. Razem z grafiką, kodem, czy czymkolwiek innym, co AI akurat generuje.
Do tej pory tryb głosowy w ChatGPT był osobnym bytem. Klikałeś ikonę, interfejs się zmieniał, traciłeś kontekst wizualny. Chciałeś coś zobaczyć? Wracałeś do tekstu.
Teraz wszystko dzieje się równolegle.
Zadajesz pytanie głosowo, a odpowiedź pojawia się na ekranie — słyszysz ją i widzisz jednocześnie. ChatGPT generuje wykres? Widzisz go od razu. Kod? Też. Obrazek? Analogicznie.
Może brzmieć jak drobnostka. Zmienia jednak sposób interakcji. Bo nagle rozmowa z AI staje się... naturalniejsza. Mniej klikania, więcej płynności.
OpenAI od miesięcy chwali się multimodalnością GPT-4. Tekst, obraz, dźwięk — wszystko w jednym modelu.
Problem? Interfejs nie nadążał za możliwościami.
Teraz nadążył.
Przykład: pytasz głosowo o analizę danych. ChatGPT odpowiada — słyszysz wyjaśnienie, widzisz tabelę i wykres. Bez przerywania, bez przełączania widoków. Kontekst zostaje. Uwaga też.
Dla użytkowników mobilnych to jeszcze większa zmiana. Telefon w kieszeni, słuchawki w uszach, a na ekranie — pełna transkrypcja i wizualizacje. Idealne do nauki, burzy mózgów czy szybkiego researchu w drodze.
Przede wszystkim — sposób pracy.
Wcześniej tryb głosowy był dla "rozmów". Tekst — do "poważnych" zadań. Teraz granica znika. Możesz dyktować prompt, widzieć efekt, poprawiać głosowo, znowu patrzeć na wynik. Bez wychodzenia z flow.
Dla osób z dysleksją, problemami wzrokowymi czy po prostu preferujących audio — to game changer. Dostępność AI nagle staje się... dostępniejsza.
I jeszcze jedno: konkurencja nie śpi. Google Gemini, Claude od Anthropic — wszyscy pracują nad płynniejszymi interfejsami. OpenAI właśnie podbił stawkę.
Pewnie nie.
Użytkownicy już pytają o kolejne rzeczy: współdzielenie ekranu podczas rozmowy głosowej, adnotacje na obrazach w czasie rzeczywistym, lepsze wsparcie dla języków poza angielskim.
To jednak dobry krok. Bo najlepsze technologie to te, o których przestajesz myśleć — po prostu działają. I właśnie w tym kierunku idzie ChatGPT.
Sprawdź sam — jeśli masz dostęp do trybu głosowego (Plus, Team, Enterprise), zaktualizuj aplikację. Nowy interfejs czeka.
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar