Gemini Live rozumie długie rozmowy. 7 komend, które działają
Źródło: Link
Źródło: Link
118 lekcji od zera do eksperta. Bez kodowania.
Google właśnie zaktualizował Gemini do wersji 3.1 Flash Live. Główna zmiana? Model rozumie długie, wielowątkowe rozmowy i odpowiada szybciej niż poprzednie wersje. Nie musisz już dzielić złożonych pytań na kawałki. Nie powtarzasz kontekstu co trzy zdania.
Gemini Live to tryb głosowy asystenta Google. Działa podobnie jak Advanced Voice Mode w ChatGPT – rozmawiasz naturalnie, model reaguje w czasie rzeczywistym. Różnica? Gemini 3.1 Flash Live ma dłuższą pamięć kontekstu i lepiej radzi sobie z przeskakiwaniem między tematami.

Canaltech przetestował komendy głosowe Gemini Live pod kątem produktywności. Sprawdziłem ich listę i wybrałem te, które mają sens w codziennej pracy – bez marketingowego bełkotu.
Komenda: "Podsumuj mi najważniejsze punkty z tego maila".
Gemini Live analizuje treść i wyciąga kluczowe informacje – decyzje, terminy, zadania do wykonania. Działa sprawnie, jeśli wkleisz tekst lub podyktujeszz główne fragmenty. Model nie gubi wątku nawet przy mailach z kilkoma tematami naraz.
Komenda: "Pomóż mi zaplanować dzień – mam spotkanie o 10:00, raport do 15:00 i trzy telefony do klientów".
Gemini układa harmonogram, sugeruje bloki czasowe i przypomina o przerwach. To nie jest magiczne rozwiązanie – jeśli masz chaotyczny kalendarz, pomaga uporządkować myśli zanim otworzysz Google Calendar.

Komenda: "Przypomnij mi kluczowe punkty z ostatniej rozmowy z klientem X i zaproponuj tematy na dzisiejsze spotkanie".
Tutaj Gemini korzysta z wcześniejszych notatek (jeśli je udostępniłeś) lub z informacji, które mu podyktowałeś. Model nie ma dostępu do Twojego CRM-a, więc musisz podać kontekst. Po jego podaniu generuje sensowną agendę.
Komenda: "Znajdź mi najnowsze dane o rynku AI w Polsce i podsumuj w trzech punktach".
Gemini przeszukuje dostępne źródła i wyciąga kluczowe statystyki. Nie zastąpi pełnego researchu – jeśli potrzebujesz szybkiego kontekstu przed rozmową, działa. Pamiętaj tylko, żeby weryfikować liczby w oryginalnych źródłach.
Komenda: "Zamień te notatki na listę zadań z priorytetami".
Dyktujeszz chaotyczne myśli po spotkaniu, Gemini porządkuje je w strukturę: co trzeba zrobić najpierw, co może poczekać, co wymaga decyzji kogoś innego. Przydatne, jeśli masz nawyk robienia notatek głosowych w drodze z biura.

Komenda: "Wyjaśnij mi różnicę między modelem Gemini 3 Pro a 3.1 Flash – Jeśli chodzi o mojej pracy w marketingu".
Gemini 3.1 Flash Live lepiej radzi sobie z pytaniami wymagającymi kontekstu niż poprzednie wersje. Nie musisz tłumaczyć od zera, czym się zajmujesz – model pamięta wcześniejsze fragmenty rozmowy i dopasowuje odpowiedź.
Komenda: "Rzuć mi pięć pomysłów na kampanię produktu X dla grupy docelowej Y".
Gemini generuje propozycje, które możesz dalej rozwijać w dialogu. Nie są to gotowe strategie – jako punkt wyjścia do dyskusji z zespołem działają sprawnie. Model reaguje na Twoje "nie, to nie to" i modyfikuje kierunek w locie.
Główna przewaga to długi kontekst konwersacji. ChatGPT w trybie głosowym też radzi sobie dobrze, ale Gemini 3.1 Flash Live rzadziej "zapomina" wątki z początku rozmowy. Jeśli prowadzisz 15-minutową dyskusję o kilku tematach naraz, Google ma przewagę.
Drugi punkt: integracja z ekosystemem Google. Gemini ma natywny dostęp do Gmail, Kalendarza, Drive'a. Nie musisz ręcznie kopiować treści – model sięga po dane sam (oczywiście po Twojej zgodzie). To oszczędza czas, jeśli i tak pracujesz w Google Workspace.
Trzeci: szybkość reakcji. Flash Live odpowiada zauważalnie szybciej niż standardowy Gemini 3 Pro. Różnica to około 1-2 sekundy na odpowiedź. Nie To przypomina dużo, ale w naturalnej rozmowie to odczuwalne.
Model ma problemy z językiem polskim w trybie głosowym. Rozpoznawanie mowy działa, ale jakość odpowiedzi spada – szczególnie przy branżowym żargonie. Jeśli pracujesz po polsku, lepsze rezultaty daje dyktowanie po angielsku lub pisanie.
Druga sprawa: brak offline'u. Gemini Live wymaga stałego połączenia z internetem. Jeśli Twoje połączenie szwankuje, rozmowa się zacina. Google pracuje nad stabilnością, ale na razie to ograniczenie.
Trzecia kwestia: prywatność. Wszystkie rozmowy trafiają na serwery Google. Firma zapewnia, że nie wykorzystuje ich do treningu modeli bez zgody – jeśli rozmawiasz o wrażliwych danych firmowych, zastanów się dwa razy.
Gemini Live sprawdzi się, jeśli:
Nie ma sensu, jeśli:
Gemini 3.1 Flash Live to solidny krok naprzód w obsłudze głosowej AI. Nie zmienia zasad gry – jeśli już korzystasz z asystentów głosowych, Google daje Ci lepsze narzędzie niż pół roku temu. Siedem komend z tego artykułu to dobry punkt startowy do testów. Sprawdź, które z nich oszczędzają Ci czas – reszta to marketing.
Na podstawie: Canaltech
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar