Gemini generuje muzykę AI w 30 sekund. Lyria 3 dostępna po polsku
Źródło: Link
Źródło: Link
118 lekcji od zera do eksperta. Bez kodowania.
Google właśnie wbudował generator muzyki AI bezpośrednio w Gemini. Nie potrzebujesz osobnej aplikacji. Nie musisz czekać na dostęp do beta testów. Otwierasz chatbota, wpisujesz prompt – i dostajesz 30-sekundowy utwór. Po polsku.
Model nazywa się Lyria 3. To trzecia generacja technologii muzycznej Google'a. Wcześniej był dostępny tylko dla wybranych twórców w zamkniętym środowisku Music AI Sandbox. Teraz każdy użytkownik Gemini może go użyć.
Mechanizm jest prosty: wpisujesz tekstowy opis tego, co chcesz usłyszeć. Lyria 3 analizuje prompt i generuje 30-sekundowy fragment muzyczny. Możesz określić gatunek, tempo, nastrój, instrumentację – model rozumie polskie opisy.
Przykłady promptów, które działają:
Model nie tworzy piosenek z tekstem – generuje instrumentalne podkłady muzyczne. To ważne rozróżnienie. Jeśli szukasz AI, które pisze pełne piosenki z wokalem, Lyria 3 ma też inne zastosowania, ale w Gemini dostępna jest tylko wersja instrumentalna.
Każdy wygenerowany utwór trwa dokładnie 30 sekund. To nie przypadek. Google świadomie ograniczył długość, prawdopodobnie z dwóch powodów: obciążenie serwerów i kwestie prawne związane z prawami autorskimi do dłuższych kompozycji.
30 sekund wystarczy, żeby stworzyć intro do podcastu, dźwięk powiadomienia, podkład do krótkiego video na social media. Za mało na pełny utwór muzyczny. Google celuje w szybkie, użytkowe zastosowania – nie w konkurencję dla Spotify.
Lyria 3 to trzecia iteracja modelu. Pierwsza wersja (Lyria 1) pojawiła się w 2023 roku jako eksperyment wewnętrzny. Lyria 2 trafiła do Music AI Sandbox – zamkniętego środowiska dla producentów muzycznych i twórców treści.
Kluczowe zmiany w Lyria 3:
Według informacji z Heise Online, Lyria 3 wykorzystuje architekturę transformerową podobną do dużych modeli językowych. Zamiast tokenów tekstowych przetwarza reprezentacje dźwiękowe. To pozwala modelowi „rozumieć” strukturę muzyczną – rytm, harmonię, dynamikę.
Funkcja jest dostępna w aplikacji mobilnej Gemini (Android i iOS) oraz w wersji webowej. Nie musisz mieć płatnej subskrypcji – działa na darmowym planie. Google udostępnił ją globalnie, w tym w Polsce.
Praktyczne zastosowania, które sprawdziłem:
Czego Lyria 3 NIE robi dobrze: długich, złożonych kompozycji z wieloma sekcjami. 30 sekund to za mało, żeby zbudować pełną strukturę zwrotka-refren-bridge. Model działa najlepiej przy prostych, jednolitych nastrojowo fragmentach.
Google oznacza każdy wygenerowany utwór cyfrowym watermarkiem SynthID. To niewidoczna sygnatura dźwiękowa, która identyfikuje muzykę jako wygenerowaną przez AI. Watermark przetrwa kompresję MP3, edycję w DAW, nawet nagranie przez mikrofon.
Kwestia praw autorskich: według warunków użytkowania Gemini, masz prawo używać wygenerowanej muzyki do celów osobistych i komercyjnych. Google nie rości sobie praw do utworów. Ale – i to ważne – nie gwarantuje, że muzyka nie narusza praw osób trzecich.
Lyria 3 trenowano na dużym zbiorze nagrań muzycznych. Google nie ujawnił szczegółów licencjonowania tego datasetu. To oznacza potencjalne ryzyko prawne, jeśli wygenerowany utwór będzie zbyt podobny do istniejącej kompozycji. Dla zastosowań komercyjnych warto mieć to na uwadze.
Jeśli tworzysz treści wideo, podcasty, prezentacje – otwórz Gemini i wygeneruj 5 różnych podkładów muzycznych. Sprawdź, czy któryś pasuje do Twojego projektu. Zajmie Ci to 10 minut.
Konkretny test, który możesz zrobić teraz:
Jeśli potrzebujesz dłuższych utworów, możesz wygenerować kilka 30-sekundowych fragmentów i połączyć je w darmowym edytorze audio jak Audacity. To nie da Ci pełnej spójności kompozycyjnej (przejścia między fragmentami mogą być nienaturalne), ale dla prostych zastosowań może wystarczyć.
Lyria 3 to kolejny krok w integracji generatywnego AI z narzędziami, których używasz codziennie. Podobnie jak Claude Sonnet 4.6 rozszerza możliwości chatbotów, Google rozszerza Gemini o funkcje, które wcześniej wymagały osobnych aplikacji. Trend jest jasny: AI przestaje być zestawem wyspecjalizowanych narzędzi, a staje się uniwersalnym interfejsem do różnych zadań.
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar