Modele AI
Modele AI · 2 min czytania · 13 listopada 2025

GPT-5.1 z nowymi testami bezpieczeństwa emocjonalnego

GPT-5.1 z nowymi testami bezpieczeństwa emocjonalnego - LLM

Źródło: Link

OpenAI właśnie opublikowało zaktualizowaną kartę systemową dla dwóch wariantów GPT-5.1 – Instant i Thinking. To nie jest kolejny dokument "dla galerii". Firma po raz pierwszy testuje, jak jej modele wpływają na zdrowie psychiczne użytkowników. I czy mogą wywoływać uzależnienie emocjonalne.

Dwa modele, dwa różne profile ryzyka

GPT-5.1 Instant to szybka wersja do codziennych zadań. GPT-5.1 Thinking został zaprojektowany do złożonego rozumowania (i faktycznie "myśli" dłużej przed odpowiedzią). Addendum do karty systemowej pokazuje, jak różnią się ich profile ryzyka.

Instant przeszedł standardowe testy: dezinformacja, treści szkodliwe, stronniczość. Thinking dostał dodatkowy pakiet – sprawdzano jego zdolności do autonomicznego działania i potencjalne zachowania manipulacyjne.

Zdrowie psychiczne jako kategoria ewaluacji

Najbardziej interesujące są nowe kategorie ewaluacji. OpenAI po raz pierwszy włączyło do karty systemowej ocenę wpływu na zdrowie psychiczne i ryzyko uzależnienia emocjonalnego. Brzmi poważnie? Bo jest.

Firma sprawdzała, czy długotrwałe interakcje z modelem mogą prowadzić do nadmiernej zależności emocjonalnej użytkowników. Konkretne wyniki testów nie zostały ujawnione w pełnym zakresie (typowe dla OpenAI). Sama obecność tych kategorii w oficjalnym dokumencie to jednak sygnał. Firma przyznaje, że modele językowe mogą wpływać na psychikę – zwłaszcza tych użytkowników, którzy traktują je jako źródło wsparcia emocjonalnego.

Iteracyjne podejście do bezpieczeństwa

Addendum podkreśla, że bezpieczeństwo to proces, nie jednorazowy test. OpenAI aktualizuje metryki w miarę pojawiania się nowych zagrożeń i przypadków użycia.

GPT-5.1 Thinking przeszedł rozszerzone testy autonomii. Sprawdzano, czy model może samodzielnie planować długoterminowe działania bez nadzoru człowieka. Przy jego zdolnościach rozumowania mogłoby to być problematyczne.

Dokument zawiera także zaktualizowane dane o wydajności obu modeli w standardowych benchmarkach: odporność na jailbreaking, generowanie treści szkodliwych i utrzymywanie granic etycznych w różnych scenariuszach.

Co to oznacza dla Ciebie jako użytkownika

Jeśli korzystasz z GPT-5.1, możesz spodziewać się bardziej konserwatywnych odpowiedzi w tematach związanych ze zdrowiem psychicznym. Model został przeszkolony, by rozpoznawać sytuacje, w których możesz potrzebować profesjonalnej pomocy. I kierować Cię do odpowiednich zasobów zamiast próbować "zastąpić" terapeutę.

Dla deweloperów budujących aplikacje na GPT-5.1 to sygnał, by uwzględnić te aspekty w projektowaniu doświadczeń użytkownika. Zwłaszcza w aplikacjach edukacyjnych, coachingowych czy wszelkich innych, gdzie interakcje mogą być długotrwałe i osobiste.

Źródła

Informacje o artykule

Ten temat omawiam szerzej na webinarze

90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.

Zapisz sie na webinar
Udostępnij:
Jan Gajos

Ekspert AI & Founder, AI Evolution

Pasjonat sztucznej inteligencji, który od ponad 15 lat działa z sukcesem biznesowo i szkoleniowo. Wprowadzam AI do swoich firm oraz codziennego życia. Fascynują mnie nowe technologie, gry wideo i składanie klocków Lego – tam też widzę logikę i kreatywność, które AI potrafi wzmacniać. Wierzę, że dobrze użyta sztuczna inteligencja to nie ogłupiające ułatwienie, lecz prawdziwy przełom w sposobie, w jaki myślimy, tworzymy i pracujemy.