Jak wykryć tekst napisany przez AI - 3 skuteczne narzędzia

Dostajesz CV, artykuł od freelancera albo esej od studenta. Czytasz i myślisz: "to wygląda jak ChatGPT". Jak to sprawdzić? I czy w ogóle da się to sprawdzić?

Narzędzia do detekcji tekstów generowanych przez AI obiecują prostą odpowiedź. Problem w tym, że żadne z nich nie działa idealnie. Niektóre działają lepiej niż inne.

Detekcja AI-generated text - granica między człowiekiem a maszyną rozmywa się

Trzy narzędzia, które warto znać

Na rynku jest kilkadziesiąt detektorów AI. Większość to śmieciowe apki, które zgadują na podstawie "To przypomina AI". Trzy wyróżniają się podejściem i bazą użytkowników.

GPTZero - dla edukacji

Powstało na uniwersytecie Princeton, teraz używają go szkoły i uczelnie. Analizuje "perplexity" (jak bardzo tekst zaskakuje model) i "burstiness" (czy zdania mają różną długość i złożoność). Ludzie piszą chaotycznie, AI równo.

Zasada: jeśli tekst jest zbyt przewidywalny dla modelu językowego, prawdopodobnie został przez model językowy napisany. Logiczne - choć nie zawsze trafne.

Originality.ai - dla content marketingu

Płatne narzędzie (0,01 USD za 100 słów) skierowane do agencji i firm. Oprócz detekcji AI sprawdza plagiat. Twórcy twierdzą, że ma 99% accuracy. W praktyce to zależy od tego, jak dobrze ktoś podrasował prompt.

Używają własnego modelu wytrenowanego na milionach przykładów tekstów ludzkich i AI. Problem: model był trenowany głównie na GPT-3 i wczesnym GPT-4. Nowsze modele (Claude Opus 4.7, Gemini 3.5) piszą bardziej "po ludzku".

Turnitin - dla akademii

Gigant w sprawdzaniu plagiatów dodał detekcję AI. Używają go uniwersytety na całym świecie. Analizuje fragmenty tekstu i przypisuje im procent prawdopodobieństwa, że pochodzą z AI.

Zaleta: integracja z systemami uczelni. Wada: studenci już znaleźli sposoby na obejście (parafrazowanie przez inny model, mieszanie źródeł, ręczne poprawki co kilka zdań).

Interfejs typowego detektora AI - procenty, wykresy i... wątpliwości

Skuteczność - liczby nie kłamią (choć nie mówią całej prawdy)

Twórcy narzędzi podają accuracy 95-99%. W kontrolowanych testach - owszem. W realu - zupełnie inna historia.

GPTZero w badaniach niezależnych wykrył około 80% tekstów z czystego ChatGPT. Gdy ktoś poprawił tekst ręcznie (zmienił co trzecie zdanie, dodał przykłady, przestawił akapity) - accuracy spadło do 40-50%.

Originality.ai radzi sobie lepiej z hybrydami (tekst AI + ludzkie poprawki). Ma problem z fałszywymi pozytywami. Zdarza się, że tekst napisany przez człowieka, który po prostu pisze schematycznie, zostaje oznaczony jako AI.

Turnitin nie publikuje dokładnych liczb. Nauczyciele akademiccy raportują podobne problemy - narzędzie dobrze wykrywa leniwe copy-paste z ChatGPT, gorzej radzi sobie z przemyślanym użyciem AI jako narzędzia roboczego.

Dlaczego żaden detektor nie jest pewny

Modele językowe uczą się pisać jak ludzie. Im lepszy model, tym trudniej go wykryć. Claude Opus 4.7 czy Gemini 3.5 potrafią naśladować styl, dodawać błędy, zmieniać rytm zdań.

Detektory działają na zasadzie statystycznej - szukają wzorców typowych dla AI. Te wzorce zmieniają się z każdą nową wersją modelu. To wyścig zbrojeń, w którym detektory zawsze są krok w tyle.

Dodatkowo: jeśli ktoś użył AI do researchu, napisał szkic ręcznie, potem poprawił przez AI, a na końcu jeszcze raz ręcznie - gdzie jest granica? Czy to tekst AI, czy ludzki?

Wyścig między generacją a detekcją - kto wygra?

Ograniczenia, o których nikt głośno nie mówi

Narzędzia do detekcji AI mają fundamentalny problem: nie wiedzą, co wykrywają. Nie "widzą" AI - widzą wzorce statystyczne. Te wzorce mogą pochodzić z wielu źródeł.

Fałszywe pozytywy niszczą zaufanie

Osoba z autyzmem pisze strukturalnie, używa powtórzeń, unika metafor. Detektor: "90% AI". Osoba ucząca się języka pisze prosto, bez idiomów. Detektor: "85% AI". Ktoś pisze techniczny raport według szablonu. Detektor: "95% AI".

Problem nie jest teoretyczny. Studenci już zostali niesłusznie oskarżeni o oszustwo na podstawie wyników z detektorów. Freelancerzy stracili kontrakty. Etyczne implikacje są realne.

Język ma znaczenie

Większość detektorów była trenowana głównie na angielskim. Polska, czeska, węgierska wersja tego samego tekstu? Accuracy spada dramatycznie. GPTZero oficjalnie wspiera tylko angielski. Originality.ai dodało kilka języków - skuteczność nie jest porównywalna.

Jeśli sprawdzasz polski tekst - wyniki traktuj z jeszcze większą ostrożnością niż przy angielskim.

Brak standardu prawnego

Żadne narzędzie nie jest certyfikowane jako dowód. Nie ma regulacji określających, kiedy detektor może być użyty do podjęcia decyzji (zwolnienie, ocena, odrzucenie aplikacji). AI Act w Europie zaczyna to porządkować - jeszcze nie ma jasnych wytycznych dla detektorów.

Używasz detektora w firmie do oceny kandydatów? Prawnie stoisz na grząskim gruncie. Zwłaszcza jeśli odrzucisz kogoś tylko na podstawie wyniku z narzędzia.

Jak używać detektorów w praktyce

Detektory AI to narzędzie wspomagające, nie wyrok. Możesz ich użyć jako pierwszego filtra - nigdy jako jedynego dowodu.

Dostajesz 85% AI detection? To sygnał do głębszej analizy, nie do odrzucenia tekstu. Porozmawiaj z autorem. Poproś o wyjaśnienie procesu. Sprawdź inne prace.

W firmach, które wdrażają AI, najlepsze praktyki to:

Używaj detektora jako jednego z wielu sygnałów, nie jako decydującego
Ustal próg (np. "sprawdzamy ręcznie wszystko powyżej 70%") i trzymaj się go konsekwentnie
Dokumentuj proces - jeśli ktoś zakwestionuje decyzję, musisz pokazać, że nie opierałeś się tylko na detektorze
Aktualizuj narzędzia - stare wersje nie radzą sobie z nowymi modelami

Najważniejsze: zamiast walczyć z AI, zastanów się, czy problem nie leży gdzie indziej. Jeśli student może zdać egzamin kopiując z ChatGPT - może egzamin jest źle zaprojektowany? Jeśli freelancer dostarcza AI-generated content zamiast własnej pracy - może brief był zbyt ogólny?

Naucz się używać AI zamiast go wykrywać

Zamiast bać się, że ktoś używa AI - naucz się go używać lepiej niż konkurencja. W kursie AI Evolution pokazuję, jak pracować z modelami językowymi tak, żeby wynik był Twój - nie maszynowy. Od promptów przez edycję po hybrydowy workflow. 118 lekcji, od zera do eksperta.

Sprawdź AI Evolution →

Najczęstsze pytania

Czy darmowe detektory AI są skuteczne?

GPTZero ma darmową wersję, która działa przyzwoicie na prostych tekstach z ChatGPT. Przy hybrydach (AI + człowiek) skuteczność spada do 40-50%. Płatne narzędzia jak Originality.ai są lepsze - wciąż nie idealne. Żaden detektor nie daje 100% pewności.

Jak sprawdzić tekst po polsku?

Większość detektorów była trenowana na angielskim. GPTZero oficjalnie wspiera tylko angielski, Originality.ai dodało kilka języków - accuracy jest niższa. Jeśli musisz sprawdzić polski tekst - użyj kilku narzędzi i porównaj wyniki. Pamiętaj, że są mniej wiarygodne niż przy angielskim.

Czy można obejść detektory AI?

Tak. Ręczne poprawki co kilka zdań, parafrazowanie przez inny model, mieszanie źródeł - to wystarczy, żeby zmylić większość detektorów. Im więcej ludzkiej pracy w tekście, tym trudniej wykryć AI. Dlatego detektory działają tylko na leniwe copy-paste, nie na przemyślane użycie AI jako narzędzia.

Czy wynik z detektora to dowód w sądzie?

Nie. Żadne narzędzie nie jest certyfikowane jako dowód. Nie ma standardu prawnego określającego, kiedy detektor może być użyty do podjęcia decyzji. AI Act w Europie zaczyna to regulować - jeszcze nie ma jasnych wytycznych. Używaj detektorów jako sygnału, nie jako wyroku.

Na podstawie: AI Evolution Blog

Jak wykryć tekst napisany przez AI - 3 narzędzia, które działają

Powiązane tematy