Jak wykryć tekst napisany przez AI - 3 narzędzia, które działają
Źródło: Link
Źródło: Link
90 minut praktyki na żywo. Pokazuję krok po kroku, jak zacząć z AI bez kodowania.
Dostajesz CV, artykuł od freelancera albo esej od studenta. Czytasz i myślisz: "to wygląda jak ChatGPT". Jak to sprawdzić? I czy w ogóle da się to sprawdzić?
Narzędzia do detekcji tekstów generowanych przez AI obiecują prostą odpowiedź. Problem w tym, że żadne z nich nie działa idealnie. Niektóre działają lepiej niż inne.

Na rynku jest kilkadziesiąt detektorów AI. Większość to śmieciowe apki, które zgadują na podstawie "To przypomina AI". Trzy wyróżniają się podejściem i bazą użytkowników.
Powstało na uniwersytecie Princeton, teraz używają go szkoły i uczelnie. Analizuje "perplexity" (jak bardzo tekst zaskakuje model) i "burstiness" (czy zdania mają różną długość i złożoność). Ludzie piszą chaotycznie, AI równo.
Zasada: jeśli tekst jest zbyt przewidywalny dla modelu językowego, prawdopodobnie został przez model językowy napisany. Logiczne - choć nie zawsze trafne.
Płatne narzędzie (0,01 USD za 100 słów) skierowane do agencji i firm. Oprócz detekcji AI sprawdza plagiat. Twórcy twierdzą, że ma 99% accuracy. W praktyce to zależy od tego, jak dobrze ktoś podrasował prompt.
Używają własnego modelu wytrenowanego na milionach przykładów tekstów ludzkich i AI. Problem: model był trenowany głównie na GPT-3 i wczesnym GPT-4. Nowsze modele (Claude Opus 4.7, Gemini 3.5) piszą bardziej "po ludzku".
Gigant w sprawdzaniu plagiatów dodał detekcję AI. Używają go uniwersytety na całym świecie. Analizuje fragmenty tekstu i przypisuje im procent prawdopodobieństwa, że pochodzą z AI.
Zaleta: integracja z systemami uczelni. Wada: studenci już znaleźli sposoby na obejście (parafrazowanie przez inny model, mieszanie źródeł, ręczne poprawki co kilka zdań).

Twórcy narzędzi podają accuracy 95-99%. W kontrolowanych testach - owszem. W realu - zupełnie inna historia.
GPTZero w badaniach niezależnych wykrył około 80% tekstów z czystego ChatGPT. Gdy ktoś poprawił tekst ręcznie (zmienił co trzecie zdanie, dodał przykłady, przestawił akapity) - accuracy spadło do 40-50%.
Originality.ai radzi sobie lepiej z hybrydami (tekst AI + ludzkie poprawki). Ma problem z fałszywymi pozytywami. Zdarza się, że tekst napisany przez człowieka, który po prostu pisze schematycznie, zostaje oznaczony jako AI.
Turnitin nie publikuje dokładnych liczb. Nauczyciele akademiccy raportują podobne problemy - narzędzie dobrze wykrywa leniwe copy-paste z ChatGPT, gorzej radzi sobie z przemyślanym użyciem AI jako narzędzia roboczego.
Modele językowe uczą się pisać jak ludzie. Im lepszy model, tym trudniej go wykryć. Claude Opus 4.7 czy Gemini 3.5 potrafią naśladować styl, dodawać błędy, zmieniać rytm zdań.
Detektory działają na zasadzie statystycznej - szukają wzorców typowych dla AI. Te wzorce zmieniają się z każdą nową wersją modelu. To wyścig zbrojeń, w którym detektory zawsze są krok w tyle.
Dodatkowo: jeśli ktoś użył AI do researchu, napisał szkic ręcznie, potem poprawił przez AI, a na końcu jeszcze raz ręcznie - gdzie jest granica? Czy to tekst AI, czy ludzki?

Narzędzia do detekcji AI mają fundamentalny problem: nie wiedzą, co wykrywają. Nie "widzą" AI - widzą wzorce statystyczne. Te wzorce mogą pochodzić z wielu źródeł.
Osoba z autyzmem pisze strukturalnie, używa powtórzeń, unika metafor. Detektor: "90% AI". Osoba ucząca się języka pisze prosto, bez idiomów. Detektor: "85% AI". Ktoś pisze techniczny raport według szablonu. Detektor: "95% AI".
Problem nie jest teoretyczny. Studenci już zostali niesłusznie oskarżeni o oszustwo na podstawie wyników z detektorów. Freelancerzy stracili kontrakty. Etyczne implikacje są realne.
Większość detektorów była trenowana głównie na angielskim. Polska, czeska, węgierska wersja tego samego tekstu? Accuracy spada dramatycznie. GPTZero oficjalnie wspiera tylko angielski. Originality.ai dodało kilka języków - skuteczność nie jest porównywalna.
Jeśli sprawdzasz polski tekst - wyniki traktuj z jeszcze większą ostrożnością niż przy angielskim.
Żadne narzędzie nie jest certyfikowane jako dowód. Nie ma regulacji określających, kiedy detektor może być użyty do podjęcia decyzji (zwolnienie, ocena, odrzucenie aplikacji). AI Act w Europie zaczyna to porządkować - jeszcze nie ma jasnych wytycznych dla detektorów.
Używasz detektora w firmie do oceny kandydatów? Prawnie stoisz na grząskim gruncie. Zwłaszcza jeśli odrzucisz kogoś tylko na podstawie wyniku z narzędzia.
Detektory AI to narzędzie wspomagające, nie wyrok. Możesz ich użyć jako pierwszego filtra - nigdy jako jedynego dowodu.
Dostajesz 85% AI detection? To sygnał do głębszej analizy, nie do odrzucenia tekstu. Porozmawiaj z autorem. Poproś o wyjaśnienie procesu. Sprawdź inne prace.
W firmach, które wdrażają AI, najlepsze praktyki to:
Najważniejsze: zamiast walczyć z AI, zastanów się, czy problem nie leży gdzie indziej. Jeśli student może zdać egzamin kopiując z ChatGPT - może egzamin jest źle zaprojektowany? Jeśli freelancer dostarcza AI-generated content zamiast własnej pracy - może brief był zbyt ogólny?
Zamiast bać się, że ktoś używa AI - naucz się go używać lepiej niż konkurencja. W kursie AI Evolution pokazuję, jak pracować z modelami językowymi tak, żeby wynik był Twój - nie maszynowy. Od promptów przez edycję po hybrydowy workflow. 118 lekcji, od zera do eksperta.
Sprawdź AI Evolution →GPTZero ma darmową wersję, która działa przyzwoicie na prostych tekstach z ChatGPT. Przy hybrydach (AI + człowiek) skuteczność spada do 40-50%. Płatne narzędzia jak Originality.ai są lepsze - wciąż nie idealne. Żaden detektor nie daje 100% pewności.
Większość detektorów była trenowana na angielskim. GPTZero oficjalnie wspiera tylko angielski, Originality.ai dodało kilka języków - accuracy jest niższa. Jeśli musisz sprawdzić polski tekst - użyj kilku narzędzi i porównaj wyniki. Pamiętaj, że są mniej wiarygodne niż przy angielskim.
Tak. Ręczne poprawki co kilka zdań, parafrazowanie przez inny model, mieszanie źródeł - to wystarczy, żeby zmylić większość detektorów. Im więcej ludzkiej pracy w tekście, tym trudniej wykryć AI. Dlatego detektory działają tylko na leniwe copy-paste, nie na przemyślane użycie AI jako narzędzia.
Nie. Żadne narzędzie nie jest certyfikowane jako dowód. Nie ma standardu prawnego określającego, kiedy detektor może być użyty do podjęcia decyzji. AI Act w Europie zaczyna to regulować - jeszcze nie ma jasnych wytycznych. Używaj detektorów jako sygnału, nie jako wyroku.
Na podstawie: AI Evolution Blog
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar