Her - detektyw dla Claude Code, który czyta za Ciebie 4000 linii JSON
Źródło: Link
Źródło: Link
118 lekcji bez kodowania. ChatGPT, Claude, Gemini, automatyzacje. Notatnik AI i AI Coach w cenie.
Każda sesja Claude Code zapisuje wszystko do pliku .jsonl. Każdy ruch. Każde wywołanie narzędzia. Każdy token. Problem? Ten plik jest tylko do zapisu. Nikt nie czyta 4000 linii JSON, żeby zrozumieć, dlaczego agent sięgnął do produkcji albo gdzie zniknął budżet kontekstu.
Her czyta to za Ciebie.

Pomysł jest prosty: wrzucasz plik z sesji na stronę, a Her rekonstruuje przebieg w zrozumiałym języku. Pokazuje ryzykowne działania - wdrożenia, zmiany w konfiguracji, operacje na produkcji, wycieki sekretów - i prowadzi Cię do konkretnego momentu, w którym to się stało.
Nie musisz przeglądać tysięcy linii. Her robi to za Ciebie i mówi wprost: "Tu agent zmienił plik .env", "Tam wywołał deploy na produkcję", "W tym miejscu zużył połowę budżetu tokenów".
Widzisz też, które narzędzia były używane, które subagenci się uruchomiły, które serwery MCP zostały wywołane. Her podpowiada lepsze praktyki tylko wtedy, gdy wykryje konkretny, naprawialny wzorzec - opierając się na doświadczeniach Anthropic i społeczności. Sugeruje, nigdy nie narzuca. Milczy, gdy nie ma nic wartościowego do powiedzenia.
Jest też funkcja Ask Her. Możesz zapytać "dlaczego użyto tego narzędzia?" i dostaniesz odpowiedź opartą na śladzie z sesji - z cytatami z konkretnych momentów i linkami do wywołań narzędzi.
Wrzuć jeden plik - dostaniesz widok sesji. Wrzuć kilka - zbudujesz widok projektu i przeszukasz pytanie w wielu sesjach naraz.

Her nie wysyła Twoich danych do żadnego zewnętrznego API. Model - Nemotron-Mini-4B-Instruct - działa na GPU w samym Space'ie przez ZeroGPU. Twoja sesja jest wgrywana tylko do prywatnej, automatycznie usuwanej przestrzeni, która należy do Twojego uruchomienia. Nic nie wychodzi poza tę maszynę.
To, co sprawia, że Her jest wiarygodna: silnik ewaluacji jest w pełni deterministyczny. Model jest używany tylko do pisania tekstu w języku angielskim i proponowania miękkich sugestii. Nigdy nie twierdzi, że coś znalazł. Liczby się nie zmieniają, gdy zmienisz model.
Her nie tylko pokazuje, które narzędzia CLI były używane - ona je identyfikuje. Baza danych najpopularniejszych narzędzi z Homebrew, npm i PyPI jest wbudowana w Space, więc większość narzędzi jest rozpoznawana offline z krótkim opisem. Gdy agent uruchamia narzędzia do wdrożeń, klientów baz danych albo serwery deweloperskie, Her flaguje to jako aktywność wymagającą drugiego spojrzenia.

Her powstała w weekend. Na początku miała być widokiem operatora - grafem podróży, gdzie każde zapytanie to węzeł, a każde wywołanie narzędzia to krawędź. Szybko okazało się, że większość sesji to nie liniowe ścieżki, tylko gęste sieci wywołań. Graf się rozrastał, stawał się nieczytelny.
Wtedy zespół zmienił podejście. Zamiast wizualizować wszystko, Her zaczęła filtrować i priorytetyzować. Pokazuje tylko to, co ważne. Resztę ukrywa (możesz do niej wrócić, jeśli potrzebujesz).
Dla każdego, kto używa Claude Code i chce wiedzieć, co naprawdę się dzieje pod maską. Dla zespołów, które muszą audytować sesje agentów AI. Dla osób, które chcą zrozumieć, gdzie idą tokeny i dlaczego agent podjął konkretną decyzję.
Her nie jest narzędziem do debugowania kodu. To narzędzie do zrozumienia zachowania agenta. Do audytu. Do nauki. Do tego, żeby wiedzieć, kiedy agent zrobił coś, czego nie powinien - i dlaczego.
Jeśli pracujesz z agentami AI w produkcji, Her może być Twoim detektywem. Tym, który czyta za Ciebie to, co nikt inny nie chce czytać.
Tak, Her jest zaprojektowana specjalnie do analizy plików .jsonl generowanych przez Claude Code. Nie obsługuje innych formatów sesji agentów AI.
Tak. Her nie wysyła danych do zewnętrznych API. Model działa lokalnie na GPU w Space'ie przez ZeroGPU, a Twoje pliki są przechowywane tylko w prywatnej, automatycznie usuwanej przestrzeni przypisanej do Twojego uruchomienia.
Tak. Możesz wrzucić kilka plików i zbudować widok projektu, który pozwala przeszukiwać pytania w wielu sesjach jednocześnie.
Nie. Her nie analizuje jakości kodu. Pokazuje, co agent zrobił, które narzędzia użył, gdzie poszły tokeny i które działania były potencjalnie ryzykowne. Sugeruje lepsze praktyki tylko wtedy, gdy wykryje konkretny, naprawialny wzorzec.
Na podstawie: Hugging Face Blog
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar