Indyjski Zero STT Med pokonuje Whispera w medycznej transkrypcji
Źródło: Link
Źródło: Link
Gdy lekarz dyktuje rozpoznanie, a system ASR zamienia "angina" na "engine" – to nie tylko zabawna anegdota. To realne zagrożenie. Bengalurski Shunyalabs właśnie pokazał, że medyczna transkrypcja mowy może być znacznie dokładniejsza niż oferują to giganci branży.
Zero STT Med, nowy model automatycznego rozpoznawania mowy (ASR) od indyjskiego startupu, osiągnął Word Error Rate (WER) na poziomie 11,1% i Character Error Rate (CER) 5,1%. Lepsze wyniki niż OpenAI Whisper, ElevenLabs Scribe czy AWS Transcribe – systemy, które do tej pory wyznaczały standardy w transkrypcji audio.
WER na poziomie 11,1% oznacza błąd mniej więcej co dziewiąte słowo. W medycynie, gdzie terminologia jest skomplikowana, a stawka wysoka, to znacząca poprawa wobec konkurencji. Character Error Rate 5,1% pokazuje dodatkowo, że model radzi sobie z precyzyjnym zapisem nawet długich, specjalistycznych terminów.
Standardowe systemy ASR trenowane są na ogólnym języku. Stąd problemy z rozpoznawaniem nazw leków, procedur czy anatomicznych określeń. Zero STT Med został wyspecjalizowany właśnie w tym obszarze – i to przekłada się na mierzalną przewagę.
Startup z Bengaluru nie próbuje konkurować w ogólnej transkrypcji. Stawia na vertical AI – modele wyspecjalizowane w konkretnych branżach. To strategia, która coraz częściej przynosi lepsze rezultaty niż uniwersalne rozwiązania (nawet jeśli te drugie mają za sobą budżety wielkich korporacji).
Medyczna dokumentacja to obszar, gdzie dokładność transkrypcji bezpośrednio wpływa na jakość opieki i bezpieczeństwo pacjentów. Każdy błąd w zapisie dawkowania leku czy rozpoznania może mieć poważne konsekwencje. Dlatego lekarze często wolą dyktować ręcznie niż polegać na niedoskonałych systemach automatycznych.
Lepsza transkrypcja to mniej czasu spędzanego na poprawianiu błędów w dokumentacji. Dla lekarzy, którzy spędzają nawet kilka godzin dziennie na wypełnianiu elektronicznej dokumentacji medycznej, to realna oszczędność. Czas, który mogą przeznaczyć na pacjentów.
Zero STT Med pokazuje też szerszy trend: modele niszowe, trenowane na specjalistycznych danych, mogą przewyższać uniwersalne rozwiązania w konkretnych zastosowaniach. Dobra wiadomość dla branż, które do tej pory musiały zadowalać się systemami "wystarczająco dobrymi".
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar