Google i genomika: dekada pracy nad AI dla medycyny
Źródło: Link
Źródło: Link
DNA człowieka to 3 miliardy par zasad. Jego analiza jeszcze dekadę temu trwała tygodnie i kosztowała fortunę. Dziś AI od Google robi to w godziny, a czasem minuty – i to z dokładnością przewyższającą możliwości człowieka.
W 2014 roku Google uruchomiło Genomics API, pierwszą chmurową platformę do przechowywania i analizowania danych genomicznych na dużą skalę. Od tego momentu firma systematycznie budowała narzędzia łączące genomikę z uczeniem maszynowym, doprowadzając do przełomu w diagnostyce medycznej.
W 2017 roku Google wypuściło DeepVariant – model oparty na sieciach neuronowych, który identyfikuje warianty genetyczne w sekwencjonowanych genomach. Tradycyjne metody analizy popełniały błędy w około 1-2% przypadków, co przy miliardach par zasad dawało miliony potencjalnych pomyłek. DeepVariant obniżył wskaźnik błędów do poziomu, który wcześniej był nieosiągalny.
Model traktuje dane sekwencjonowania jak obraz – przekształca surowe odczyty DNA w wizualizacje, które sieć neuronowa "przegląda" niczym zdjęcia. Ta pozornie prosta zmiana perspektywy dała skok jakościowy w dokładności. W 2020 roku DeepVariant otrzymał oficjalne uznanie FDA jako narzędzie wspierające diagnostykę kliniczną.
Google nie poprzestało na analizie jednostkowych próbek. W 2018 roku zespół uruchomił narzędzia do analiz populacyjnych, umożliwiające porównywanie tysięcy genomów jednocześnie. To otworzyło drogę do badań nad chorobami rzadkimi i identyfikacji mutacji dziedzicznych w skali niemożliwej wcześniej do osiągnięcia.
W 2021 roku pojawiło się rozszerzenie DeepVariant o możliwość analizowania długich odczytów sekwencjonowania – technologii, która pozwala "czytać" dłuższe fragmenty DNA naraz. To istotne, bo część mutacji genetycznych jest widoczna dopiero wtedy, gdy spojrzysz na większy kontekst (trochę jak próba zrozumienia zdania po pojedynczych literach).
Choć AlphaFold, przedstawiony w 2020 roku, nie jest narzędziem stricte genomicznym, wykorzystuje dane genetyczne do przewidywania struktury 3D białek. Do tej pory naukowcy spędzali lata na eksperymentalnym ustalaniu kształtu pojedynczego białka. AlphaFold robi to w minuty z dokładnością porównywalną z metodami laboratoryjnymi.
Do 2024 roku model przewidział strukturę ponad 200 milionów białek – praktycznie wszystkich znanych nauce. Baza danych AlphaFold jest dziś wykorzystywana przez badaczy pracujących nad nowymi lekami, zrozumieniem mechanizmów chorób i projektowaniem terapii genowych.
Narzędzia AI od Google trafiły już do setek laboratoriów na świecie. Przyspieszenie analizy genomowej oznacza szybszą diagnostykę chorób genetycznych u noworodków, lepsze dopasowanie terapii onkologicznych do profilu mutacji pacjenta i niższe koszty badań genetycznych. To, co 10 lat temu było dostępne tylko w najlepszych ośrodkach badawczych, dziś może wykorzystać szpital powiatowy z dostępem do chmury.
Google udostępnia DeepVariant jako open source, co pozwala laboratoriom na całym świecie korzystać z niego bez licencji. To podejście (rzadkie w komercyjnym świecie) przyspieszyło adopcję technologii i realnie wpłynęło na dostępność zaawansowanej diagnostyki.
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar