Sztuczna inteligencja pokonuje zespoły ekspertów w analizie danych medycznych
Badanie opublikowane w "Cell Reports Medicine" wykazało, że narzędzia generatywnej sztucznej inteligencji dorównywały lub przewyższały tradycyjne zespoły badawcze w analizie danych mikrobiomu od ponad 1200 kobiet w ciąży w celu przewidywania przedwczesnego porodu – skracając dwuletni harmonogram badań do zaledwie sześciu miesięcy.
Przełomowy wynik
Odkrycie było na tyle uderzające, że skłoniło doświadczonych badaczy do refleksji: narzędzia generatywnej sztucznej inteligencji, przy odpowiednich podpowiedziach, mogą analizować złożone zbiory danych medycznych szybciej niż doświadczone zespoły badawcze – a czasem dawać lepsze wyniki.
Badanie opublikowane 17 lutego 2026 roku w Cell Reports Medicine przez naukowców z UC San Francisco (UCSF) i Wayne State University postawiło osiem narzędzi generatywnej sztucznej inteligencji w bezpośredniej konfrontacji z tradycyjnymi zespołami zajmującymi się analizą danych w wysoce istotnym zadaniu: przewidywaniu przedwczesnego porodu na podstawie danych mikrobiomu pochwy zebranych od ponad 1200 kobiet w ciąży w dziewięciu niezależnych badaniach.
Punkt odniesienia DREAM
Punktem odniesienia dla pracy ludzkiej było Preterm Birth DREAM Challenge – konkurs crowdsourcingowy z zakresu uczenia maszynowego, w którym 318 zespołów zgłosiło 148 modeli do przewidywania, czy kobiety urodzą przed 37. tygodniem ciąży. Najlepsze modele kierowane przez ludzi osiągnęły pole pod krzywą ROC (AUROC) na poziomie 0,68 dla standardowego porodu przedwczesnego i 0,92 dla wczesnego porodu przedwczesnego (przed 32. tygodniem) – co jest dobrym wynikiem według wszelkich standardów klinicznych.
Kiedy naukowcy powtórzyli to wyzwanie, wykorzystując generatywną sztuczną inteligencję – dostarczając dużym modelom językowym ustrukturyzowane podpowiedzi i prosząc je o wygenerowanie kompletnych potoków analitycznych – cztery z ośmiu narzędzi AI wygenerowały modele konkurencyjne lub lepsze od najlepszych zgłoszeń ludzkich. Różnica w szybkości była dramatyczna: podczas gdy oryginalny konkurs DREAM trwał prawie dwa lata od powstania do publikacji, projekt wspomagany przez sztuczną inteligencję został ukończony w zaledwie sześć miesięcy.
Młodsi badacze, profesjonalne wyniki
Być może najbardziej wymownym przykładem byli dwaj badacze bez stopni doktorskich. Reuben Sarwal, student studiów magisterskich na UCSF, i Victor Tarca, uczeń liceum, współpracowali, wykorzystując narzędzia AI do budowy realnych modeli predykcyjnych – generując funkcjonalny kod analityczny w minuty, a nie w godziny lub dni, jakich zadanie to normalnie wymagałoby od doświadczonych programistów.
„To naprawdę demokratyzuje to, kto może prowadzić tego rodzaju badania” – powiedział współautor badania Adi Tarca, profesor na Wayne State University, według relacji UCSF. Odkrycie sugeruje, że tradycyjne wymaganie dotyczące dużych, wysoce wyspecjalizowanych zespołów do rozwiązywania dużych zbiorów danych biomedycznych może szybko zanikać.
Zastrzeżenia i ograniczenia
Wyniki nie były jednolicie pozytywne. Połowa testowanych narzędzi AI nie zdołała wygenerować wiarygodnych wyników. Naukowcy ostrzegali również, że sztuczna inteligencja może generować wyglądające wiarygodnie, ale subtelnie błędne analizy, jeśli nie jest starannie nadzorowana. Jakość podpowiedzi okazała się krytyczna: tylko precyzyjne, dobrze skonstruowane instrukcje konsekwentnie dawały wiarygodne wyniki.
Autorzy badania podkreślają, że wiedza ekspercka człowieka pozostaje niezbędna. Naukowcy muszą nadal walidować modele, interpretować wyniki w kontekście klinicznym i chronić przed obciążeniami algorytmicznymi – szczególnie w zbiorach danych, które mogą niedostatecznie reprezentować niektóre grupy etniczne lub społeczno-ekonomiczne.
Szersze implikacje dla nauk klinicznych
Przedwczesny poród jest główną przyczyną śmierci noworodków na świecie i głównym czynnikiem długotrwałych wyzwań poznawczych i motorycznych u dzieci. Szybsze, bardziej dostępne narzędzia do analizy danych mogłyby przyspieszyć rozwój modeli diagnostycznych i spersonalizowanych ocen ryzyka – potencjalnie ratując życie na dużą skalę.
Ale szersze znaczenie wykracza daleko poza położnictwo. Jeśli generatywna sztuczna inteligencja może powielać miesiące pracy ekspertów w dziedzinie analizy danych w różnych dziedzinach medycyny – onkologii, genomice, kardiologii – wąskie gardło potoku badawczego może się zasadniczo przesunąć. Pytanie brzmi już nie tylko, kto ma dostęp do danych, ale kto ma dostęp do właściwych podpowiedzi. To badanie sugeruje, że druga bariera szybko upada.