Sztuczna inteligencja prawie została lekarzem. "Zdała" trudny egzamin

Oprogramowanie sztucznej inteligencji było w stanie uzyskać pozytywne wyniki amerykańskiego egzaminu medycznego, co w przypadku człowieka zwykle wymaga wielu lat szkolenia. O sprawie informuje pismo "PLOSDigital Health".

Sztuczna inteligencja GPT3 zdała trudny egzamin medyczny w USA. Zdjęcie poglądoweSztuczna inteligencja GPT zdała trudny egzamin medyczny w USA. Zdjęcie poglądowe
Źródło zdjęć: © Adobe Stock

ChatGPT to nowy system sztucznej inteligencji (AI), znany jako duży model językowy (po angielskiu - Logic Learning Machine, LLM). Został zaprojektowany do generowania tekstów podobnych do pisanych przez człowieka poprzez przewidywanie nadchodzących sekwencji słów. W przeciwieństwie do większości chatbotów ChatGPT nie przeszukuje internetu. Teksty generuje, wykorzystując relacje między słowami przewidywane przez wewnętrzne procesy.

Sztuczna inteligencja prawie została lekarzem

Jak wykazały badania, ChatGPT może uzyskać wynik równy lub zbliżony do około 60-proc. progu wymaganego do uzyskania licencji medycznej w Stanach Zjednoczonych (USMLE), z odpowiedziami, które mają spójny, wewnętrzny sens.

Dr Tiffany Kung i jej współpracownicy z medycznego startupu AnsibleHealth przetestowali możliwości ChatGPT na przykładzie USMLE, wysoce wystandaryzowanej i regulowanej serii trzech egzaminów wymaganych do uzyskania licencji medycznej w Stanach Zjednoczonych. USMLE, przeznaczony dla studentów medycyny i lekarzy stażystów, ocenia wiedzę obejmującą większość dyscyplin medycznych, od biochemii, przez rozumowanie diagnostyczne, po bioetykę.

Po usunięciu pytań opartych na obrazach autorzy przetestowali oprogramowanie na 350 z 376 pytań publicznych dostępnych w wydaniu USMLE z czerwca 2022 r.

W trzech egzaminach USMLE ChatGPT uzyskał wynik między 52,4 proc. a 75,0 proc. Próg przejścia dla każdego roku wynosił około 60 proc. ChatGPT wykazał również 94,6 proc. zgodności we wszystkich swoich odpowiedziach i uzyskał co najmniej jeden znaczący wgląd (coś, co było nowe, nieoczywiste i klinicznie ważne) dla 88,9 proc. swoich odpowiedzi.

Co istotne, ChatGPT przewyższył wynikami PubMedGPT, model przeszkolony wyłącznie w oparciu o literaturę z dziedziny biomedycyny, który uzyskał 50,8 proc. prawidłowych odpowiedzi na starszym zbiorze danych pytań w stylu USMLE.

Potencjał sztucznej inteligencji

Chociaż stosunkowo niewielki rozmiar danych wejściowych ograniczał głębokość i zakres analiz - autorzy zauważają, że ich odkrycia dają wgląd w potencjał ChatGPT w zakresie poprawy edukacji medycznej, a ostatecznie praktyki klinicznej. Na przykład klinicyści w AnsibleHealth już używają ChatGPT do "tłumaczenia" skomplikowanego żargonu raportów medycznych w celu łatwiejszego zrozumienia ich przez pacjentów.

"Osiągnięcie pozytywnego wyniku tego niezwykle trudnego egzaminu eksperckiego i dokonanie tego bez wsparcia ze strony ludzi stanowi znaczący kamień milowy w klinicznym dojrzewaniu sztucznej inteligencji" - piszą autorzy.

Dr Tiffany Kung zaznaczyła, że rola ChatGPT wykraczała poza bycie przedmiotem badania. "ChatGPT znacząco przyczynił się do napisania [naszego] tekstu… Współpracowaliśmy z ChatGPT podobnie jak z kolegą, prosząc go o syntezę, uproszczenie i oferowanie kontrapunktów do szkiców w toku… Wszyscy współautorzy cenili wkład ChatGPT" - napisała.

Źródło artykułu:
Wybrane dla Ciebie
Silne wzrosty dolara i ropy. Kursy pną się w górę
Silne wzrosty dolara i ropy. Kursy pną się w górę
Rada Fiskalna ostrzega: demografia i rosnący dług zmuszą do łączenia gmin
Rada Fiskalna ostrzega: demografia i rosnący dług zmuszą do łączenia gmin
Ile kosztuje funt? Kurs funta do złotego PLN/GBP 26.2.2026
Ile kosztuje funt? Kurs funta do złotego PLN/GBP 26.2.2026
Ile kosztuje frank szwajcarski? Kurs franka do złotego PLN/CHF 26.2.2026
Ile kosztuje frank szwajcarski? Kurs franka do złotego PLN/CHF 26.2.2026
Ile kosztuje dolar? Kurs dolara do złotego PLN/USD 26.2.2026
Ile kosztuje dolar? Kurs dolara do złotego PLN/USD 26.2.2026
PGE rośnie, KGHM traci. Dwie prędkości na GPW
PGE rośnie, KGHM traci. Dwie prędkości na GPW
Ile kosztuje euro? Kurs euro do złotego PLN/EUR 26.02.2026
Ile kosztuje euro? Kurs euro do złotego PLN/EUR 26.02.2026
Podatek od szopy wyższy niż od domu. RPO interweniuje
Podatek od szopy wyższy niż od domu. RPO interweniuje
Problem w największym polskim banku. Były utrudnienia w korzystaniu z serwisów i aplikacji
Problem w największym polskim banku. Były utrudnienia w korzystaniu z serwisów i aplikacji
Merz w Chinach. Kanclerz ostrzega przed strategią Pekinu
Merz w Chinach. Kanclerz ostrzega przed strategią Pekinu
Potężny spadek wartości bitcoina. Gdzie jest dno?
Potężny spadek wartości bitcoina. Gdzie jest dno?
BGK ze specjalnym statusem w Ukrainie. Ratyfikacja umowy
BGK ze specjalnym statusem w Ukrainie. Ratyfikacja umowy