Saskaņā ar ziņojumiem ChatGPT ir iespēja nokārtot medicīniskos eksāmenus, taču saskaņā ar jauniem pētījumiem nebūs saprātīgs lēmums paļauties uz to, lai veiktu nopietnus veselības novērtējumus, piemēram, ja pacientam ar sāpēm krūtīs ir nepieciešams hospitalizēt.

ChatGPT ir gudrs, taču nespēj novērtēt sirdsdarbību

Pētījumā, kas publicēts žurnālā PLOS ONE, ChatGPT sniedza atšķirīgus secinājumus, atgriežot nekonsekventu sirdsdarbības riska līmeni vienam un tam pašam pacientam pētījumā, kurā piedalījās tūkstošiem pacientu ar sāpēm krūtīs.

Vašingtonas štata universitātes Elsona S. Floida Medicīnas koledžas pētnieks Dr. Tomass Hestons, kurš bija arī pētījuma galvenais autors, teica:

“ChatGPT nerīkojās konsekventi; Ņemot vērā tieši tādus pašus datus, ChatGPT novērtētu zemu risku, pēc tam nākamreiz vidēju risku, un dažkārt tas varētu sasniegt augstu risku.

Avots: WSU.

Pēc pētnieku domām, problēma, iespējams, ir saistīta ar nejaušības pakāpi, kas iebūvēta jaunākajā programmatūras versijā ChatGPT-4, jo tā palīdz tai dažādot atbildes, lai atdarinātu dabisko valodu. Taču Hestons saka, ka šis pats nejaušības līmenis nedarbojas lietošanas gadījumos veselības aprūpē un var būt bīstams, jo tas prasa vienotu, konsekventu atbildi.

Ārstiem ātri jāizvērtē pacienta stāvokļa steidzamība, jo sāpes krūtīs ir ikdienišķa sūdzība slimnīcas neatliekamās palīdzības nodaļās. 

Dažus ļoti nopietnus pacientus var viegli atpazīt pēc simptomiem, bet sarežģītāki ir tie, kuriem ir mazāks risks, sacīja doktors Hestons, īpaši, ja viņiem ir jāizlemj, vai kāds ir pietiekami ārpus riska, lai viņu nosūtītu mājās ar ambulatoro aprūpi. pakalpojumus vai būtu jāuzņem.

Citas sistēmas izrādās uzticamākas

AI neironu tīkls, piemēram, ChatGPT, kas ir apmācīts ar lielu skaitu parametru ar milzīgām datu kopām, var novērtēt miljardus mainīgo sekundēs, kas dod iespēju ātrāk un daudz detalizētāk izprast sarežģītu scenāriju. 

Dr Hestons saka, ka medicīnas speciālisti sirdsdarbības riska novērtēšanai galvenokārt izmanto divus modeļus, ko sauc par HEART un TIMI, un viņam patīk programmatūra, jo tie izmanto vairākus mainīgos lielumus, tostarp vecumu, veselības vēsturi un simptomus, un tie paļaujas uz mazāk mainīgo nekā ChatGPT.

Pētījumam Dr. Hestons un viņa kolēģis Dr. Lorenss Lūiss no tās pašas universitātes Sentluisas pilsētiņas izmantoja trīs datu kopas ar 10 000 nejauši simulētu gadījumu katrā. Vienai datu kopai bija pieci mainīgie no sirds skalas; citā bija iekļauti septiņi mainīgie no TIMI; un trešajā bija 44 mainīgie, kas tika atlasīti nejauši. 

Pirmajās divās datu kopās ChatGPT radīja nekonsekventu riska novērtējumu 45% līdz 48% gadījumu atsevišķiem simulētiem gadījumiem, salīdzinot ar nemainīgu TIMI un HEART punktu skaitu. Bet trešajai datu kopai, neskatoties uz to, ka tā tika palaista vairākas reizes, ChatGPT sniedza atšķirīgus rezultātus tiem pašiem gadījumiem.

Dr. Hestons uzskata, ka, attīstoties tehnoloģijai, veselības aprūpē pastāv lielāks GenAI potenciāls, neskatoties uz neapmierinošajiem pētījuma rezultātiem. Pēc viņa teiktā, sistēmās var augšupielādēt medicīniskos dokumentus, un, ja ierodas ārkārtas situācija, ārsti varētu lūgt ChatGPT sniegt svarīgākos faktus par pacientu. Var arī lūgt ģenerēt dažas iespējamās diagnozes un katras no tām pamatojumu, kas palīdzēs ārstiem izprast problēmu.