Skip to main content

-først med nyheder om ny medicin

ChatGPT giver præcise svar på patienters spørgsmål om tyktarmskræft

Sprogmodellen ChatGPT leverer ifølge kræftlæger præcise og relevante svar på spørgsmål fra patienter om tyktarmskræft. Dog er modellen stærkest, når det kommer til at svare på patienters generelle spørgsmål om tyktarmskræft sammenlignet med spørgsmål relateret til behandling og diagnose.

Det viser et studie præsenteret på den amerikanske kræftkongres ASCO GI 2025 (abstract #299).  

"Ved at evaluere ChatGPT’s præstation har vi ønsket at afdække dens potentiale som et supplerende redskab til at forbedre [patienters] sundhedskompetencer og understøtte patientuddannelsen," siger førsteforfatter Sujata Ojha, læge ved Dell Medical School, University of Texas, USA, i en pressemeddelelse på ASCO’s hjemmeside. 

Forskerne havde inden opstart af studiet udvalgt ti almindelige patientspørgsmål om tyktarmskræft, som forskerne har fundet hos American Cancer Society og Mayo Clinic’s hjemmesider. 

Spørgsmålene blev inddelt i to kategorier:  

1)     Generelle oplysninger, der dækker symptomer, screening og forebyggelse. 

2)     Diagnose og behandling, der fokuserer på mere komplekse kliniske spørgsmål.  

ChatGPT blev bedt om at besvare spørgsmålene, der var formuleret som patientspørgsmål. De genererede svar blev herefter vurderet af onkologiske eksperter ved hjælp af en fempunkts Likert-skala, hvor 1 repræsenterede "helt uenig" og 5 "helt enig".  

Resultaterne viste, at ChatGPT opnåede en gennemsnitlig score på 4,72 på tværs af de to kategorier. Svar relateret til generelle oplysninger scorede dog højere end svar om diagnose og behandling, og forskellen var statistisk signifikant (p=0,034). De onkologiske eksperter, der vurderede ChatGPT’s præcision og korrekthed, var generelt enige i deres vurderinger, og der var ingen signifikant forskel mellem vurderingernes score (p=0,221).  

Forskerne konkluderer på baggrund af resultaterne, at selvom ChatGPT giver præcise og korrekte svar på spørgsmål om symptomer, screening og forebyggelse, så viser studiet også, at modellen har begrænsninger, når det kommer til mere klinisk komplekse emner som diagnose og behandling.