
Nyt studie baner vejen mod AI-screening for diabetisk retinopati
Annotører fra Odense Universitetshospital er generelt enige om, hvordan man markerer diabetisk retinopati-læsioner, viser dansk studie. Studiet skal danne grundlag for en algoritme til fremtidig screening. Det er et vigtigt første skridt på rejsen, siger studiets førsteforfatter.
Resultaterne fra det danske studie er i begyndelsen af maj blevet præsenteret som en poster på den centrale øjenkongres ARVO 2025, der fandt sted i Salt Lake City fra 3. til 7. maj.
300 nethindebilleder er i studiet blev gennemgået af 18 uddannelseslæger og medicinstuderende, som alle er certificeret i gradering af diabetisk nethindesygdom via den digitale træningsplatform VIOLA. De 300 billeder blev tilfældigt delt ud 1:1 mellem to grupper, der bestod af henholdsvis ti og otte annotører.
Resultaterne viser, at der var moderat til udbredt enighed om de fleste nethindeskader i grupperne. Det tegner godt i forhold til at bruge disse data til fremadrettet at træne kunstig intelligens, siger studiets førsteforfatter, Simon Joel Lowater, læge og ph.d.-studerende ved Øjenafdeling E på Odense Universitetshospital.
”Det her studie er et vigtigt første skridt på rejsen. Vi tester, om de mange fagfolk, der har certifikat, men begrænset erfaring, overhovedet er enige med hinanden. Det viser resultaterne, at de er. Nu kan vi som næste skridt sammenligne de yngre lægers vurderinger af billederne med eksperternes, der er speciallæger og har flere års erfaring. Formålet er at afklare, om en tilgang med samlet input fra mange certificerede personer giver mere præcise markeringer end få eksperter med flere års erfaring på området,” siger Simon Joel Lowater.
Fundament for AI-screening
Sammenligningen af, hvordan forskellige fagfolk graduerer billeder af diabetisk retinopati, bliver lavet for at udvikle en grundmodel, som forskerne kan bygge deres egen Deep Learning model-ud fra. Det forventer forskerne vil give et bedre fundament for senere algoritmekonstruktion, der kan bistå med at estimere risikoen for synstruende proliferativ diabetisk retinopati, siger Simon Joel Lowater. Kvaliteten af den kunstige intelligens afhænger af kvaliteten af de data, den lærer af.
Tidligere oftalmologisk forskningsleder på Odense Universitetshospital, professor Jakob Grauslund har tidligere forklaret, hvorfor det er nødvendigt at udvikle egne algoritmer inden for screening af diabetisk retinopati.
”Eksisterende algoritmer, der findes på det internationale marked, er ikke altid kompatible med setuppet i et nationalt eller regionalt screeninginitiativ. At indarbejde en færdig algoritme købt af eksempelvis Google vil få detektionsraten inden for diabetisk retinopati til at eksplodere, da algoritmen ikke er lavet til danske forhold samtidig med, at det juridisk og GDPR-mæssigt vil være en ”no-go”, har Jakob Grauslund tidligere udtalt til Oftalmologisk Tidsskrift.
Overraskende resultater
I det aktuelle studie anvendte forskerne et computerprogram (Computer Vision Annotation Tool) til at markere syv typer af øjenskader, eksempelvis mikroaneurismer, blødninger og arvæv. Annotører blev delt ind i to grupper – A og B. Forskerne bag studiet undersøgte, hvor enige alle i gruppe A var med hinanden, og hvor enige alle i gruppe B var med hinanden, men ikke hvor enige A var med B.
Enigheden blev målt med en statistisk metode kaldet ICC (intra-class correlation coefficient).
Nogle skader som mikroaneurismer og blødninger blev markeret med rigtig høj enighed (ICC over 0,9). For nogle skadetyper såsom hårde eksudater og cotton wool spots var enigheden mere moderat (ICC omkring 0,73–0,85).
Oftalmologisk Tidsskrift: Hvorfor er der bestemte skadetyper, som det er sværere at blive enige om?
”Det handler formentlig om, at for nogle læsionstyper kan det være svært at identificere selve læsionen eller differentiere den fra andre læsionstyper.” svarer Simon Joel Lowater.
Der var også overraskelser til forskerne, da de gennemgik deres fund.
”Eksempelvis fandt vi, mod vores forventning, en højere enighed blandt annotørerne i forhold til intraretinale mikrovaskulære abnormaliteter (IRMA), end eksempelvis for Cotton Wool Spots og hårde ekssudater. Dette var bestemt ikke, hvad vi havde forventet. IRMA-forandringer kan netop i høj grad være svære at identificere samt differentiere fra eksempelvis dannelse af nye kar, så det var lidt overraskende, og det bliver vi nødt til at undersøgere nærmere.”