In Journal of Clinical Oncology wordt een machine learning model beschreven voor het beoordelen van de respons op basis van FDG-PET-scans van patiënten met een non-hodgkinlymfoom (NHL). De resultaten suggereren dat het model – na verdere verfijning en prospectieve validatie – kan worden opgenomen in radiologische workflows, waarmee een aanzienlijke tijdsbesparing gerealiseerd zou kunnen worden.
De onderzoekers ontwikkelden een deep learning-algoritme voor een volledig geautomatiseerde beoordeling van de respons volgens de Lugano 2014-classificatie. De voorgestelde methode werd getraind en getest met FDG-PET-beelden uit 3 internationale klinische studies met verschillende NHL-subtypes en behandelingen (NCT02257567, NCT02500407, NCT01287741). De output van het model werd vergeleken met de beoordeling van de Independent Review Committees (IRC) in de betreffende studies. Ook werd de voorspellende waarde van het algoritme voor verschillende uitkomsten beoordeeld.
De geautomatiseerde responsbeoordeling had een hoge mate van overeenstemming met die van de IRC (overeenstemming respectievelijk 93%, 87% en 85% in NCT01287741, NCT02500407 en NCT02257567) en was sterk voorspellend voor de uitkomsten met een trend voor een hogere nauwkeurigheid met betrekking tot het risico om te overlijden ten opzichte van de IRC-beoordeling (OS HR op basis van complete metabole respons (CMR) volgens het model: 0,123, 0,054 en 0,205 in NCT01287741, NCT02500407 en NCT02257567, ten opzichte van respectievelijk 0,226, 0,292 en 0,272 voor CMR volgens IRC-beoordeling). Ook beoordeelde een radioloog de output van het algoritme (mediane beoordelingstijd 1,38 minuten/beoordeling). Er werden geen significante verschillen waargenomen in de mate van overeenstemming tussen de radioloog en het model en de mate van overeenstemming tussen de radioloog en de IRC.
Bron: