- ICH GCP
- Registro degli studi clinici negli Stati Uniti
- Sperimentazione clinica NCT04991987
Studio di convalida multicentrico di uno strumento di intelligenza artificiale per la classificazione automatica delle radiografie del torace
Panoramica dello studio
Stato
Descrizione dettagliata
Un problema attuale nei Dipartimenti di Radiologia è il costante aumento del numero di studi eseguiti. Questo volume sempre crescente di informazioni implica un aumento del tempo che i medici specialisti devono dedicare a riferire questi studi. La metodologia utilizzata per la refertazione varia a seconda della modalità di imaging, che nei centri ad alta complessità comprende radiologia, tomografia computerizzata, risonanza magnetica ed ecografia, tra le altre. Attualmente il maggior volume di studi appartiene ai normali raggi X. Presso l'Hospital Italiano de Buenos Aires (HIBA) nel 2019 sono state eseguite più di 220.000 radiografie e all'interno di questo gruppo oltre il 50% delle pratiche sono radiografie del torace, che vengono eseguite come metodo di rilevamento iniziale di patologie potenzialmente gravi (nodulo polmonare, polmonite, pneumotorace).
Questa modalità di imaging non è attraente e non è esplorata dalle nuove generazioni di specialisti di imaging, che preferiscono spostarsi verso metodi più moderni e complessi come la tomografia computerizzata o la risonanza magnetica. Pertanto, il problema del crescente volume di radiografie semplici da analizzare è aggravato dalla carenza di specialisti con dedizione ed esperienza nella loro interpretazione.
Nel campo dell'informatica è emersa un'area di studio chiamata Intelligenza Artificiale (AI), che consiste in un sistema informatico che impara a svolgere specifici compiti di routine e può integrare o imitare il lavoro umano. Lo sviluppatore deve comunicare al sistema di intelligenza artificiale quale risposta si desidera da un dato stimolo. Un esempio di ciò è il correttore ortografico in un elaboratore di testi.
Il campo dell'intelligenza artificiale comprende un'ampia varietà di sottocampi e tecniche specifiche, come Machine Learning (ML) o Deep Learning (DL). ML comprende qualsiasi strumento in cui i dati computerizzati vengono utilizzati per adattare un modello che trae conclusioni da questi dati di input. Gli algoritmi sono addestrati per apprendere determinati compiti sulla base di una serie di informazioni precedentemente classificate. Ciò include anche le tecniche tradizionali per la creazione di modelli predittivi o modelli di classificazione. Il filtro antispam della posta elettronica è un esempio di ML. Le reti neurali sono uno degli strumenti inclusi nel machine learning.
Infine, DL è un tipo di ML che ha iniziato ad apparire nel 2015, che consiste nell'aggiungere livelli a una rete neurale tradizionale e creare così un modello non lineare con un grado di complessità maggiore poiché aumenta il numero di parametri da regolare. Questa rete è esposta a un set di dati di addestramento, costituito da informazioni già etichettate, e "impara" a etichettare nuove informazioni imitando i criteri di etichettatura del set di dati. Questo apprendimento è in realtà un aggiustamento iterativo dei parametri del modello, che vengono iterativamente modificati in base all'errore tra l'etichettatura originale e l'etichettatura suggerita dalla rete. Una volta addestrato il modello, i suoi parametri vengono fissati e può essere utilizzato per dedurre etichette di nuove informazioni la cui etichettatura è sconosciuta. È stato riscontrato che i metodi DL hanno prestazioni molto migliori nell'analisi dei dati rispetto ai metodi tradizionali. DL ha già applicazioni nella vita di tutti i giorni, come gli assistenti vocali negli smartphone o il riconoscimento automatico dei volti e l'etichettatura nei social network.
Il DL applicato all'elaborazione delle immagini si basa su un metodo chiamato reti neurali convoluzionali. La sua applicazione è stata studiata nel campo dell'imaging medico, trovando miglioramenti nelle prestazioni, dal rilevamento di oggetti (strutture anatomiche o patologiche nelle immagini radiologiche) ai compiti di segmentazione.
Dal 2018, Hospital Italiano de Buenos Aires gestisce il programma TRx, che consiste nello sviluppo di uno strumento basato sull'intelligenza artificiale per rilevare i risultati patologici nelle radiografie del torace. Il progetto fa parte del programma Artificial Intelligence in Healthcare dell'Hospital Italiano de Buenos Aires ed è realizzato da un team multidisciplinare di professionisti, tra cui ingegneri biomedici, data scientist, radiologi, informatici clinici clinici, metodologi e ingegneri del software. TRx è un modello DL, sviluppato e convalidato presso HIBA, che rileva quattro tipi di risultati radiologici sulle radiografie del torace: opacità polmonari (noduli, masse, polmonite, consolidamenti, vetro smerigliato o atelettasia), pneumotorace, versamenti pleurici e costola fratture. Questo rilevamento viene eseguito attraverso quattro moduli indipendenti che sono integrati in un unico sistema. Durante l'elaborazione di una radiografia, TRx riporta diversi tipi di risultati. Innanzitutto, il sistema TRx unificato indica in modo dicotomico se l'immagine è sospetta per un reperto patologico o se si tratta probabilmente di una normale radiografia del torace. In secondo luogo, ciascuno dei quattro moduli indica in particolare se è stato rilevato rispettivamente un reperto di opacità polmonare, pneumotorace, versamento pleurico o frattura costale. Infine, TRx consente la visualizzazione di una mappa termica sull'immagine che indica a colori la regione del torace in cui è stato rilevato un reperto sospetto.
L'uso previsto di questo strumento è assistere i medici non esperti di imaging nella diagnosi delle radiografie del torace rilevando automaticamente i risultati radiologici. TRx versione 1.0 (TRx v1) valuta le radiografie frontali del torace di pazienti di età superiore a 14 anni per quattro tipi di reperti: opacità polmonari, versamento pleurico, fratture e pneumotorace. L'obiettivo di questo strumento è quello di migliorare le prestazioni diagnostiche dei medici non di imaging fornendo assistenza o un "rapporto preliminare".
Un fatto che viene sottolineato nell'IA è che i modelli devono essere replicabili; il modello deve dare risultati uguali o migliori se riceve lo stesso input. Anche se questo sembra ovvio, è in contrasto con gli esseri umani, che comunemente mostrano variabilità sia inter che intra-osservatore. Lo standard di un modello di intelligenza artificiale dovrebbe almeno corrispondere alle prestazioni umane che assisterà. La replicabilità dipende dal problema e la quantità di variabilità dipende dall'attività specifica a portata di mano.
Ci sono autori che riferiscono che un modello AI può presentare difficoltà nel fornire previsioni accurate quando applicato a nuove situazioni o popolazioni (cioè a cui non è stato esposto durante l'addestramento). Mentre i radiologi sono in grado di adattarsi con successo alle differenze nelle immagini (dovute allo spessore della sezione, alla marcatura dello scanner, all'intensità del campo, all'intensità del gradiente o al tempo di contrasto) senza influire sulla loro interpretazione delle immagini, l'IA generalmente manca di tale capacità. Ad esempio, se un agente AI è stato addestrato solo con le immagini di uno scanner MRI da 3 Tesla, non è possibile garantire a priori che avrà gli stessi risultati su scansioni eseguite a 1,5 Tesla. Una soluzione è sviluppare processi matematici per riconoscere, normalizzare e trasformare i dati per ridurre al minimo la deriva. Un altro approccio per mitigare questo fenomeno consiste nell'eseguire l'addestramento e la convalida con set di dati "completi", che rappresentano ogni tipo di acquisizione e ricostruzione di dati di immagini.
Al fine di valutare le prestazioni diagnostiche di uno strumento di intelligenza artificiale in modo completo e quindi garantirne l'uso previsto, si raccomanda di eseguire studi multicentrici, che consentano di misurare queste prestazioni in diverse popolazioni di pazienti e diversi protocolli di acquisizione delle immagini. Il presente studio multicentrico cerca di convalidare esternamente le prestazioni di uno strumento AI (TRx v.1) come strumento di assistenza diagnostica per radiografie del torace.
Tipo di studio
Iscrizione (Anticipato)
Contatti e Sedi
Luoghi di studio
-
-
-
Buenos Aires, Argentina, 1199
- Hospital Italiano de Buenos Aires
-
-
Criteri di partecipazione
Criteri di ammissibilità
Età idonea allo studio
Accetta volontari sani
Sessi ammissibili allo studio
Metodo di campionamento
Popolazione di studio
Descrizione
Criterio di inclusione:
Saranno inclusi i raggi X che soddisfano i seguenti requisiti:
- Radiografia del torace
- Appartengono a pazienti di età superiore ai 18 anni.
- Advocacy e acquisizione digitale
- Studio condotto nelle suddette istituzioni e archiviato nei rispettivi sistemi di archiviazione e comunicazione delle immagini
Criteri di esclusione:
Raggi X esclusi:
- Tecnica scadente (basso contrasto, velato, fuori centro)
- Presenza di posizione anomala del paziente durante l'acquisizione.
Piano di studio
Come è strutturato lo studio?
Dettagli di progettazione
Cosa sta misurando lo studio?
Misure di risultato primarie
Misura del risultato |
Misura Descrizione |
Lasso di tempo |
|---|---|---|
|
Concordanza tra strumento AI e standard di riferimento
Lasso di tempo: 5 mesi
|
Verrà analizzata la concordanza tra la categoria assegnata dai professionisti e quella assegnata dall'algoritmo.
A tal fine, verrà valutato un test diagnostico per il rilevamento dell'anomalia (ovvero, il test è positivo quando si osserva almeno uno dei quattro tipi di reperti).
Considerando la diagnosi degli specialisti come standard di riferimento, verrà costruita la matrice di confusione e calcolate le metriche diagnostiche dello strumento AI (sensibilità, specificità e valori predittivi).
Gli intervalli di confidenza al 95% saranno calcolati utilizzando la distribuzione binomiale esatta.
|
5 mesi
|
Misure di risultato secondarie
Misura del risultato |
Misura Descrizione |
Lasso di tempo |
|---|---|---|
|
Curve caratteristiche operative del ricevitore
Lasso di tempo: 5 mesi
|
Le curve caratteristiche operative del ricevitore saranno costruite per la categoria globale di anormalità e per ciascuno dei singoli rilievi radiologici, calcolando in ogni caso l'area sotto la curva (valore compreso tra 0 e 1).
Un modello le cui previsioni sono errate al 100% ha un'area sotto la curva di 0,0; un altro le cui previsioni sono corrette al 100% ha un'area sotto la curva di 1,0.
La categorizzazione operata dai radiologi esperti sarà assunta come standard di riferimento.
Verrà valutato se vi è una differenza significativa tra l'area sotto la curva dello strumento AI e il valore di riferimento stimato per i medici non esperti di imaging (ad es.
medici del pronto soccorso o specializzandi).
Verrà utilizzato il test di De Long con un livello di significatività di 0,01.
|
5 mesi
|
|
Analisi qualitativa
Lasso di tempo: 5 mesi
|
Le immagini con diagnosi errate (falsi negativi e falsi positivi) e le corrispondenti mappe di calore generate dall'algoritmo saranno studiate singolarmente.
|
5 mesi
|
|
Indice di concordanza tra osservatori
Lasso di tempo: 5 mesi
|
Sarà analizzata la concordanza inter-osservatore tra gli specialisti partecipanti.
Nei casi in cui l'immagine in questione è classificata in modo diverso da ciascuno degli osservatori, verrà chiesto loro di rivedere le immagini insieme per definire una categoria.
|
5 mesi
|
|
Analisi per istituzione
Lasso di tempo: 5 mesi
|
Le variabili dei punti 1. e 2. saranno calcolate separatamente per le immagini di ciascuna istituzione partecipante.
Valuteremo se c'è una differenza significativa nei diversi valori dell'area sotto la curva tra le istituzioni utilizzando il test De Long.
Verrà utilizzato un livello di significatività di 0,01.
|
5 mesi
|
Collaboratori e investigatori
Investigatori
- Investigatore principale: Sonia E Benitez, MD, MSc, Hospital Italiano de Buenos Aires
Pubblicazioni e link utili
Pubblicazioni generali
- Calvert JS, Price DA, Chettipally UK, Barton CW, Feldman MD, Hoffman JL, Jay M, Das R. A computational approach to early sepsis detection. Comput Biol Med. 2016 Jul 1;74:69-73. doi: 10.1016/j.compbiomed.2016.05.003. Epub 2016 May 12.
- Kesselman A, Soroosh G, Mollura DJ; RAD-AID Conference Writing Group. 2015 RAD-AID Conference on International Radiology for Developing Countries: The Evolving Global Radiology Landscape. J Am Coll Radiol. 2016 Sep;13(9):1139-1144. doi: 10.1016/j.jacr.2016.03.028. Epub 2016 May 25.
- Chartrand G, Cheng PM, Vorontsov E, Drozdzal M, Turcotte S, Pal CJ, Kadoury S, Tang A. Deep Learning: A Primer for Radiologists. Radiographics. 2017 Nov-Dec;37(7):2113-2131. doi: 10.1148/rg.2017170077.
- Erickson BJ, Korfiatis P, Akkus Z, Kline TL. Machine Learning for Medical Imaging. Radiographics. 2017 Mar-Apr;37(2):505-515. doi: 10.1148/rg.2017160130. Epub 2017 Feb 17.
- Balthazar P, Harri P, Prater A, Safdar NM. Protecting Your Patients' Interests in the Era of Big Data, Artificial Intelligence, and Predictive Analytics. J Am Coll Radiol. 2018 Mar;15(3 Pt B):580-586. doi: 10.1016/j.jacr.2017.11.035. Epub 2018 Feb 6.
- Mosquera C, Diaz FN, Binder F, Rabellino JM, Benitez SE, Beresnak AD, Seehaus A, Ducrey G, Ocantos JA, Luna DR. Chest x-ray automated triage: A semiologic approach designed for clinical implementation, exploiting different types of labels through a combination of four Deep Learning architectures. Comput Methods Programs Biomed. 2021 Jul;206:106130. doi: 10.1016/j.cmpb.2021.106130. Epub 2021 May 2.
Collegamenti utili
- Weakly Supervised Learning of Deep Convolutional Neural Networks [Internet]. 2016 Institute of Electrical and Electronics Engineers, Conference on Computer Vision and Pattern Recognition. 2016.
- Guest Editorial Deep Learning in Medical Imaging: Overview and Future Promise of an Exciting New Technique [Internet]. Vol. 35, Institute of Electrical and Electronics Engineers, Transactions on Medical Imaging. 2016. p. 1153-9.
- Dataset shift in machine learning. Neural Information Processing. 2008.
Studiare le date dei record
Studia le date principali
Inizio studio (Effettivo)
Completamento primario (Anticipato)
Completamento dello studio (Anticipato)
Date di iscrizione allo studio
Primo inviato
Primo inviato che soddisfa i criteri di controllo qualità
Primo Inserito (Effettivo)
Aggiornamenti dei record di studio
Ultimo aggiornamento pubblicato (Effettivo)
Ultimo aggiornamento inviato che soddisfa i criteri QC
Ultimo verificato
Maggiori informazioni
Termini relativi a questo studio
Parole chiave
Termini MeSH pertinenti aggiuntivi
Altri numeri di identificazione dello studio
- 6025
Informazioni su farmaci e dispositivi, documenti di studio
Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti
Studia un dispositivo regolamentato dalla FDA degli Stati Uniti
Queste informazioni sono state recuperate direttamente dal sito web clinicaltrials.gov senza alcuna modifica. In caso di richieste di modifica, rimozione o aggiornamento dei dettagli dello studio, contattare register@clinicaltrials.gov. Non appena verrà implementata una modifica su clinicaltrials.gov, questa verrà aggiornata automaticamente anche sul nostro sito web .