Questa pagina è stata tradotta automaticamente e l'accuratezza della traduzione non è garantita. Si prega di fare riferimento al Versione inglese per un testo di partenza.

Studio di convalida multicentrico di uno strumento di intelligenza artificiale per la classificazione automatica delle radiografie del torace

28 luglio 2021 aggiornato da: Hospital Italiano de Buenos Aires
Un problema attuale nei Dipartimenti di Radiologia è il costante aumento del numero di studi eseguiti. Attualmente il maggior volume di studi appartiene ai normali raggi X. Questo problema è aggravato dalla carenza di specialisti con dedizione ed esperienza nella loro interpretazione. Nel campo dell'informatica è emersa un'area di studio chiamata Intelligenza Artificiale (AI), che consiste in un sistema informatico che impara a svolgere specifici compiti di routine e può integrare o imitare il lavoro umano. Dal 2018, Hospital Italiano de Buenos Aires gestisce il programma TRx, che consiste nello sviluppo di uno strumento basato sull'intelligenza artificiale per rilevare i risultati patologici nelle radiografie del torace. L'uso previsto di questo strumento è assistere i medici non esperti di imaging nella diagnosi delle radiografie del torace rilevando automaticamente i risultati radiologici. Il presente studio multicentrico cerca di convalidare esternamente le prestazioni di uno strumento AI (TRx v1) come strumento di assistenza diagnostica per radiografie del torace.

Panoramica dello studio

Descrizione dettagliata

Un problema attuale nei Dipartimenti di Radiologia è il costante aumento del numero di studi eseguiti. Questo volume sempre crescente di informazioni implica un aumento del tempo che i medici specialisti devono dedicare a riferire questi studi. La metodologia utilizzata per la refertazione varia a seconda della modalità di imaging, che nei centri ad alta complessità comprende radiologia, tomografia computerizzata, risonanza magnetica ed ecografia, tra le altre. Attualmente il maggior volume di studi appartiene ai normali raggi X. Presso l'Hospital Italiano de Buenos Aires (HIBA) nel 2019 sono state eseguite più di 220.000 radiografie e all'interno di questo gruppo oltre il 50% delle pratiche sono radiografie del torace, che vengono eseguite come metodo di rilevamento iniziale di patologie potenzialmente gravi (nodulo polmonare, polmonite, pneumotorace).

Questa modalità di imaging non è attraente e non è esplorata dalle nuove generazioni di specialisti di imaging, che preferiscono spostarsi verso metodi più moderni e complessi come la tomografia computerizzata o la risonanza magnetica. Pertanto, il problema del crescente volume di radiografie semplici da analizzare è aggravato dalla carenza di specialisti con dedizione ed esperienza nella loro interpretazione.

Nel campo dell'informatica è emersa un'area di studio chiamata Intelligenza Artificiale (AI), che consiste in un sistema informatico che impara a svolgere specifici compiti di routine e può integrare o imitare il lavoro umano. Lo sviluppatore deve comunicare al sistema di intelligenza artificiale quale risposta si desidera da un dato stimolo. Un esempio di ciò è il correttore ortografico in un elaboratore di testi.

Il campo dell'intelligenza artificiale comprende un'ampia varietà di sottocampi e tecniche specifiche, come Machine Learning (ML) o Deep Learning (DL). ML comprende qualsiasi strumento in cui i dati computerizzati vengono utilizzati per adattare un modello che trae conclusioni da questi dati di input. Gli algoritmi sono addestrati per apprendere determinati compiti sulla base di una serie di informazioni precedentemente classificate. Ciò include anche le tecniche tradizionali per la creazione di modelli predittivi o modelli di classificazione. Il filtro antispam della posta elettronica è un esempio di ML. Le reti neurali sono uno degli strumenti inclusi nel machine learning.

Infine, DL è un tipo di ML che ha iniziato ad apparire nel 2015, che consiste nell'aggiungere livelli a una rete neurale tradizionale e creare così un modello non lineare con un grado di complessità maggiore poiché aumenta il numero di parametri da regolare. Questa rete è esposta a un set di dati di addestramento, costituito da informazioni già etichettate, e "impara" a etichettare nuove informazioni imitando i criteri di etichettatura del set di dati. Questo apprendimento è in realtà un aggiustamento iterativo dei parametri del modello, che vengono iterativamente modificati in base all'errore tra l'etichettatura originale e l'etichettatura suggerita dalla rete. Una volta addestrato il modello, i suoi parametri vengono fissati e può essere utilizzato per dedurre etichette di nuove informazioni la cui etichettatura è sconosciuta. È stato riscontrato che i metodi DL hanno prestazioni molto migliori nell'analisi dei dati rispetto ai metodi tradizionali. DL ha già applicazioni nella vita di tutti i giorni, come gli assistenti vocali negli smartphone o il riconoscimento automatico dei volti e l'etichettatura nei social network.

Il DL applicato all'elaborazione delle immagini si basa su un metodo chiamato reti neurali convoluzionali. La sua applicazione è stata studiata nel campo dell'imaging medico, trovando miglioramenti nelle prestazioni, dal rilevamento di oggetti (strutture anatomiche o patologiche nelle immagini radiologiche) ai compiti di segmentazione.

Dal 2018, Hospital Italiano de Buenos Aires gestisce il programma TRx, che consiste nello sviluppo di uno strumento basato sull'intelligenza artificiale per rilevare i risultati patologici nelle radiografie del torace. Il progetto fa parte del programma Artificial Intelligence in Healthcare dell'Hospital Italiano de Buenos Aires ed è realizzato da un team multidisciplinare di professionisti, tra cui ingegneri biomedici, data scientist, radiologi, informatici clinici clinici, metodologi e ingegneri del software. TRx è un modello DL, sviluppato e convalidato presso HIBA, che rileva quattro tipi di risultati radiologici sulle radiografie del torace: opacità polmonari (noduli, masse, polmonite, consolidamenti, vetro smerigliato o atelettasia), pneumotorace, versamenti pleurici e costola fratture. Questo rilevamento viene eseguito attraverso quattro moduli indipendenti che sono integrati in un unico sistema. Durante l'elaborazione di una radiografia, TRx riporta diversi tipi di risultati. Innanzitutto, il sistema TRx unificato indica in modo dicotomico se l'immagine è sospetta per un reperto patologico o se si tratta probabilmente di una normale radiografia del torace. In secondo luogo, ciascuno dei quattro moduli indica in particolare se è stato rilevato rispettivamente un reperto di opacità polmonare, pneumotorace, versamento pleurico o frattura costale. Infine, TRx consente la visualizzazione di una mappa termica sull'immagine che indica a colori la regione del torace in cui è stato rilevato un reperto sospetto.

L'uso previsto di questo strumento è assistere i medici non esperti di imaging nella diagnosi delle radiografie del torace rilevando automaticamente i risultati radiologici. TRx versione 1.0 (TRx v1) valuta le radiografie frontali del torace di pazienti di età superiore a 14 anni per quattro tipi di reperti: opacità polmonari, versamento pleurico, fratture e pneumotorace. L'obiettivo di questo strumento è quello di migliorare le prestazioni diagnostiche dei medici non di imaging fornendo assistenza o un "rapporto preliminare".

Un fatto che viene sottolineato nell'IA è che i modelli devono essere replicabili; il modello deve dare risultati uguali o migliori se riceve lo stesso input. Anche se questo sembra ovvio, è in contrasto con gli esseri umani, che comunemente mostrano variabilità sia inter che intra-osservatore. Lo standard di un modello di intelligenza artificiale dovrebbe almeno corrispondere alle prestazioni umane che assisterà. La replicabilità dipende dal problema e la quantità di variabilità dipende dall'attività specifica a portata di mano.

Ci sono autori che riferiscono che un modello AI può presentare difficoltà nel fornire previsioni accurate quando applicato a nuove situazioni o popolazioni (cioè a cui non è stato esposto durante l'addestramento). Mentre i radiologi sono in grado di adattarsi con successo alle differenze nelle immagini (dovute allo spessore della sezione, alla marcatura dello scanner, all'intensità del campo, all'intensità del gradiente o al tempo di contrasto) senza influire sulla loro interpretazione delle immagini, l'IA generalmente manca di tale capacità. Ad esempio, se un agente AI è stato addestrato solo con le immagini di uno scanner MRI da 3 Tesla, non è possibile garantire a priori che avrà gli stessi risultati su scansioni eseguite a 1,5 Tesla. Una soluzione è sviluppare processi matematici per riconoscere, normalizzare e trasformare i dati per ridurre al minimo la deriva. Un altro approccio per mitigare questo fenomeno consiste nell'eseguire l'addestramento e la convalida con set di dati "completi", che rappresentano ogni tipo di acquisizione e ricostruzione di dati di immagini.

Al fine di valutare le prestazioni diagnostiche di uno strumento di intelligenza artificiale in modo completo e quindi garantirne l'uso previsto, si raccomanda di eseguire studi multicentrici, che consentano di misurare queste prestazioni in diverse popolazioni di pazienti e diversi protocolli di acquisizione delle immagini. Il presente studio multicentrico cerca di convalidare esternamente le prestazioni di uno strumento AI (TRx v.1) come strumento di assistenza diagnostica per radiografie del torace.

Tipo di studio

Osservativo

Iscrizione (Anticipato)

385

Contatti e Sedi

Questa sezione fornisce i recapiti di coloro che conducono lo studio e informazioni su dove viene condotto lo studio.

Luoghi di studio

      • Buenos Aires, Argentina, 1199
        • Hospital Italiano de Buenos Aires

Criteri di partecipazione

I ricercatori cercano persone che corrispondano a una certa descrizione, chiamata criteri di ammissibilità. Alcuni esempi di questi criteri sono le condizioni generali di salute di una persona o trattamenti precedenti.

Criteri di ammissibilità

Età idonea allo studio

18 anni e precedenti (Adulto, Adulto più anziano)

Accetta volontari sani

N/A

Sessi ammissibili allo studio

Tutto

Metodo di campionamento

Campione di probabilità

Popolazione di studio

L'unità di studio saranno le radiografie del torace fornite dai centri partecipanti, mantenendo la riservatezza del paziente in questione (senza alcun dato sensibile come nome, cognome, numero di carta d'identità o data di nascita). Le immagini saranno ottenute retrospettivamente dai rispettivi database istituzionali.

Descrizione

Criterio di inclusione:

Saranno inclusi i raggi X che soddisfano i seguenti requisiti:

  • Radiografia del torace
  • Appartengono a pazienti di età superiore ai 18 anni.
  • Advocacy e acquisizione digitale
  • Studio condotto nelle suddette istituzioni e archiviato nei rispettivi sistemi di archiviazione e comunicazione delle immagini

Criteri di esclusione:

Raggi X esclusi:

  • Tecnica scadente (basso contrasto, velato, fuori centro)
  • Presenza di posizione anomala del paziente durante l'acquisizione.

Piano di studio

Questa sezione fornisce i dettagli del piano di studio, compreso il modo in cui lo studio è progettato e ciò che lo studio sta misurando.

Come è strutturato lo studio?

Dettagli di progettazione

Cosa sta misurando lo studio?

Misure di risultato primarie

Misura del risultato
Misura Descrizione
Lasso di tempo
Concordanza tra strumento AI e standard di riferimento
Lasso di tempo: 5 mesi
Verrà analizzata la concordanza tra la categoria assegnata dai professionisti e quella assegnata dall'algoritmo. A tal fine, verrà valutato un test diagnostico per il rilevamento dell'anomalia (ovvero, il test è positivo quando si osserva almeno uno dei quattro tipi di reperti). Considerando la diagnosi degli specialisti come standard di riferimento, verrà costruita la matrice di confusione e calcolate le metriche diagnostiche dello strumento AI (sensibilità, specificità e valori predittivi). Gli intervalli di confidenza al 95% saranno calcolati utilizzando la distribuzione binomiale esatta.
5 mesi

Misure di risultato secondarie

Misura del risultato
Misura Descrizione
Lasso di tempo
Curve caratteristiche operative del ricevitore
Lasso di tempo: 5 mesi
Le curve caratteristiche operative del ricevitore saranno costruite per la categoria globale di anormalità e per ciascuno dei singoli rilievi radiologici, calcolando in ogni caso l'area sotto la curva (valore compreso tra 0 e 1). Un modello le cui previsioni sono errate al 100% ha un'area sotto la curva di 0,0; un altro le cui previsioni sono corrette al 100% ha un'area sotto la curva di 1,0. La categorizzazione operata dai radiologi esperti sarà assunta come standard di riferimento. Verrà valutato se vi è una differenza significativa tra l'area sotto la curva dello strumento AI e il valore di riferimento stimato per i medici non esperti di imaging (ad es. medici del pronto soccorso o specializzandi). Verrà utilizzato il test di De Long con un livello di significatività di 0,01.
5 mesi
Analisi qualitativa
Lasso di tempo: 5 mesi
Le immagini con diagnosi errate (falsi negativi e falsi positivi) e le corrispondenti mappe di calore generate dall'algoritmo saranno studiate singolarmente.
5 mesi
Indice di concordanza tra osservatori
Lasso di tempo: 5 mesi
Sarà analizzata la concordanza inter-osservatore tra gli specialisti partecipanti. Nei casi in cui l'immagine in questione è classificata in modo diverso da ciascuno degli osservatori, verrà chiesto loro di rivedere le immagini insieme per definire una categoria.
5 mesi
Analisi per istituzione
Lasso di tempo: 5 mesi
Le variabili dei punti 1. e 2. saranno calcolate separatamente per le immagini di ciascuna istituzione partecipante. Valuteremo se c'è una differenza significativa nei diversi valori dell'area sotto la curva tra le istituzioni utilizzando il test De Long. Verrà utilizzato un livello di significatività di 0,01.
5 mesi

Collaboratori e investigatori

Qui è dove troverai le persone e le organizzazioni coinvolte in questo studio.

Investigatori

  • Investigatore principale: Sonia E Benitez, MD, MSc, Hospital Italiano de Buenos Aires

Pubblicazioni e link utili

La persona responsabile dell'inserimento delle informazioni sullo studio fornisce volontariamente queste pubblicazioni. Questi possono riguardare qualsiasi cosa relativa allo studio.

Pubblicazioni generali

Studiare le date dei record

Queste date tengono traccia dell'avanzamento della registrazione dello studio e dell'invio dei risultati di sintesi a ClinicalTrials.gov. I record degli studi e i risultati riportati vengono esaminati dalla National Library of Medicine (NLM) per assicurarsi che soddisfino specifici standard di controllo della qualità prima di essere pubblicati sul sito Web pubblico.

Studia le date principali

Inizio studio (Effettivo)

1 luglio 2021

Completamento primario (Anticipato)

28 febbraio 2022

Completamento dello studio (Anticipato)

31 luglio 2022

Date di iscrizione allo studio

Primo inviato

28 luglio 2021

Primo inviato che soddisfa i criteri di controllo qualità

28 luglio 2021

Primo Inserito (Effettivo)

5 agosto 2021

Aggiornamenti dei record di studio

Ultimo aggiornamento pubblicato (Effettivo)

5 agosto 2021

Ultimo aggiornamento inviato che soddisfa i criteri QC

28 luglio 2021

Ultimo verificato

1 luglio 2021

Maggiori informazioni

Termini relativi a questo studio

Informazioni su farmaci e dispositivi, documenti di studio

Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti

No

Studia un dispositivo regolamentato dalla FDA degli Stati Uniti

No

Queste informazioni sono state recuperate direttamente dal sito web clinicaltrials.gov senza alcuna modifica. In caso di richieste di modifica, rimozione o aggiornamento dei dettagli dello studio, contattare register@clinicaltrials.gov. Non appena verrà implementata una modifica su clinicaltrials.gov, questa verrà aggiornata automaticamente anche sul nostro sito web .

Sottoscrivi