- ICH GCP
- Registro degli studi clinici negli Stati Uniti
- Sperimentazione clinica NCT07493681
ChatGPT nella Diagnosi e Gestione delle Polineuropatie Complesse: Analisi Comparativa con Neurologi Utilizzando Casi del Mondo Reale (REASON)
Ruolo di ChatGPT nella Diagnosi Differenziale delle Polineuropatie e Confronto delle sue Prestazioni con quelle di Specialisti in Neuropatia Periferica e Non Specialisti
CONTESTO E SCOPO Le polineuropatie sono malattie che colpiscono i nervi periferici e si verificano in circa l'1% della popolazione generale, arrivando fino al 13% tra gli anziani. Nonostante la loro prevalenza, una diagnosi accurata è spesso difficile e richiede competenze specialistiche non sempre disponibili in modo uniforme. I pazienti valutati in contesti di cure primarie o non specialistici sperimentano frequentemente ritardi diagnostici o diagnosi errate, evidenziando la necessità di strumenti innovativi per supportare i clinici nei momenti critici del processo diagnostico.
I modelli di linguaggio di grandi dimensioni (LLM) di intelligenza artificiale (AI), come ChatGPT, sono sempre più esplorati come potenziali aiuti nella diagnosi clinica. Questi strumenti possono elaborare informazioni cliniche complesse e generare suggerimenti diagnostici a basso costo e con ampia accessibilità. Tuttavia, le loro prestazioni in condizioni neurologiche specializzate, in particolare le polineuropatie complesse, non sono ancora state rigorosamente valutate in contesti reali.
OBIETTIVI DELLO STUDIO Questo studio mira a valutare le prestazioni diagnostiche di ChatGPT-4o su casi reali di polineuropatia e a confrontarle con quelle di specialisti in malattie dei nervi periferici e neurologi non specialisti. Un obiettivo secondario è valutare se l'esposizione agli output di ChatGPT-4o influenza e potenzialmente migliora l'accuratezza diagnostica dei neurologi.
DISEGNO DELLO STUDIO Si tratterà di uno studio comparativo di accuratezza diagnostica condotto in due centri di riferimento terziario per neuropatie periferiche a Milano, Italia. Cento pazienti con diagnosi confermate di polineuropatia saranno selezionati casualmente tra pazienti ambulatoriali consecutivi. Ogni caso sarà riassunto in un formato standardizzato che include dati demografici, storia dei sintomi, risultati dell'esame neurologico, risultati degli studi di conduzione nervosa e dati di laboratorio di screening. Solo i casi con una diagnosi confermata dopo almeno 12 mesi di follow-up clinico saranno inclusi.
ChatGPT-4o sarà presentato con ogni caso utilizzando un prompt strutturato, e gli verrà chiesto di fornire: (1) una diagnosi principale, (2) due diagnosi differenziali alternative e (3) un singolo test diagnostico di conferma raccomandato. Il modello sarà eseguito in due prove indipendenti per valutare la coerenza delle risposte.
Gli stessi 100 casi saranno anche esaminati da neurologi di centri internazionali multipli. I partecipanti saranno classificati come specialisti in malattie dei nervi periferici, neurologi che praticano regolarmente in centri terziari di polineuropatia, o non specialisti, inclusi neurologi generali o quelli sub-specializzati in altri campi. I neurologi forniranno prima le loro valutazioni diagnostiche in modo indipendente, e successivamente verrà loro mostrato l'output di ChatGPT-4o con l'opzione di rivedere le loro risposte.
SIGNIFICATO ATTESO Questo studio fornirà prove sul fatto che i LLM basati sull'AI possano servire come affidabili aiuti diagnostici in casi complessi di polineuropatia.
Panoramica dello studio
Stato
Condizioni
Intervento / Trattamento
Descrizione dettagliata
Background and Rationale Le polineuropatie rappresentano un gruppo eterogeneo di disturbi che colpiscono il sistema nervoso periferico e costituiscono una delle condizioni neurologiche più comuni riscontrate nella pratica clinica. La loro prevalenza è stimata all'incirca all'1% nella popolazione generale e aumenta sostanzialmente con l'età, raggiungendo quasi il 4% tra gli individui di mezza età e fino al 13% tra gli anziani. Le neuropatie periferiche rappresentano quindi un contributore significativo alla morbilità neurologica e all'utilizzo delle risorse sanitarie a livello mondiale.
Stabilire la diagnosi eziologica della polineuropatia rimane una sfida clinica. Nonostante i progressi nei test di laboratorio e nelle tecniche neurofisiologiche, il processo diagnostico continua a fare molto affidamento su un'attenta valutazione clinica, inclusa un'anamnesi dettagliata del paziente e un esame neurologico, seguiti dall'uso mirato di indagini elettrofisiologiche e di laboratorio. In molti casi, una diagnosi accurata richiede una competenza specializzata nei disturbi neuromuscolari.
L'accesso a tale competenza è distribuito in modo disomogeneo nei sistemi sanitari. Una parte sostanziale dei pazienti con neuropatie periferiche viene inizialmente valutata da medici non specialisti, inclusi neurologi generalisti o clinici in contesti di cure primarie o secondarie. Ritardi diagnostici e classificazioni errate dei sottotipi di neuropatia sono quindi relativamente comuni, in particolare per eziologie rare o atipiche. Queste sfide evidenziano la necessità di strumenti in grado di supportare i clinici durante il processo diagnostico.
I recenti progressi nell'intelligenza artificiale (IA), in particolare lo sviluppo di modelli linguistici di grandi dimensioni (LLM), hanno generato un crescente interesse per le loro potenziali applicazioni in medicina clinica. ChatGPT, sviluppato da OpenAI e basato sull'architettura Generative Pre-trained Transformer, è un sistema di IA conversazionale in grado di generare ragionamenti medici e suggerimenti diagnostici contestualmente consapevoli. Studi emergenti suggeriscono che gli LLM possono raggiungere prestazioni diagnostiche paragonabili a quelle di tirocinanti medici o medici in determinati compiti di ragionamento clinico.
Tuttavia, la valutazione rigorosa delle prestazioni degli LLM in condizioni neurologiche complesse rimane limitata. In particolare, esistono poche prove riguardo alle loro prestazioni in casi di polineuropatia diagnosticamente impegnativi tipicamente riscontrati nei centri di riferimento terziari. Valutare le capacità e i limiti di tali strumenti in questo contesto è essenziale prima di considerare il loro potenziale ruolo come sistemi di supporto alle decisioni cliniche.
Questo studio mira a valutare sistematicamente le prestazioni diagnostiche di ChatGPT-4o quando applicato a casi reali di polineuropatia e a confrontare le sue prestazioni con quelle di neurologi specialisti e non specialisti.
Study Objectives L'obiettivo principale di questo studio è valutare l'accuratezza diagnostica di ChatGPT-4o nell'identificare la principale diagnosi eziologica in casi complessi di polineuropatia.
In particolare, lo studio mira a confrontare le prestazioni diagnostiche di ChatGPT-4o con quelle di specialisti in malattie dei nervi periferici e di neurologi non specialisti.
Gli obiettivi secondari includono la valutazione della capacità di ChatGPT-4o di generare diagnosi differenziali appropriate e raccomandare test diagnostici di conferma adeguati. Lo studio valuterà anche se l'esposizione a suggerimenti diagnostici generati dall'IA influenza le decisioni diagnostiche dei neurologi. Inoltre, lo studio valuterà la coerenza delle risposte di ChatGPT-4o attraverso valutazioni indipendenti ripetute e caratterizzerà i tipi di errori prodotti dal modello quando vengono generate diagnosi errate.
Study Design Questo è uno studio di accuratezza diagnostica comparativa progettato per valutare le prestazioni di un modello linguistico di grandi dimensioni basato sull'intelligenza artificiale rispetto ai neurologi umani.
Lo studio sarà condotto in due centri di riferimento terziari per neuropatie periferiche situati a Milano, Italia: Humanitas Research Hospital (IRCCS) e Fondazione IRCCS Istituto Neurologico Carlo Besta. Queste istituzioni forniscono cure specializzate a pazienti con un'ampia gamma di polineuropatie, incluse eziologie infiammatorie, ereditarie, metaboliche, tossiche e paraneoplastiche.
Il protocollo dello studio è stato approvato dal Comitato Etico dell'Humanitas Research Hospital e sarà condotto in conformità con i principi della Dichiarazione di Helsinki.
Study Population and Case Selection I casi clinici saranno identificati retrospettivamente da pazienti valutati negli ambulatori di polineuropatia delle istituzioni partecipanti. I casi eleggibili includeranno pazienti con diagnosi confermata di polineuropatia per i quali è stata stabilita una diagnosi eziologica stabile dopo almeno 12 mesi di follow-up clinico.
Le informazioni cliniche saranno estratte dalle cartelle cliniche e utilizzate per preparare riassunti standardizzati dei casi. I dati inclusi nei riassunti rifletteranno le informazioni tipicamente disponibili durante la valutazione diagnostica iniziale, inclusi dati demografici del paziente, anamnesi clinica, risultati dell'esame neurologico, risultati degli studi di conduzione nervosa e risultati dei test di screening di laboratorio standard.
Dal pool di casi eleggibili, 100 casi saranno selezionati casualmente utilizzando un metodo di campionamento generato al computer. Tutti i casi saranno resi anonimi prima dell'analisi.
Il set di dati finale dovrebbe includere un ampio spettro di eziologie di polineuropatia che riflettono i modelli di riferimento dei centri neuromuscolari terziari, inclusi neuropatie infiammatorie, neuropatie ereditarie, neuropatie metaboliche, neuropatie tossiche e altre condizioni meno comuni.
Case Evaluation by ChatGPT-4o Il sistema di intelligenza artificiale valutato in questo studio è ChatGPT-4o Enterprise, sviluppato da OpenAI.
Ogni riassunto di caso clinico sarà presentato al modello utilizzando prompt standardizzati che istruiscono il modello ad analizzare lo scenario clinico e fornire un ragionamento diagnostico. Per ogni caso, al modello verrà chiesto di generare:
- una principale diagnosi eziologica,
- due diagnosi alternative meno probabili,
- e un test diagnostico in grado di confermare la diagnosi principale. Per minimizzare il bias contestuale, ogni caso sarà valutato in una sessione indipendente senza cronologia di conversazione precedente. L'intero set di dati sarà valutato due volte in due esecuzioni indipendenti al fine di valutare la riproducibilità e la coerenza delle risposte del modello.
Case Evaluation by Neurologists Un gruppo di neurologi di diversi centri internazionali parteciperà come valutatori umani nello studio. I partecipanti includeranno sia specialisti in malattie dei nervi periferici che neurologi senza una specifica sottospecializzazione nei disturbi neuromuscolari.
I neurologi esamineranno gli stessi riassunti standardizzati dei casi utilizzando un'interfaccia web e sarà loro chiesto di fornire una diagnosi principale, due diagnosi differenziali alternative e un test diagnostico di conferma raccomandato per ogni caso.
La valutazione sarà condotta in due fasi. Nella prima fase, i neurologi esamineranno indipendentemente i casi e forniranno le loro valutazioni diagnostiche. Nella seconda fase, i casi saranno presentati nuovamente insieme all'output diagnostico generato da ChatGPT-4o, consentendo ai neurologi di confermare o modificare le loro risposte precedenti. Questo disegno consentirà di valutare l'influenza potenziale dei suggerimenti generati dall'IA sulle decisioni diagnostiche dei medici.
Outcome Assessment L'esito primario dello studio è l'accuratezza diagnostica per la diagnosi principale, definita come la proporzione di casi in cui la diagnosi principale proposta corrisponde alla diagnosi eziologica confermata finale.
Gli esiti secondari includono l'accuratezza delle diagnosi differenziali, l'appropriatezza dei test diagnostici di conferma raccomandati e i cambiamenti nelle prestazioni diagnostiche dei neurologi dopo aver esaminato gli output generati dall'IA.
Tutte le risposte saranno valutate rispetto alla diagnosi confermata finale per ciascun caso. L'appropriatezza delle diagnosi differenziali e delle raccomandazioni sui test diagnostici sarà valutata indipendentemente da neurologi esperti con ampia esperienza nella diagnosi di polineuropatia.
Clinical Significance Questo studio fornirà prove empiriche sulle prestazioni diagnostiche di un modello linguistico di grandi dimensioni in un dominio neurologico complesso. Confrontando direttamente il ragionamento diagnostico generato dall'IA con quello di neurologi specialisti e non specialisti, lo studio mira a chiarire il potenziale ruolo dei modelli linguistici di grandi dimensioni come strumenti di supporto alle decisioni in neurologia.
Tipo di studio
Iscrizione (Effettivo)
Contatti e Sedi
Luoghi di studio
-
-
MI
-
Milan, MI, Italia, 20089
- Humanitas Research Hospital
-
-
Criteri di partecipazione
Criteri di ammissibilità
Età idonea allo studio
- Bambino
- Adulto
- Adulto più anziano
Accetta volontari sani
Metodo di campionamento
Popolazione di studio
Descrizione
Criteri di inclusione
- Diagnosi confermata di polineuropatia di qualsiasi eziologia
- Diagnosi eziologica definitiva confermata dopo almeno 12 mesi di follow-up clinico
- Disponibilità di informazioni cliniche, elettrofisiologiche e di laboratorio sufficienti nella cartella clinica per consentire la preparazione di una sintesi standardizzata del caso
Criteri di esclusione
- Assenza di una diagnosi eziologica confermata (neuropatia idiopatica)
Piano di studio
Come è strutturato lo studio?
Dettagli di progettazione
Coorti e interventi
Gruppo / Coorte |
Intervento / Trattamento |
|---|---|
|
Pazienti con polineuropatia
Pazienti con una diagnosi eziologica confermata di polineuropatia valutati presso centri di riferimento terziari per le malattie neuromuscolari.
I dati clinici di questi pazienti verranno utilizzati per generare riassunti di casi standardizzati e anonimizzati che saranno valutati da neurologi e da un modello di linguaggio di grandi dimensioni basato sull'intelligenza artificiale (ChatGPT-4o) per l'accuratezza diagnostica.
|
ChatGPT-4o Enterprise (OpenAI) viene valutato come un modello linguistico di grandi dimensioni basato sull'intelligenza artificiale per il ragionamento diagnostico clinico.
Al modello verranno presentati riassunti standardizzati e anonimizzati di casi clinici, che genererà una diagnosi principale, due diagnosi differenziali alternative e un test diagnostico di conferma raccomandato per ciascun caso.
I riepiloghi dei casi
|
Cosa sta misurando lo studio?
Misure di risultato primarie
Misura del risultato |
Misura Descrizione |
Lasso di tempo |
|---|---|---|
|
Accuratezza Diagnostica della Diagnosi Principale
Lasso di tempo: per tutta la durata dello studio, in media 6 mesi
|
Proporzione di casi in cui la diagnosi principale proposta da ChatGPT-4o, neurologi specialisti o neurologi non specialisti corrisponde alla diagnosi eziologica finale confermata del paziente.
|
per tutta la durata dello studio, in media 6 mesi
|
Misure di risultato secondarie
Misura del risultato |
Misura Descrizione |
Lasso di tempo |
|---|---|---|
|
Accuratezza delle Diagnosi Differenziali
Lasso di tempo: fino al completamento dello studio, in media 6 mesi
|
Proporzione dei casi in cui la corretta diagnosi eziologica è inclusa tra le tre diagnosi proposte (una diagnosi principale e due diagnosi differenziali alternative).
|
fino al completamento dello studio, in media 6 mesi
|
|
Variazione nell'Accuratezza Diagnostica del Neurologo Dopo la Revisione dell'IA
Lasso di tempo: fino al completamento dello studio, in media 6 mesi
|
Variazione dell'accuratezza diagnostica del neurologista prima e dopo la revisione degli output di ChatGPT-4o.
|
fino al completamento dello studio, in media 6 mesi
|
|
Consistenza delle Risposte di ChatGPT-4o tra Prove Indipendenti
Lasso di tempo: fino al completamento dello studio, in media 6 mesi
|
Accordo tra due esecuzioni indipendenti di ChatGPT-4o nella valutazione degli stessi casi clinici.
|
fino al completamento dello studio, in media 6 mesi
|
Collaboratori e investigatori
Sponsor
Collaboratori
Investigatori
- Investigatore principale: Pietro Emiliano Doneddu, MD, Neurologist, Humanitas Research Hospital IRCCS, Rozzano-Milan
Pubblicazioni e link utili
Pubblicazioni generali
- Fonseca A, Ferreira A, Ribeiro L, Moreira S, Duque C. Embracing the future-is artificial intelligence already better? A comparative study of artificial intelligence performance in diagnostic accuracy and decision-making. Eur J Neurol. 2024 Apr;31(4):e16195. doi: 10.1111/ene.16195. Epub 2024 Jan 18.
- Kanjee Z, Crowe B, Rodman A. Accuracy of a Generative Artificial Intelligence Model in a Complex Diagnostic Challenge. JAMA. 2023 Jul 3;330(1):78-80. doi: 10.1001/jama.2023.8288.
- Uwishema O, Boon P. Bridging the Gaps: Addressing Inequities in Neurological Care for Underserved Populations. Eur J Neurol. 2025 Feb;32(2):e70073. doi: 10.1111/ene.70073. No abstract available.
- Elafros MA, Kvalsund MP, Callaghan BC. The Global Burden of Polyneuropathy-In Need of an Accurate Assessment. JAMA Neurol. 2022 Jun 1;79(6):537-538. doi: 10.1001/jamaneurol.2022.0565. No abstract available.
Studiare le date dei record
Studia le date principali
Inizio studio (Effettivo)
Completamento primario (Effettivo)
Completamento dello studio (Effettivo)
Date di iscrizione allo studio
Primo inviato
Primo inviato che soddisfa i criteri di controllo qualità
Primo Inserito (Effettivo)
Aggiornamenti dei record di studio
Ultimo aggiornamento pubblicato (Effettivo)
Ultimo aggiornamento inviato che soddisfa i criteri QC
Ultimo verificato
Maggiori informazioni
Termini relativi a questo studio
Parole chiave
Termini MeSH pertinenti aggiuntivi
Altri numeri di identificazione dello studio
- 485/24
Piano per i dati dei singoli partecipanti (IPD)
Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?
Descrizione del piano IPD
Periodo di condivisione IPD
Criteri di accesso alla condivisione IPD
Tipo di informazioni di supporto alla condivisione IPD
- STUDIO_PROTOCOLLO
- LINFA
- ICF
- CODICE_ANALITICO
- RSI
Informazioni su farmaci e dispositivi, documenti di studio
Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti
Studia un dispositivo regolamentato dalla FDA degli Stati Uniti
Queste informazioni sono state recuperate direttamente dal sito web clinicaltrials.gov senza alcuna modifica. In caso di richieste di modifica, rimozione o aggiornamento dei dettagli dello studio, contattare register@clinicaltrials.gov. Non appena verrà implementata una modifica su clinicaltrials.gov, questa verrà aggiornata automaticamente anche sul nostro sito web .
Prove cliniche su ChatGPT-4o
-
Lahore University of Management SciencesKing Edward Medical UniversityCompletato
-
Lahore University of Management SciencesCompletato
-
Maastricht UniversityAga Khan University; University of Indonesia, Jakarta, IndonesiaCompletatoDiagnosi | Vignette di Pazienti FittiziOlanda, Indonesia, Kenya
-
North Sichuan Medical CollegePeking University; Peking University First Hospital; Monash University; Case Western... e altri collaboratoriNon ancora reclutamentoMalattie cardiache | Infezioni | Polmonite | Patologia | Cancro | Insufficienza respiratoriaCina
-
Philipps University MarburgCompletatoMalattie reumaticheGermania
-
Charite University, Berlin, GermanyGerman Research Foundation; Max Planck Institute for Human DevelopmentNon ancora reclutamentoRaccomandazioni per lo Screening del Cancro Ovarico da parte dei GinecologiGermania
-
North Sichuan Medical CollegeAffiliated Hospital of North Sichuan Medical CollegeCompletato
-
Chang Gung University of Science and TechnologyNational Science and Technology Council, TaiwanNon ancora reclutamentoComunicazione sociale | CHF - insufficienza cardiaca congestizia | 65 anni in più
-
Boston Intelligent Medical Research Center, Shenzhen...Tsinghua UniversityNon ancora reclutamentoCura preoperatoria
-
Chang Gung University of Science and TechnologyNon ancora reclutamentoComunicazione sociale | CHF - insufficienza cardiaca congestizia | 65 anni in più | Sarcopenia nell'anziano