- ICH GCP
- Registro degli studi clinici negli Stati Uniti
- Sperimentazione clinica NCT07250516
La Capacità Diagnostica e di Triage della Collaborazione tra Profani e Modelli Linguistici di Grandi Dimensioni in Cina
25 novembre 2025 aggiornato da: Zhang Min, Huazhong University of Science and Technology
La Capacità Diagnostica e di Triage della Collaborazione tra Non Professionisti e Modelli Linguistici di Grande Scala: un Esperimento Controllato Randomizzato Nazionale Pre-test Post-test in Cina
L'obiettivo di questo studio controllato randomizzato è valutare il ruolo dei grandi modelli linguistici nel migliorare la capacità delle persone comuni di autodiagnosticare e triage le malattie comuni. Le principali domande a cui mira a rispondere sono:
- L'utilizzo di un LLM aiuta i partecipanti a formulare autodiagnosi e decisioni di cura più accurate per malattie comuni, rispetto alla loro prima ipotesi senza alcun aiuto?
- Quanto è migliore quando le persone lavorano insieme a un LLM, rispetto all'utilizzo di un motore di ricerca normale, all'utilizzo del solo LLM o a come deciderebbero i medici? I ricercatori confronteranno i partecipanti assegnati casualmente al gruppo LLM (utilizzando DeepSeek) o al gruppo motore di ricerca per vedere se l'approccio assistito da LLM porta a giudizi clinici migliori.
I partecipanti:
- Leggeranno una delle 48 brevi vignette sanitarie realistiche;
- Formuleranno un'ipotesi iniziale su cosa potrebbe non andare elencando fino a tre possibili cause, classificate dalla più alla meno probabile, e sceglieranno un livello di cura: cercare cure immediate, vedere un medico entro un giorno, vedere un medico entro una settimana o gestire a casa senza cure mediche.
- Utilizzeranno lo strumento assegnato (DeepSeek o un motore di ricerca standard) per cercare informazioni e aggiornare la loro ipotesi e decisione di cura;
- Invieranno la diagnosi finale e la scelta di cura dopo aver utilizzato lo strumento. Inoltre, il team di studio ha valutato le prestazioni di altri quattro modelli di IA (GPT-4o, GPT-o1, DeepSeek-v3 e DeepSeek-r1) e di 33 medici di medicina generale esperti sulle stesse vignette.
Panoramica dello studio
Stato
Completato
Tipo di studio
Interventistico
Iscrizione (Effettivo)
6360
Fase
- Non applicabile
Contatti e Sedi
Questa sezione fornisce i recapiti di coloro che conducono lo studio e informazioni su dove viene condotto lo studio.
Luoghi di studio
-
-
Hubei
-
Wuhan, Hubei, Cina
- Tongji Medical College of Huazhong University of Science & Technology School of Medicine and Health Management
-
-
Criteri di partecipazione
I ricercatori cercano persone che corrispondano a una certa descrizione, chiamata criteri di ammissibilità. Alcuni esempi di questi criteri sono le condizioni generali di salute di una persona o trattamenti precedenti.
Criteri di ammissibilità
Età idonea allo studio
- Adulto
- Adulto più anziano
Accetta volontari sani
No
Descrizione
Criteri di inclusione:
- Età di 18 anni o superiore
- Attuale residente della Cina continentale
- Storia di partecipazione di alta qualità a sondaggi online sulla piattaforma Credamo (tasso di accettazione dei sondaggi storici ≥ 80% e punteggio di credito personale ≥ 70)
Criteri di esclusione:
- Risposte al sondaggio incomplete
- Fallimento sugli elementi di controllo qualità incorporati
- Tempo di completamento implausibilmente breve (<180 secondi per il gruppo motore di ricerca; <360 secondi per il gruppo LLM)
- Fornitura di risposte non diagnostiche o irrilevanti (ad esempio, "sconosciuto", "non so")
- Modello coerente di risposte identiche su tutti gli elementi
Piano di studio
Questa sezione fornisce i dettagli del piano di studio, compreso il modo in cui lo studio è progettato e ciò che lo studio sta misurando.
Come è strutturato lo studio?
Dettagli di progettazione
- Scopo principale: Ricerca sui servizi sanitari
- Assegnazione: Randomizzato
- Modello interventistico: Assegnazione parallela
- Mascheramento: Separare
Armi e interventi
Gruppo di partecipanti / Arm |
Intervento / Trattamento |
|---|---|
|
Sperimentale: gruppo integrato persona comune-LLM
Dopo aver inizialmente risposto a una domanda di diagnosi clinica e triage senza l'ausilio di strumenti, ai partecipanti è stato chiesto di utilizzare un grande modello linguistico (Deepseek v3 o r1) per recuperare informazioni sanitarie e poi rispondere nuovamente alla stessa domanda
|
I partecipanti in questo gruppo hanno utilizzato un modello di linguaggio di grandi dimensioni (DeepSeek) per cercare informazioni mediche relative a una vignetta clinica dopo aver fornito le decisioni iniziali di diagnosi e triage.
È stato loro richiesto di interagire liberamente con il modello per raccogliere approfondimenti e quindi aggiornare le loro diagnosi e raccomandazioni di triage.
L'intervento simula l'uso nel mondo reale di strumenti di intelligenza artificiale per il processo decisionale sulla salute personale
|
|
Comparatore attivo: gruppo motore di ricerca per profani
Dopo aver inizialmente risposto a una domanda di diagnosi clinica e triage senza l'uso di strumenti, ai partecipanti è stato richiesto di utilizzare un motore di ricerca per recuperare informazioni sanitarie e poi rispondere nuovamente alla stessa domanda
|
I partecipanti in questo gruppo hanno utilizzato motori di ricerca internet mainstream (ad esempio, Baidu, Google, Bing) per cercare informazioni sulla vignetta clinica dopo aver preso le decisioni diagnostiche e di triage iniziali.
Era loro permesso di cercare liberamente, ma non era consentito l'uso di qualsiasi piattaforma di chatbot AI denominata o di modelli linguistici di grandi dimensioni.
Questo gruppo rappresenta il tipico comportamento di ricerca autonoma di informazioni sanitarie online.
|
Cosa sta misurando lo studio?
Misure di risultato primarie
Misura del risultato |
Misura Descrizione |
Lasso di tempo |
|---|---|---|
|
Top-3 Accuratezza Diagnostica
Lasso di tempo: Immediatamente dopo l'intervento (nella stessa sessione di indagine)
|
L'esito diagnostico primario è stato definito come la proporzione di partecipanti che includevano la diagnosi corretta nelle loro prime tre diagnosi differenziali dopo aver utilizzato lo strumento assegnato (LLM o motore di ricerca).
L'accuratezza è stata valutata per ciascuno dei 48 scenari clinici e aggregata tra tutti i partecipanti in ciascun gruppo.
|
Immediatamente dopo l'intervento (nella stessa sessione di indagine)
|
|
Accuratezza del Triage (corrispondenza esatta a 4 classi)
Lasso di tempo: Immediatamente dopo l'intervento (nella stessa sessione di indagine)
|
L'accuratezza del triage è stata definita come la proporzione di partecipanti che hanno selezionato il livello di triage corretto (cure emergenti, entro un giorno, entro una settimana o autocura) corrispondente allo standard di riferimento.
C'erano 12 scenari per categoria di triage.
|
Immediatamente dopo l'intervento (nella stessa sessione di indagine)
|
Misure di risultato secondarie
Misura del risultato |
Misura Descrizione |
Lasso di tempo |
|---|---|---|
|
Precisione Diagnostica Top-1
Lasso di tempo: Immediatamente dopo l'intervento (nella stessa sessione del sondaggio)
|
La proporzione di partecipanti che ha selezionato la diagnosi corretta come prima diagnosi dopo aver utilizzato lo strumento assegnato.
Questa misura la precisione del giudizio diagnostico finale dei non professionisti.
|
Immediatamente dopo l'intervento (nella stessa sessione del sondaggio)
|
|
Accuratezza del Triage (corrispondenza binaria a 2 classi)
Lasso di tempo: Immediatamente dopo l'intervento (durante la stessa sessione di indagine)
|
Immediatamente dopo l'intervento (durante la stessa sessione di indagine)
|
Collaboratori e investigatori
Qui è dove troverai le persone e le organizzazioni coinvolte in questo studio.
Investigatori
- Investigatore principale: Chenxi Liu, Huazhong University of Science and Technology
Studiare le date dei record
Queste date tengono traccia dell'avanzamento della registrazione dello studio e dell'invio dei risultati di sintesi a ClinicalTrials.gov. I record degli studi e i risultati riportati vengono esaminati dalla National Library of Medicine (NLM) per assicurarsi che soddisfino specifici standard di controllo della qualità prima di essere pubblicati sul sito Web pubblico.
Studia le date principali
Inizio studio (Effettivo)
27 aprile 2025
Completamento primario (Effettivo)
1 luglio 2025
Completamento dello studio (Effettivo)
1 luglio 2025
Date di iscrizione allo studio
Primo inviato
17 novembre 2025
Primo inviato che soddisfa i criteri di controllo qualità
25 novembre 2025
Primo Inserito (Effettivo)
26 novembre 2025
Aggiornamenti dei record di studio
Ultimo aggiornamento pubblicato (Effettivo)
26 novembre 2025
Ultimo aggiornamento inviato che soddisfa i criteri QC
25 novembre 2025
Ultimo verificato
1 ottobre 2025
Maggiori informazioni
Termini relativi a questo studio
Altri numeri di identificazione dello studio
- JCYJ20240813115806009
Piano per i dati dei singoli partecipanti (IPD)
Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?
NO
Informazioni su farmaci e dispositivi, documenti di studio
Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti
No
Studia un dispositivo regolamentato dalla FDA degli Stati Uniti
No
Queste informazioni sono state recuperate direttamente dal sito web clinicaltrials.gov senza alcuna modifica. In caso di richieste di modifica, rimozione o aggiornamento dei dettagli dello studio, contattare register@clinicaltrials.gov. Non appena verrà implementata una modifica su clinicaltrials.gov, questa verrà aggiornata automaticamente anche sul nostro sito web .
Prove cliniche su Intervento basato sulla vignetta
-
Liu ZhihanAttivo, non reclutanteSmart Services Care Services di Community and Home BasedCina
-
Brown UniversityJohns Hopkins University; University of Arkansas; Anhui Medical UniversityCompletato
-
University of HoustonUniversity of OklahomaNon ancora reclutamentoIntervento di fuga+NRT | QuitStart Intervention+Nrt | Ctrl+NrtStati Uniti
Prove cliniche su Ricerca di informazioni sanitarie assistita dall'intelligenza artificiale
-
Vidya RamanCompletato