Questa pagina è stata tradotta automaticamente e l'accuratezza della traduzione non è garantita. Si prega di fare riferimento al Versione inglese per un testo di partenza.

La Capacità Diagnostica e di Triage della Collaborazione tra Profani e Modelli Linguistici di Grandi Dimensioni in Cina

25 novembre 2025 aggiornato da: Zhang Min, Huazhong University of Science and Technology

La Capacità Diagnostica e di Triage della Collaborazione tra Non Professionisti e Modelli Linguistici di Grande Scala: un Esperimento Controllato Randomizzato Nazionale Pre-test Post-test in Cina

L'obiettivo di questo studio controllato randomizzato è valutare il ruolo dei grandi modelli linguistici nel migliorare la capacità delle persone comuni di autodiagnosticare e triage le malattie comuni. Le principali domande a cui mira a rispondere sono:

L'utilizzo di un LLM aiuta i partecipanti a formulare autodiagnosi e decisioni di cura più accurate per malattie comuni, rispetto alla loro prima ipotesi senza alcun aiuto?
Quanto è migliore quando le persone lavorano insieme a un LLM, rispetto all'utilizzo di un motore di ricerca normale, all'utilizzo del solo LLM o a come deciderebbero i medici? I ricercatori confronteranno i partecipanti assegnati casualmente al gruppo LLM (utilizzando DeepSeek) o al gruppo motore di ricerca per vedere se l'approccio assistito da LLM porta a giudizi clinici migliori.

I partecipanti:

Leggeranno una delle 48 brevi vignette sanitarie realistiche;
Formuleranno un'ipotesi iniziale su cosa potrebbe non andare elencando fino a tre possibili cause, classificate dalla più alla meno probabile, e sceglieranno un livello di cura: cercare cure immediate, vedere un medico entro un giorno, vedere un medico entro una settimana o gestire a casa senza cure mediche.
Utilizzeranno lo strumento assegnato (DeepSeek o un motore di ricerca standard) per cercare informazioni e aggiornare la loro ipotesi e decisione di cura;
Invieranno la diagnosi finale e la scelta di cura dopo aver utilizzato lo strumento. Inoltre, il team di studio ha valutato le prestazioni di altri quattro modelli di IA (GPT-4o, GPT-o1, DeepSeek-v3 e DeepSeek-r1) e di 33 medici di medicina generale esperti sulle stesse vignette.

Panoramica dello studio

Stato

Completato

Condizioni

Intervento / Trattamento

Tipo di studio

Interventistico

Iscrizione (Effettivo)

6360

Fase

Non applicabile

Contatti e Sedi

Questa sezione fornisce i recapiti di coloro che conducono lo studio e informazioni su dove viene condotto lo studio.

Luoghi di studio

Cina
- Hubei
  - Wuhan, Hubei, Cina
    - Tongji Medical College of Huazhong University of Science & Technology School of Medicine and Health Management

Criteri di partecipazione

I ricercatori cercano persone che corrispondano a una certa descrizione, chiamata criteri di ammissibilità. Alcuni esempi di questi criteri sono le condizioni generali di salute di una persona o trattamenti precedenti.

Criteri di ammissibilità

Età idonea allo studio

Adulto
Adulto più anziano

Accetta volontari sani

Descrizione

Criteri di inclusione:

Età di 18 anni o superiore
Attuale residente della Cina continentale
Storia di partecipazione di alta qualità a sondaggi online sulla piattaforma Credamo (tasso di accettazione dei sondaggi storici ≥ 80% e punteggio di credito personale ≥ 70)

Criteri di esclusione:

Risposte al sondaggio incomplete
Fallimento sugli elementi di controllo qualità incorporati
Tempo di completamento implausibilmente breve (<180 secondi per il gruppo motore di ricerca; <360 secondi per il gruppo LLM)
Fornitura di risposte non diagnostiche o irrilevanti (ad esempio, "sconosciuto", "non so")
Modello coerente di risposte identiche su tutti gli elementi

Piano di studio

Questa sezione fornisce i dettagli del piano di studio, compreso il modo in cui lo studio è progettato e ciò che lo studio sta misurando.

Come è strutturato lo studio?

Dettagli di progettazione

Scopo principale: Ricerca sui servizi sanitari
Assegnazione: Randomizzato
Modello interventistico: Assegnazione parallela
Mascheramento: Separare

Numero di armi

Armi e interventi

Gruppo di partecipanti / Arm	Intervento / Trattamento
Sperimentale: gruppo integrato persona comune-LLM Dopo aver inizialmente risposto a una domanda di diagnosi clinica e triage senza l'ausilio di strumenti, ai partecipanti è stato chiesto di utilizzare un grande modello linguistico (Deepseek v3 o r1) per recuperare informazioni sanitarie e poi rispondere nuovamente alla stessa domanda	Comportamentale: Ricerca di informazioni sanitarie assistita dall'intelligenza artificiale I partecipanti in questo gruppo hanno utilizzato un modello di linguaggio di grandi dimensioni (DeepSeek) per cercare informazioni mediche relative a una vignetta clinica dopo aver fornito le decisioni iniziali di diagnosi e triage. È stato loro richiesto di interagire liberamente con il modello per raccogliere approfondimenti e quindi aggiornare le loro diagnosi e raccomandazioni di triage. L'intervento simula l'uso nel mondo reale di strumenti di intelligenza artificiale per il processo decisionale sulla salute personale
Comparatore attivo: gruppo motore di ricerca per profani Dopo aver inizialmente risposto a una domanda di diagnosi clinica e triage senza l'uso di strumenti, ai partecipanti è stato richiesto di utilizzare un motore di ricerca per recuperare informazioni sanitarie e poi rispondere nuovamente alla stessa domanda	Comportamentale: Ricerca sanitaria convenzionale su internet I partecipanti in questo gruppo hanno utilizzato motori di ricerca internet mainstream (ad esempio, Baidu, Google, Bing) per cercare informazioni sulla vignetta clinica dopo aver preso le decisioni diagnostiche e di triage iniziali. Era loro permesso di cercare liberamente, ma non era consentito l'uso di qualsiasi piattaforma di chatbot AI denominata o di modelli linguistici di grandi dimensioni. Questo gruppo rappresenta il tipico comportamento di ricerca autonoma di informazioni sanitarie online.

Gruppo di partecipanti / Arm

Intervento / Trattamento

Sperimentale: gruppo integrato persona comune-LLM

Dopo aver inizialmente risposto a una domanda di diagnosi clinica e triage senza l'ausilio di strumenti, ai partecipanti è stato chiesto di utilizzare un grande modello linguistico (Deepseek v3 o r1) per recuperare informazioni sanitarie e poi rispondere nuovamente alla stessa domanda

Comportamentale: Ricerca di informazioni sanitarie assistita dall'intelligenza artificiale

I partecipanti in questo gruppo hanno utilizzato un modello di linguaggio di grandi dimensioni (DeepSeek) per cercare informazioni mediche relative a una vignetta clinica dopo aver fornito le decisioni iniziali di diagnosi e triage. È stato loro richiesto di interagire liberamente con il modello per raccogliere approfondimenti e quindi aggiornare le loro diagnosi e raccomandazioni di triage. L'intervento simula l'uso nel mondo reale di strumenti di intelligenza artificiale per il processo decisionale sulla salute personale

Comparatore attivo: gruppo motore di ricerca per profani

Dopo aver inizialmente risposto a una domanda di diagnosi clinica e triage senza l'uso di strumenti, ai partecipanti è stato richiesto di utilizzare un motore di ricerca per recuperare informazioni sanitarie e poi rispondere nuovamente alla stessa domanda

Comportamentale: Ricerca sanitaria convenzionale su internet

I partecipanti in questo gruppo hanno utilizzato motori di ricerca internet mainstream (ad esempio, Baidu, Google, Bing) per cercare informazioni sulla vignetta clinica dopo aver preso le decisioni diagnostiche e di triage iniziali. Era loro permesso di cercare liberamente, ma non era consentito l'uso di qualsiasi piattaforma di chatbot AI denominata o di modelli linguistici di grandi dimensioni. Questo gruppo rappresenta il tipico comportamento di ricerca autonoma di informazioni sanitarie online.

Cosa sta misurando lo studio?

Misure di risultato primarie

Misura del risultato	Misura Descrizione	Lasso di tempo
Top-3 Accuratezza Diagnostica Lasso di tempo: Immediatamente dopo l'intervento (nella stessa sessione di indagine)	L'esito diagnostico primario è stato definito come la proporzione di partecipanti che includevano la diagnosi corretta nelle loro prime tre diagnosi differenziali dopo aver utilizzato lo strumento assegnato (LLM o motore di ricerca). L'accuratezza è stata valutata per ciascuno dei 48 scenari clinici e aggregata tra tutti i partecipanti in ciascun gruppo.	Immediatamente dopo l'intervento (nella stessa sessione di indagine)
Accuratezza del Triage (corrispondenza esatta a 4 classi) Lasso di tempo: Immediatamente dopo l'intervento (nella stessa sessione di indagine)	L'accuratezza del triage è stata definita come la proporzione di partecipanti che hanno selezionato il livello di triage corretto (cure emergenti, entro un giorno, entro una settimana o autocura) corrispondente allo standard di riferimento. C'erano 12 scenari per categoria di triage.	Immediatamente dopo l'intervento (nella stessa sessione di indagine)

Misure di risultato secondarie

Misura del risultato	Misura Descrizione	Lasso di tempo
Precisione Diagnostica Top-1 Lasso di tempo: Immediatamente dopo l'intervento (nella stessa sessione del sondaggio)	La proporzione di partecipanti che ha selezionato la diagnosi corretta come prima diagnosi dopo aver utilizzato lo strumento assegnato. Questa misura la precisione del giudizio diagnostico finale dei non professionisti.	Immediatamente dopo l'intervento (nella stessa sessione del sondaggio)
Accuratezza del Triage (corrispondenza binaria a 2 classi) Lasso di tempo: Immediatamente dopo l'intervento (durante la stessa sessione di indagine)		Immediatamente dopo l'intervento (durante la stessa sessione di indagine)

Collaboratori e investigatori

Qui è dove troverai le persone e le organizzazioni coinvolte in questo studio.

Sponsor

Huazhong University of Science and Technology

Investigatori

Investigatore principale: Chenxi Liu, Huazhong University of Science and Technology

Studiare le date dei record

Queste date tengono traccia dell'avanzamento della registrazione dello studio e dell'invio dei risultati di sintesi a ClinicalTrials.gov. I record degli studi e i risultati riportati vengono esaminati dalla National Library of Medicine (NLM) per assicurarsi che soddisfino specifici standard di controllo della qualità prima di essere pubblicati sul sito Web pubblico.

Studia le date principali

Inizio studio (Effettivo)

27 aprile 2025

Completamento primario (Effettivo)

1 luglio 2025

Completamento dello studio (Effettivo)

1 luglio 2025

Date di iscrizione allo studio

Primo inviato

17 novembre 2025

Primo inviato che soddisfa i criteri di controllo qualità

25 novembre 2025

Primo Inserito (Effettivo)

26 novembre 2025

Aggiornamenti dei record di studio

Ultimo aggiornamento pubblicato (Effettivo)

26 novembre 2025

Ultimo aggiornamento inviato che soddisfa i criteri QC

25 novembre 2025

Ultimo verificato

1 ottobre 2025

Maggiori informazioni

Termini relativi a questo studio

Altri numeri di identificazione dello studio

JCYJ20240813115806009

Piano per i dati dei singoli partecipanti (IPD)

Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?

Informazioni su farmaci e dispositivi, documenti di studio

Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti

Studia un dispositivo regolamentato dalla FDA degli Stati Uniti

Queste informazioni sono state recuperate direttamente dal sito web clinicaltrials.gov senza alcuna modifica. In caso di richieste di modifica, rimozione o aggiornamento dei dettagli dello studio, contattare register@clinicaltrials.gov. Non appena verrà implementata una modifica su clinicaltrials.gov, questa verrà aggiornata automaticamente anche sul nostro sito web .

Prove cliniche su Intervento basato sulla vignetta

Liu Zhihan

Attivo, non reclutante

Efficacia di un sistema di servizi di assistenza integrata intelligente e di casa per anziani (ESCHIC)

Smart Services Care Services di Community and Home Based

Cina
Brown University
Johns Hopkins University; University of Arkansas; Anhui Medical University

Completato

mHealth e autotest dell'HIV

Mobile Health Intervention per promuovere l'autotest dell'HIV

Cina
University of Houston
University of Oklahoma

Non ancora reclutamento

Migliorare la cessazione del fumo per il popolo afroamericano ovunque (ESCAPE)

Intervento di fuga+NRT | QuitStart Intervention+Nrt | Ctrl+Nrt

Stati Uniti

Prove cliniche su Ricerca di informazioni sanitarie assistita dall'intelligenza artificiale

Vidya Raman

Completato

Analisi retrospettiva nelle misure di qualità delle cure nei pazienti con adenotonsillectomia pediatrica

Adenotonsillectomia

La Capacità Diagnostica e di Triage della Collaborazione tra Profani e Modelli Linguistici di Grandi Dimensioni in Cina

La Capacità Diagnostica e di Triage della Collaborazione tra Non Professionisti e Modelli Linguistici di Grande Scala: un Esperimento Controllato Randomizzato Nazionale Pre-test Post-test in Cina

Panoramica dello studio

Stato

Condizioni

Intervento / Trattamento

Tipo di studio

Iscrizione (Effettivo)

Fase

Contatti e Sedi

Luoghi di studio

Criteri di partecipazione

Criteri di ammissibilità

Età idonea allo studio

Accetta volontari sani

Descrizione

Piano di studio

Come è strutturato lo studio?

Dettagli di progettazione

Numero di armi

Armi e interventi

Gruppo di partecipanti / Arm

Intervento / Trattamento

Cosa sta misurando lo studio?

Misure di risultato primarie

Misura del risultato

Misura Descrizione

Lasso di tempo

Misure di risultato secondarie

Misura del risultato

Misura Descrizione

Lasso di tempo

Collaboratori e investigatori

Sponsor

Investigatori

Studiare le date dei record

Studia le date principali

Inizio studio (Effettivo)

Completamento primario (Effettivo)

Completamento dello studio (Effettivo)

Date di iscrizione allo studio

Primo inviato

Primo inviato che soddisfa i criteri di controllo qualità

Primo Inserito (Effettivo)

Aggiornamenti dei record di studio

Ultimo aggiornamento pubblicato (Effettivo)

Ultimo aggiornamento inviato che soddisfa i criteri QC

Ultimo verificato

Maggiori informazioni

Termini relativi a questo studio

Altri numeri di identificazione dello studio

Piano per i dati dei singoli partecipanti (IPD)

Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?

Informazioni su farmaci e dispositivi, documenti di studio

Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti

Studia un dispositivo regolamentato dalla FDA degli Stati Uniti

Prove cliniche su Intervento basato sulla vignetta

Prove cliniche su Ricerca di informazioni sanitarie assistita dall'intelligenza artificiale

Cerca prove simili

Sponsor e collaboratori

Condizioni mediche

Interventi farmacologici

CROs by country

CROs in Germany

Condizioni

Malattie rare

Interventi farmacologici

Supplementi dietetici

Sponsor / Collaboratori

Sedi