Questa pagina è stata tradotta automaticamente e l'accuratezza della traduzione non è garantita. Si prega di fare riferimento al Versione inglese per un testo di partenza.

Improving the Reliability of LLMs as Medical Assistants for the General Public (LAMP-1)

3 luglio 2026 aggiornato da: Ji Xunming,MD,PhD, Capital Medical University

Improving the Reliability of LLMs as Medical Assistants for the General Public: a Proof of Concept Simulation Trial

This study will evaluate whether three-minute six-dimensions education(3M-6D education) can improve the reliability of large language models as medical assistants for the general public. Participants will be randomly assigned to receive or not receive 3M-6D education and then use ChatGPT, Gemini, or non-AI information resources. The study will assess relevant condition identification, disposition concordance, red-flag identification, and NASA-TLX score.

Panoramica dello studio

Stato

Reclutamento

Condizioni

Relevant Conditions Identification

Intervento / Trattamento

Descrizione dettagliata

This randomized, controlled, proof-of-concept simulation trial will evaluate whether three-minute six-dimensions education (3M-6D education) can improve the reliability of large language models as medical assistants for the general public.

Eligible participants will be randomly assigned in a 1:1:1:1:1 ratio to one of five study groups: the 3M-6D education GPT group, the GPT group, the 3M-6D education Gemini group, the Gemini group, or the control group. Participants in the 3M-6D education GPT and 3M-6D education Gemini groups will receive approximately three minutes of education before using ChatGPT or Gemini.Each participant will be randomly assigned one of 10 standardized clinical scenarios and complete a simulated counseling task in unrestricted natural language within approximately 10 minutes. The study will assess relevant condition identification, disposition concordance, red-flag identification, and NASA-TLX score.

Tipo di studio

Interventistico

Iscrizione (Stimato)

525

Fase

Non applicabile

Contatti e Sedi

Questa sezione fornisce i recapiti di coloro che conducono lo studio e informazioni su dove viene condotto lo studio.

Contatto studio

Nome: Xunming Ji
Numero di telefono: 01083198962
Email: jixm@ccmu.edu.cn

Backup dei contatti dello studio

Nome: Chuanjie Wu
Numero di telefono: 01083199439
Email: wuchuanjie@ccmu.edu.cn

Luoghi di studio

Cina
- Beijing Municipality
  - Beijing, Beijing Municipality, Cina
    - Reclutamento
    - Beijing Ctiy
    - Contatto:
      
      Chuanjie Wu
      
      Numero di telefono: 010-83199439
      
      Email: wuchuanjie@ccmu.edu.cn

Criteri di partecipazione

I ricercatori cercano persone che corrispondano a una certa descrizione, chiamata criteri di ammissibilità. Alcuni esempi di questi criteri sono le condizioni generali di salute di una persona o trattamenti precedenti.

Criteri di ammissibilità

Età idonea allo studio

Adulto
Adulto più anziano

Accetta volontari sani

Sì

Descrizione

Inclusion Criteria:

Age 18 years or greater, male or female;
Completed primary school or higher education;
Able to use a smartphone or computer to complete online interaction;
No history of acute ischemic stroke, systemic lupus erythematosus, gastric ulcer, pneumonia, acute cardiac infarction, urinary tract infection, uterine fibroids, diabetes, osteoarthritis, or migraine.
Able to understand and comply with study procedures and to provide written informed consent.

Exclusion Criteria:

Currently or previously employed as a healthcare worker;
Previously received systematic medical training;
Currently involved in concurrent research that may interfere with the results of the present trial;
The investigator considered that the participant had other conditions that might affect compliance or preclude participation.

Piano di studio

Questa sezione fornisce i dettagli del piano di studio, compreso il modo in cui lo studio è progettato e ciò che lo studio sta misurando.

Come è strutturato lo studio?

Dettagli di progettazione

Scopo principale: Ricerca sui servizi sanitari
Assegnazione: Randomizzato
Modello interventistico: Assegnazione parallela
Mascheramento: Separare

Numero di armi

Armi e interventi

Gruppo di partecipanti / Arm	Intervento / Trattamento
Sperimentale: 3M-6D education GPT Group Participants will first be trained in 3M-6D education, then use ChatGPT to complete a consultation task in unrestricted natural language in approximately 10 minutes.	Altro: ChatGPT Participants use ChatGPT to complete a standardized simulated clinical scenarios in unrestricted natural language. Comportamentale: three minutes six dimensions education 3M-6D education is designed based on Cognitive Load Theory to reduce the cognitive burden on patients during medical interactions with AI and to improve the clarity and completeness of symptom reporting. Guided by cognitive load theory and the natural process physicians use to take medical histories, the investigators identified candidate information dimensions and developed a structured expression framework with six dimensions for public health queries through a Delphi expert consensus process. Participants were instructed to use the framework to describe their symptoms across these six dimensions; this process can typically be completed within three minutes, so the investigators call this approach three minutes six dimensions education (3M-6D education).
Sperimentale: 3M-6D education Gemini Group Participants will first be trained in 3M-6D education, then use Gemini to complete a consultation task in unrestricted natural language in approximately 10 minutes.	Altro: Gemini Participants use Gemini to complete a standardized simulated clinical scenarios in unrestricted natural language. Comportamentale: three minutes six dimensions education 3M-6D education is designed based on Cognitive Load Theory to reduce the cognitive burden on patients during medical interactions with AI and to improve the clarity and completeness of symptom reporting. Guided by cognitive load theory and the natural process physicians use to take medical histories, the investigators identified candidate information dimensions and developed a structured expression framework with six dimensions for public health queries through a Delphi expert consensus process. Participants were instructed to use the framework to describe their symptoms across these six dimensions; this process can typically be completed within three minutes, so the investigators call this approach three minutes six dimensions education (3M-6D education).
Comparatore attivo: GPT Group Participants will use ChatGPT to complete a consultation task in unrestricted natural language in approximately 10 minutes.	Altro: ChatGPT Participants use ChatGPT to complete a standardized simulated clinical scenarios in unrestricted natural language.
Comparatore attivo: Gemini Group Participants will use Gemini to complete a consultation task in unrestricted natural language in approximately 10 minutes.	Altro: Gemini Participants use Gemini to complete a standardized simulated clinical scenarios in unrestricted natural language.
Nessun intervento: Control group Participants will use non-AI tools such as internet searches and medical websites to complete a consultation task in unrestricted natural language in approximately 10 minutes.

Cosa sta misurando lo studio?

Misure di risultato primarie

Misura del risultato	Misura Descrizione	Lasso di tempo
Relevant conditions identification of the 3M-6D education GPT group compared with the GPT group Lasso di tempo: 1 hour.	Relevant conditions identification is defined as the proportion of participants whose final response includes the expert-defined final diagnosis or a relevant differential diagnosis.	1 hour.
Disposition concordance of the 3M-6D education GPT group compared with the GPT group Lasso di tempo: 1 hour.	Disposition concordance is defined as the proportion of participants whose final care recommendation matches the expert-defined level. The five levels are self-care, routine outpatient care, urgent outpatient care, emergency department visit, and emergency medical services.	1 hour.
Relevant conditions identification of the 3M-6D education Gemini group compared with the Gemini group Lasso di tempo: 1 hour.		1 hour.
Disposition concordance of the 3M-6D education Gemini group compared with the Gemini group Lasso di tempo: 1 hour.		1 hour.

Misure di risultato secondarie

Misura del risultato	Misura Descrizione	Lasso di tempo
Relevant conditions identification of the 3M-6D education GPT group compared with the control group Lasso di tempo: 1 hour.		1 hour.
Relevant conditions identification of the 3M-6D education Gemini group compared with the control group Lasso di tempo: 1 hour.		1 hour.
Disposition concordance of the 3M-6D education GPT group compared with the control group Lasso di tempo: 1 hour.		1 hour.
Disposition concordance of the 3M-6D education Gemini group compared with the control group Lasso di tempo: 1 hour.		1 hour.
Red-flag identification in the 3M-6D education GPT group compared with the GPT group Lasso di tempo: 1 hour.	Red-flag identification is defined as the proportion of participants whose final response includes the key warning signs that experts defined for the assigned scenario.	1 hour.
Red-flag identification in the 3M-6D education GPT group compared with the control group Lasso di tempo: 1 hour.		1 hour.
Red-flag identification in the 3M-6D education Gemini group compared with the Gemini group Lasso di tempo: 1 hour.		1 hour.
Red-flag identification in the 3M-6D education Gemini group compared with the control group Lasso di tempo: 1 hour.		1 hour.
NASA Task Load Index score of the 3M-6D education GPT group compared with the GPT group Lasso di tempo: 1 hour.	NASA-TLX score is a self-reported task-load score measured after the simulated consultation with a physician. It includes six domains: mental demand, physical demand, temporal demand, effort, frustration, and performance. Each domain is scored from 0 to 100. The total score is the mean of the six domains. Higher scores indicate greater perceived task load.	1 hour.
NASA Task Load Index score of the 3M-6D education GPT group compared with the control group Lasso di tempo: 1 hour.	NASA-TLX score is a self-reported task-load score measured after the simulated consultation with a physician. It includes six domains: mental demand, physical demand, temporal demand, effort, frustration, and performance. Each domain is scored from 0 to 100. The total score is the mean of the six domains. Higher scores indicate greater perceived task load.	1 hour.
NASA Task Load Index score of the 3M-6D education Gemini group compared with the Gemini group Lasso di tempo: 1 hour.	NASA-TLX score is a self-reported task-load score measured after the simulated consultation with a physician. It includes six domains: mental demand, physical demand, temporal demand, effort, frustration, and performance. Each domain is scored from 0 to 100. The total score is the mean of the six domains. Higher scores indicate greater perceived task load.	1 hour.
NASA Task Load Index score of the 3M-6D education Gemini group compared with the control group Lasso di tempo: 1 hour.	NASA-TLX score is a self-reported task-load score measured after the simulated consultation with a physician. It includes six domains: mental demand, physical demand, temporal demand, effort, frustration, and performance. Each domain is scored from 0 to 100. The total score is the mean of the six domains. Higher scores indicate greater perceived task load.	1 hour.
Relevant conditions identification of the 3M-6D education GPT group compared with the 3M-6D education Gemini group Lasso di tempo: 1 hour.		1 hour.
Disposition concordance of the 3M-6D education GPT group compared with the 3M-6D education Gemini group Lasso di tempo: 1 hour.		1 hour.
Red-flag identification in the 3M-6D education GPT group compared with the 3M-6D education Gemini group Lasso di tempo: 1 hour.		1 hour.
NASA Task Load Index score of the 3M-6D education GPT group compared with the 3M-6D education Gemini group Lasso di tempo: 1 hour.	NASA-TLX score is a self-reported task-load score measured after the simulated consultation with a physician. It includes six domains: mental demand, physical demand, temporal demand, effort, frustration, and performance. Each domain is scored from 0 to 100. The total score is the mean of the six domains. Higher scores indicate greater perceived task load.	1 hour.

Altre misure di risultato

Misura del risultato	Misura Descrizione	Lasso di tempo
Failure to identify red flags in the 3M-6D education GPT group compared with the GPT group Lasso di tempo: 1 hour.	Failure to identify red flags is defined as the proportion of participants whose final response does not include the expert-defined red-flag symptoms or warning signs for the assigned standardized simulated clinical scenario.	1 hour.
Failure to identify red flags in the 3M-6D education GPT group compared with the control group Lasso di tempo: 1 hour.		1 hour.
Failure to identify red flags in the 3M-6D education Gemini group compared with the Gemini group Lasso di tempo: 1 hour.		1 hour.
Failure to identify red flags in the 3M-6D education Gemini group compared with the control group Lasso di tempo: 1 hour.		1 hour.
Underestimation of disposition in the 3M-6D education GPT group compared with the GPT group Lasso di tempo: 1 hour.	Underestimation of disposition is defined as the proportion of participants whose final care recommendation is lower than the expert-defined disposition level for the assigned standardized simulated clinical scenario.	1 hour.
Underestimation of disposition in the 3M-6D education GPT group compared with the control group Lasso di tempo: 1 hour.		1 hour.
Underestimation of disposition in the 3M-6D education Gemini group compared with the Gemini group Lasso di tempo: 1 hour.		1 hour.
Underestimation of disposition in the 3M-6D education Gemini group compared with the control group Lasso di tempo: 1 hour.		1 hour.

Collaboratori e investigatori

Qui è dove troverai le persone e le organizzazioni coinvolte in questo studio.

Sponsor

Capital Medical University

Collaboratori

Xuanwu Hospital, Beijing

Studiare le date dei record

Queste date tengono traccia dell'avanzamento della registrazione dello studio e dell'invio dei risultati di sintesi a ClinicalTrials.gov. I record degli studi e i risultati riportati vengono esaminati dalla National Library of Medicine (NLM) per assicurarsi che soddisfino specifici standard di controllo della qualità prima di essere pubblicati sul sito Web pubblico.

Studia le date principali

Inizio studio (Effettivo)

3 luglio 2026

Completamento primario (Stimato)

20 luglio 2026

Completamento dello studio (Stimato)

20 luglio 2026

Date di iscrizione allo studio

Primo inviato

11 giugno 2026

Primo inviato che soddisfa i criteri di controllo qualità

11 giugno 2026

Primo Inserito (Effettivo)

16 giugno 2026

Aggiornamenti dei record di studio

Ultimo aggiornamento pubblicato (Effettivo)

7 luglio 2026

Ultimo aggiornamento inviato che soddisfa i criteri QC

3 luglio 2026

Ultimo verificato

1 luglio 2026

Maggiori informazioni

Termini relativi a questo studio

Parole chiave

Altri numeri di identificazione dello studio

LAMP-1

Piano per i dati dei singoli partecipanti (IPD)

Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?

INDECISO

Informazioni su farmaci e dispositivi, documenti di studio

Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti

Studia un dispositivo regolamentato dalla FDA degli Stati Uniti

Queste informazioni sono state recuperate direttamente dal sito web clinicaltrials.gov senza alcuna modifica. In caso di richieste di modifica, rimozione o aggiornamento dei dettagli dello studio, contattare register@clinicaltrials.gov. Non appena verrà implementata una modifica su clinicaltrials.gov, questa verrà aggiornata automaticamente anche sul nostro sito web .

Prove cliniche su ChatGPT

Istituto Clinico Humanitas
Fondazione I.R.C.C.S. Istituto Neurologico Carlo Besta

Completato

ChatGPT nella Diagnosi e Gestione delle Polineuropatie Complesse: Analisi Comparativa con Neurologi Utilizzando Casi del Mondo Reale (REASON)

Polineuropatie

Italia
Philipps University Marburg

Completato

Al per migliorare la diagnosi delle malattie reumatiche rare (AIDRARER)

Malattie reumatiche

Germania
Charite University, Berlin, Germany
German Research Foundation; Max Planck Institute for Human Development

Non ancora reclutamento

Screening del Cancro Ovarico e AI (AI-OCS-Gyn)

Raccomandazioni per lo Screening del Cancro Ovarico da parte dei Ginecologi

Germania
Chang Gung University of Science and Technology
National Science and Technology Council, Taiwan

Non ancora reclutamento

Intervento basato su Chatgpt per la fragilità sociale nelle donne anziane con CHF: differenze di genere

Comunicazione sociale | CHF - insufficienza cardiaca congestizia | 65 anni in più
Boston Intelligent Medical Research Center, Shenzhen...
Tsinghua University

Non ancora reclutamento

ChatGPT vs. Human in Writing a Preoperative Visit Sheet

Cura preoperatoria
Chang Gung University of Science and Technology

Non ancora reclutamento

Confronto di sarcopenia, fragilità fisica, psicologica e sociale nelle donne anziane ricoverate in ambito metropolitano e rurale

Comunicazione sociale | CHF - insufficienza cardiaca congestizia | 65 anni in più | Sarcopenia nell'anziano
Lahore University of Management Sciences
King Edward Medical University

Completato

L'impatto dei modelli linguistici di grandi dimensioni sul ragionamento diagnostico tra i medici

Diagnosi

Pakistan
Montefiore Medical Center

Completato

Valutazione della risposta del medico con approfondimenti contestuali rispetto ai motori standard - Intelligenza artificiale Rag vs LLM Clinical Decision Support (PRECISE)

Modelli di linguaggio di grandi dimensioni

Stati Uniti
Carleton University
Université de Montréal

Completato

Valutazione dell'efficacia e dell'usabilità dell'intelligenza artificiale (ChatGPT) per gli studenti di scienze della salute (AIHSS)

Attività educative | IA (Intelligenza Artificiale)

Canada
National Taiwan University Hospital

Iscrizione su invito

Utilizzo di Chatgpt come coach di lavoro per adulti con disturbo dello spettro autistico

Autismo | Performance di un colloquio di lavoro

Taiwan

Improving the Reliability of LLMs as Medical Assistants for the General Public (LAMP-1)

Improving the Reliability of LLMs as Medical Assistants for the General Public: a Proof of Concept Simulation Trial

Panoramica dello studio

Stato

Condizioni

Intervento / Trattamento

Descrizione dettagliata

Tipo di studio

Iscrizione (Stimato)

Fase

Contatti e Sedi

Contatto studio

Backup dei contatti dello studio

Luoghi di studio

Criteri di partecipazione

Criteri di ammissibilità

Età idonea allo studio

Accetta volontari sani

Descrizione

Piano di studio

Come è strutturato lo studio?

Dettagli di progettazione

Numero di armi

Armi e interventi

Gruppo di partecipanti / Arm

Intervento / Trattamento

Cosa sta misurando lo studio?

Misure di risultato primarie

Misura del risultato

Misura Descrizione

Lasso di tempo

Misure di risultato secondarie

Misura del risultato

Misura Descrizione

Lasso di tempo

Altre misure di risultato

Misura del risultato

Misura Descrizione

Lasso di tempo

Collaboratori e investigatori

Sponsor

Collaboratori

Studiare le date dei record

Studia le date principali

Inizio studio (Effettivo)

Completamento primario (Stimato)

Completamento dello studio (Stimato)

Date di iscrizione allo studio

Primo inviato

Primo inviato che soddisfa i criteri di controllo qualità

Primo Inserito (Effettivo)

Aggiornamenti dei record di studio

Ultimo aggiornamento pubblicato (Effettivo)

Ultimo aggiornamento inviato che soddisfa i criteri QC

Ultimo verificato

Maggiori informazioni

Termini relativi a questo studio

Parole chiave

Altri numeri di identificazione dello studio

Piano per i dati dei singoli partecipanti (IPD)

Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?

Informazioni su farmaci e dispositivi, documenti di studio

Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti

Studia un dispositivo regolamentato dalla FDA degli Stati Uniti

Prove cliniche su ChatGPT

Cerca prove simili

Sponsor e collaboratori

Condizioni mediche

Interventi farmacologici

CROs by country

CROs in Equatorial Guinea

Condizioni

Malattie rare

Interventi farmacologici

Supplementi dietetici

Sponsor / Collaboratori

Sedi