Questa pagina è stata tradotta automaticamente e l'accuratezza della traduzione non è garantita. Si prega di fare riferimento al Versione inglese per un testo di partenza.

Ragionamento medico su casi diagnostici con modelli linguistici di grandi dimensioni

15 febbraio 2024 aggiornato da: Jonathan Chen, Stanford University

Ragionamento diagnostico con chatbot con modelli linguistici di grandi dimensioni

Questo studio valuterà l'effetto di fornire l'accesso a GPT-4, un ampio modello linguistico, rispetto ai tradizionali strumenti di supporto alle decisioni diagnostiche sulle prestazioni nei compiti di ragionamento diagnostico basato sui casi.

Panoramica dello studio

Stato

Completato

Condizioni

Intervento / Trattamento

Descrizione dettagliata

Le tecnologie di intelligenza artificiale (AI), in particolare modelli linguistici avanzati come ChatGPT di OpenAI, hanno il potenziale per migliorare il processo decisionale medico. Sebbene ChatGPT-4 non sia stato sviluppato per l'uso in applicazioni mediche specifiche, si è dimostrato promettente in vari contesti sanitari, tra cui la scrittura di note mediche, la risposta alle domande dei pazienti e la facilitazione della consultazione medica. Tuttavia, si sa poco su come ChatGPT aumenti le capacità di ragionamento clinico dei medici.

Il ragionamento clinico è un processo complesso che coinvolge il riconoscimento di pattern, l’applicazione della conoscenza e il ragionamento probabilistico. L’integrazione di strumenti di intelligenza artificiale come ChatGPT-4 nei flussi di lavoro dei medici potrebbe potenzialmente aiutare a ridurre il carico di lavoro dei medici e diminuire la probabilità di diagnosi mancate. Tuttavia, ChatGPT-4 non è stato sviluppato ai fini del ragionamento clinico né è stato validato per questo scopo. Inoltre, potrebbe essere soggetto a disinformazione, comprese confabulazioni convincenti che potrebbero fuorviare i medici. Se i medici abusano di questo strumento, esso potrebbe non migliorare il ragionamento diagnostico e potrebbe addirittura causare danni. Pertanto, è importante studiare come i medici utilizzano modelli linguistici di grandi dimensioni per potenziare il ragionamento clinico prima dell’integrazione di routine nella cura del paziente.

In questo studio, randomizzeremo i partecipanti per rispondere a casi diagnostici con o senza accesso a ChatGPT-4. Ai partecipanti verrà chiesto di fornire tre diagnosi differenziali per ciascun caso, con risultati favorevoli e contrari per ciascuna diagnosi. Inoltre verrà chiesto loro di fornire la diagnosi principale insieme ai passaggi diagnostici successivi. Le risposte saranno valutate da revisori indipendenti in cieco rispetto all'assegnazione del trattamento.

Tipo di studio

Interventistico

Iscrizione (Effettivo)

50

Fase

  • Non applicabile

Contatti e Sedi

Questa sezione fornisce i recapiti di coloro che conducono lo studio e informazioni su dove viene condotto lo studio.

Luoghi di studio

    • California
      • Palo Alto, California, Stati Uniti, 94304
        • Stanford University

Criteri di partecipazione

I ricercatori cercano persone che corrispondano a una certa descrizione, chiamata criteri di ammissibilità. Alcuni esempi di questi criteri sono le condizioni generali di salute di una persona o trattamenti precedenti.

Criteri di ammissibilità

Età idonea allo studio

  • Bambino
  • Adulto
  • Adulto più anziano

Accetta volontari sani

Descrizione

Criterio di inclusione:

  • I partecipanti devono essere medici autorizzati e aver completato almeno il secondo anno post-laurea (PGY2) di formazione medica.
  • Formazione in medicina interna, medicina di famiglia o medicina d'urgenza.

Criteri di esclusione:

  • Attualmente non pratico clinicamente.

Piano di studio

Questa sezione fornisce i dettagli del piano di studio, compreso il modo in cui lo studio è progettato e ciò che lo studio sta misurando.

Come è strutturato lo studio?

Dettagli di progettazione

  • Scopo principale: Diagnostico
  • Assegnazione: Randomizzato
  • Modello interventistico: Assegnazione parallela
  • Mascheramento: Separare

Armi e interventi

Gruppo di partecipanti / Arm
Intervento / Trattamento
Comparatore attivo: GPT-4
Il gruppo avrà accesso a GPT-4.
Modello linguistico di grandi dimensioni GPT-4 di OpenAI con interfaccia chat.
Nessun intervento: Risorse abituali
Il gruppo non avrà accesso a GPT-4 ma sarà incoraggiato a utilizzare tutte le risorse che desidera oltre ai modelli linguistici di grandi dimensioni (UpToDate, Dynamed, Google, ecc.).

Cosa sta misurando lo studio?

Misure di risultato primarie

Misura del risultato
Misura Descrizione
Lasso di tempo
Ragionamento diagnostico
Lasso di tempo: Durante la valutazione
Il risultato primario sarà la percentuale corretta (intervallo: da 0 a 100) per ciascun caso. Per ogni caso, ai partecipanti verranno chieste le tre principali diagnosi e risultati del caso che supportano quella diagnosi e si oppongono a quella diagnosi. I partecipanti riceveranno 1 punto per ogni diagnosi plausibile. Anche i risultati a sostegno della diagnosi e quelli contrari alla diagnosi verranno valutati in base alla correttezza, con 1 punto per le risposte parzialmente corrette e 2 punti per le risposte completamente corrette. Ai partecipanti verrà quindi chiesto di nominare la loro diagnosi migliore, guadagnando un punto per una risposta ragionevole e due punti per la risposta più corretta. Infine ai partecipanti verrà chiesto di nominare fino a 3 passaggi successivi per valutare ulteriormente il paziente con un punto assegnato per una risposta parzialmente corretta e due punti per una risposta completamente corretta. L'esito primario sarà confrontato a livello di caso dai gruppi randomizzati.
Durante la valutazione

Misure di risultato secondarie

Misura del risultato
Misura Descrizione
Lasso di tempo
Tempo dedicato alla diagnosi
Lasso di tempo: Durante la valutazione
Confronteremo quanto tempo (in minuti) i partecipanti trascorrono per caso tra i due bracci di studio.
Durante la valutazione

Collaboratori e investigatori

Qui è dove troverai le persone e le organizzazioni coinvolte in questo studio.

Investigatori

  • Investigatore principale: Jonathan H Chen, MD, PhD, Stanford University
  • Investigatore principale: Adam Rodman, MD, Beth Israel Deaconess Medical Center
  • Investigatore principale: Andrew Olson, MD, University of Minnesota

Studiare le date dei record

Queste date tengono traccia dell'avanzamento della registrazione dello studio e dell'invio dei risultati di sintesi a ClinicalTrials.gov. I record degli studi e i risultati riportati vengono esaminati dalla National Library of Medicine (NLM) per assicurarsi che soddisfino specifici standard di controllo della qualità prima di essere pubblicati sul sito Web pubblico.

Studia le date principali

Inizio studio (Effettivo)

29 novembre 2023

Completamento primario (Effettivo)

30 dicembre 2023

Completamento dello studio (Effettivo)

30 dicembre 2023

Date di iscrizione allo studio

Primo inviato

27 novembre 2023

Primo inviato che soddisfa i criteri di controllo qualità

27 novembre 2023

Primo Inserito (Effettivo)

6 dicembre 2023

Aggiornamenti dei record di studio

Ultimo aggiornamento pubblicato (Effettivo)

20 febbraio 2024

Ultimo aggiornamento inviato che soddisfa i criteri QC

15 febbraio 2024

Ultimo verificato

1 febbraio 2024

Maggiori informazioni

Termini relativi a questo studio

Termini MeSH pertinenti aggiuntivi

Altri numeri di identificazione dello studio

  • 71319

Piano per i dati dei singoli partecipanti (IPD)

Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?

NO

Informazioni su farmaci e dispositivi, documenti di studio

Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti

No

Studia un dispositivo regolamentato dalla FDA degli Stati Uniti

No

Queste informazioni sono state recuperate direttamente dal sito web clinicaltrials.gov senza alcuna modifica. In caso di richieste di modifica, rimozione o aggiornamento dei dettagli dello studio, contattare register@clinicaltrials.gov. Non appena verrà implementata una modifica su clinicaltrials.gov, questa verrà aggiornata automaticamente anche sul nostro sito web .

Prove cliniche su GPT-4

Sottoscrivi