Denne siden ble automatisk oversatt og nøyaktigheten av oversettelsen er ikke garantert. Vennligst referer til engelsk versjon for en kildetekst.

Lege resonnerer om diagnostiske tilfeller med store språkmodeller

15. februar 2024 oppdatert av: Jonathan Chen, Stanford University

Diagnostisk resonnement med store språkmodell-chatroboter

Denne studien vil evaluere effekten av å gi tilgang til GPT-4, en stor språkmodell, sammenlignet med tradisjonelle diagnostiske beslutningsstøtteverktøy på ytelse på saksbaserte diagnostiske resonneringsoppgaver.

Studieoversikt

Status

Fullført

Forhold

Diagnose

Intervensjon / Behandling

Annen: GPT-4

Detaljert beskrivelse

Kunstig intelligens (AI)-teknologier, spesielt avanserte store språkmodeller som OpenAIs ChatGPT, har potensialet til å forbedre medisinske beslutninger. Selv om ChatGPT-4 ikke ble utviklet for bruk i medisinske spesifikke applikasjoner, har den vist lovende i ulike helsevesenkontekster, inkludert skriving av medisinske notater, adressering av pasienthenvendelser og tilrettelegging for medisinsk konsultasjon. Det er imidlertid lite kjent om hvordan ChatGPT forsterker de kliniske resonneringsevnene til klinikere.

Klinisk resonnement er en kompleks prosess som involverer mønstergjenkjenning, kunnskapsanvendelse og sannsynlighetsresonnement. Å integrere AI-verktøy som ChatGPT-4 i legearbeidsflyter kan potensielt bidra til å redusere klinikerens arbeidsmengde og redusere sannsynligheten for tapte diagnoser. ChatGPT-4 ble imidlertid ikke utviklet for klinisk resonnement og har heller ikke blitt validert for dette formålet. Videre kan det være gjenstand for desinformasjon, inkludert overbevisende konfabulasjoner som kan villede klinikere. Hvis klinikere misbruker dette verktøyet, kan det hende at det ikke forbedrer diagnostisk resonnement og kan til og med forårsake skade. Derfor er det viktig å studere hvordan klinikere bruker store språkmodeller for å forsterke klinisk resonnement før rutinemessig inkorporering i pasientbehandling.

I denne studien vil vi randomisere deltakerne til å svare på diagnostiske tilfeller med eller uten tilgang til ChatGPT-4. Deltakerne vil bli bedt om å gi tre differensialdiagnoser for hvert tilfelle, med støttende og motstridende funn for hver diagnose. I tillegg vil de bli bedt om å gi sin toppdiagnose sammen med neste diagnostiske trinn. Svarene vil bli vurdert av uavhengige anmeldere som er blindet for behandlingsoppdrag.

Studietype

Intervensjonell

Registrering (Faktiske)

Fase

Ikke aktuelt

Kontakter og plasseringer

Denne delen inneholder kontaktinformasjon for de som utfører studien, og informasjon om hvor denne studien blir utført.

Studiekontakt

Navn: Robert J Gallo, MD
Telefonnummer: (650) 723-4000
E-post: rjgallo@stanford.edu

Studer Kontakt Backup

Navn: Jonathan H Chen, MD, PhD
Telefonnummer: (650) 723-4000
E-post: jonc101@stanford.edu

Studiesteder

Forente stater
- California
  - Palo Alto, California, Forente stater, 94304
    - Stanford University

Deltakelseskriterier

Forskere ser etter personer som passer til en bestemt beskrivelse, kalt kvalifikasjonskriterier. Noen eksempler på disse kriteriene er en persons generelle helsetilstand eller tidligere behandlinger.

Kvalifikasjonskriterier

Alder som er kvalifisert for studier

Barn
Voksen
Eldre voksen

Tar imot friske frivillige

Beskrivelse

Inklusjonskriterier:

Deltakere må være autorisert leger og ha fullført minst postgraduate år 2 (PGY2) av medisinsk opplæring.
Opplæring i indremedisin, familiemedisin eller akuttmedisin.

Ekskluderingskriterier:

Trener ikke klinisk for øyeblikket.

Studieplan

Denne delen gir detaljer om studieplanen, inkludert hvordan studien er utformet og hva studien måler.

Hvordan er studiet utformet?

Designdetaljer

Primært formål: Diagnostisk
Tildeling: Randomisert
Intervensjonsmodell: Parallell tildeling
Masking: Enkelt

Antall våpen

Våpen og intervensjoner

Deltakergruppe / Arm	Intervensjon / Behandling
Aktiv komparator: GPT-4 Gruppen vil få tilgang til GPT-4.	Annen: GPT-4 OpenAIs GPT-4 store språkmodell med chat-grensesnitt.
Ingen inngripen: Vanlige ressurser Gruppen vil ikke få tilgang til GPT-4, men vil bli oppfordret til å bruke alle ressurser de ønsker i tillegg til store språkmodeller (UpToDate, Dynamed, google, etc).

Hva måler studien?

Primære resultatmål

Resultatmål	Tiltaksbeskrivelse	Tidsramme
Diagnostisk resonnement Tidsramme: Under evaluering	Det primære utfallet vil være prosenten riktig (område: 0 til 100) for hvert tilfelle. For hvert tilfelle vil deltakerne bli bedt om tre toppdiagnoser og funn fra caset som støtter den diagnosen og motsetter seg den diagnosen. Deltakerne får 1 poeng for hver plausibel diagnose. Funn som støtter diagnosen og funn som motsetter seg diagnosen vil også graderes ut fra riktighet, med 1 poeng for delvis korrekte og 2 poeng for helt korrekte svar. Deltakerne vil deretter bli bedt om å navngi sin toppdiagnose, og tjene ett poeng for et rimelig svar og to poeng for det mest korrekte svaret. Til slutt vil deltakerne bli bedt om å nevne opptil 3 neste trinn for å vurdere pasienten videre med ett poeng for en delvis korrekt respons og to poeng for en helt korrekt respons. Det primære resultatet vil bli sammenlignet på case-nivå av de randomiserte gruppene.	Under evaluering

Sekundære resultatmål

Resultatmål	Tiltaksbeskrivelse	Tidsramme
Tid brukt på diagnose Tidsramme: Under evaluering	Vi vil sammenligne hvor mye tid (i minutter) deltakerne bruker per case mellom de to studiearmene.	Under evaluering

Samarbeidspartnere og etterforskere

Det er her du vil finne personer og organisasjoner som er involvert i denne studien.

Sponsor

Stanford University

Samarbeidspartnere

Beth Israel Deaconess Medical Center

University of Minnesota

Etterforskere

Hovedetterforsker: Jonathan H Chen, MD, PhD, Stanford University
Hovedetterforsker: Adam Rodman, MD, Beth Israel Deaconess Medical Center
Hovedetterforsker: Andrew Olson, MD, University of Minnesota

Studierekorddatoer

Disse datoene sporer fremdriften for innsending av studieposter og sammendragsresultater til ClinicalTrials.gov. Studieposter og rapporterte resultater gjennomgås av National Library of Medicine (NLM) for å sikre at de oppfyller spesifikke kvalitetskontrollstandarder før de legges ut på det offentlige nettstedet.

Studer hoveddatoer

Studiestart (Faktiske)

29. november 2023

Primær fullføring (Faktiske)

30. desember 2023

Studiet fullført (Faktiske)

30. desember 2023

Datoer for studieregistrering

Først innsendt

27. november 2023

Først innsendt som oppfylte QC-kriteriene

27. november 2023

Først lagt ut (Faktiske)

6. desember 2023

Oppdateringer av studieposter

Sist oppdatering lagt ut (Faktiske)

20. februar 2024

Siste oppdatering sendt inn som oppfylte QC-kriteriene

15. februar 2024

Sist bekreftet

1. februar 2024

Mer informasjon

Begreper knyttet til denne studien

Nøkkelord

Ytterligere relevante MeSH-vilkår

Andre studie-ID-numre

71319

Plan for individuelle deltakerdata (IPD)

Planlegger du å dele individuelle deltakerdata (IPD)?

NEI

Legemiddel- og utstyrsinformasjon, studiedokumenter

Studerer et amerikansk FDA-regulert medikamentprodukt

Nei

Studerer et amerikansk FDA-regulert enhetsprodukt

Nei

Denne informasjonen ble hentet direkte fra nettstedet clinicaltrials.gov uten noen endringer. Hvis du har noen forespørsler om å endre, fjerne eller oppdatere studiedetaljene dine, vennligst kontakt register@clinicaltrials.gov. Så snart en endring er implementert på clinicaltrials.gov, vil denne også bli oppdatert automatisk på nettstedet vårt. .

Kliniske studier på Diagnose

University Hospital, Grenoble
Société Française d'Anesthésie et de Réanimation

Fullført

eFast Diagnosis Performance in Guiding First Aid Resuscitation (eFAST Decision)

eFast Diagnosis Performance in Guiding First Aid Resuscitation and Hemostasis

Frankrike
Zagazig University

Rekruttering

Gyldighet av lunge-ultralyd ved diagnose av akutt respiratorisk distress-syndrom

of Lung Ultrasound in Diagnosis of Acute Respiratory Distress Syndrome

Egypt

Kliniske studier på GPT-4

Stanford University
Beth Israel Deaconess Medical Center; University of Minnesota

Rekruttering

Lege resonnerer på ledelsessaker med store språkmodeller

Klinisk beslutningstaking

Forente stater
Wang Shalong
Central South University

Aktiv, ikke rekrutterende

ChatGPT hjelper videreutdanning for medisinstudenter: En studie om selvstyrt læringsforbedring (CHAT-MS)

Medisinsk utdanning | Kunstig intelligens | Selvstyrt læring

Kina
Hoffmann-La Roche

Rekruttering

En studie for å evaluere sikkerheten, farmakokinetikken og den foreløpige antitumoraktiviteten til RO7227166 i kombinasjon med obinutuzumab og i kombinasjon med glofitamab etter en førbehandlingsdose av obinutuzumab administrert til deltakere med residiverende/refraktært lymfkin-hodomgom.

Lymfom, Non-Hodgkin

Forente stater, Belgia, Australia, Danmark, Italia, Spania, Frankrike, Storbritannia
Taipei Veterans General Hospital, Taiwan

Rekruttering

Evaluering av rollen til ChatGPT i opplæring av pasienter med tidlig stadium hepatocellulært karsinom

Karsinom, hepatocellulært

Taiwan
Pharma Holdings AS
CTC Clinical Trial Consultants AB

Fullført

Studie for å evaluere effektiviteten, sikkerheten og toleransen til 3 % LTX-109 for nasal dekolonisering av Staphylococcus Aureus

Nasal avkolonisering av Staphylococcus Aureus

Sverige
Janssen Research & Development, LLC

Fullført

En studie i friske voksne for å evaluere sikkerheten og immunogenisiteten til forskjellige doser av JNJ-63871860

Sunn

Forente stater
Maisonneuve-Rosemont Hospital

Fullført

Inspiratorisk støtte forbedrer preoksygenering hos friske personer

Sunn

Canada
University of Washington

Rekruttering

Prospektiv case-serie for å forbedre frittstående kognitiv atferdsterapikomponenter for multippel sklerosetretthet

Multippel sklerose | Utmattelse

Forente stater
University of Utah
Novartis

Tilbaketrukket

BKM120 i avansert, metastatisk eller tilbakevendende endometriekreft (BKM120)

Livmorkreft

Forente stater
Jeffrey A. Cohen, MD
Jacobus Pharmaceutical

Avsluttet

Kontrollert utprøving av 3,4-diaminopyridin (3-4DAP) ved Lambert-Eaton myasthenic syndrom (LEMS) (3-4DAP)

Muskel svakhet

Forente stater

Lege resonnerer om diagnostiske tilfeller med store språkmodeller

Diagnostisk resonnement med store språkmodell-chatroboter

Studieoversikt

Status

Forhold

Intervensjon / Behandling

Detaljert beskrivelse

Studietype

Registrering (Faktiske)

Fase

Kontakter og plasseringer

Studiekontakt

Studer Kontakt Backup

Studiesteder

Deltakelseskriterier

Kvalifikasjonskriterier

Alder som er kvalifisert for studier

Tar imot friske frivillige

Beskrivelse

Studieplan

Hvordan er studiet utformet?

Designdetaljer

Antall våpen

Våpen og intervensjoner

Deltakergruppe / Arm

Intervensjon / Behandling

Hva måler studien?

Primære resultatmål

Resultatmål

Tiltaksbeskrivelse

Tidsramme

Sekundære resultatmål

Resultatmål

Tiltaksbeskrivelse

Tidsramme

Samarbeidspartnere og etterforskere

Sponsor

Samarbeidspartnere

Etterforskere

Studierekorddatoer

Studer hoveddatoer

Studiestart (Faktiske)

Primær fullføring (Faktiske)

Studiet fullført (Faktiske)

Datoer for studieregistrering

Først innsendt

Først innsendt som oppfylte QC-kriteriene

Først lagt ut (Faktiske)

Oppdateringer av studieposter

Sist oppdatering lagt ut (Faktiske)

Siste oppdatering sendt inn som oppfylte QC-kriteriene

Sist bekreftet

Mer informasjon

Begreper knyttet til denne studien

Nøkkelord

Ytterligere relevante MeSH-vilkår

Andre studie-ID-numre

Plan for individuelle deltakerdata (IPD)

Planlegger du å dele individuelle deltakerdata (IPD)?

Legemiddel- og utstyrsinformasjon, studiedokumenter

Studerer et amerikansk FDA-regulert medikamentprodukt

Studerer et amerikansk FDA-regulert enhetsprodukt

Kliniske studier på Diagnose

Kliniske studier på GPT-4

Søk i lignende forsøk

Sponsorer og samarbeidspartnere

Medisinsk tilstand

Legemiddelintervensjoner

CROs by country

CROs in Austria

Forhold

Sjeldne sykdommer

Legemiddelintervensjoner

Kosttilskudd

Sponsor / samarbeidspartnere

Steder