Denne side blev automatisk oversat, og nøjagtigheden af ​​oversættelsen er ikke garanteret. Der henvises til engelsk version for en kildetekst.

Læge ræsonnerer om diagnostiske tilfælde med store sprogmodeller

15. februar 2024 opdateret af: Jonathan Chen, Stanford University

Diagnostisk ræsonnement med store sprogmodelchatbots

Denne undersøgelse vil evaluere effekten af ​​at give adgang til GPT-4, en stor sprogmodel, sammenlignet med traditionelle diagnostiske beslutningsstøtteværktøjer på ydeevne på case-baserede diagnostiske ræsonnementopgaver.

Studieoversigt

Status

Afsluttet

Betingelser

Intervention / Behandling

Detaljeret beskrivelse

Kunstig intelligens (AI) teknologier, specifikt avancerede store sprogmodeller som OpenAIs ChatGPT, har potentialet til at forbedre medicinsk beslutningstagning. Selvom ChatGPT-4 ikke blev udviklet til dets brug i medicinsk-specifikke applikationer, har det vist lovende i forskellige sundhedsmæssige sammenhænge, ​​herunder medicinsk noteskrivning, adressering af patienthenvendelser og facilitering af medicinsk konsultation. Der er dog lidt kendt om, hvordan ChatGPT øger klinikernes kliniske ræsonnementevner.

Klinisk ræsonnement er en kompleks proces, der involverer mønstergenkendelse, videnanvendelse og probabilistisk ræsonnement. At integrere AI-værktøjer som ChatGPT-4 i lægearbejdsgange kan potentielt hjælpe med at reducere klinikernes arbejdsbyrde og mindske sandsynligheden for manglende diagnoser. ChatGPT-4 blev dog ikke udviklet med henblik på klinisk ræsonnement og er heller ikke blevet valideret til dette formål. Yderligere kan det være underlagt desinformation, herunder overbevisende konfabulationer, der kan vildlede klinikere. Hvis klinikere misbruger dette værktøj, forbedrer det muligvis ikke diagnostisk ræsonnement og kan endda forårsage skade. Derfor er det vigtigt at studere, hvordan klinikere bruger store sprogmodeller til at øge klinisk ræsonnement forud for rutinemæssig inkorporering i patientbehandling.

I denne undersøgelse vil vi randomisere deltagere til at besvare diagnostiske tilfælde med eller uden adgang til ChatGPT-4. Deltagerne vil blive bedt om at give tre differentialdiagnoser for hvert tilfælde, med understøttende og modsatrettede fund for hver diagnose. Derudover vil de blive bedt om at give deres topdiagnose sammen med de næste diagnostiske trin. Svarene vil blive bedømt af uafhængige anmeldere, der er blindet for behandlingsopgave.

Undersøgelsestype

Interventionel

Tilmelding (Faktiske)

50

Fase

  • Ikke anvendelig

Kontakter og lokationer

Dette afsnit indeholder kontaktoplysninger for dem, der udfører undersøgelsen, og oplysninger om, hvor denne undersøgelse udføres.

Studiesteder

    • California
      • Palo Alto, California, Forenede Stater, 94304
        • Stanford University

Deltagelseskriterier

Forskere leder efter personer, der passer til en bestemt beskrivelse, kaldet berettigelseskriterier. Nogle eksempler på disse kriterier er en persons generelle helbredstilstand eller tidligere behandlinger.

Berettigelseskriterier

Aldre berettiget til at studere

  • Barn
  • Voksen
  • Ældre voksen

Tager imod sunde frivillige

Ja

Beskrivelse

Inklusionskriterier:

  • Deltagerne skal være autoriserede læger og have gennemført mindst post-graduate år 2 (PGY2) af medicinsk uddannelse.
  • Uddannelse i intern medicin, familiemedicin eller akutmedicin.

Ekskluderingskriterier:

  • Praktiserer ikke klinisk i øjeblikket.

Studieplan

Dette afsnit indeholder detaljer om studieplanen, herunder hvordan undersøgelsen er designet, og hvad undersøgelsen måler.

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

  • Primært formål: Diagnostisk
  • Tildeling: Randomiseret
  • Interventionel model: Parallel tildeling
  • Maskning: Enkelt

Våben og indgreb

Deltagergruppe / Arm
Intervention / Behandling
Aktiv komparator: GPT-4
Gruppen får adgang til GPT-4.
OpenAI's GPT-4 store sprogmodel med chatgrænseflade.
Ingen indgriben: Sædvanlige ressourcer
Gruppen vil ikke få adgang til GPT-4, men vil blive opfordret til at bruge alle de ressourcer, de ønsker udover store sprogmodeller (UpToDate, Dynamed, google osv.).

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Diagnostisk ræsonnement
Tidsramme: Under evaluering
Det primære resultat vil være procenten korrekt (interval: 0 til 100) for hvert tilfælde. For hver case vil deltagerne blive bedt om tre topdiagnoser og fund fra casen, der understøtter den diagnose og modsætter sig denne diagnose. Deltagerne får 1 point for hver plausibel diagnose. Fund, der understøtter diagnosen og fund, der modsætter sig diagnosen, vil ligeledes blive bedømt ud fra rigtigheden, med 1 point for delvist korrekte og 2 point for helt korrekte svar. Deltagerne vil derefter blive bedt om at navngive deres topdiagnose, hvor de tjener et point for et rimeligt svar og to point for det mest korrekte svar. Til sidst vil deltagerne blive bedt om at nævne op til 3 næste trin for yderligere at evaluere patienten med et point for et delvist korrekt svar og to point for et fuldstændigt korrekt svar. Det primære resultat vil blive sammenlignet på case-niveau af de randomiserede grupper.
Under evaluering

Sekundære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Tid brugt på diagnose
Tidsramme: Under evaluering
Vi vil sammenligne, hvor meget tid (i minutter) deltagerne bruger pr. case mellem de to undersøgelsesarme.
Under evaluering

Samarbejdspartnere og efterforskere

Det er her, du vil finde personer og organisationer, der er involveret i denne undersøgelse.

Efterforskere

  • Ledende efterforsker: Jonathan H Chen, MD, PhD, Stanford University
  • Ledende efterforsker: Adam Rodman, MD, Beth Israel Deaconess Medical Center
  • Ledende efterforsker: Andrew Olson, MD, University of Minnesota

Datoer for undersøgelser

Disse datoer sporer fremskridtene for indsendelser af undersøgelsesrekord og resumeresultater til ClinicalTrials.gov. Studieregistreringer og rapporterede resultater gennemgås af National Library of Medicine (NLM) for at sikre, at de opfylder specifikke kvalitetskontrolstandarder, før de offentliggøres på den offentlige hjemmeside.

Studer store datoer

Studiestart (Faktiske)

29. november 2023

Primær færdiggørelse (Faktiske)

30. december 2023

Studieafslutning (Faktiske)

30. december 2023

Datoer for studieregistrering

Først indsendt

27. november 2023

Først indsendt, der opfyldte QC-kriterier

27. november 2023

Først opslået (Faktiske)

6. december 2023

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

20. februar 2024

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

15. februar 2024

Sidst verificeret

1. februar 2024

Mere information

Begreber relateret til denne undersøgelse

Yderligere relevante MeSH-vilkår

Andre undersøgelses-id-numre

  • 71319

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

INGEN

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Ingen

Studerer et amerikansk FDA-reguleret enhedsprodukt

Ingen

Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .

Kliniske forsøg med Diagnose

Kliniske forsøg med GPT-4

3
Abonner