Denne side blev automatisk oversat, og nøjagtigheden af oversættelsen er ikke garanteret. Der henvises til engelsk version for en kildetekst.

Læge ræsonnerer om diagnostiske tilfælde med store sprogmodeller

15. februar 2024 opdateret af: Jonathan Chen, Stanford University

Diagnostisk ræsonnement med store sprogmodelchatbots

Denne undersøgelse vil evaluere effekten af at give adgang til GPT-4, en stor sprogmodel, sammenlignet med traditionelle diagnostiske beslutningsstøtteværktøjer på ydeevne på case-baserede diagnostiske ræsonnementopgaver.

Studieoversigt

Status

Afsluttet

Betingelser

Diagnose

Intervention / Behandling

Andet: GPT-4

Detaljeret beskrivelse

Kunstig intelligens (AI) teknologier, specifikt avancerede store sprogmodeller som OpenAIs ChatGPT, har potentialet til at forbedre medicinsk beslutningstagning. Selvom ChatGPT-4 ikke blev udviklet til dets brug i medicinsk-specifikke applikationer, har det vist lovende i forskellige sundhedsmæssige sammenhænge, herunder medicinsk noteskrivning, adressering af patienthenvendelser og facilitering af medicinsk konsultation. Der er dog lidt kendt om, hvordan ChatGPT øger klinikernes kliniske ræsonnementevner.

Klinisk ræsonnement er en kompleks proces, der involverer mønstergenkendelse, videnanvendelse og probabilistisk ræsonnement. At integrere AI-værktøjer som ChatGPT-4 i lægearbejdsgange kan potentielt hjælpe med at reducere klinikernes arbejdsbyrde og mindske sandsynligheden for manglende diagnoser. ChatGPT-4 blev dog ikke udviklet med henblik på klinisk ræsonnement og er heller ikke blevet valideret til dette formål. Yderligere kan det være underlagt desinformation, herunder overbevisende konfabulationer, der kan vildlede klinikere. Hvis klinikere misbruger dette værktøj, forbedrer det muligvis ikke diagnostisk ræsonnement og kan endda forårsage skade. Derfor er det vigtigt at studere, hvordan klinikere bruger store sprogmodeller til at øge klinisk ræsonnement forud for rutinemæssig inkorporering i patientbehandling.

I denne undersøgelse vil vi randomisere deltagere til at besvare diagnostiske tilfælde med eller uden adgang til ChatGPT-4. Deltagerne vil blive bedt om at give tre differentialdiagnoser for hvert tilfælde, med understøttende og modsatrettede fund for hver diagnose. Derudover vil de blive bedt om at give deres topdiagnose sammen med de næste diagnostiske trin. Svarene vil blive bedømt af uafhængige anmeldere, der er blindet for behandlingsopgave.

Undersøgelsestype

Interventionel

Tilmelding (Faktiske)

Fase

Ikke anvendelig

Kontakter og lokationer

Dette afsnit indeholder kontaktoplysninger for dem, der udfører undersøgelsen, og oplysninger om, hvor denne undersøgelse udføres.

Studiesteder

Forenede Stater
- California
  - Palo Alto, California, Forenede Stater, 94304
    - Stanford University

Deltagelseskriterier

Forskere leder efter personer, der passer til en bestemt beskrivelse, kaldet berettigelseskriterier. Nogle eksempler på disse kriterier er en persons generelle helbredstilstand eller tidligere behandlinger.

Berettigelseskriterier

Aldre berettiget til at studere

Barn
Voksen
Ældre voksen

Tager imod sunde frivillige

Beskrivelse

Inklusionskriterier:

Deltagerne skal være autoriserede læger og have gennemført mindst post-graduate år 2 (PGY2) af medicinsk uddannelse.
Uddannelse i intern medicin, familiemedicin eller akutmedicin.

Ekskluderingskriterier:

Praktiserer ikke klinisk i øjeblikket.

Studieplan

Dette afsnit indeholder detaljer om studieplanen, herunder hvordan undersøgelsen er designet, og hvad undersøgelsen måler.

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

Primært formål: Diagnostisk
Tildeling: Randomiseret
Interventionel model: Parallel tildeling
Maskning: Enkelt

Antal våben

Våben og indgreb

Deltagergruppe / Arm	Intervention / Behandling
Aktiv komparator: GPT-4 Gruppen får adgang til GPT-4.	Andet: GPT-4 OpenAI's GPT-4 store sprogmodel med chatgrænseflade.
Ingen indgriben: Sædvanlige ressourcer Gruppen vil ikke få adgang til GPT-4, men vil blive opfordret til at bruge alle de ressourcer, de ønsker udover store sprogmodeller (UpToDate, Dynamed, google osv.).

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål	Foranstaltningsbeskrivelse	Tidsramme
Diagnostisk ræsonnement Tidsramme: Under evaluering	Det primære resultat vil være procenten korrekt (interval: 0 til 100) for hvert tilfælde. For hver case vil deltagerne blive bedt om tre topdiagnoser og fund fra casen, der understøtter den diagnose og modsætter sig denne diagnose. Deltagerne får 1 point for hver plausibel diagnose. Fund, der understøtter diagnosen og fund, der modsætter sig diagnosen, vil ligeledes blive bedømt ud fra rigtigheden, med 1 point for delvist korrekte og 2 point for helt korrekte svar. Deltagerne vil derefter blive bedt om at navngive deres topdiagnose, hvor de tjener et point for et rimeligt svar og to point for det mest korrekte svar. Til sidst vil deltagerne blive bedt om at nævne op til 3 næste trin for yderligere at evaluere patienten med et point for et delvist korrekt svar og to point for et fuldstændigt korrekt svar. Det primære resultat vil blive sammenlignet på case-niveau af de randomiserede grupper.	Under evaluering

Sekundære resultatmål

Resultatmål	Foranstaltningsbeskrivelse	Tidsramme
Tid brugt på diagnose Tidsramme: Under evaluering	Vi vil sammenligne, hvor meget tid (i minutter) deltagerne bruger pr. case mellem de to undersøgelsesarme.	Under evaluering

Samarbejdspartnere og efterforskere

Det er her, du vil finde personer og organisationer, der er involveret i denne undersøgelse.

Sponsor

Stanford University

Samarbejdspartnere

Beth Israel Deaconess Medical Center

University of Minnesota

Efterforskere

Ledende efterforsker: Jonathan H Chen, MD, PhD, Stanford University
Ledende efterforsker: Adam Rodman, MD, Beth Israel Deaconess Medical Center
Ledende efterforsker: Andrew Olson, MD, University of Minnesota

Datoer for undersøgelser

Disse datoer sporer fremskridtene for indsendelser af undersøgelsesrekord og resumeresultater til ClinicalTrials.gov. Studieregistreringer og rapporterede resultater gennemgås af National Library of Medicine (NLM) for at sikre, at de opfylder specifikke kvalitetskontrolstandarder, før de offentliggøres på den offentlige hjemmeside.

Studer store datoer

Studiestart (Faktiske)

29. november 2023

Primær færdiggørelse (Faktiske)

30. december 2023

Studieafslutning (Faktiske)

30. december 2023

Datoer for studieregistrering

Først indsendt

27. november 2023

Først indsendt, der opfyldte QC-kriterier

27. november 2023

Først opslået (Faktiske)

6. december 2023

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

20. februar 2024

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

15. februar 2024

Sidst verificeret

1. februar 2024

Mere information

Begreber relateret til denne undersøgelse

Nøgleord

Yderligere relevante MeSH-vilkår

Andre undersøgelses-id-numre

71319

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

INGEN

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Ingen

Studerer et amerikansk FDA-reguleret enhedsprodukt

Ingen

Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .

Kliniske forsøg med Diagnose

University Hospital, Grenoble
Société Française d'Anesthésie et de Réanimation

Afsluttet

eFast Diagnosis Performance in Guiding First Aid Resuscitation (eFAST Decision)

eFast Diagnosis Performance in Guiding First Aid Resuscitation and Hemostasis

Frankrig
Zagazig University

Rekruttering

Gyldighed af lunge-ultralyd ved diagnose af akut respiratorisk distress-syndrom

of Lung Ultrasound in Diagnosis of Acute Respiratory Distress Syndrome

Egypten

Kliniske forsøg med GPT-4

Stanford University
Beth Israel Deaconess Medical Center; University of Minnesota

Afsluttet

Læge ræsonnerer om ledelsessager med store sprogmodeller

Klinisk beslutningstagning

Forenede Stater
Montefiore Medical Center

Afsluttet

Evaluering af læge respons med kontekstuel indsigt vs. standardmotorer - kunstig intelligens Rag vs LLM klinisk beslutningsstøtte (PRECISE)

Store sprogmodeller

Forenede Stater
Stanford University
Beth Israel Deaconess Medical Center

Afsluttet

Diagnostisk begrundelse med tilpasset GPT-4-model

Patologiske processer | Sygdom

Forenede Stater
North Sichuan Medical College
Peking University; Peking University First Hospital; Monash University; Case... og andre samarbejdspartnere

Ikke rekrutterer endnu

Multidisciplinær behandling af store sprogmodellers antropomorfisme (MDTALLM)

Hjertesygdomme | Infektioner | Lungebetændelse | Sygdom | Kræft | Åndedrætssvigt

Kina
Case Comprehensive Cancer Center

Ikke rekrutterer endnu

Forbedring af patientens forståelse af deres diagnose af prostatacancer ved hjælp af AI

Prostatakræft

Forenede Stater
Maastricht University
Aga Khan University; University of Indonesia, Jakarta, Indonesia

Afsluttet

Det Store Ukendte: En Rejse Ind i Generativ AI's Transformerende Indvirkning på Medicinske Fag

Diagnose | Vignetter af fiktive patienter

Holland, Indonesien, Kenya
University Hospital Heidelberg

Afsluttet

Indvirkning af GPT-brug på essayskrivningspræstationer og kognitive evner

Kognitiv forandring | Velvære, psykologisk

Tyskland
Istituto Ortopedico Rizzoli

Afsluttet

Observationsundersøgelse af AI -nøjagtighed ved diagnosticering og behandling af mislykkede eller smertefulde hoftearthroplastik (PAINGPT)

Total hoftearthroplastik (THA)

Italien
Montefiore Medical Center

Rekruttering

Evaluering af effektiviteten af GPT-baseret ernæring og diabetesrådgivning i svangerskabsdiabetesbehandling: Et randomiseret kontrolleret forsøg (AIM-GDM) (AIM-GDM)

Svangerskabsdiabetes

Forenede Stater
zhen wang

Afsluttet

AI i Hypertension Treatment Education: Sammenligning af GPT og traditionelle metoder (AIHT-EDU)

Forhøjet blodtryk | Medicinsk Uddannelse | GPT

Kina

Læge ræsonnerer om diagnostiske tilfælde med store sprogmodeller

Diagnostisk ræsonnement med store sprogmodelchatbots

Studieoversigt

Status

Betingelser

Intervention / Behandling

Detaljeret beskrivelse

Undersøgelsestype

Tilmelding (Faktiske)

Fase

Kontakter og lokationer

Studiesteder

Deltagelseskriterier

Berettigelseskriterier

Aldre berettiget til at studere

Tager imod sunde frivillige

Beskrivelse

Studieplan

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

Antal våben

Våben og indgreb

Deltagergruppe / Arm

Intervention / Behandling

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål

Foranstaltningsbeskrivelse

Tidsramme

Sekundære resultatmål

Resultatmål

Foranstaltningsbeskrivelse

Tidsramme

Samarbejdspartnere og efterforskere

Sponsor

Samarbejdspartnere

Efterforskere

Datoer for undersøgelser

Studer store datoer

Studiestart (Faktiske)

Primær færdiggørelse (Faktiske)

Studieafslutning (Faktiske)

Datoer for studieregistrering

Først indsendt

Først indsendt, der opfyldte QC-kriterier

Først opslået (Faktiske)

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

Sidst verificeret

Mere information

Begreber relateret til denne undersøgelse

Nøgleord

Yderligere relevante MeSH-vilkår

Andre undersøgelses-id-numre

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Studerer et amerikansk FDA-reguleret enhedsprodukt

Kliniske forsøg med Diagnose

Kliniske forsøg med GPT-4

Søg i lignende forsøg

Sponsorer og samarbejdspartnere

Medicinske tilstande

Narkotikainterventioner

CROs by country

CROs in Mozambique

Betingelser

Sjældne sygdomme

Narkotikainterventioner

Kosttilskud

Sponsor / samarbejdspartnere

Placeringer