Diese Seite wurde automatisch übersetzt und die Genauigkeit der Übersetzung wird nicht garantiert. Bitte wende dich an die englische Version für einen Quelltext.

Argumentation des Arztes zu diagnostischen Fällen mit großen Sprachmodellen

15. Februar 2024 aktualisiert von: Jonathan Chen, Stanford University

Diagnostisches Denken mit Chatbots mit großen Sprachmodellen

In dieser Studie wird die Auswirkung der Bereitstellung des Zugriffs auf GPT-4, einem großen Sprachmodell, im Vergleich zu herkömmlichen diagnostischen Entscheidungsunterstützungstools auf die Leistung bei fallbasierten diagnostischen Argumentationsaufgaben bewertet.

Studienübersicht

Status

Abgeschlossen

Bedingungen

Intervention / Behandlung

Detaillierte Beschreibung

Technologien der künstlichen Intelligenz (KI), insbesondere fortschrittliche große Sprachmodelle wie ChatGPT von OpenAI, haben das Potenzial, die medizinische Entscheidungsfindung zu verbessern. Obwohl ChatGPT-4 nicht für den Einsatz in medizinspezifischen Anwendungen entwickelt wurde, hat es sich in verschiedenen Gesundheitskontexten als vielversprechend erwiesen, darunter beim Verfassen medizinischer Notizen, bei der Beantwortung von Patientenanfragen und bei der Erleichterung medizinischer Beratungen. Es ist jedoch wenig darüber bekannt, wie ChatGPT die klinischen Denkfähigkeiten von Ärzten verbessert.

Klinisches Denken ist ein komplexer Prozess, der Mustererkennung, Wissensanwendung und probabilistisches Denken umfasst. Die Integration von KI-Tools wie ChatGPT-4 in die Arbeitsabläufe von Ärzten könnte möglicherweise dazu beitragen, die Arbeitsbelastung des Klinikpersonals zu verringern und die Wahrscheinlichkeit verpasster Diagnosen zu verringern. Allerdings wurde ChatGPT-4 weder zum Zweck des Clinical Reasoning entwickelt noch wurde es für diesen Zweck validiert. Darüber hinaus kann es zu Fehlinformationen, einschließlich überzeugender Konfabulationen, kommen, die Ärzte irreführen können. Wenn Ärzte dieses Tool missbrauchen, verbessert es möglicherweise nicht die diagnostische Argumentation und kann sogar Schaden anrichten. Daher ist es wichtig zu untersuchen, wie Ärzte große Sprachmodelle verwenden, um das klinische Denken zu verbessern, bevor sie routinemäßig in die Patientenversorgung integriert werden.

In dieser Studie werden wir die Teilnehmer randomisieren, um Diagnosefälle mit oder ohne Zugang zu ChatGPT-4 zu beantworten. Die Teilnehmer werden gebeten, für jeden Fall drei Differenzialdiagnosen mit unterstützenden und gegensätzlichen Befunden für jede Diagnose anzugeben. Darüber hinaus werden sie gebeten, ihre Top-Diagnose zusammen mit den nächsten Diagnoseschritten anzugeben. Die Antworten werden von unabhängigen Gutachtern bewertet, die keinen Einblick in die Behandlungszuordnung haben.

Studientyp

Interventionell

Einschreibung (Tatsächlich)

50

Phase

  • Unzutreffend

Kontakte und Standorte

Dieser Abschnitt enthält die Kontaktdaten derjenigen, die die Studie durchführen, und Informationen darüber, wo diese Studie durchgeführt wird.

Studienorte

    • California
      • Palo Alto, California, Vereinigte Staaten, 94304
        • Stanford University

Teilnahmekriterien

Forscher suchen nach Personen, die einer bestimmten Beschreibung entsprechen, die als Auswahlkriterien bezeichnet werden. Einige Beispiele für diese Kriterien sind der allgemeine Gesundheitszustand einer Person oder frühere Behandlungen.

Zulassungskriterien

Studienberechtigtes Alter

  • Kind
  • Erwachsene
  • Älterer Erwachsener

Akzeptiert gesunde Freiwillige

Ja

Beschreibung

Einschlusskriterien:

  • Die Teilnehmer müssen zugelassene Ärzte sein und mindestens das Postgraduiertenjahr 2 (PGY2) der medizinischen Ausbildung abgeschlossen haben.
  • Ausbildung in Innere Medizin, Familienmedizin oder Notfallmedizin.

Ausschlusskriterien:

  • Derzeit nicht klinisch tätig.

Studienplan

Dieser Abschnitt enthält Einzelheiten zum Studienplan, einschließlich des Studiendesigns und der Messung der Studieninhalte.

Wie ist die Studie aufgebaut?

Designdetails

  • Hauptzweck: Diagnose
  • Zuteilung: Zufällig
  • Interventionsmodell: Parallele Zuordnung
  • Maskierung: Single

Waffen und Interventionen

Teilnehmergruppe / Arm
Intervention / Behandlung
Aktiver Komparator: GPT-4
Die Gruppe erhält Zugriff auf GPT-4.
Das große GPT-4-Sprachmodell von OpenAI mit Chat-Schnittstelle.
Kein Eingriff: Übliche Ressourcen
Die Gruppe erhält keinen Zugriff auf GPT-4, wird jedoch aufgefordert, neben großen Sprachmodellen (UpToDate, Dynamed, Google usw.) alle gewünschten Ressourcen zu nutzen.

Was misst die Studie?

Primäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Diagnostisches Denken
Zeitfenster: Während der Auswertung
Das primäre Ergebnis ist der Prozentsatz der korrekten Ergebnisse (Bereich: 0 bis 100) für jeden Fall. Für jeden Fall werden die Teilnehmer nach drei Top-Diagnosen und Erkenntnissen aus dem Fall gefragt, die diese Diagnose stützen und gegen diese Diagnose sind. Für jede plausible Diagnose erhalten die Teilnehmer 1 Punkt. Befunde, die die Diagnose unterstützen, und Befunde, die der Diagnose entgegenstehen, werden ebenfalls nach der Richtigkeit bewertet, mit 1 Punkt für teilweise richtige und 2 Punkten für völlig richtige Antworten. Anschließend werden die Teilnehmer gebeten, ihre Top-Diagnose zu nennen. Sie erhalten einen Punkt für eine vernünftige Antwort und zwei Punkte für die richtigste Antwort. Abschließend werden die Teilnehmer gebeten, bis zu drei nächste Schritte zur weiteren Beurteilung des Patienten zu benennen, wobei ein Punkt für eine teilweise richtige Antwort und zwei Punkte für eine vollständig richtige Antwort vergeben werden. Das primäre Ergebnis wird von den randomisierten Gruppen auf Fallebene verglichen.
Während der Auswertung

Sekundäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Für die Diagnose aufgewendete Zeit
Zeitfenster: Während der Auswertung
Wir werden vergleichen, wie viel Zeit (in Minuten) die Teilnehmer pro Fall zwischen den beiden Studienarmen verbringen.
Während der Auswertung

Mitarbeiter und Ermittler

Hier finden Sie Personen und Organisationen, die an dieser Studie beteiligt sind.

Ermittler

  • Hauptermittler: Jonathan H Chen, MD, PhD, Stanford University
  • Hauptermittler: Adam Rodman, MD, Beth Israel Deaconess Medical Center
  • Hauptermittler: Andrew Olson, MD, University of Minnesota

Studienaufzeichnungsdaten

Diese Daten verfolgen den Fortschritt der Übermittlung von Studienaufzeichnungen und zusammenfassenden Ergebnissen an ClinicalTrials.gov. Studienaufzeichnungen und gemeldete Ergebnisse werden von der National Library of Medicine (NLM) überprüft, um sicherzustellen, dass sie bestimmten Qualitätskontrollstandards entsprechen, bevor sie auf der öffentlichen Website veröffentlicht werden.

Haupttermine studieren

Studienbeginn (Tatsächlich)

29. November 2023

Primärer Abschluss (Tatsächlich)

30. Dezember 2023

Studienabschluss (Tatsächlich)

30. Dezember 2023

Studienanmeldedaten

Zuerst eingereicht

27. November 2023

Zuerst eingereicht, das die QC-Kriterien erfüllt hat

27. November 2023

Zuerst gepostet (Tatsächlich)

6. Dezember 2023

Studienaufzeichnungsaktualisierungen

Letztes Update gepostet (Tatsächlich)

20. Februar 2024

Letztes eingereichtes Update, das die QC-Kriterien erfüllt

15. Februar 2024

Zuletzt verifiziert

1. Februar 2024

Mehr Informationen

Begriffe im Zusammenhang mit dieser Studie

Zusätzliche relevante MeSH-Bedingungen

Andere Studien-ID-Nummern

  • 71319

Plan für individuelle Teilnehmerdaten (IPD)

Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?

NEIN

Arzneimittel- und Geräteinformationen, Studienunterlagen

Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt

Nein

Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt

Nein

Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .

Klinische Studien zur GPT-4

Abonnieren