Diese Seite wurde automatisch übersetzt und die Genauigkeit der Übersetzung wird nicht garantiert. Bitte wende dich an die englische Version für einen Quelltext.

Kann Feedback aus einem großsprachigen Modell die Qualität der Gesundheitsversorgung verbessern?

30. Januar 2026 aktualisiert von: Jason Abaluck, Yale University

Ein Pilotpilzpilot eines LLM-Tools zur Unterstützung von Gesundheitsarbeitern an Front in niedrigen Ressourcenumgebungen

Ziel dieser Studie ist es zu lernen, ob computergestützte Ratschläge dazu beitragen können, die Patientenversorgung in nigerianischen Gesundheitskliniken zu verbessern. Die Hauptfrage, die es zu beantworten soll, lautet: Hilft das Geben von Arbeitnehmern des Gesundheitswesens sofortiger Computer -Feedback ihnen bessere Entscheidungen über die Patientenversorgung?

Forscher werden die Patientenversorgungsnotizen vergleichen, die von den Mitarbeitern des Gesundheitswesens vor und nach dem Erhalt von Computerfeedback geschrieben wurden, um festzustellen, ob das Feedback die Pflegequalität verbessert. Ein Arzt, der nicht weiß, ob Feedback gegeben wurde, wird diese Notizen überprüfen.

Die Teilnehmer werden:

  • Von einem Community -Gesundheitsarbeiter gesehen werden, der das Computer -Feedback -System nutzt
  • Von einem voll ausgebildeten Arzt behandelt werden
  • Lassen Sie sich auf Malaria, Anämie oder Harnwegsinfektionen testen, wenn sie bestimmte Symptome aufweisen

Studienübersicht

Detaillierte Beschreibung

Dieses Projekt testet, ob große Sprachmodelle (LLMs) die Patientenversorgung in nigerianischen Grundversorgungkliniken verbessern können, indem sie dem Anbieter in der natürlichen Sprache maßgeschneiderte und sofortige Feedback geben. Ein LLM-basiertes Tool, das in ein elektronisches Patientenaufzeichnungsmanagementsystem integriert ist, bietet "Second Opinions" für Community Health Extension Workers (Chews) in zwei Kliniken in Nigeria. Diese zweiten Meinungen sollen widerspiegeln, was ein Überprüfungsarzt die Kauen beraten könnte, nachdem er seinen ersten Bericht über einen Patienten gesehen oder gehört hat.

Für die Hauptanalyse verwendet diese Studie einen Vergleich von zwei Patienten, die durch das Kauen erstellt wurden. eine während der anfänglichen Patientenberatung und eines nach dem LLM -Feedback. Der Patient wird auch von einem voll ausgebildeten Arzt gesehen, der für die Patientenversorgung verantwortlich ist. Der MO führt eine geblendete Überprüfung der Patientenscheine des Chew durch, um Änderungen in der Pflege des Chew infolge des LLM -Feedbacks zu messen. Die Daten stammen aus den Informationen, die in der elektronischen Krankenakte (EMR) des Patienten erfasst wurden, und aus Umfragedaten, die aus Kauen, Überprüfung von MOS und einer Gruppe von Ärzten überprüft wurden.

Studientyp

Interventionell

Einschreibung (Tatsächlich)

491

Phase

  • Unzutreffend

Kontakte und Standorte

Dieser Abschnitt enthält die Kontaktdaten derjenigen, die die Studie durchführen, und Informationen darüber, wo diese Studie durchgeführt wird.

Studienorte

    • Kano State
      • Kano, Kano State, Nigeria
        • EHA Clinics REACH Community Clinic, Gyadi Gyadi
      • Kano, Kano State, Nigeria
        • EHA Clinics, 33 Lamido Crescent

Teilnahmekriterien

Forscher suchen nach Personen, die einer bestimmten Beschreibung entsprechen, die als Auswahlkriterien bezeichnet werden. Einige Beispiele für diese Kriterien sind der allgemeine Gesundheitszustand einer Person oder frühere Behandlungen.

Zulassungskriterien

Studienberechtigtes Alter

  • Kind
  • Erwachsene
  • Älterer Erwachsener

Akzeptiert gesunde Freiwillige

Nein

Beschreibung

Einschlusskriterien:

  • Der Patient befindet sich in der Klinik für ambulante Beratung
  • Die Zustimmung der Eltern/Erziehungsberechtigte ist für Personen unter 18 Jahren erforderlich

Ausschlusskriterien:

  • Der Patient benötigt keine Notfallversorgung
  • Der Patient ist nicht in der Klinik, um eine Untersuchung zu untersuchen (z. Gewicht, Blutdruck, Nachuntersuchung nach Genesung)
  • Der Patient ist kein Trauma -Patient (Besuch gilt nicht für Unfall, Wunde oder Verletzung)
  • Der Patient ist nicht in der Klinik für ein geplanter Eingriff oder eine Geburt

Studienplan

Dieser Abschnitt enthält Einzelheiten zum Studienplan, einschließlich des Studiendesigns und der Messung der Studieninhalte.

Wie ist die Studie aufgebaut?

Designdetails

  • Hauptzweck: Versorgungsforschung
  • Zuteilung: N / A
  • Interventionsmodell: Einzelgruppenzuweisung
  • Maskierung: Keine (Offenes Etikett)

Waffen und Interventionen

Teilnehmergruppe / Arm
Intervention / Behandlung
Experimental: Klinische Bewertung mit und ohne LLMs
Die Ermittler beschäftigen ein Design innerhalb des Patienten. Patienten erhalten zwei sequentielle Bewertungen von einem Community Health Extension Workor: zuerst ohne und dann mit großer Sprachmodellhilfe.
Ein in das elektronische medizinischen Aufzeichnungssystem der Klinik integrierte Großsprachmodell (LLM) bietet Echtzeit-Feedback zu Patientenbewertungen. Die Mitarbeiter der Community Health Extension erstellen zunächst einen Standard -SOAP -Hinweis, senden Sie ihn an die LLM und erhalten detaillierte Feedback- und wichtige Empfehlungen. Sie können dann ihre Bewertung basierend auf diesem Feedback aktualisieren. Alle endgültigen Behandlungsentscheidungen werden von Ärzten getroffen, die die Patienten unabhängig bewerten.

Was misst die Studie?

Primäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Indikator für einen Fehler im Behandlungsplan (mit dem Potenzial für Schaden)
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate

Während der Bewertung der SOAP -Notiz wird das MO gebeten, anzugeben, ob der Behandlungsplan für den Patienten Fehler enthält, was auf die eigene Diagnose des MO abhängig ist. Dies wird als 1 codiert, wenn das MO angibt, dass es einen Fehler und 0 angibt.

Der einführende Text (hier für SOAP -Hinweis A) lautet: Bitte bewerten Sie, ob die Behandlung in SOAP -Hinweis A für den Zustand dieses Patienten geeignet ist. Bitte begründen Sie dies auf Ihre eigene Diagnose, nicht die Diagnose des Chew in Seifennote A.

Darauf folgt die Frage: Ist der Behandlungsplan für den Patienten in SOAP -Hinweis auf eine völlig angemessene Ansicht Ihrer eigenen Diagnose (berücksichtige bedingte Behandlungen auf der Grundlage medizinischer Tests)? Antwort "Nein", wenn der Patient angesichts Ihrer Diagnose eine andere medizinische Versorgung erhalten sollte. Dies kann sowohl geringfügige Unterschiede (z. B. der Patient sollte geraten werden, sich auszuruhen) als auch schwerwiegende Fehler (z. B. sollte der Patient einen völlig anderen Satz von Medikamenten erhalten). (Antwortoptionen: Ja/Nein/unsicher)

Durch Abschluss der Studie durchschnittlich sechs Monate
Indikator für einen Fehler im Behandlungsplan, der einen Verlust von mindestens X-Qualitäts-inpassungsbezogener Leben verursacht
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate
Diese Variable wird als 1 codiert, wenn das MO angibt, dass ein solcher Fehler und 0 ansonsten vorliegt. X ist definiert als der höchste Benchmark auf der entsprechenden Daly -Skala, so dass mindestens 5% der Patienten einen Fehler haben, der in der nicht unterstützten Seifennote groß ist. Mit anderen Worten, schwerwiegende Fehler sind Fehler, die eine Schadensbewertung bei oder über dem 95. Perzentil des Schadens auf der unassistierten Skala (Pooling Child- und Erwachsenenskalen) erzeugen.
Durch Abschluss der Studie durchschnittlich sechs Monate
Indikator für den besseren Behandlungsplan (wie durch die MOS festgelegt)
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate
Basierend auf der Daly -Bewertung von SOAP -Hinweis A gegen B (Zählinstanzen ohne Fehler wie 0 Daly Loss) wird der Indikator als 1 codiert, wenn der SOAP -Hinweis den besseren Behandlungsplan (niedrigerer Daly -Verlust) und 0 hat, wenn MOS beides beurteilt wird Anmerkungen, die als Reaktion auf die folgende Frage gleich sind: Gibt es aussagekräftige Unterschiede in den Behandlungsplänen von SOAP Note A und B?
Durch Abschluss der Studie durchschnittlich sechs Monate
Indikator dafür, ob die Behandlung mit einem vorgegebenen "Versorgungsstandard" übereinstimmt, steht im Einklang
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate

Risikopatienten erhalten Malaria, Anämie und UTI-Screening gemäß bestimmten demografischen Kriterien. Ein Datensatz wird dann mit einer Beobachtung für jeden (Patienten, Screening -Test, Anmerkung) bis zu sechs pro Patient konstruiert.

Der Indikator für die Behandlungsfehlallokation berichtet, ob ein Patient aufgrund des Testergebnisses oder des Mangels an Symptomen fälschlicherweise wegen einer Erkrankung behandelt wurde. Die Variable wird als 1 codiert, wenn der Patient positiv getestet und entweder unangemessen oder keine Behandlung erhalten hat. Es wird auch als 1 codiert, wenn der Patient negativ getestet wurde oder nicht basierend auf dem Symptombildschirm getestet wurde, sondern eine Behandlung für die Erkrankung erhielt. Die Variable wird nur als 0 codiert, wenn der Patient negativ getestet wurde und nicht für den entsprechenden Zustand behandelt wurde oder wenn er positiv getestet wurde und die richtige Behandlung erhielt.

Durch Abschluss der Studie durchschnittlich sechs Monate

Sekundäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Indikatoren, die Diagnose und Behandlungsausrichtung zwischen Kauen und MOS bezeichnen
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate

Für jedes Medikament im Behandlungsplan des Chew gibt es eine "klinische Indikation" (die mit dem Arzneimittel verbundene Diagnose) zusammen mit einem Indikator, der feststellt, ob eine bestimmte Rezept auf ein medizinisches Testergebnis bedingt ist. Das Forschungsteam wird drei Indikatoren eines Spiels in Betracht ziehen:

  • jede Übereinstimmung mit dem Inhalt des Bereichs "klinischer Indikation" über Medikamente hinweg;
  • jede Übereinstimmung mit dem Inhalt des "Medikamenten" -Feldes über Indikationen hinweg, einschließlich der Frage, ob das Medikament auf einem Test abhängig ist oder nicht;
  • eine Übereinstimmung sowohl von Medikamenten als auch von Indikation (und Testbedingungen).
Durch Abschluss der Studie durchschnittlich sechs Monate
Alternative Indikatoren für die Miserklokation der Behandlungen
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate

Das Forschungsteam wird die folgenden Indikatoren für die Misallokation der Behandlung erstellen:

  • Fehlallokation aufgrund von Überbeschreibung: Eine Erkrankung wird behandelt, dass der Patient bestätigt wird, nicht zu haben
  • Fehlallokation aufgrund von Unterbeschreibung: Eine Bedingung, die der Patient hat, wird nicht behandelt
  • Fehlallokation aufgrund falscher Dosierung oder Arzneimittelauswahl: Eine Erkrankung, die der Patient hat, wird behandelt, aber die gewählte Dosierung oder Medikamente ist unangemessen.
Durch Abschluss der Studie durchschnittlich sechs Monate
Beziehung des QALY -Verlustes zur Schwere des Patientenzustands
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate

Bei Patienten mit nur leichten Krankheiten kann der Umfang des QALY -Verlusts durch Fehler im Vergleich zu Patienten mit schwereren Krankheiten begrenzt sein.

In diesem Sinne wird der QALY -Verlust auf Indikatoren für leichte, mittelschwere und schwere Krankheiten (wie durch das MO bewertet) jeweils mit dem assistierten Hinweis Indikator interagiert und kontrolliert die Festeffekte von Patienten. Die Ergebnisse werden grafisch angezeigt.

Durch Abschluss der Studie durchschnittlich sechs Monate
Indikatoren für die Angemessenheit medizinischer Testentscheidungen
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate

Die potenzielle Fehlallokation von medizinischen Tests wird auf zwei Arten operationalisiert:

  1. Für jeden Testtyp erstellt das Forschungsteam einen Indikator, der als 1 kodiert wird, wenn der Kauen empfiehlt positiv sein.
  2. Zweitens erstellt das Forschungsteam einen Indikator auf der Ebene (Patient, Test, Bezeichnung), die misst, ob der Chew und MO denselben oder einen vergleichbaren medizinischen Test angefordert haben ).

Wenn diese Indikatoren kombiniert werden, tritt ein Missverhältnis auf, wenn und entweder: i) ein Test nicht vom Kauen angefordert wurde, sondern positiv war, oder ii) der Test wurde vom Kauen angefordert, aber das Ergebnis war negativ und kein äquivalenter Test wurde von der geordnet MO.

Durch Abschluss der Studie durchschnittlich sechs Monate
Durchschnitt und Verteilung von Daly verloren
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate
Der Effekt der LLM -Unterstützung, die Daly verloren hat, wird eher direkt als indirekt gemessen (wie bei der Wahrscheinlichkeit von Fehlern und schwerem Fehler, die Hinweis ist die bessere Anmerkung). Die vollständige Verteilung der Daly -Bewertungen für die unterstützten und nicht unterstützten Notizen wird auch in den Ergebnissen angezeigt.
Durch Abschluss der Studie durchschnittlich sechs Monate
MO Evaluierung von Seifennotizen: Abweichungen von der Seife des MO
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate
Das MO wird gebeten, für jede SOAP -Bezeichnung zu beurteilen, ob die angeordneten medizinischen Tests erforderlich oder klinisch nützlich waren, ob fehlende oder falsche/unnötige Diagnosen und ob fehlende oder falsche/unnötige Behandlungsplanelemente vorhanden sind.
Durch Abschluss der Studie durchschnittlich sechs Monate
MO -Bewertung von Seifennotizen: Arten von Schaden, die anfallen
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate
Das MO wird gebeten, kurzfristige Schäden (zusätzliche Symptome oder Beschwerden für einige Zeit) und jeglichen schwerwiegenden schweren Schäden (Risiko einer Beeinträchtigung, Tod usw.) aus dem Behandlungsplan in der SOAP-Notiz zu bewerten.
Durch Abschluss der Studie durchschnittlich sechs Monate
MO -Bewertung von Seifennotizen: Messung der gesunden Zeit in Daly gemessen
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate
Das MO bietet auch eine Gesamtbewertung, die die "gesunde Zeitverlust" durch Fehler in der Behandlung in der SOAP -Notiz widerspiegeln soll. Für jede Bewertung und jeden Plan, der von einem Kauen (mit oder ohne LLM -Rat) erstellt wurde, bewertet ein MO die erwartete Größe des gesunden Lebens, das verloren gehen würde, wenn der Kausplan anstelle des MO -Plans umgesetzt würde.
Durch Abschluss der Studie durchschnittlich sechs Monate
MD -Bewertung von Chew- und Mo -Hinweisen: MOS -Fehler mit dem MO -Fehler
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate
In einem ersten Schritt werden nur die MO -Notizen überprüft und festlegen, ob in der Diagnose oder Behandlung in der bedingten Notiz oder in der endgültigen Notiz Fehler vorliegt. Wenn ein Fehler identifiziert wird, bewertet der MDS den Fehler nach Schweregrad, um medizinische Fehler von Meinungsunterschieden zu einem Patienten zu unterscheiden, der nicht anwesend ist.
Durch Abschluss der Studie durchschnittlich sechs Monate
MD -Bewertung von Chew- und Mo -Anmerkungen: SOAP -Note -Bewertung
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate

Der MD wird gebeten, kurzfristige Schäden (zusätzliche Symptome oder Beschwerden für einen bestimmten Zeitraum) und einen langfristigen schwerwiegenden Schaden (Risiko einer Beeinträchtigung, Tod usw.) aus dem Behandlungsplan in der SOAP-Notiz zu bewerten.

Der MD liefert auch eine Gesamtbewertung, die die "gesunde Zeitverlust" durch alle Fehler in der Behandlung in der SOAP -Notiz widerspiegeln soll. Für jede Bewertung und jeden Plan, der von einem Kauen (mit oder ohne LLM -Rat) erstellt wurde, bewertet ein MO die erwartete Größe des gesunden Lebens, das verloren gehen würde, wenn der Kausplan anstelle des MO -Plans umgesetzt würde. Eine gesunde Zeit wird in Einheiten mit Behinderung eingestelltes Lebensjahr (DALYS) gemessen, die sowohl die Länge als auch die Lebensqualität widerspiegeln.

Durch Abschluss der Studie durchschnittlich sechs Monate
MD -Bewertung von Chew und Mo Notes: LLM Review
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate

Das MDS wird auch das LLM -Feedback überprüfen und die folgenden Fragen beantworten:

"Hat der Kauen allen, einigen oder keinem der LLM -Empfehlungen gefolgt?" Wenn einige oder keine: "Stellen Sie sich vor, der Kauen hatte alle Empfehlungen des LLM gefolgt. Wäre der resultierende Behandlungsplan eine Verbesserung gegenüber ihrer assistierten Note? "(Ja/Nein) Wenn ja:" Bitte erklären Sie. "" " "Hat die LLM Fehler gemacht?" (Ja/Nein) Wenn ja: "War ein Aspekt des assistierten Behandlungsplans des Chew schlechter als der unassistierte Plan, weil der Chew der fehlerhaften Empfehlung des LLM folgte?" Wenn ja: "Bitte erklären.

Durch Abschluss der Studie durchschnittlich sechs Monate
Indikator für die Angemessenheit von Triage -Entscheidungen
Zeitfenster: Durch Abschluss der Studie durchschnittlich sechs Monate
Für jeden (Patienten, Anmerkung) berichtet ein Indikator, ob die Entscheidung der Kauen -Triage (die Absicht der Triage in der SOAP -Anmerkung angegeben hat) und die MO vorgeschlagen, die Entscheidung der Triage auszurichten.
Durch Abschluss der Studie durchschnittlich sechs Monate

Mitarbeiter und Ermittler

Hier finden Sie Personen und Organisationen, die an dieser Studie beteiligt sind.

Sponsor

Ermittler

  • Hauptermittler: Jason Abaluck, Yale University

Studienaufzeichnungsdaten

Diese Daten verfolgen den Fortschritt der Übermittlung von Studienaufzeichnungen und zusammenfassenden Ergebnissen an ClinicalTrials.gov. Studienaufzeichnungen und gemeldete Ergebnisse werden von der National Library of Medicine (NLM) überprüft, um sicherzustellen, dass sie bestimmten Qualitätskontrollstandards entsprechen, bevor sie auf der öffentlichen Website veröffentlicht werden.

Haupttermine studieren

Studienbeginn (Tatsächlich)

30. Januar 2025

Primärer Abschluss (Tatsächlich)

17. Oktober 2025

Studienabschluss (Tatsächlich)

17. Oktober 2025

Studienanmeldedaten

Zuerst eingereicht

23. Januar 2025

Zuerst eingereicht, das die QC-Kriterien erfüllt hat

6. Februar 2025

Zuerst gepostet (Tatsächlich)

12. Februar 2025

Studienaufzeichnungsaktualisierungen

Letztes Update gepostet (Tatsächlich)

3. Februar 2026

Letztes eingereichtes Update, das die QC-Kriterien erfüllt

30. Januar 2026

Zuletzt verifiziert

1. April 2025

Mehr Informationen

Begriffe im Zusammenhang mit dieser Studie

Andere Studien-ID-Nummern

  • 2000035990

Plan für individuelle Teilnehmerdaten (IPD)

Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?

JA

Beschreibung des IPD-Plans

Die folgenden nicht identifizierten einzelnen Teilnehmerdaten (IDP) werden gemeinsam genutzt:

Patients Demografie und Vitals Symptome und klinische Befunde, die durch Kauen- und MOS -Testergebnisse (Malaria, Anämie, UTI) Behandlungspläne und Vorschriften für Seife mit und ohne LLM -Unterstützung von Kaus- und MOS -Anbieterbewertungen und Daly -Ratings -Umfragemantworten aus Köchen und MD -Panel dokumentiert wurden Bewertungen

IPD-Sharing-Zeitrahmen

Daten werden anderen Forschern ab 3 Monaten nach der Veröffentlichung zur Verfügung stehen und bleiben ohne Enddatum verfügbar.

IPD-Sharing-Zugriffskriterien

Akademische Forscher mit einer formellen Ernennung an einer Forschungseinrichtung müssen einen Forschungsvorschlag vorlegen, in dem beabsichtigte Analysen Details detailliert werden und einen Datenvertragsvertrag unterzeichnen.

Art der unterstützenden IPD-Freigabeinformationen

  • STUDIENPROTOKOLL
  • SAFT
  • ICF
  • ANALYTIC_CODE
  • CSR

Arzneimittel- und Geräteinformationen, Studienunterlagen

Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt

Nein

Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt

Nein

Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .

Klinische Studien zur Alle Bedingungen

Klinische Studien zur Unterstützung der klinischen Entscheidungsunterstützung in großer Sprachmodell

Abonnieren