Denne side blev automatisk oversat, og nøjagtigheden af ​​oversættelsen er ikke garanteret. Der henvises til engelsk version for en kildetekst.

Kan feedback fra en stor sprogmodel forbedre sundhedsvæsenets kvalitet?

30. januar 2026 opdateret af: Jason Abaluck, Yale University

En pilot-ptudy af et LLM-værktøj til at støtte frontlinie sundhedsarbejdere i indstillinger med lav ressource

Målet med denne undersøgelse er at lære, om computerassisteret rådgivning kan hjælpe med at forbedre patientpleje i nigerianske sundhedsklinikker. Det vigtigste spørgsmål, det sigter mod at besvare, er: Hjælper det at give sundhedsarbejdere øjeblikkelig computer feedback dem med at tage bedre beslutninger om patientpleje?

Forskere vil sammenligne patientpleje noter skrevet af sundhedsarbejdere før og efter at de modtager computer feedback for at se, om feedback forbedrer plejekvaliteten. En læge, der ikke ved, om der blev givet feedback, vil gennemgå disse noter.

Deltagerne vil:

  • Ses af en sundhedsarbejder i samfundet, der bruger computerfeedback -systemet
  • Behandles af en fuldt uddannet læge
  • Bliv testet for malaria, anæmi eller urinvejsinfektioner, hvis de har visse symptomer

Studieoversigt

Status

Afsluttet

Betingelser

Detaljeret beskrivelse

Dette projekt tester, om store sprogmodeller (LLM'er) kan forbedre patientpleje i nigerianske klinikker til primærpleje ved at give tilpassede og øjeblikkelige feedback til udbyderen på naturligt sprog. Et LLM-baseret værktøj integreret i et elektronisk patientoptagelsestyringssystem giver "anden udtalelser" til samfundsudvidelsesarbejdere (CHEWS) på to klinikker i Nigeria. Disse andet udtalelser er beregnet til at spejle, hvad en gennemgangslæge kan rådgive tyggerne efter at have set eller hørt deres oprindelige rapport om en patient.

Til hovedanalysen anvender denne undersøgelse en sammenligning inden for patienten af ​​to patientnotater oprettet af tyggen; en under den indledende patientkonsultation, og en efter LLM -feedback blev modtaget. Patienten ses også af en fuldt uddannet medicinsk officer, der er ansvarlig for patientpleje. MO udfører en blindet gennemgang af Chews patientnoter for at måle ændringer i Chew's pleje som et resultat af LLM -feedback. Dataene kommer fra de oplysninger, der er fanget i den elektroniske medicinske journal (EMR) for patienten og fra undersøgelsesdata indsamlet fra tygger, gennemgang af MOS og et panel med gennemgang af medicinske læger.

Undersøgelsestype

Interventionel

Tilmelding (Faktiske)

491

Fase

  • Ikke anvendelig

Kontakter og lokationer

Dette afsnit indeholder kontaktoplysninger for dem, der udfører undersøgelsen, og oplysninger om, hvor denne undersøgelse udføres.

Studiesteder

    • Kano State
      • Kano, Kano State, Nigeria
        • EHA Clinics REACH Community Clinic, Gyadi Gyadi
      • Kano, Kano State, Nigeria
        • EHA Clinics, 33 Lamido Crescent

Deltagelseskriterier

Forskere leder efter personer, der passer til en bestemt beskrivelse, kaldet berettigelseskriterier. Nogle eksempler på disse kriterier er en persons generelle helbredstilstand eller tidligere behandlinger.

Berettigelseskriterier

Aldre berettiget til at studere

  • Barn
  • Voksen
  • Ældre voksen

Tager imod sunde frivillige

Ingen

Beskrivelse

Inkluderingskriterier:

  • Patienten er på klinikken for poliklinisk konsultation
  • Forælder/værge -samtykke er påkrævet for enkeltpersoner under 18 år

Ekskluderingskriterier:

  • Patienten kræver ikke akutpleje
  • Patienten er ikke på klinikken for en kontrol (f.eks. vægt, blodtryk, opfølgning efter bedring)
  • Patienten er ikke en traumepatient (besøg er ikke for en ulykke, sår eller skade)
  • Patienten er ikke på klinikken til en planlagt procedure eller en fødsel

Studieplan

Dette afsnit indeholder detaljer om studieplanen, herunder hvordan undersøgelsen er designet, og hvad undersøgelsen måler.

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

  • Primært formål: Sundhedstjenesteforskning
  • Tildeling: N/A
  • Interventionel model: Enkelt gruppeopgave
  • Maskning: Ingen (Åben etiket)

Våben og indgreb

Deltagergruppe / Arm
Intervention / Behandling
Eksperimentel: Klinisk vurdering med og uden LLM'er
Efterforskerne anvender et design inden for patienten. Patienter modtager to sekventielle vurderinger fra en sundhedsudvidelsesarbejder i samfundet: først uden og derefter med stor sprogmodelhjælp.
En stor sprogmodel (LLM) integreret i klinikens elektroniske medicinske journalsystem giver feedback i realtid på patientvurderinger. Fællesskabets sundhedsudvidelsesarbejdere opretter først en standard sæbe note, indsender den til LLM og modtager detaljerede feedback og nøgleanbefalinger. De kan derefter opdatere deres vurdering baseret på denne feedback. Alle endelige behandlingsbeslutninger træffes af medicinske officerer, der uafhængigt evaluerer patienter.

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Indikator for en fejl i behandlingsplanen (med potentialet for skade)
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder

Under evaluering af sæbe note bliver MO bedt om at indikere, om behandlingsplanen for patienten indeholder fejl, der er betinget af MO's egen diagnose. Dette er kodet som 1, hvis MO angiver, at der er en fejl og 0 ellers.

Den indledende tekst (her for sæbe note A) er: Evaluer, om behandlingen i sæbe Bemærk A er passende for denne patients tilstand. Baser dette på din egen diagnose, ikke Chew's diagnose i sæbe note A.

Dette efterfølges af spørgsmålet: Er behandlingsplanen for patienten i sæbe note en helt passende i betragtning af din egen diagnose (redegør for betingede behandlinger baseret på medicinske test)? Svar "nej" hvis patienten skal modtage forskellig medicinsk behandling i betragtning af din diagnose. Dette kan omfatte både mindre forskelle (for eksempel skal patienten rådes til at hvile) og større fejl (for eksempel skal patienten modtage et helt andet sæt medicin). (Svarmuligheder: Ja/Nej/usikker)

Gennem undersøgelsesafslutning, i gennemsnit seks måneder
Indikator for en fejl i behandlingsplanen, der forårsager et tab på mindst X kvalitetsjusterede livsdage
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder
Denne variabel kodes som 1, hvis MO angiver, at der er en sådan fejl og 0 ellers. X defineres som det højeste benchmark på den relevante Daly -skala, så mindst 5% af patienterne har en fejl, der er stor i den uassisterede SOAP -note. Med andre ord er alvorlige fejl eventuelle fejl, der genererer en skadevurdering på eller over den 95. percentil af skade på den uassisterede skala (pooling af børn og voksen skalaer).
Gennem undersøgelsesafslutning, i gennemsnit seks måneder
Indikator for den bedre behandlingsplan (som bestemt af MOS)
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder
Baseret på Daly -klassificeringen af ​​sæbe note A vs. B (tæller forekomster uden fejl som 0 Daly -tab), er indikatoren kodet som 1, hvis SOAP -note har den bedre behandlingsplan (Nedre Daly -tab) og 0, hvis MOS -dommer begge Bemærkninger til at være de samme som svar på følgende spørgsmål: Er der nogen meningsfulde forskelle i behandlingsplanerne for sæbe note A og B?
Gennem undersøgelsesafslutning, i gennemsnit seks måneder
Indikator for, om behandlingen er i overensstemmelse med en forudbestemt "standard for pleje"
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder

Patienter i fare modtager malaria, anæmi og UTI-screening i overensstemmelse med visse demografiske kriterier. Et datasæt konstrueres derefter med en observation for hver (patient, screeningstest, note), op til seks pr. Patient.

Indikatoren for fejlbehandling af behandlingen registrerer, om en patient blev forkert behandlet for en tilstand baseret på testresultatet eller manglen på symptomer. Variablen kodes som 1, hvis patienten testede positivt og enten modtog upassende eller ingen behandling. Det er også kodet som 1, hvis patienten testede negativt eller ikke blev testet baseret på symptomskærmen, men modtog behandling for tilstanden. Variablen er kun kodet som 0, hvis patienten testede negativt og blev korrekt ikke behandlet for den tilsvarende tilstand, eller hvis de testede positiv og modtog den korrekte behandling.

Gennem undersøgelsesafslutning, i gennemsnit seks måneder

Sekundære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Indikatorer, der angiver diagnose og behandlingsjustering mellem tygger og MOS
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder

For hver medicin i Chews behandlingsplan er der en "klinisk indikation" (diagnosen forbundet med lægemidlet) sammen med en indikator, der specificerer, om en given recept er betinget af et medicinsk testresultat. Forskerteamet vil overveje tre indikatorer for en kamp:

  • Enhver kamp med indholdet af feltet "klinisk indikation" på tværs af medicin;
  • Enhver kamp med indholdet af feltet "medicin" på tværs af indikationer, herunder om medicinen er betinget af en test eller ej;
  • En match af både medicin og indikation (og testbetingelse).
Gennem undersøgelsesafslutning, i gennemsnit seks måneder
Alternative indikatorer til behandling af behandling
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder

Forskningsteamet vil konstruere følgende indikatorer for fejlbehandling af behandling:

  • Forkert tildeling på grund af overpræsentation: en tilstand behandles, at patienten bekræftes ikke at have
  • Misallokation på grund af underpræsentation: En betingelse, som patienten bekræftes at have, behandles ikke
  • Misallokation på grund af forkert dosering eller valg af lægemiddel: En betingelse, som patienten har, behandles, men den valgte dosering eller medicin er upassende.
Gennem undersøgelsesafslutning, i gennemsnit seks måneder
Forholdet mellem qaly -tab og sværhedsgraden af ​​patienttilstand
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder

Hos patienter med kun milde sygdomme kan omfanget af QALY -tab fra fejl være begrænset i forhold til patienter med mere alvorlige sygdomme.

Med dette i tankerne regresseres qaly -tab på indikatorer for milde, moderate og alvorlige sygdomme (som vurderet af MO) hver interagerede med den assisterede note -indikator, der kontrollerer for patientens faste effekter. Resultaterne vises grafisk.

Gennem undersøgelsesafslutning, i gennemsnit seks måneder
Indikatorer for hensigtsmæssigheden af ​​beslutninger om medicinsk test
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder

Den potentielle forkert tildeling af medicinsk test er operationeliseret på to måder:

  1. For hver testtype konstruerer forskerteamet en indikator, der er kodet som 1, hvis Chew anbefaler at gennemføre en test, der viser sig at være negativ, og en anden indikator, der er 1, hvis Chew forsømmer at anmode om en test, der viser sig at Vær positiv.
  2. For det andet vil forskerteamet konstruere en indikator på niveauet for (patient, test, note), der måler, om tyggen og MO anmodede om det samme eller en sammenlignelig medicinsk test (f.eks. Tyggedagen anmodede ).

Ved at kombinere disse indikatorer forekommer et misforhold, hvis og kun hvis enten: i) en test ikke blev anmodet om af tyggen, men var positiv, eller ii) testen blev anmodet om af tyggen, men resultatet var negativt, og der blev ikke bestilt nogen tilsvarende test af Mo.

Gennem undersøgelsesafslutning, i gennemsnit seks måneder
Gennemsnit og distribution af Daly tabt
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder
Effekten af ​​LLM -bistand Daly mistet måles direkte snarere end indirekte (som med sandsynlighed for fejl og alvorlig fejl, hvilken note er den bedre note). Den fulde distribution af Daly -ratings for de assisterede og uassisterede noter vil også blive vist i resultaterne.
Gennem undersøgelsesafslutning, i gennemsnit seks måneder
MO -evaluering af sæbebemærkninger: Afvigelser fra MO's sæbe
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder
MO bliver bedt om at vurdere for hver SOAP -note, om medicinske tests bestilte var nødvendige eller klinisk nyttige, om der mangler eller forkerte/unødvendige diagnoser, og om der mangler eller forkerte/unødvendige behandlingsplanelementer.
Gennem undersøgelsesafslutning, i gennemsnit seks måneder
MO Evaluering af sæbebemærkninger: Typer af skader, der er afholdt
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder
MO bliver bedt om at vurdere enhver kortvarig skade (yderligere symptomer eller ubehag i en eller anden periode) og enhver langsigtet alvorlig skade (risiko for værdiforringelse, død osv.) Fra behandlingsplanen i sæbe-note.
Gennem undersøgelsesafslutning, i gennemsnit seks måneder
MO -evaluering af sæbebemærkninger: Måling af sund tid tabt i Daly
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder
MO tilvejebringer også en samlet bedømmelse, der er beregnet til at afspejle den "sunde tid, der er mistet" fra eventuelle fejl i behandlingen i SOAP -note. For hver vurdering og plan, der er konstrueret af en tygge (med eller uden LLM -rådgivning), vil en MO vurdere den forventede størrelse af et sundt liv, der ville gå tabt, hvis Chew -planen blev implementeret i stedet for MO's plan.
Gennem undersøgelsesafslutning, i gennemsnit seks måneder
MD -evaluering af Chew og MO -noter: Flagging af MO -fejl
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder
I et første trin vil de kun gennemgå MO -noterne og registrere, om der er nogen fejl i den diagnose eller behandling, der er foreslået i den betingede note eller i den sidste note. Hvis der identificeres en fejl, vil MDS bedømme fejlen efter sværhedsgrad for at skelne medicinske fejl fra forskelle i mening om en patient, der ikke er til stede.
Gennem undersøgelsesafslutning, i gennemsnit seks måneder
MD -evaluering af Chew og MO -noter: SOAP Note Rating
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder

MD bliver bedt om at vurdere enhver kortvarig skade (yderligere symptomer eller ubehag i en eller anden periode) og enhver langsigtet alvorlig skade (risiko for svækkelse, død osv.) Fra behandlingsplanen i sæbe-note.

MD tilvejebringer også en samlet bedømmelse, der er beregnet til at afspejle den "sunde tid, der er mistet" fra eventuelle fejl i behandlingen i SOAP -note. For hver vurdering og plan, der er konstrueret af en tygge (med eller uden LLM -rådgivning), vil en MO vurdere den forventede størrelse af et sundt liv, der ville gå tabt, hvis Chew -planen blev implementeret i stedet for MO's plan. Sund tid måles i enheder med handicapjusteret livsår (DALY'er), der afspejler både længde og livskvalitet.

Gennem undersøgelsesafslutning, i gennemsnit seks måneder
MD Evaluering af Chew og MO -noter: LLM Review
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder

MDS vil også gennemgå LLM -feedback og besvare følgende spørgsmål:

"Følgede tyggen alle, nogle eller ingen af ​​LLM -anbefalinger?" Hvis nogle eller ingen: "Forestil dig, at tyggen havde fulgt alle henstillinger fra LLM. Ville den resulterende behandlingsplan være en forbedring i forhold til deres assisterede note? "(Ja/nej), hvis ja:" Forklar venligst. "" "Llm begik LLM nogen fejl?" (Ja/Nej) Hvis ja: "Var et aspekt af Chew's assisterede behandlingsplan værre end den uassisterede plan, fordi Chew fulgte LLM's fejlagtige anbefaling?" Hvis ja: "Forklar venligst.

Gennem undersøgelsesafslutning, i gennemsnit seks måneder
Indikator for passende triage -beslutninger
Tidsramme: Gennem undersøgelsesafslutning, i gennemsnit seks måneder
For hver (patient, note), registrerer en indikator, om Chew Triage -beslutningen (en intention om at triage indikeret i sæbebemærkningen), og MO foreslog triage -beslutning på linje.
Gennem undersøgelsesafslutning, i gennemsnit seks måneder

Samarbejdspartnere og efterforskere

Det er her, du vil finde personer og organisationer, der er involveret i denne undersøgelse.

Sponsor

Efterforskere

  • Ledende efterforsker: Jason Abaluck, Yale University

Datoer for undersøgelser

Disse datoer sporer fremskridtene for indsendelser af undersøgelsesrekord og resumeresultater til ClinicalTrials.gov. Studieregistreringer og rapporterede resultater gennemgås af National Library of Medicine (NLM) for at sikre, at de opfylder specifikke kvalitetskontrolstandarder, før de offentliggøres på den offentlige hjemmeside.

Studer store datoer

Studiestart (Faktiske)

30. januar 2025

Primær færdiggørelse (Faktiske)

17. oktober 2025

Studieafslutning (Faktiske)

17. oktober 2025

Datoer for studieregistrering

Først indsendt

23. januar 2025

Først indsendt, der opfyldte QC-kriterier

6. februar 2025

Først opslået (Faktiske)

12. februar 2025

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

3. februar 2026

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

30. januar 2026

Sidst verificeret

1. april 2025

Mere information

Begreber relateret til denne undersøgelse

Andre undersøgelses-id-numre

  • 2000035990

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

JA

IPD-planbeskrivelse

Følgende de-identificerede individuelle deltagerdata (IDP) deles:

Patientdemografi og vitalesymptomer og kliniske fund dokumenteret af Chews og MOS -testresultater (malaria, anæmi, UTI) behandlingsplaner og recept soapnotater med og uden LLM -hjælp fra både Chews og MOS -udbydervurderinger og Daly Ratings Survey -svar fra tyggeledninger og MD -panel anmeldelser

IPD-delingstidsramme

Data vil være tilgængelige for andre forskere, der begynder 3 måneder efter offentliggørelsen og forbliver tilgængelige uden slutdato.

IPD-delingsadgangskriterier

Akademiske forskere med en formel udnævnelse på en forskningsinstitution skal forelægge et forskningsforslag, der detaljerede tilsigtede analyser og underskrive en aftale om databrug.

IPD-deling Understøttende informationstype

  • STUDY_PROTOCOL
  • SAP
  • ICF
  • ANALYTIC_CODE
  • CSR

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Ingen

Studerer et amerikansk FDA-reguleret enhedsprodukt

Ingen

Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .

Kliniske forsøg med Alle betingelser

Kliniske forsøg med Stor til klinisk beslutningsstøtte til sprogmodel

Abonner