Denne side blev automatisk oversat, og nøjagtigheden af ​​oversættelsen er ikke garanteret. Der henvises til engelsk version for en kildetekst.

Skalerbar Klinisk Overvågning af Store Sprogmodeller Via Usikkerhedstriangulering (SCOUT)

Prospektiv Evaluering af en Model-Agnostisk Meta-Verificeringsramme (SCOUT) til Skalerbar Klinisk Overvågning af Store Sprogmodels Output i Diagnostisering af Koronar Hjertesygdom: Et Multi-Læser, Randomiseret, Crossover-Studie

Denne prospektive, multi-læser, randomiserede crossover-studie evaluerer SCOUT (Scalable Clinical Oversight via Uncertainty Triangulation), en model-agnostisk meta-verificeringsramme, der selektivt udsætter upålidelige store sprogmodel (LLM) forudsigelser til klinikere ved at triangulere tre ortogonale usikkerhedssignaler: modelheterogenitet, stokastisk inkonsistens og ræsonnementkritik. Studiet vurderer, om SCOUT-assisteret gennemgang kan reducere lægens gennemgangstid sammenlignet med standard manuel gennemgang af AI-genererede diagnoser, mens der opretholdes ikke-underlegen diagnostisk nøjagtighed ved underinddeling af koronar hjertesygdom (CHD).

Studieoversigt

Detaljeret beskrivelse

Baggrund: Store sprogmodeller anvendes i stigende grad i kliniske arbejdsgange, men at kræve, at klinikere gennemgår alle AI-output, ophæver de effektivitetsgevinster, der motiverer deres indførelse. SCOUT adresserer dette effektivitets-sikkerhedsparadoks gennem algoritmisk metaverifikation.

SCOUT-rammen triangulerer tre ortogonale eksterne signaler for at bestemme usikkerhed på cases-niveau: (1) Modelheterogenitet - om en strukturelt forskellig hjælpende LLM er enig med den primære model; (2) Stokastisk inkonsistens - om gentagne udtag fra den samme model giver divergerende output; (3) Ræsonnementkritik - om en ekstern kontrolmodel identificerer logiske fejl i ræsonnementets tankegangskæde.

I dette crossover-forsøg gennemgår 7 klinikere af forskellig anciennitet (2 juniorresidenser, 3 seniorresidenser, 2 overlæger) hver alle 110 cases under både standard manuel gennemgang og SCOUT-assisterede gennemgangsarbejdsgange. Studiet evaluerer arbejdsgangseffektivitet (primær endpoint) og diagnostisk nøjagtighed (sekundær endpoint).

Undersøgelsestype

Interventionel

Tilmelding (Anslået)

7

Fase

  • Ikke anvendelig

Kontakter og lokationer

Dette afsnit indeholder kontaktoplysninger for dem, der udfører undersøgelsen, og oplysninger om, hvor denne undersøgelse udføres.

Studiekontakt

Deltagelseskriterier

Forskere leder efter personer, der passer til en bestemt beskrivelse, kaldet berettigelseskriterier. Nogle eksempler på disse kriterier er en persons generelle helbredstilstand eller tidligere behandlinger.

Berettigelseskriterier

Aldre berettiget til at studere

  • Voksen
  • Ældre voksen

Tager imod sunde frivillige

Ingen

Beskrivelse

Inklusionskriterier:

  • Speciallæger i hjerte- og karsygdomme eller under uddannelse til samme på Fuwai Hospital
  • Omfatter tre erfaringsniveauer: yngre borgere, ældre borgere, overlæger

Eksklusionskriterier:

  • Klinikere involveret i udvikling eller optimering af SCOUT-rammen
  • Klinikere involveret i guldstandardbedømmelsesprocessen

Studieplan

Dette afsnit indeholder detaljer om studieplanen, herunder hvordan undersøgelsen er designet, og hvad undersøgelsen måler.

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

  • Primært formål: Diagnostisk
  • Tildeling: Randomiseret
  • Interventionel model: Crossover opgave
  • Maskning: Ingen (Åben etiket)

Våben og indgreb

Deltagergruppe / Arm
Intervention / Behandling
Aktiv komparator: Kontrol (Standard manuel gennemgang)
Læger gennemgår manuelt alle tilfælde i kontrollen (n=54) med adgang til AI-forudsigelser og begrundelser. Ingen selektiv udsættelse.
Læger udfører en fuld manuel gennemgang af 54 tilfælde ved hjælp af rå medicinske journaler med adgang til AI-modellens forudsigelser og ræsonnement, men uden SCOUT-usikkerhedsstratificering eller selektiv udskydelse.
Eksperimentel: Eksperimentel (SCOUT-assisteret gennemgang)
Læger behandler interventionssættet (n=56) gennem SCOUT-rammen. Lave-usikkerhedstilfælde accepteres automatisk; høje-usikkerhedstilfælde gennemgår lægegennemgang med fuldt revisionsspor.
SCOUT-Assisted Review (Interventionsarm): Læger gennemgår 56 sager behandlet gennem SCOUT-rammen. For sager klassificeret som lav usikkerhed (D(x)=0) accepteres AI-forudsigelsen automatisk uden lægegennemgang. For høj usikkerhedssager (D(x)=1) gennemgår lægen sagen med adgang til hovedmodellens kæde-af-tænkning-ræsonnement og meta-verificeringsrevisionsresultaterne. Hovedmodellen er DeepSeek-V3.1 med kæde-af-tænkning-prompting.

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Gennemsnitlig lægegennemgangstid pr. sag (minutter)
Tidsramme: Gennem studieafslutningen, i gennemsnit 2 timer.
Gennemsnitlig tid brugt af hver kliniker på at gennemgå og træffe en diagnostisk beslutning pr. sag under hver behandlingsarm.
Målt i minutter.
Gennem studieafslutningen, i gennemsnit 2 timer.

Sekundære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Diagnostic accuracy (%)
Tidsramme: Gennem studiefærdiggørelse, i gennemsnit 2 timer.
Andel af korrekte klassifikationer af KKS-subtyper (STEMI, NSTEMI, ustabil angina pectoris, kroniske koronarsyndromer) i hver arm.
Gennem studiefærdiggørelse, i gennemsnit 2 timer.
Computational Return on Investment (ROI)
Tidsramme: Gennem studiefærdiggørelse, i gennemsnit 2 timer.
Forholdet mellem besparelser i lægetid (vurderet til standardiserede minutlønninger fra Sanming sundhedsreformens benchmarktal) og beregningsomkostningerne for SCOUT-inferens, opdelt efter klinikerens anciennitetsniveau.
Gennem studiefærdiggørelse, i gennemsnit 2 timer.

Samarbejdspartnere og efterforskere

Det er her, du vil finde personer og organisationer, der er involveret i denne undersøgelse.

Datoer for undersøgelser

Disse datoer sporer fremskridtene for indsendelser af undersøgelsesrekord og resumeresultater til ClinicalTrials.gov. Studieregistreringer og rapporterede resultater gennemgås af National Library of Medicine (NLM) for at sikre, at de opfylder specifikke kvalitetskontrolstandarder, før de offentliggøres på den offentlige hjemmeside.

Studer store datoer

Studiestart (Anslået)

19. februar 2026

Primær færdiggørelse (Anslået)

28. februar 2026

Studieafslutning (Anslået)

28. februar 2026

Datoer for studieregistrering

Først indsendt

9. februar 2026

Først indsendt, der opfyldte QC-kriterier

14. februar 2026

Først opslået (Faktiske)

17. februar 2026

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

17. februar 2026

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

14. februar 2026

Sidst verificeret

1. februar 2026

Mere information

Begreber relateret til denne undersøgelse

Andre undersøgelses-id-numre

  • 2025-2702-1

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

JA

IPD-planbeskrivelse

De-identificerede individuelle deltagerdata, der ligger til grund for resultaterne rapporteret i denne undersøgelse, vil blive stillet til rådighed.

IPD-delingstidsramme

Begynder 1 måned efter offentliggørelsen af de primære resultater og tilgængelig i op til 60 måneder.

IPD-delingsadgangskriterier

Data er tilgængelige fra den tilsvarende forfatter efter rimelig anmodning. Anmodere skal fremsætte et metodisk forsvarligt forskningsforslag og underskrive en dataanvendelsesaftale.

IPD-deling Understøttende informationstype

  • STUDY_PROTOCOL
  • SAP
  • ICF
  • ANALYTIC_CODE
  • CSR

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Ingen

Studerer et amerikansk FDA-reguleret enhedsprodukt

Ingen

Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .

Kliniske forsøg med Standard manuel gennemgangsarbejdsgang

Abonner