Denne side blev automatisk oversat, og nøjagtigheden af oversættelsen er ikke garanteret. Der henvises til engelsk version for en kildetekst.

Skalerbar Klinisk Overvågning af Store Sprogmodeller Via Usikkerhedstriangulering (SCOUT)

14. februar 2026 opdateret af: China National Center for Cardiovascular Diseases

Prospektiv Evaluering af en Model-Agnostisk Meta-Verificeringsramme (SCOUT) til Skalerbar Klinisk Overvågning af Store Sprogmodels Output i Diagnostisering af Koronar Hjertesygdom: Et Multi-Læser, Randomiseret, Crossover-Studie

Denne prospektive, multi-læser, randomiserede crossover-studie evaluerer SCOUT (Scalable Clinical Oversight via Uncertainty Triangulation), en model-agnostisk meta-verificeringsramme, der selektivt udsætter upålidelige store sprogmodel (LLM) forudsigelser til klinikere ved at triangulere tre ortogonale usikkerhedssignaler: modelheterogenitet, stokastisk inkonsistens og ræsonnementkritik. Studiet vurderer, om SCOUT-assisteret gennemgang kan reducere lægens gennemgangstid sammenlignet med standard manuel gennemgang af AI-genererede diagnoser, mens der opretholdes ikke-underlegen diagnostisk nøjagtighed ved underinddeling af koronar hjertesygdom (CHD).

Studieoversigt

Status

Ikke rekrutterer endnu

Betingelser

Koronar hjertesygdom (CHD)

Intervention / Behandling

Detaljeret beskrivelse

Baggrund: Store sprogmodeller anvendes i stigende grad i kliniske arbejdsgange, men at kræve, at klinikere gennemgår alle AI-output, ophæver de effektivitetsgevinster, der motiverer deres indførelse. SCOUT adresserer dette effektivitets-sikkerhedsparadoks gennem algoritmisk metaverifikation.

SCOUT-rammen triangulerer tre ortogonale eksterne signaler for at bestemme usikkerhed på cases-niveau: (1) Modelheterogenitet - om en strukturelt forskellig hjælpende LLM er enig med den primære model; (2) Stokastisk inkonsistens - om gentagne udtag fra den samme model giver divergerende output; (3) Ræsonnementkritik - om en ekstern kontrolmodel identificerer logiske fejl i ræsonnementets tankegangskæde.

I dette crossover-forsøg gennemgår 7 klinikere af forskellig anciennitet (2 juniorresidenser, 3 seniorresidenser, 2 overlæger) hver alle 110 cases under både standard manuel gennemgang og SCOUT-assisterede gennemgangsarbejdsgange. Studiet evaluerer arbejdsgangseffektivitet (primær endpoint) og diagnostisk nøjagtighed (sekundær endpoint).

Undersøgelsestype

Interventionel

Tilmelding (Anslået)

Fase

Ikke anvendelig

Kontakter og lokationer

Dette afsnit indeholder kontaktoplysninger for dem, der udfører undersøgelsen, og oplysninger om, hvor denne undersøgelse udføres.

Studiekontakt

Navn: Xiaojin Gao, Dr.
Telefonnummer: +86 010 88322415
E-mail: sophie_gao@sina.com

Deltagelseskriterier

Forskere leder efter personer, der passer til en bestemt beskrivelse, kaldet berettigelseskriterier. Nogle eksempler på disse kriterier er en persons generelle helbredstilstand eller tidligere behandlinger.

Berettigelseskriterier

Aldre berettiget til at studere

Voksen
Ældre voksen

Tager imod sunde frivillige

Ingen

Beskrivelse

Inklusionskriterier:

Speciallæger i hjerte- og karsygdomme eller under uddannelse til samme på Fuwai Hospital
Omfatter tre erfaringsniveauer: yngre borgere, ældre borgere, overlæger

Eksklusionskriterier:

Klinikere involveret i udvikling eller optimering af SCOUT-rammen
Klinikere involveret i guldstandardbedømmelsesprocessen

Studieplan

Dette afsnit indeholder detaljer om studieplanen, herunder hvordan undersøgelsen er designet, og hvad undersøgelsen måler.

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

Primært formål: Diagnostisk
Tildeling: Randomiseret
Interventionel model: Crossover opgave
Maskning: Ingen (Åben etiket)

Antal våben

Våben og indgreb

Deltagergruppe / Arm	Intervention / Behandling
Aktiv komparator: Kontrol (Standard manuel gennemgang) Læger gennemgår manuelt alle tilfælde i kontrollen (n=54) med adgang til AI-forudsigelser og begrundelser. Ingen selektiv udsættelse.	Diagnostisk test: Standard manuel gennemgangsarbejdsgang Læger udfører en fuld manuel gennemgang af 54 tilfælde ved hjælp af rå medicinske journaler med adgang til AI-modellens forudsigelser og ræsonnement, men uden SCOUT-usikkerhedsstratificering eller selektiv udskydelse.
Eksperimentel: Eksperimentel (SCOUT-assisteret gennemgang) Læger behandler interventionssættet (n=56) gennem SCOUT-rammen. Lave-usikkerhedstilfælde accepteres automatisk; høje-usikkerhedstilfælde gennemgår lægegennemgang med fuldt revisionsspor.	Diagnostisk test: SCOUT-Assisteret Gennemgangsarbejdsgang SCOUT-Assisted Review (Interventionsarm): Læger gennemgår 56 sager behandlet gennem SCOUT-rammen. For sager klassificeret som lav usikkerhed (D(x)=0) accepteres AI-forudsigelsen automatisk uden lægegennemgang. For høj usikkerhedssager (D(x)=1) gennemgår lægen sagen med adgang til hovedmodellens kæde-af-tænkning-ræsonnement og meta-verificeringsrevisionsresultaterne. Hovedmodellen er DeepSeek-V3.1 med kæde-af-tænkning-prompting.

Deltagergruppe / Arm

Intervention / Behandling

Aktiv komparator: Kontrol (Standard manuel gennemgang)

Læger gennemgår manuelt alle tilfælde i kontrollen (n=54) med adgang til AI-forudsigelser og begrundelser. Ingen selektiv udsættelse.

Diagnostisk test: Standard manuel gennemgangsarbejdsgang

Læger udfører en fuld manuel gennemgang af 54 tilfælde ved hjælp af rå medicinske journaler med adgang til AI-modellens forudsigelser og ræsonnement, men uden SCOUT-usikkerhedsstratificering eller selektiv udskydelse.

Eksperimentel: Eksperimentel (SCOUT-assisteret gennemgang)

Læger behandler interventionssættet (n=56) gennem SCOUT-rammen. Lave-usikkerhedstilfælde accepteres automatisk; høje-usikkerhedstilfælde gennemgår lægegennemgang med fuldt revisionsspor.

Diagnostisk test: SCOUT-Assisteret Gennemgangsarbejdsgang

SCOUT-Assisted Review (Interventionsarm): Læger gennemgår 56 sager behandlet gennem SCOUT-rammen. For sager klassificeret som lav usikkerhed (D(x)=0) accepteres AI-forudsigelsen automatisk uden lægegennemgang. For høj usikkerhedssager (D(x)=1) gennemgår lægen sagen med adgang til hovedmodellens kæde-af-tænkning-ræsonnement og meta-verificeringsrevisionsresultaterne. Hovedmodellen er DeepSeek-V3.1 med kæde-af-tænkning-prompting.

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål	Foranstaltningsbeskrivelse	Tidsramme
Gennemsnitlig lægegennemgangstid pr. sag (minutter) Tidsramme: Gennem studieafslutningen, i gennemsnit 2 timer.	Gennemsnitlig tid brugt af hver kliniker på at gennemgå og træffe en diagnostisk beslutning pr. sag under hver behandlingsarm. Målt i minutter.	Gennem studieafslutningen, i gennemsnit 2 timer.

Sekundære resultatmål

Resultatmål	Foranstaltningsbeskrivelse	Tidsramme
Diagnostic accuracy (%) Tidsramme: Gennem studiefærdiggørelse, i gennemsnit 2 timer.	Andel af korrekte klassifikationer af KKS-subtyper (STEMI, NSTEMI, ustabil angina pectoris, kroniske koronarsyndromer) i hver arm.	Gennem studiefærdiggørelse, i gennemsnit 2 timer.
Computational Return on Investment (ROI) Tidsramme: Gennem studiefærdiggørelse, i gennemsnit 2 timer.	Forholdet mellem besparelser i lægetid (vurderet til standardiserede minutlønninger fra Sanming sundhedsreformens benchmarktal) og beregningsomkostningerne for SCOUT-inferens, opdelt efter klinikerens anciennitetsniveau.	Gennem studiefærdiggørelse, i gennemsnit 2 timer.

Samarbejdspartnere og efterforskere

Det er her, du vil finde personer og organisationer, der er involveret i denne undersøgelse.

Sponsor

China National Center for Cardiovascular Diseases

Datoer for undersøgelser

Disse datoer sporer fremskridtene for indsendelser af undersøgelsesrekord og resumeresultater til ClinicalTrials.gov. Studieregistreringer og rapporterede resultater gennemgås af National Library of Medicine (NLM) for at sikre, at de opfylder specifikke kvalitetskontrolstandarder, før de offentliggøres på den offentlige hjemmeside.

Studer store datoer

Studiestart (Anslået)

19. februar 2026

Primær færdiggørelse (Anslået)

28. februar 2026

Studieafslutning (Anslået)

28. februar 2026

Datoer for studieregistrering

Først indsendt

9. februar 2026

Først indsendt, der opfyldte QC-kriterier

14. februar 2026

Først opslået (Faktiske)

17. februar 2026

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

17. februar 2026

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

14. februar 2026

Sidst verificeret

1. februar 2026

Mere information

Begreber relateret til denne undersøgelse

Nøgleord

kunstig intelligens

Yderligere relevante MeSH-vilkår

Andre undersøgelses-id-numre

2025-2702-1

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

IPD-planbeskrivelse

De-identificerede individuelle deltagerdata, der ligger til grund for resultaterne rapporteret i denne undersøgelse, vil blive stillet til rådighed.

IPD-delingstidsramme

Begynder 1 måned efter offentliggørelsen af de primære resultater og tilgængelig i op til 60 måneder.

IPD-delingsadgangskriterier

Data er tilgængelige fra den tilsvarende forfatter efter rimelig anmodning. Anmodere skal fremsætte et metodisk forsvarligt forskningsforslag og underskrive en dataanvendelsesaftale.

IPD-deling Understøttende informationstype

STUDY_PROTOCOL
SAP
ICF
ANALYTIC_CODE
CSR

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Ingen

Studerer et amerikansk FDA-reguleret enhedsprodukt

Ingen

Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .

Kliniske forsøg med Standard manuel gennemgangsarbejdsgang

Universitat Politècnica de Catalunya
University of Liverpool; The BMJ

Afsluttet

Evaluering af virkningen af at vurdere under peer review CONSORT-tjeklisten indsendt af forfattere

Peer Review, Udgivelse | Fuldstændighed af rapportering

Det Forenede Kongerige
Pakistan Association of Cognitive Therapists

Rekruttering

Forsøg med gennemførlighed og accept af en kulturelt tilpasset manual versus standard CBT-manual: Et randomiseret kontrolforsøg

Depression | Angst

Pakistan
Fred Hutchinson Cancer Center

Trukket tilbage

Palliativ plejekonsultation for at forbedre kommunikationen for patienter, der overvejer kirurgi for en pancreas-neoplasma

Pancreas neoplasma

Forenede Stater
Facultad de Enfermería, Fisioterapia y Podología...

Ikke rekrutterer endnu

Myotensive ekstraokulære muskelt teknikker tilføjet manuel terapi for migræne uden aura

Migræne uden aura

Spanien
M.D. Anderson Cancer Center
National Cancer Institute (NCI)

Afsluttet

Effekt af PACK Health Support Program på patientrapporterede resultater hos patienter med brystkræft

Brystkarcinom | Tilbagevendende brystkarcinom | Duktalt brystkarcinom in situ | Invasivt brystkarcinom

Forenede Stater
Ohio State University Comprehensive Cancer Center

Afsluttet

Online Mindfulness-baseret intervention for at mindske præ-procedureel angst før en førstegangs screening koloskopi

Kolorektalt karcinom

Forenede Stater
Mayo Clinic

Tilmelding efter invitation

Tilbyder HPV-selvindsamling i nye sundhedsindstillinger for at forbedre optagelsen af screening af livmoderhalskræft

Cervikal karcinom | Human papillomavirus infektion | Humant papillomavirus-relateret cervikal karcinom

Forenede Stater
Ohio State University Comprehensive Cancer Center

Rekruttering

Slå lungekræft i Ohio-protokollen til forbedring af overlevelse hos patienter med fase IV ikke-småcellet lungekræft (BLCIO)

Nuværende ryger | Lunge Adenocarcinom | Stadie IV ikke-småcellet lungekræft | Planocellulært lungekarcinom | Cigaretryger

Forenede Stater
Jonsson Comprehensive Cancer Center
Silicon Valley Community Foundation

Aktiv, ikke rekrutterende

Underernæringsscreening og diætintervention for at forbedre ernæringsresultater hos patienter med uoperabel bugspytkirtelkræft

Stadie III Bugspytkirtelkræft | Adenocarcinom i bugspytkirtlen Ikke-operabel

Forenede Stater
SWOG Cancer Research Network
National Cancer Institute (NCI)

Aktiv, ikke rekrutterende

Øger brugen af et genomisk tumorkort antallet af patienter, der modtager genominformeret behandling

Avanceret malignt fast neoplasma | Ildfast malignt fast neoplasma | Tilbagevendende malignt fast neoplasma | Metastatisk malignt fast neoplasma

Forenede Stater, Puerto Rico

Skalerbar Klinisk Overvågning af Store Sprogmodeller Via Usikkerhedstriangulering (SCOUT)

Prospektiv Evaluering af en Model-Agnostisk Meta-Verificeringsramme (SCOUT) til Skalerbar Klinisk Overvågning af Store Sprogmodels Output i Diagnostisering af Koronar Hjertesygdom: Et Multi-Læser, Randomiseret, Crossover-Studie

Studieoversigt

Status

Betingelser

Intervention / Behandling

Detaljeret beskrivelse

Undersøgelsestype

Tilmelding (Anslået)

Fase

Kontakter og lokationer

Studiekontakt

Deltagelseskriterier

Berettigelseskriterier

Aldre berettiget til at studere

Tager imod sunde frivillige

Beskrivelse

Studieplan

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

Antal våben

Våben og indgreb

Deltagergruppe / Arm

Intervention / Behandling

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål

Foranstaltningsbeskrivelse

Tidsramme

Sekundære resultatmål

Resultatmål

Foranstaltningsbeskrivelse

Tidsramme

Samarbejdspartnere og efterforskere

Sponsor

Datoer for undersøgelser

Studer store datoer

Studiestart (Anslået)

Primær færdiggørelse (Anslået)

Studieafslutning (Anslået)

Datoer for studieregistrering

Først indsendt

Først indsendt, der opfyldte QC-kriterier

Først opslået (Faktiske)

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

Sidst verificeret

Mere information

Begreber relateret til denne undersøgelse

Nøgleord

Yderligere relevante MeSH-vilkår

Andre undersøgelses-id-numre

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

IPD-planbeskrivelse

IPD-delingstidsramme

IPD-delingsadgangskriterier

IPD-deling Understøttende informationstype

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Studerer et amerikansk FDA-reguleret enhedsprodukt

Kliniske forsøg med Standard manuel gennemgangsarbejdsgang

Søg i lignende forsøg

Sponsorer og samarbejdspartnere

Medicinske tilstande

Narkotikainterventioner

CROs by country

CROs in Bahrain

Betingelser

Sjældne sygdomme

Narkotikainterventioner

Kosttilskud

Sponsor / samarbejdspartnere

Placeringer