Tato stránka byla automaticky přeložena a přesnost překladu není zaručena. Podívejte se prosím na anglická verze pro zdrojový text.

Škálovatelný klinický dohled nad velkými jazykovými modely pomocí triangulace nejistoty (SCOUT)

14. února 2026 aktualizováno: China National Center for Cardiovascular Diseases

Prospektivní hodnocení modelově agnostického meta-verifikačního rámce (SCOUT) pro škálovatelný klinický dohled nad výstupy velkých jazykových modelů při diagnostice ischemické choroby srdeční: multicentrická, randomizovaná, křížová studie

Tato prospektivní, vícečtenářská, randomizovaná křížová studie vyhodnocuje SCOUT (Scalable Clinical Oversight via Uncertainty Triangulation), modelově agnostický metaverifikační rámec, který selektivně odkládá nespolehlivé předpovědi velkých jazykových modelů (LLM) na kliniky triangulací tří ortogonálních signálů nejistoty: heterogenita modelu, stochastická nekonzistence a kritika uvažování. Studie posuzuje, zda může SCOUT asistovaný přezkum snížit čas potřebný pro přezkum lékařem ve srovnání se standardním manuálním přezkumem AI generovaných diagnóz, přičemž zachová nehorší diagnostickou přesnost u subtypizace ischemické choroby srdeční (CHD).

Přehled studie

Postavení

Zatím nenabíráme

Podmínky

Ischemická choroba srdeční (CHD)

Intervence / Léčba

Detailní popis

Pozadí: Velké jazykové modely jsou stále více nasazovány v klinických pracovních postupech, ale vyžadování lékařského přezkumu každého výstupu AI popírá zisky v efektivitě, které motivují jejich přijetí. SCOUT řeší tento paradox efektivity a bezpečnosti prostřednictvím algoritmické meta-verifikace.

Rámec SCOUT trianguluje tři ortogonální externí signály, aby určil nejistotu na úrovni případu: (1) Heterogenita modelu – zda se strukturálně odlišný pomocný LLM shoduje s primárním modelem; (2) Stochastická nekonzistence – zda opakované vzorkování ze stejného modelu vede k odlišným výstupům; (3) Kritika uvažování – zda externí kontrolní model identifikuje logické chyby v řetězci uvažování.

V této křížové studii 7 kliniků různé seniority (2 mladší rezidenti, 3 starší rezidenti, 2 atestovaní lékaři) každý přezkoumá všech 110 případů v rámci standardního manuálního přezkumu i pracovních postupů přezkumu s asistencí SCOUT. Studie hodnotí efektivitu pracovního postupu (primární cíl) a diagnostickou přesnost (sekundární cíl).

Typ studie

Intervenční

Zápis (Odhadovaný)

Fáze

Nelze použít

Kontakty a umístění

Tato část poskytuje kontaktní údaje pro ty, kteří studii provádějí, a informace o tom, kde se tato studie provádí.

Studijní kontakt

Jméno: Xiaojin Gao, Dr.
Telefonní číslo: +86 010 88322415
E-mail: sophie_gao@sina.com

Kritéria účasti

Výzkumníci hledají lidi, kteří odpovídají určitému popisu, kterému se říká kritéria způsobilosti. Některé příklady těchto kritérií jsou celkový zdravotní stav osoby nebo předchozí léčba.

Kritéria způsobilosti

Věk způsobilý ke studiu

Dospělý
Starší dospělý

Přijímá zdravé dobrovolníky

Popis

Kritéria pro zařazení:

Kardiologové s atestací nebo ve výcviku ve Fuwai Hospital
Zahrnující tři úrovně zkušeností: mladší rezidenty, starší rezidenty, atestované lékaře

Kritéria pro vyloučení:

Klinici zapojení do vývoje nebo optimalizace rámce SCOUT
Klinici zapojení do procesu zlatého standardu rozhodování

Studijní plán

Tato část poskytuje podrobnosti o studijním plánu, včetně toho, jak je studie navržena a co studie měří.

Jak je studie koncipována?

Detaily designu

Primární účel: Diagnostický
Přidělení: Randomizované
Intervenční model: Crossover Assignment
Maskování: Žádné (otevřený štítek)

Počet zbraní

Zbraně a zásahy

Skupina účastníků / Arm	Intervence / Léčba
Aktivní komparátor: Kontrola (standardní manuální přezkum) Lékaři ručně přezkoumávají všechny případy v kontrolní skupině (n=54) s přístupem k predikcím a zdůvodněním AI. Žádné selektivní odložení.	Diagnostický test: Standardní pracovní postup manuálního přezkumu Lékaři provedou úplnou manuální kontrolu 54 případů pomocí nezpracovaných lékařských záznamů s přístupem k predikcím a odůvodněním modelu AI, ale bez SCOUT stratifikace nejistoty nebo selektivního odložení.
Experimentální: Experimentální (SCOUT-Assisted Review) Lékaři zpracovávají soubor intervencí (n=56) prostřednictvím rámce SCOUT. Případy s nízkou nejistotou jsou automaticky přijímány; případy s vysokou nejistotou podléhají přezkoumání lékařem s úplnou záznamovou stopou.	Diagnostický test: Pracovní postup SCOUT-Assisted Review SCOUT-Assisted Review (Intervention Arm): Lékaři přezkoumají 56 případů zpracovaných prostřednictvím SCOUT frameworku. U případů klasifikovaných jako nízká nejistota (D(x)=0) je AI predikce automaticky přijata bez přezkoumání lékařem. U případů s vysokou nejistotou (D(x)=1) lékař přezkoumá případ s přístupem k řetězci úvah hlavního modelu a výsledkům meta-verifikačního auditu. Hlavním modelem je DeepSeek-V3.1 s řetězcem úvah (chain-of-thought prompting).

Skupina účastníků / Arm

Intervence / Léčba

Aktivní komparátor: Kontrola (standardní manuální přezkum)

Lékaři ručně přezkoumávají všechny případy v kontrolní skupině (n=54) s přístupem k predikcím a zdůvodněním AI. Žádné selektivní odložení.

Diagnostický test: Standardní pracovní postup manuálního přezkumu

Lékaři provedou úplnou manuální kontrolu 54 případů pomocí nezpracovaných lékařských záznamů s přístupem k predikcím a odůvodněním modelu AI, ale bez SCOUT stratifikace nejistoty nebo selektivního odložení.

Experimentální: Experimentální (SCOUT-Assisted Review)

Lékaři zpracovávají soubor intervencí (n=56) prostřednictvím rámce SCOUT. Případy s nízkou nejistotou jsou automaticky přijímány; případy s vysokou nejistotou podléhají přezkoumání lékařem s úplnou záznamovou stopou.

Diagnostický test: Pracovní postup SCOUT-Assisted Review

SCOUT-Assisted Review (Intervention Arm): Lékaři přezkoumají 56 případů zpracovaných prostřednictvím SCOUT frameworku. U případů klasifikovaných jako nízká nejistota (D(x)=0) je AI predikce automaticky přijata bez přezkoumání lékařem. U případů s vysokou nejistotou (D(x)=1) lékař přezkoumá případ s přístupem k řetězci úvah hlavního modelu a výsledkům meta-verifikačního auditu. Hlavním modelem je DeepSeek-V3.1 s řetězcem úvah (chain-of-thought prompting).

Co je měření studie?

Primární výstupní opatření

Měření výsledku	Popis opatření	Časové okno
Průměrný čas lékaře na přezkoumání případu (minuty) Časové okno: Po dobu trvání studie, v průměru 2 hodiny.	Průměrný čas strávený každým klinikem při přezkoumání a stanovení diagnostického rozhodnutí na případ v každé skupině. Měřeno v minutách.	Po dobu trvání studie, v průměru 2 hodiny.

Sekundární výstupní opatření

Měření výsledku	Popis opatření	Časové okno
Diagnostická přesnost (%) Časové okno: Až do ukončení studie, v průměru 2 hodiny.	Podíl správných klasifikací podtypů CHD (STEMI, NSTEMI, nestabilní angina pectoris, chronické koronární syndromy) v každé větvi studie.	Až do ukončení studie, v průměru 2 hodiny.
Výpočet návratnosti investic (ROI) Časové okno: Po dobu trvání studie, v průměru 2 hodiny.	Poměr úspory času lékaře (oceněné na základě standardizovaných minutových mezd z referenčních hodnot zdravotnické reformy Sanming) k výpočetním nákladům SCOUT inference, rozčleněný podle úrovně odbornosti klinického lékaře.	Po dobu trvání studie, v průměru 2 hodiny.

Spolupracovníci a vyšetřovatelé

Zde najdete lidi a organizace zapojené do této studie.

Sponzor

China National Center for Cardiovascular Diseases

Termíny studijních záznamů

Tato data sledují průběh záznamů studie a předkládání souhrnných výsledků na ClinicalTrials.gov. Záznamy ze studií a hlášené výsledky jsou před zveřejněním na veřejné webové stránce přezkoumány Národní lékařskou knihovnou (NLM), aby se ujistily, že splňují specifické standardy kontroly kvality.

Hlavní termíny studia

Začátek studia (Odhadovaný)

19. února 2026

Primární dokončení (Odhadovaný)

28. února 2026

Dokončení studie (Odhadovaný)

28. února 2026

Termíny zápisu do studia

První předloženo

9. února 2026

První předloženo, které splnilo kritéria kontroly kvality

14. února 2026

První zveřejněno (Aktuální)

17. února 2026

Aktualizace studijních záznamů

Poslední zveřejněná aktualizace (Aktuální)

17. února 2026

Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality

14. února 2026

Naposledy ověřeno

1. února 2026

Více informací

Termíny související s touto studií

Klíčová slova

umělá inteligence

Další relevantní podmínky MeSH

Další identifikační čísla studie

2025-2702-1

Plán pro data jednotlivých účastníků (IPD)

Plánujete sdílet data jednotlivých účastníků (IPD)?

ANO

Popis plánu IPD

Deidentifikovaná individuální data účastníků, která jsou základem výsledků uvedených v této studii, budou zpřístupněna.

Časový rámec sdílení IPD

Začíná 1 měsíc po zveřejnění primárních výsledků a je k dispozici až 60 měsíců.

Kritéria přístupu pro sdílení IPD

Data jsou k dispozici u odpovídajícího autora na přiměřenou žádost. Žadatelé budou muset předložit metodicky správný výzkumný návrh a podepsat dohodu o užívání dat.

Typ podpůrných informací pro sdílení IPD

PROTOKOL STUDY
MÍZA
ICF
ANALYTIC_CODE
CSR

Informace o lécích a zařízeních, studijní dokumenty

Studuje lékový produkt regulovaný americkým FDA

Studuje produkt zařízení regulovaný americkým úřadem FDA

Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .

Škálovatelný klinický dohled nad velkými jazykovými modely pomocí triangulace nejistoty (SCOUT)

Prospektivní hodnocení modelově agnostického meta-verifikačního rámce (SCOUT) pro škálovatelný klinický dohled nad výstupy velkých jazykových modelů při diagnostice ischemické choroby srdeční: multicentrická, randomizovaná, křížová studie

Přehled studie

Postavení

Podmínky

Intervence / Léčba

Detailní popis

Typ studie

Zápis (Odhadovaný)

Fáze

Kontakty a umístění

Studijní kontakt

Kritéria účasti

Kritéria způsobilosti

Věk způsobilý ke studiu

Přijímá zdravé dobrovolníky

Popis

Studijní plán

Jak je studie koncipována?

Detaily designu

Počet zbraní

Zbraně a zásahy

Skupina účastníků / Arm

Intervence / Léčba

Co je měření studie?

Primární výstupní opatření

Měření výsledku

Popis opatření

Časové okno

Sekundární výstupní opatření

Měření výsledku

Popis opatření

Časové okno

Spolupracovníci a vyšetřovatelé

Sponzor

Termíny studijních záznamů

Hlavní termíny studia

Začátek studia (Odhadovaný)

Primární dokončení (Odhadovaný)

Dokončení studie (Odhadovaný)

Termíny zápisu do studia

První předloženo

První předloženo, které splnilo kritéria kontroly kvality

První zveřejněno (Aktuální)

Aktualizace studijních záznamů

Poslední zveřejněná aktualizace (Aktuální)

Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality

Naposledy ověřeno

Více informací

Termíny související s touto studií

Klíčová slova

Další relevantní podmínky MeSH

Další identifikační čísla studie

Plán pro data jednotlivých účastníků (IPD)

Plánujete sdílet data jednotlivých účastníků (IPD)?

Popis plánu IPD

Časový rámec sdílení IPD

Kritéria přístupu pro sdílení IPD

Typ podpůrných informací pro sdílení IPD

Informace o lécích a zařízeních, studijní dokumenty

Studuje lékový produkt regulovaný americkým FDA

Studuje produkt zařízení regulovaný americkým úřadem FDA

Prohledejte podobné pokusy

Sponzoři a spolupracovníci

Zdravotní podmínky

Drogové intervence

CROs by country

CROs in Chile

Podmínky

Vzácné nemoci

Drogové intervence

Doplňky stravy

Sponzor / Spolupracovníci

Místa