Tato stránka byla automaticky přeložena a přesnost překladu není zaručena. Podívejte se prosím na anglická verze pro zdrojový text.

Škálovatelný klinický dohled nad velkými jazykovými modely pomocí triangulace nejistoty (SCOUT)

Prospektivní hodnocení modelově agnostického meta-verifikačního rámce (SCOUT) pro škálovatelný klinický dohled nad výstupy velkých jazykových modelů při diagnostice ischemické choroby srdeční: multicentrická, randomizovaná, křížová studie

Tato prospektivní, vícečtenářská, randomizovaná křížová studie vyhodnocuje SCOUT (Scalable Clinical Oversight via Uncertainty Triangulation), modelově agnostický metaverifikační rámec, který selektivně odkládá nespolehlivé předpovědi velkých jazykových modelů (LLM) na kliniky triangulací tří ortogonálních signálů nejistoty: heterogenita modelu, stochastická nekonzistence a kritika uvažování. Studie posuzuje, zda může SCOUT asistovaný přezkum snížit čas potřebný pro přezkum lékařem ve srovnání se standardním manuálním přezkumem AI generovaných diagnóz, přičemž zachová nehorší diagnostickou přesnost u subtypizace ischemické choroby srdeční (CHD).

Přehled studie

Detailní popis

Pozadí: Velké jazykové modely jsou stále více nasazovány v klinických pracovních postupech, ale vyžadování lékařského přezkumu každého výstupu AI popírá zisky v efektivitě, které motivují jejich přijetí. SCOUT řeší tento paradox efektivity a bezpečnosti prostřednictvím algoritmické meta-verifikace.

Rámec SCOUT trianguluje tři ortogonální externí signály, aby určil nejistotu na úrovni případu: (1) Heterogenita modelu – zda se strukturálně odlišný pomocný LLM shoduje s primárním modelem; (2) Stochastická nekonzistence – zda opakované vzorkování ze stejného modelu vede k odlišným výstupům; (3) Kritika uvažování – zda externí kontrolní model identifikuje logické chyby v řetězci uvažování.

V této křížové studii 7 kliniků různé seniority (2 mladší rezidenti, 3 starší rezidenti, 2 atestovaní lékaři) každý přezkoumá všech 110 případů v rámci standardního manuálního přezkumu i pracovních postupů přezkumu s asistencí SCOUT. Studie hodnotí efektivitu pracovního postupu (primární cíl) a diagnostickou přesnost (sekundární cíl).

Typ studie

Intervenční

Zápis (Odhadovaný)

7

Fáze

  • Nelze použít

Kontakty a umístění

Tato část poskytuje kontaktní údaje pro ty, kteří studii provádějí, a informace o tom, kde se tato studie provádí.

Studijní kontakt

Kritéria účasti

Výzkumníci hledají lidi, kteří odpovídají určitému popisu, kterému se říká kritéria způsobilosti. Některé příklady těchto kritérií jsou celkový zdravotní stav osoby nebo předchozí léčba.

Kritéria způsobilosti

Věk způsobilý ke studiu

  • Dospělý
  • Starší dospělý

Přijímá zdravé dobrovolníky

Ne

Popis

Kritéria pro zařazení:

  • Kardiologové s atestací nebo ve výcviku ve Fuwai Hospital
  • Zahrnující tři úrovně zkušeností: mladší rezidenty, starší rezidenty, atestované lékaře

Kritéria pro vyloučení:

  • Klinici zapojení do vývoje nebo optimalizace rámce SCOUT
  • Klinici zapojení do procesu zlatého standardu rozhodování

Studijní plán

Tato část poskytuje podrobnosti o studijním plánu, včetně toho, jak je studie navržena a co studie měří.

Jak je studie koncipována?

Detaily designu

  • Primární účel: Diagnostický
  • Přidělení: Randomizované
  • Intervenční model: Crossover Assignment
  • Maskování: Žádné (otevřený štítek)

Zbraně a zásahy

Skupina účastníků / Arm
Intervence / Léčba
Aktivní komparátor: Kontrola (standardní manuální přezkum)
Lékaři ručně přezkoumávají všechny případy v kontrolní skupině (n=54) s přístupem k predikcím a zdůvodněním AI. Žádné selektivní odložení.
Lékaři provedou úplnou manuální kontrolu 54 případů pomocí nezpracovaných lékařských záznamů s přístupem k predikcím a odůvodněním modelu AI, ale bez SCOUT stratifikace nejistoty nebo selektivního odložení.
Experimentální: Experimentální (SCOUT-Assisted Review)
Lékaři zpracovávají soubor intervencí (n=56) prostřednictvím rámce SCOUT. Případy s nízkou nejistotou jsou automaticky přijímány; případy s vysokou nejistotou podléhají přezkoumání lékařem s úplnou záznamovou stopou.
SCOUT-Assisted Review (Intervention Arm): Lékaři přezkoumají 56 případů zpracovaných prostřednictvím SCOUT frameworku. U případů klasifikovaných jako nízká nejistota (D(x)=0) je AI predikce automaticky přijata bez přezkoumání lékařem. U případů s vysokou nejistotou (D(x)=1) lékař přezkoumá případ s přístupem k řetězci úvah hlavního modelu a výsledkům meta-verifikačního auditu. Hlavním modelem je DeepSeek-V3.1 s řetězcem úvah (chain-of-thought prompting).

Co je měření studie?

Primární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Průměrný čas lékaře na přezkoumání případu (minuty)
Časové okno: Po dobu trvání studie, v průměru 2 hodiny.
Průměrný čas strávený každým klinikem při přezkoumání a stanovení diagnostického rozhodnutí na případ v každé skupině. Měřeno v minutách.
Po dobu trvání studie, v průměru 2 hodiny.

Sekundární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Diagnostická přesnost (%)
Časové okno: Až do ukončení studie, v průměru 2 hodiny.
Podíl správných klasifikací podtypů CHD (STEMI, NSTEMI, nestabilní angina pectoris, chronické koronární syndromy) v každé větvi studie.
Až do ukončení studie, v průměru 2 hodiny.
Výpočet návratnosti investic (ROI)
Časové okno: Po dobu trvání studie, v průměru 2 hodiny.
Poměr úspory času lékaře (oceněné na základě standardizovaných minutových mezd z referenčních hodnot zdravotnické reformy Sanming) k výpočetním nákladům SCOUT inference, rozčleněný podle úrovně odbornosti klinického lékaře.
Po dobu trvání studie, v průměru 2 hodiny.

Spolupracovníci a vyšetřovatelé

Zde najdete lidi a organizace zapojené do této studie.

Termíny studijních záznamů

Tato data sledují průběh záznamů studie a předkládání souhrnných výsledků na ClinicalTrials.gov. Záznamy ze studií a hlášené výsledky jsou před zveřejněním na veřejné webové stránce přezkoumány Národní lékařskou knihovnou (NLM), aby se ujistily, že splňují specifické standardy kontroly kvality.

Hlavní termíny studia

Začátek studia (Odhadovaný)

19. února 2026

Primární dokončení (Odhadovaný)

28. února 2026

Dokončení studie (Odhadovaný)

28. února 2026

Termíny zápisu do studia

První předloženo

9. února 2026

První předloženo, které splnilo kritéria kontroly kvality

14. února 2026

První zveřejněno (Aktuální)

17. února 2026

Aktualizace studijních záznamů

Poslední zveřejněná aktualizace (Aktuální)

17. února 2026

Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality

14. února 2026

Naposledy ověřeno

1. února 2026

Více informací

Termíny související s touto studií

Klíčová slova

Další identifikační čísla studie

  • 2025-2702-1

Plán pro data jednotlivých účastníků (IPD)

Plánujete sdílet data jednotlivých účastníků (IPD)?

ANO

Popis plánu IPD

Deidentifikovaná individuální data účastníků, která jsou základem výsledků uvedených v této studii, budou zpřístupněna.

Časový rámec sdílení IPD

Začíná 1 měsíc po zveřejnění primárních výsledků a je k dispozici až 60 měsíců.

Kritéria přístupu pro sdílení IPD

Data jsou k dispozici u odpovídajícího autora na přiměřenou žádost. Žadatelé budou muset předložit metodicky správný výzkumný návrh a podepsat dohodu o užívání dat.

Typ podpůrných informací pro sdílení IPD

  • PROTOKOL STUDY
  • MÍZA
  • ICF
  • ANALYTIC_CODE
  • CSR

Informace o lécích a zařízeních, studijní dokumenty

Studuje lékový produkt regulovaný americkým FDA

Ne

Studuje produkt zařízení regulovaný americkým úřadem FDA

Ne

Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .

Předplatit