- ICH GCP
- Registr klinických studií v USA
- Klinická studie NCT07414966
Škálovatelný klinický dohled nad velkými jazykovými modely pomocí triangulace nejistoty (SCOUT)
Prospektivní hodnocení modelově agnostického meta-verifikačního rámce (SCOUT) pro škálovatelný klinický dohled nad výstupy velkých jazykových modelů při diagnostice ischemické choroby srdeční: multicentrická, randomizovaná, křížová studie
Přehled studie
Postavení
Podmínky
Detailní popis
Pozadí: Velké jazykové modely jsou stále více nasazovány v klinických pracovních postupech, ale vyžadování lékařského přezkumu každého výstupu AI popírá zisky v efektivitě, které motivují jejich přijetí. SCOUT řeší tento paradox efektivity a bezpečnosti prostřednictvím algoritmické meta-verifikace.
Rámec SCOUT trianguluje tři ortogonální externí signály, aby určil nejistotu na úrovni případu: (1) Heterogenita modelu – zda se strukturálně odlišný pomocný LLM shoduje s primárním modelem; (2) Stochastická nekonzistence – zda opakované vzorkování ze stejného modelu vede k odlišným výstupům; (3) Kritika uvažování – zda externí kontrolní model identifikuje logické chyby v řetězci uvažování.
V této křížové studii 7 kliniků různé seniority (2 mladší rezidenti, 3 starší rezidenti, 2 atestovaní lékaři) každý přezkoumá všech 110 případů v rámci standardního manuálního přezkumu i pracovních postupů přezkumu s asistencí SCOUT. Studie hodnotí efektivitu pracovního postupu (primární cíl) a diagnostickou přesnost (sekundární cíl).
Typ studie
Zápis (Odhadovaný)
Fáze
- Nelze použít
Kontakty a umístění
Studijní kontakt
- Jméno: Xiaojin Gao, Dr.
- Telefonní číslo: +86 010 88322415
- E-mail: sophie_gao@sina.com
Kritéria účasti
Kritéria způsobilosti
Věk způsobilý ke studiu
- Dospělý
- Starší dospělý
Přijímá zdravé dobrovolníky
Popis
Kritéria pro zařazení:
- Kardiologové s atestací nebo ve výcviku ve Fuwai Hospital
- Zahrnující tři úrovně zkušeností: mladší rezidenty, starší rezidenty, atestované lékaře
Kritéria pro vyloučení:
- Klinici zapojení do vývoje nebo optimalizace rámce SCOUT
- Klinici zapojení do procesu zlatého standardu rozhodování
Studijní plán
Jak je studie koncipována?
Detaily designu
- Primární účel: Diagnostický
- Přidělení: Randomizované
- Intervenční model: Crossover Assignment
- Maskování: Žádné (otevřený štítek)
Zbraně a zásahy
Skupina účastníků / Arm |
Intervence / Léčba |
|---|---|
|
Aktivní komparátor: Kontrola (standardní manuální přezkum)
Lékaři ručně přezkoumávají všechny případy v kontrolní skupině (n=54) s přístupem k predikcím a zdůvodněním AI.
Žádné selektivní odložení.
|
Lékaři provedou úplnou manuální kontrolu 54 případů pomocí nezpracovaných lékařských záznamů s přístupem k predikcím a odůvodněním modelu AI, ale bez SCOUT stratifikace nejistoty nebo selektivního odložení.
|
|
Experimentální: Experimentální (SCOUT-Assisted Review)
Lékaři zpracovávají soubor intervencí (n=56) prostřednictvím rámce SCOUT.
Případy s nízkou nejistotou jsou automaticky přijímány; případy s vysokou nejistotou podléhají přezkoumání lékařem s úplnou záznamovou stopou.
|
SCOUT-Assisted Review (Intervention Arm): Lékaři přezkoumají 56 případů zpracovaných prostřednictvím SCOUT frameworku.
U případů klasifikovaných jako nízká nejistota (D(x)=0) je AI predikce automaticky přijata bez přezkoumání lékařem.
U případů s vysokou nejistotou (D(x)=1) lékař přezkoumá případ s přístupem k řetězci úvah hlavního modelu a výsledkům meta-verifikačního auditu.
Hlavním modelem je DeepSeek-V3.1 s řetězcem úvah (chain-of-thought prompting).
|
Co je měření studie?
Primární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
|---|---|---|
|
Průměrný čas lékaře na přezkoumání případu (minuty)
Časové okno: Po dobu trvání studie, v průměru 2 hodiny.
|
Průměrný čas strávený každým klinikem při přezkoumání a stanovení diagnostického rozhodnutí na případ v každé skupině.
Měřeno v minutách.
|
Po dobu trvání studie, v průměru 2 hodiny.
|
Sekundární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
|---|---|---|
|
Diagnostická přesnost (%)
Časové okno: Až do ukončení studie, v průměru 2 hodiny.
|
Podíl správných klasifikací podtypů CHD (STEMI, NSTEMI, nestabilní angina pectoris, chronické koronární syndromy) v každé větvi studie.
|
Až do ukončení studie, v průměru 2 hodiny.
|
|
Výpočet návratnosti investic (ROI)
Časové okno: Po dobu trvání studie, v průměru 2 hodiny.
|
Poměr úspory času lékaře (oceněné na základě standardizovaných minutových mezd z referenčních hodnot zdravotnické reformy Sanming) k výpočetním nákladům SCOUT inference, rozčleněný podle úrovně odbornosti klinického lékaře.
|
Po dobu trvání studie, v průměru 2 hodiny.
|
Spolupracovníci a vyšetřovatelé
Termíny studijních záznamů
Hlavní termíny studia
Začátek studia (Odhadovaný)
Primární dokončení (Odhadovaný)
Dokončení studie (Odhadovaný)
Termíny zápisu do studia
První předloženo
První předloženo, které splnilo kritéria kontroly kvality
První zveřejněno (Aktuální)
Aktualizace studijních záznamů
Poslední zveřejněná aktualizace (Aktuální)
Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality
Naposledy ověřeno
Více informací
Termíny související s touto studií
Klíčová slova
Další relevantní podmínky MeSH
Další identifikační čísla studie
- 2025-2702-1
Plán pro data jednotlivých účastníků (IPD)
Plánujete sdílet data jednotlivých účastníků (IPD)?
Popis plánu IPD
Časový rámec sdílení IPD
Kritéria přístupu pro sdílení IPD
Typ podpůrných informací pro sdílení IPD
- PROTOKOL STUDY
- MÍZA
- ICF
- ANALYTIC_CODE
- CSR
Informace o lécích a zařízeních, studijní dokumenty
Studuje lékový produkt regulovaný americkým FDA
Studuje produkt zařízení regulovaný americkým úřadem FDA
Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .