Questa pagina è stata tradotta automaticamente e l'accuratezza della traduzione non è garantita. Si prega di fare riferimento al Versione inglese per un testo di partenza.

Monitoraggio Clinico Scalabile di Modelli Linguistici di Grandi Dimensioni Tramite Triangolazione dell'Incertezza (SCOUT)

14 febbraio 2026 aggiornato da: China National Center for Cardiovascular Diseases

Valutazione Prospettica di un Framework Meta-Verifica Indipendente dal Modello (SCOUT) per la Supervisione Clinica Scalabile degli Output dei Modelli Linguistici di Grande Dimensione nella Diagnosi della Cardiopatia Coronarica: Uno Studio Crossover, Randomizzato, Multi-Lettore

Questo studio prospettico, multi-lettore, randomizzato a crossover valuta SCOUT (Scalable Clinical Oversight via Uncertainty Triangulation), un framework meta-verifica agnostico al modello che differisce selettivamente le previsioni inaffidabili dei grandi modelli linguistici (LLM) ai clinici triangolando tre segnali di incertezza ortogonali: eterogeneità del modello, incoerenza stocastica e critica del ragionamento. Lo studio valuta se la revisione assistita da SCOUT possa ridurre il tempo di revisione del medico rispetto alla revisione manuale standard delle diagnosi generate dall'IA mantenendo un'accuratezza diagnostica non inferiore nella sottotipizzazione della cardiopatia coronarica (CHD).

Panoramica dello studio

Stato

Non ancora reclutamento

Condizioni

Malattia coronarica (CHD)

Intervento / Trattamento

Descrizione dettagliata

Contesto: I modelli linguistici di grandi dimensioni vengono sempre più impiegati nei flussi di lavoro clinici, ma richiedere la revisione clinica di ogni output dell'IA annulla i guadagni di efficienza che ne motivano l'adozione. SCOUT affronta questo paradosso efficienza-sicurezza attraverso la meta-verifica algoritmica.

Il framework SCOUT triangola tre segnali esterni ortogonali per determinare l'incertezza a livello di caso: (1) Eterogeneità del modello - se un LLM ausiliario strutturalmente diverso concorda con il modello principale; (2) Incoerenza stocastica - se il campionamento ripetuto dallo stesso modello produce output divergenti; (3) Critica del ragionamento - se un modello di controllo esterno identifica errori logici nella catena di ragionamento.

In questo studio crossover, 7 clinici di diversa anzianità (2 residenti junior, 3 residenti senior, 2 medici curanti) esaminano ciascuno tutti i 110 casi sia con flussi di lavoro di revisione manuale standard che con revisione assistita da SCOUT. Lo studio valuta l'efficienza del flusso di lavoro (endpoint primario) e l'accuratezza diagnostica (endpoint secondario).

Tipo di studio

Interventistico

Iscrizione (Stimato)

Fase

Non applicabile

Contatti e Sedi

Questa sezione fornisce i recapiti di coloro che conducono lo studio e informazioni su dove viene condotto lo studio.

Contatto studio

Nome: Xiaojin Gao, Dr.
Numero di telefono: +86 010 88322415
Email: sophie_gao@sina.com

Criteri di partecipazione

I ricercatori cercano persone che corrispondano a una certa descrizione, chiamata criteri di ammissibilità. Alcuni esempi di questi criteri sono le condizioni generali di salute di una persona o trattamenti precedenti.

Criteri di ammissibilità

Età idonea allo studio

Adulto
Adulto più anziano

Accetta volontari sani

Descrizione

Criteri di inclusione:

Cardiologi certificati o in formazione presso l'ospedale Fuwai
Che coprono tre livelli di esperienza: residenti junior, residenti senior, medici curanti

Criteri di esclusione:

Clinici coinvolti nello sviluppo o ottimizzazione del framework SCOUT
Clinici coinvolti nel processo di valutazione gold-standard

Piano di studio

Questa sezione fornisce i dettagli del piano di studio, compreso il modo in cui lo studio è progettato e ciò che lo studio sta misurando.

Come è strutturato lo studio?

Dettagli di progettazione

Scopo principale: Diagnostico
Assegnazione: Randomizzato
Modello interventistico: Assegnazione incrociata
Mascheramento: Nessuno (etichetta aperta)

Numero di armi

Armi e interventi

Gruppo di partecipanti / Arm	Intervento / Trattamento
Comparatore attivo: Controllo (Revisione Manuale Standard) I medici esaminano manualmente tutti i casi nel gruppo di controllo (n=54) con accesso alle previsioni e al ragionamento dell'IA. Nessuna deferimento selettivo.	Test diagnostico: Flusso di lavoro di revisione manuale standard I medici eseguono una revisione manuale completa di 54 casi utilizzando cartelle cliniche grezze con accesso alle previsioni e al ragionamento del modello di intelligenza artificiale, ma senza stratificazione dell'incertezza SCOUT o rinvio selettivo.
Sperimentale: Sperimentale (Revisione Assistita da SCOUT) I medici elaborano il set di interventi (n=56) attraverso il framework SCOUT. I casi a bassa incertezza vengono accettati automaticamente; i casi ad alta incertezza sono sottoposti a revisione medica con tracciabilità completa.	Test diagnostico: Flusso di lavoro di revisione assistito SCOUT SCOUT-Assisted Review (Brachio di Intervento): I medici esaminano 56 casi elaborati attraverso il framework SCOUT. Per i casi classificati a bassa incertezza (D(x)=0), la previsione dell'IA viene auto-accettata senza revisione medica. Per i casi ad alta incertezza (D(x)=1), il medico rivede il caso con accesso al ragionamento a catena del pensiero del modello principale e ai risultati dell'audit di meta-verifica. Il modello principale è DeepSeek-V3.1 con prompt a catena del pensiero.

Gruppo di partecipanti / Arm

Intervento / Trattamento

Comparatore attivo: Controllo (Revisione Manuale Standard)

I medici esaminano manualmente tutti i casi nel gruppo di controllo (n=54) con accesso alle previsioni e al ragionamento dell'IA. Nessuna deferimento selettivo.

Test diagnostico: Flusso di lavoro di revisione manuale standard

I medici eseguono una revisione manuale completa di 54 casi utilizzando cartelle cliniche grezze con accesso alle previsioni e al ragionamento del modello di intelligenza artificiale, ma senza stratificazione dell'incertezza SCOUT o rinvio selettivo.

Sperimentale: Sperimentale (Revisione Assistita da SCOUT)

I medici elaborano il set di interventi (n=56) attraverso il framework SCOUT. I casi a bassa incertezza vengono accettati automaticamente; i casi ad alta incertezza sono sottoposti a revisione medica con tracciabilità completa.

Test diagnostico: Flusso di lavoro di revisione assistito SCOUT

SCOUT-Assisted Review (Brachio di Intervento): I medici esaminano 56 casi elaborati attraverso il framework SCOUT. Per i casi classificati a bassa incertezza (D(x)=0), la previsione dell'IA viene auto-accettata senza revisione medica. Per i casi ad alta incertezza (D(x)=1), il medico rivede il caso con accesso al ragionamento a catena del pensiero del modello principale e ai risultati dell'audit di meta-verifica. Il modello principale è DeepSeek-V3.1 con prompt a catena del pensiero.

Cosa sta misurando lo studio?

Misure di risultato primarie

Misura del risultato	Misura Descrizione	Lasso di tempo
Tempo medio di revisione del medico per caso (minuti) Lasso di tempo: Per tutta la durata dello studio, in media 2 ore.	Tempo medio impiegato da ciascun clinico per esaminare e formulare una decisione diagnostica per caso in ciascun braccio dello studio. Misurato in minuti.	Per tutta la durata dello studio, in media 2 ore.

Misure di risultato secondarie

Misura del risultato	Misura Descrizione	Lasso di tempo
Accuratezza diagnostica (%) Lasso di tempo: Fino al completamento dello studio, una media di 2 ore.	Proporzione di classificazioni corrette dei sottotipi di CHD (STEMI, NSTEMI, angina instabile, sindromi coronariche croniche) in ciascun braccio.	Fino al completamento dello studio, una media di 2 ore.
Ritorno sull'Investimento Computazionale (ROI) Lasso di tempo: Fino al completamento dello studio, in media 2 ore.	Rapporto tra il risparmio di tempo del medico (valutato in base a salari standardizzati al minuto derivanti dai benchmark della riforma sanitaria di Sanming) e il costo computazionale dell'inferenza SCOUT, stratificato per livello di anzianità del clinico.	Fino al completamento dello studio, in media 2 ore.

Collaboratori e investigatori

Qui è dove troverai le persone e le organizzazioni coinvolte in questo studio.

Sponsor

China National Center for Cardiovascular Diseases

Studiare le date dei record

Queste date tengono traccia dell'avanzamento della registrazione dello studio e dell'invio dei risultati di sintesi a ClinicalTrials.gov. I record degli studi e i risultati riportati vengono esaminati dalla National Library of Medicine (NLM) per assicurarsi che soddisfino specifici standard di controllo della qualità prima di essere pubblicati sul sito Web pubblico.

Studia le date principali

Inizio studio (Stimato)

19 febbraio 2026

Completamento primario (Stimato)

28 febbraio 2026

Completamento dello studio (Stimato)

28 febbraio 2026

Date di iscrizione allo studio

Primo inviato

9 febbraio 2026

Primo inviato che soddisfa i criteri di controllo qualità

14 febbraio 2026

Primo Inserito (Effettivo)

17 febbraio 2026

Aggiornamenti dei record di studio

Ultimo aggiornamento pubblicato (Effettivo)

17 febbraio 2026

Ultimo aggiornamento inviato che soddisfa i criteri QC

14 febbraio 2026

Ultimo verificato

1 febbraio 2026

Maggiori informazioni

Termini relativi a questo studio

Parole chiave

intelligenza artificiale

Termini MeSH pertinenti aggiuntivi

Altri numeri di identificazione dello studio

2025-2702-1

Piano per i dati dei singoli partecipanti (IPD)

Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?

SÌ

Descrizione del piano IPD

I dati individuali dei partecipanti, resi anonimi, alla base dei risultati riportati in questo studio saranno resi disponibili.

Periodo di condivisione IPD

A partire da 1 mese dopo la pubblicazione dei risultati primari e disponibile fino a 60 mesi.

Criteri di accesso alla condivisione IPD

I dati sono disponibili presso l'autore corrispondente su richiesta ragionevole. I richiedenti dovranno presentare una proposta di ricerca metodologicamente valida e firmare un accordo sull'uso dei dati.

Tipo di informazioni di supporto alla condivisione IPD

STUDIO_PROTOCOLLO
LINFA
ICF
CODICE_ANALITICO
RSI

Informazioni su farmaci e dispositivi, documenti di studio

Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti

Studia un dispositivo regolamentato dalla FDA degli Stati Uniti

Queste informazioni sono state recuperate direttamente dal sito web clinicaltrials.gov senza alcuna modifica. In caso di richieste di modifica, rimozione o aggiornamento dei dettagli dello studio, contattare register@clinicaltrials.gov. Non appena verrà implementata una modifica su clinicaltrials.gov, questa verrà aggiornata automaticamente anche sul nostro sito web .

Monitoraggio Clinico Scalabile di Modelli Linguistici di Grandi Dimensioni Tramite Triangolazione dell'Incertezza (SCOUT)

Valutazione Prospettica di un Framework Meta-Verifica Indipendente dal Modello (SCOUT) per la Supervisione Clinica Scalabile degli Output dei Modelli Linguistici di Grande Dimensione nella Diagnosi della Cardiopatia Coronarica: Uno Studio Crossover, Randomizzato, Multi-Lettore

Panoramica dello studio

Stato

Condizioni

Intervento / Trattamento

Descrizione dettagliata

Tipo di studio

Iscrizione (Stimato)

Fase

Contatti e Sedi

Contatto studio

Criteri di partecipazione

Criteri di ammissibilità

Età idonea allo studio

Accetta volontari sani

Descrizione

Piano di studio

Come è strutturato lo studio?

Dettagli di progettazione

Numero di armi

Armi e interventi

Gruppo di partecipanti / Arm

Intervento / Trattamento

Cosa sta misurando lo studio?

Misure di risultato primarie

Misura del risultato

Misura Descrizione

Lasso di tempo

Misure di risultato secondarie

Misura del risultato

Misura Descrizione

Lasso di tempo

Collaboratori e investigatori

Sponsor

Studiare le date dei record

Studia le date principali

Inizio studio (Stimato)

Completamento primario (Stimato)

Completamento dello studio (Stimato)

Date di iscrizione allo studio

Primo inviato

Primo inviato che soddisfa i criteri di controllo qualità

Primo Inserito (Effettivo)

Aggiornamenti dei record di studio

Ultimo aggiornamento pubblicato (Effettivo)

Ultimo aggiornamento inviato che soddisfa i criteri QC

Ultimo verificato

Maggiori informazioni

Termini relativi a questo studio

Parole chiave

Termini MeSH pertinenti aggiuntivi

Altri numeri di identificazione dello studio

Piano per i dati dei singoli partecipanti (IPD)

Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?

Descrizione del piano IPD

Periodo di condivisione IPD

Criteri di accesso alla condivisione IPD

Tipo di informazioni di supporto alla condivisione IPD

Informazioni su farmaci e dispositivi, documenti di studio

Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti

Studia un dispositivo regolamentato dalla FDA degli Stati Uniti

Cerca prove simili

Sponsor e collaboratori

Condizioni mediche

Interventi farmacologici

CROs by country

CROs in Mexico

Condizioni

Malattie rare

Interventi farmacologici

Supplementi dietetici

Sponsor / Collaboratori

Sedi