Questa pagina è stata tradotta automaticamente e l'accuratezza della traduzione non è garantita. Si prega di fare riferimento al Versione inglese per un testo di partenza.

Monitoraggio Clinico Scalabile di Modelli Linguistici di Grandi Dimensioni Tramite Triangolazione dell'Incertezza (SCOUT)

Valutazione Prospettica di un Framework Meta-Verifica Indipendente dal Modello (SCOUT) per la Supervisione Clinica Scalabile degli Output dei Modelli Linguistici di Grande Dimensione nella Diagnosi della Cardiopatia Coronarica: Uno Studio Crossover, Randomizzato, Multi-Lettore

Questo studio prospettico, multi-lettore, randomizzato a crossover valuta SCOUT (Scalable Clinical Oversight via Uncertainty Triangulation), un framework meta-verifica agnostico al modello che differisce selettivamente le previsioni inaffidabili dei grandi modelli linguistici (LLM) ai clinici triangolando tre segnali di incertezza ortogonali: eterogeneità del modello, incoerenza stocastica e critica del ragionamento. Lo studio valuta se la revisione assistita da SCOUT possa ridurre il tempo di revisione del medico rispetto alla revisione manuale standard delle diagnosi generate dall'IA mantenendo un'accuratezza diagnostica non inferiore nella sottotipizzazione della cardiopatia coronarica (CHD).

Panoramica dello studio

Descrizione dettagliata

Contesto: I modelli linguistici di grandi dimensioni vengono sempre più impiegati nei flussi di lavoro clinici, ma richiedere la revisione clinica di ogni output dell'IA annulla i guadagni di efficienza che ne motivano l'adozione. SCOUT affronta questo paradosso efficienza-sicurezza attraverso la meta-verifica algoritmica.

Il framework SCOUT triangola tre segnali esterni ortogonali per determinare l'incertezza a livello di caso: (1) Eterogeneità del modello - se un LLM ausiliario strutturalmente diverso concorda con il modello principale; (2) Incoerenza stocastica - se il campionamento ripetuto dallo stesso modello produce output divergenti; (3) Critica del ragionamento - se un modello di controllo esterno identifica errori logici nella catena di ragionamento.

In questo studio crossover, 7 clinici di diversa anzianità (2 residenti junior, 3 residenti senior, 2 medici curanti) esaminano ciascuno tutti i 110 casi sia con flussi di lavoro di revisione manuale standard che con revisione assistita da SCOUT. Lo studio valuta l'efficienza del flusso di lavoro (endpoint primario) e l'accuratezza diagnostica (endpoint secondario).

Tipo di studio

Interventistico

Iscrizione (Stimato)

7

Fase

  • Non applicabile

Contatti e Sedi

Questa sezione fornisce i recapiti di coloro che conducono lo studio e informazioni su dove viene condotto lo studio.

Contatto studio

Criteri di partecipazione

I ricercatori cercano persone che corrispondano a una certa descrizione, chiamata criteri di ammissibilità. Alcuni esempi di questi criteri sono le condizioni generali di salute di una persona o trattamenti precedenti.

Criteri di ammissibilità

Età idonea allo studio

  • Adulto
  • Adulto più anziano

Accetta volontari sani

No

Descrizione

Criteri di inclusione:

  • Cardiologi certificati o in formazione presso l'ospedale Fuwai
  • Che coprono tre livelli di esperienza: residenti junior, residenti senior, medici curanti

Criteri di esclusione:

  • Clinici coinvolti nello sviluppo o ottimizzazione del framework SCOUT
  • Clinici coinvolti nel processo di valutazione gold-standard

Piano di studio

Questa sezione fornisce i dettagli del piano di studio, compreso il modo in cui lo studio è progettato e ciò che lo studio sta misurando.

Come è strutturato lo studio?

Dettagli di progettazione

  • Scopo principale: Diagnostico
  • Assegnazione: Randomizzato
  • Modello interventistico: Assegnazione incrociata
  • Mascheramento: Nessuno (etichetta aperta)

Armi e interventi

Gruppo di partecipanti / Arm
Intervento / Trattamento
Comparatore attivo: Controllo (Revisione Manuale Standard)
I medici esaminano manualmente tutti i casi nel gruppo di controllo (n=54) con accesso alle previsioni e al ragionamento dell'IA. Nessuna deferimento selettivo.
I medici eseguono una revisione manuale completa di 54 casi utilizzando cartelle cliniche grezze con accesso alle previsioni e al ragionamento del modello di intelligenza artificiale, ma senza stratificazione dell'incertezza SCOUT o rinvio selettivo.
Sperimentale: Sperimentale (Revisione Assistita da SCOUT)
I medici elaborano il set di interventi (n=56) attraverso il framework SCOUT. I casi a bassa incertezza vengono accettati automaticamente; i casi ad alta incertezza sono sottoposti a revisione medica con tracciabilità completa.
SCOUT-Assisted Review (Brachio di Intervento): I medici esaminano 56 casi elaborati attraverso il framework SCOUT. Per i casi classificati a bassa incertezza (D(x)=0), la previsione dell'IA viene auto-accettata senza revisione medica. Per i casi ad alta incertezza (D(x)=1), il medico rivede il caso con accesso al ragionamento a catena del pensiero del modello principale e ai risultati dell'audit di meta-verifica. Il modello principale è DeepSeek-V3.1 con prompt a catena del pensiero.

Cosa sta misurando lo studio?

Misure di risultato primarie

Misura del risultato
Misura Descrizione
Lasso di tempo
Tempo medio di revisione del medico per caso (minuti)
Lasso di tempo: Per tutta la durata dello studio, in media 2 ore.
Tempo medio impiegato da ciascun clinico per esaminare e formulare una decisione diagnostica per caso in ciascun braccio dello studio.
Misurato in minuti.
Per tutta la durata dello studio, in media 2 ore.

Misure di risultato secondarie

Misura del risultato
Misura Descrizione
Lasso di tempo
Accuratezza diagnostica (%)
Lasso di tempo: Fino al completamento dello studio, una media di 2 ore.
Proporzione di classificazioni corrette dei sottotipi di CHD (STEMI, NSTEMI, angina instabile, sindromi coronariche croniche) in ciascun braccio.
Fino al completamento dello studio, una media di 2 ore.
Ritorno sull'Investimento Computazionale (ROI)
Lasso di tempo: Fino al completamento dello studio, in media 2 ore.
Rapporto tra il risparmio di tempo del medico (valutato in base a salari standardizzati al minuto derivanti dai benchmark della riforma sanitaria di Sanming) e il costo computazionale dell'inferenza SCOUT, stratificato per livello di anzianità del clinico.
Fino al completamento dello studio, in media 2 ore.

Collaboratori e investigatori

Qui è dove troverai le persone e le organizzazioni coinvolte in questo studio.

Studiare le date dei record

Queste date tengono traccia dell'avanzamento della registrazione dello studio e dell'invio dei risultati di sintesi a ClinicalTrials.gov. I record degli studi e i risultati riportati vengono esaminati dalla National Library of Medicine (NLM) per assicurarsi che soddisfino specifici standard di controllo della qualità prima di essere pubblicati sul sito Web pubblico.

Studia le date principali

Inizio studio (Stimato)

19 febbraio 2026

Completamento primario (Stimato)

28 febbraio 2026

Completamento dello studio (Stimato)

28 febbraio 2026

Date di iscrizione allo studio

Primo inviato

9 febbraio 2026

Primo inviato che soddisfa i criteri di controllo qualità

14 febbraio 2026

Primo Inserito (Effettivo)

17 febbraio 2026

Aggiornamenti dei record di studio

Ultimo aggiornamento pubblicato (Effettivo)

17 febbraio 2026

Ultimo aggiornamento inviato che soddisfa i criteri QC

14 febbraio 2026

Ultimo verificato

1 febbraio 2026

Maggiori informazioni

Termini relativi a questo studio

Parole chiave

Altri numeri di identificazione dello studio

  • 2025-2702-1

Piano per i dati dei singoli partecipanti (IPD)

Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?

Descrizione del piano IPD

I dati individuali dei partecipanti, resi anonimi, alla base dei risultati riportati in questo studio saranno resi disponibili.

Periodo di condivisione IPD

A partire da 1 mese dopo la pubblicazione dei risultati primari e disponibile fino a 60 mesi.

Criteri di accesso alla condivisione IPD

I dati sono disponibili presso l'autore corrispondente su richiesta ragionevole. I richiedenti dovranno presentare una proposta di ricerca metodologicamente valida e firmare un accordo sull'uso dei dati.

Tipo di informazioni di supporto alla condivisione IPD

  • STUDIO_PROTOCOLLO
  • LINFA
  • ICF
  • CODICE_ANALITICO
  • RSI

Informazioni su farmaci e dispositivi, documenti di studio

Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti

No

Studia un dispositivo regolamentato dalla FDA degli Stati Uniti

No

Queste informazioni sono state recuperate direttamente dal sito web clinicaltrials.gov senza alcuna modifica. In caso di richieste di modifica, rimozione o aggiornamento dei dettagli dello studio, contattare register@clinicaltrials.gov. Non appena verrà implementata una modifica su clinicaltrials.gov, questa verrà aggiornata automaticamente anche sul nostro sito web .

Sottoscrivi