Questa pagina è stata tradotta automaticamente e l'accuratezza della traduzione non è garantita. Si prega di fare riferimento al Versione inglese per un testo di partenza.

Un Sistema OCR-LLM che Preserva la Privacy per la Sottoclassificazione della Sindrome Coronarica a partire dall'HPI di Ammissione: Validazione Multicentrica in Cina e negli Stati Uniti (OCR-LLM-CHD)

Sviluppo e Validazione Multicentrica di una Pipeline OCR-LLM a Protezione della Privacy per la Classificazione della Sindrome Coronarica in Quattro Sottotipi Utilizzando HPI al Ricovero in Sistemi EHR Eterogenei

Questo studio sviluppa e convalida una pipeline OCR-LLM che preserva la privacy, convertendo le storie cliniche al momento del ricovero (HPI) in sottotipi strutturati di sindrome coronarica (STEMI, NSTEMI, angina instabile e sindrome coronarica cronica).
Il sistema estrae prima il testo da immagini HPI de-identificate utilizzando OCR distribuito localmente, quindi applica modelli linguistici di grandi dimensioni con un prompt diagnostico fisso per generare la classificazione dei sottotipi e le relative evidenze.
Le prestazioni vengono valutate in una coorte di validazione interna e in diversi dataset esterni che coprono modelli eterogenei di EHR, casi di pronto soccorso e un dataset in inglese proveniente da MIMIC-IV.
Uno studio di usabilità clinica valuta le variazioni nell'accuratezza diagnostica e nel tempo con e senza l'assistenza dello strumento.

Panoramica dello studio

Tipo di studio

Osservativo

Iscrizione (Stimato)

10

Contatti e Sedi

Questa sezione fornisce i recapiti di coloro che conducono lo studio e informazioni su dove viene condotto lo studio.

Contatto studio

Criteri di partecipazione

I ricercatori cercano persone che corrispondano a una certa descrizione, chiamata criteri di ammissibilità. Alcuni esempi di questi criteri sono le condizioni generali di salute di una persona o trattamenti precedenti.

Criteri di ammissibilità

Età idonea allo studio

  • Adulto
  • Adulto più anziano

Accetta volontari sani

N/A

Metodo di campionamento

Campione di probabilità

Popolazione di studio

La popolazione dello studio comprende (1) record di incontri clinici de-identificati e (2) partecipanti medici per i test di usabilità. Per le coorti basate su record, gli incontri idonei contengono una Storia della Malattia Presente (HPI) di ammissione/presentazione (testo o testo derivato da immagini) sufficiente per la sottoclassificazione in 4 classi della sindrome coronarica (ad esempio, STEMI, NSTEMI, angina instabile, sindrome coronarica cronica). I record vengono analizzati a livello di incontro e sono organizzati in cinque coorti basate su dataset (validazione interna, validazione esterna multicentrica, validazione esterna in Pronto Soccorso, validazione esterna con EHR in inglese e usabilità clinica). Le etichette di riferimento vengono assegnate utilizzando un processo di adjudicazione clinica prestabilito.

Descrizione

Criteri di inclusione: Incontri ospedalieri con anamnesi di ammissione che documenta sintomi rilevanti per la sottotipizzazione della sindrome coronarica.

2a4afaef-9dc1-47fc-874f-9dffaf7…

Casi con documentazione sufficiente per assegnare uno dei quattro sottotipi target (STEMI, NSTEMI, UA, CCS) tramite adjudication.

-

Criteri di esclusione: Sottotipo non chiaro o informazioni temporali incomplete/incerte che impediscono l'assegnazione dello standard di riferimento.

Motivo primario di ammissione non correlato a coronaropatia dopo lo screening (per la coorte MIMIC-IV).

-

Piano di studio

Questa sezione fornisce i dettagli del piano di studio, compreso il modo in cui lo studio è progettato e ciò che lo studio sta misurando.

Come è strutturato lo studio?

Dettagli di progettazione

Coorti e interventi

Gruppo / Coorte
Intervento / Trattamento
Cohort di Sviluppo e Validazione Interna
Cohort retrospettiva utilizzata per lo sviluppo del modello e la validazione interna. Gli input sono record HPI di ammissione de-identificati (immagine o testo) del set di dati AIM-CHD. L'adjudication di esperti fornisce le etichette standard di riferimento per la sottoclassificazione della sindrome coronarica in 4 classi (STEMI, NSTEMI, angina instabile, sindrome coronarica cronica).
Un flusso di lavoro automatizzato per la gestione dei dati clinici che integra il riconoscimento ottico dei caratteri (OCR), l'ottimizzazione dell'ingegneria dei prompt e i modelli linguistici di grandi dimensioni (LLM). Il sistema elabora le cartelle cliniche non strutturate dei pazienti ricoverati/dei dipartimenti di emergenza (principalmente la storia del presente disturbo all'ammissione e i relativi testi narrativi) per estrarre indicatori clinici chiave predefiniti (ad esempio, la frazione di eiezione ventricolare sinistra, il sottotipo di sindrome coronarica, i farmaci) e classificare i casi in categorie predefinite di malattia coronarica (ad esempio, angina instabile, STEMI, NSTEMI, sindrome coronarica cronica). Il flusso di lavoro produce campi strutturati e un risultato di classificazione con estratti di evidenza a supporto.
Processo manuale standard in cui clinici esperti esaminano le cartelle cliniche dei pazienti ed estraggono gli stessi indicatori clinici predeterminati e le categorie di malattia coronarica utilizzando il giudizio clinico di routine e la revisione della documentazione. Questa astrazione manuale funge da riferimento umano per confrontare l'accuratezza diagnostica, la completezza e l'efficienza operativa con il flusso di lavoro automatizzato OCR-Prompt-LLM.
Cohorte di Validazione Esterna Multicentrica
Cohort retrospettiva multicentrica utilizzata per la validazione esterna attraverso modelli eterogenei di EHR e stili di documentazione. I registri HPI di ammissione de-identificati vengono elaborati tramite la stessa pipeline OCR-LLM, e le previsioni sono confrontate con etichette di riferimento verificate da esperti per valutare la generalizzabilità.
Un flusso di lavoro automatizzato per la gestione dei dati clinici che integra il riconoscimento ottico dei caratteri (OCR), l'ottimizzazione dell'ingegneria dei prompt e i modelli linguistici di grandi dimensioni (LLM). Il sistema elabora le cartelle cliniche non strutturate dei pazienti ricoverati/dei dipartimenti di emergenza (principalmente la storia del presente disturbo all'ammissione e i relativi testi narrativi) per estrarre indicatori clinici chiave predefiniti (ad esempio, la frazione di eiezione ventricolare sinistra, il sottotipo di sindrome coronarica, i farmaci) e classificare i casi in categorie predefinite di malattia coronarica (ad esempio, angina instabile, STEMI, NSTEMI, sindrome coronarica cronica). Il flusso di lavoro produce campi strutturati e un risultato di classificazione con estratti di evidenza a supporto.
Processo manuale standard in cui clinici esperti esaminano le cartelle cliniche dei pazienti ed estraggono gli stessi indicatori clinici predeterminati e le categorie di malattia coronarica utilizzando il giudizio clinico di routine e la revisione della documentazione. Questa astrazione manuale funge da riferimento umano per confrontare l'accuratezza diagnostica, la completezza e l'efficienza operativa con il flusso di lavoro automatizzato OCR-Prompt-LLM.
Cohort di Convalida Esterna del Dipartimento di Emergenza
Cohorte retrospettiva che rappresenta il flusso di lavoro reale del pronto soccorso. I record HPI di ammissione al PS de-identificati vengono utilizzati per valutare le prestazioni del modello in condizioni di tempo limitato e informazioni limitate e per valutare la robustezza alla variabilità della documentazione del PS.
Un flusso di lavoro automatizzato per la gestione dei dati clinici che integra il riconoscimento ottico dei caratteri (OCR), l'ottimizzazione dell'ingegneria dei prompt e i modelli linguistici di grandi dimensioni (LLM). Il sistema elabora le cartelle cliniche non strutturate dei pazienti ricoverati/dei dipartimenti di emergenza (principalmente la storia del presente disturbo all'ammissione e i relativi testi narrativi) per estrarre indicatori clinici chiave predefiniti (ad esempio, la frazione di eiezione ventricolare sinistra, il sottotipo di sindrome coronarica, i farmaci) e classificare i casi in categorie predefinite di malattia coronarica (ad esempio, angina instabile, STEMI, NSTEMI, sindrome coronarica cronica). Il flusso di lavoro produce campi strutturati e un risultato di classificazione con estratti di evidenza a supporto.
Processo manuale standard in cui clinici esperti esaminano le cartelle cliniche dei pazienti ed estraggono gli stessi indicatori clinici predeterminati e le categorie di malattia coronarica utilizzando il giudizio clinico di routine e la revisione della documentazione. Questa astrazione manuale funge da riferimento umano per confrontare l'accuratezza diagnostica, la completezza e l'efficienza operativa con il flusso di lavoro automatizzato OCR-Prompt-LLM.
Cohort di Validazione Esterna dei Dossier Elettronici Sanitari
Cohort retrospettivo derivato dal database pubblico de-identificato MIMIC-IV. Le note di ammissione/HPI in inglese sono utilizzate per valutare la trasportabilità cross-linguistica e le prestazioni degli stessi prompt di classificazione e regole di post-elaborazione rispetto alle etichette di riferimento derivate da adjudication/mappatura diagnostica strutturata (come specificato nel protocollo).
Un flusso di lavoro automatizzato per la gestione dei dati clinici che integra il riconoscimento ottico dei caratteri (OCR), l'ottimizzazione dell'ingegneria dei prompt e i modelli linguistici di grandi dimensioni (LLM). Il sistema elabora le cartelle cliniche non strutturate dei pazienti ricoverati/dei dipartimenti di emergenza (principalmente la storia del presente disturbo all'ammissione e i relativi testi narrativi) per estrarre indicatori clinici chiave predefiniti (ad esempio, la frazione di eiezione ventricolare sinistra, il sottotipo di sindrome coronarica, i farmaci) e classificare i casi in categorie predefinite di malattia coronarica (ad esempio, angina instabile, STEMI, NSTEMI, sindrome coronarica cronica). Il flusso di lavoro produce campi strutturati e un risultato di classificazione con estratti di evidenza a supporto.
Processo manuale standard in cui clinici esperti esaminano le cartelle cliniche dei pazienti ed estraggono gli stessi indicatori clinici predeterminati e le categorie di malattia coronarica utilizzando il giudizio clinico di routine e la revisione della documentazione. Questa astrazione manuale funge da riferimento umano per confrontare l'accuratezza diagnostica, la completezza e l'efficienza operativa con il flusso di lavoro automatizzato OCR-Prompt-LLM.
Cohorte di Usabilità Clinica
Cohort prospettico di valutazione di usabilità. I medici completano un'attività strutturata di sottotipizzazione della sindrome coronarica utilizzando casi HPI al momento del ricovero. Gli esiti includono l'accuratezza diagnostica e il tempo di completamento; i confronti intra-participante possono essere eseguiti tra le condizioni non assistite e assistite dallo strumento come prestabilito.
Un flusso di lavoro automatizzato per la gestione dei dati clinici che integra il riconoscimento ottico dei caratteri (OCR), l'ottimizzazione dell'ingegneria dei prompt e i modelli linguistici di grandi dimensioni (LLM). Il sistema elabora le cartelle cliniche non strutturate dei pazienti ricoverati/dei dipartimenti di emergenza (principalmente la storia del presente disturbo all'ammissione e i relativi testi narrativi) per estrarre indicatori clinici chiave predefiniti (ad esempio, la frazione di eiezione ventricolare sinistra, il sottotipo di sindrome coronarica, i farmaci) e classificare i casi in categorie predefinite di malattia coronarica (ad esempio, angina instabile, STEMI, NSTEMI, sindrome coronarica cronica). Il flusso di lavoro produce campi strutturati e un risultato di classificazione con estratti di evidenza a supporto.
Processo manuale standard in cui clinici esperti esaminano le cartelle cliniche dei pazienti ed estraggono gli stessi indicatori clinici predeterminati e le categorie di malattia coronarica utilizzando il giudizio clinico di routine e la revisione della documentazione. Questa astrazione manuale funge da riferimento umano per confrontare l'accuratezza diagnostica, la completezza e l'efficienza operativa con il flusso di lavoro automatizzato OCR-Prompt-LLM.

Cosa sta misurando lo studio?

Misure di risultato primarie

Misura del risultato
Misura Descrizione
Lasso di tempo
Accuratezza complessiva della classificazione
Lasso di tempo: 1 mese

Periodo di tempo: Fino al completamento della valutazione del set di dati (coorti interne + esterne)

Descrizione: Proporzione di casi con sottotipo corretto (STEMI/NSTEMI/UA/CCS) confrontata con lo standard di riferimento certificato da esperti.

1 mese

Collaboratori e investigatori

Qui è dove troverai le persone e le organizzazioni coinvolte in questo studio.

Studiare le date dei record

Queste date tengono traccia dell'avanzamento della registrazione dello studio e dell'invio dei risultati di sintesi a ClinicalTrials.gov. I record degli studi e i risultati riportati vengono esaminati dalla National Library of Medicine (NLM) per assicurarsi che soddisfino specifici standard di controllo della qualità prima di essere pubblicati sul sito Web pubblico.

Studia le date principali

Inizio studio (Stimato)

28 febbraio 2026

Completamento primario (Stimato)

8 marzo 2026

Completamento dello studio (Stimato)

8 marzo 2026

Date di iscrizione allo studio

Primo inviato

27 febbraio 2026

Primo inviato che soddisfa i criteri di controllo qualità

27 febbraio 2026

Primo Inserito (Effettivo)

4 marzo 2026

Aggiornamenti dei record di studio

Ultimo aggiornamento pubblicato (Effettivo)

4 marzo 2026

Ultimo aggiornamento inviato che soddisfa i criteri QC

27 febbraio 2026

Ultimo verificato

1 febbraio 2026

Maggiori informazioni

Termini relativi a questo studio

Piano per i dati dei singoli partecipanti (IPD)

Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?

NO

Descrizione del piano IPD

Per proteggere la privacy dei pazienti e rispettare le politiche di gestione dei dati delle istituzioni partecipanti (Ospedale Fuwai e sottocentri), i dati individuali dei partecipanti non saranno resi pubblicamente disponibili. Tuttavia, i risultati aggregati dello studio e le analisi statistiche saranno inclusi nella pubblicazione finale.

Informazioni su farmaci e dispositivi, documenti di studio

Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti

No

Studia un dispositivo regolamentato dalla FDA degli Stati Uniti

No

Queste informazioni sono state recuperate direttamente dal sito web clinicaltrials.gov senza alcuna modifica. In caso di richieste di modifica, rimozione o aggiornamento dei dettagli dello studio, contattare register@clinicaltrials.gov. Non appena verrà implementata una modifica su clinicaltrials.gov, questa verrà aggiornata automaticamente anche sul nostro sito web .

Prove cliniche su Sindromi coronariche acute

Prove cliniche su Flusso di Lavoro di Estrazione e Classificazione delle Informazioni OCR-Prompt-LLM (OCR-Prompt-LLM)

Sottoscrivi