Tato stránka byla automaticky přeložena a přesnost překladu není zaručena. Podívejte se prosím na anglická verze pro zdrojový text.

Vývoj nástroje pro zpracování přirozeného jazyka, který umožní klinický výzkum v urgentní medicíně (NLP-DeVal)

18. května 2026 aktualizováno: Mario Negri Institute for Pharmacological Research

Vývoj a ověření nástroje pro zpracování přirozeného jazyka, který umožní klinický výzkum v urgentní a akutní medicíně: retrospektivní kohortová studie

Cílem této retrospektivní kohortové studie je vyvinout a ověřit jazykový model, který dokáže interpretovat obsah elektronických lékařských záznamů urgentního příjmu a extrahovat relevantní informace pro výzkumné účely u všech dospělých pacientů, kteří dorazili na zúčastněná oddělení urgentního příjmu během tříletého období. .

Hlavní otázka, kterou se snaží zodpovědět, zní: je jazykový model schopen interpretovat obsah elektronických zdravotních záznamů oddělení urgentního příjmu a extrahovat z nich požadované informace tak, aby je bylo možné použít k přesným analýzám a předpovědím?

Studie je retrospektivní a data budou automaticky extrahována z lékařských zdravotních záznamů.

Přehled studie

Postavení

Nábor

Podmínky

Urgentní medicína

Intervence / Léčba

Jiný: žádný zásah

Detailní popis

VÝCHODISKA A ODŮVODNĚNÍ STUDIE

Provádění klinického výzkumu a výzkumu hodnocení kvality péče v urgentní medicíně je stejně obtížné jako důležité. Je to obtížné, protože obrovský počet pacientů, které je třeba léčit, a chronický nedostatek personálu znemožňují sběr dat ad hoc. Je to důležité, protože výzkum v konečném důsledku umožňuje lékařům a sestrám na pohotovosti založit svou praxi na důkazech získaných v jejich vlastním, jedinečném prostředí, na rozdíl od důkazů získaných v daleko vzdálených souvislostech, jak je tomu dnes běžně.

Jediným způsobem, jak překlenout propast mezi výzkumnými potřebami a dostupností robustních dat, je extrahovat data přímo z elektronických zdravotních záznamů (EHR) pohotovostních oddělení, čímž se vyhnete specializovanému a časově náročnému sběru dat. To je však obtížný úkol, protože nejužitečnější informace jsou ve formátu volného textu (např. přítomnost příznaků a symptomů, suspektní a potvrzená diagnóza, anamnéza). Takové okolnosti a potřeby vyžadují spolehlivý nástroj pro zpracování přirozeného jazyka (NLP), aby bylo možné odvodit vysoce konzistentní data z volného textu.

Dnes jsou k dispozici rozsáhlé jazykové modely, které dokážou přesně interpretovat přirozený jazyk. Tyto modely jsou trénovány na obrovském množství obecných znalostí převzatých převážně z internetu, nicméně jejich výkon ve specializovanějších oblastech, jako je například lékařská oblast, nemusí být optimální.

Tato studie je součástí většího projektu nazvaného eCREAM (umožňující klinický výzkum v urgentní a akutní medicíně) a jejím cílem je vyvinout a ověřit jazykový model (nazvaný eCREAM_LM) pro šest jazyků, který dokáže interpretovat obsah EHR oddělení pohotovosti a extrahovat relevantní informace pro výzkumné účely.

METODY

Studie je observační, multicentrická, retrospektivní, 24měsíční studie. Studie se zúčastní 30 center: 13 z Itálie, 4 z Polska, 3 z Řecka, Slovenska, Slovinska a Spojeného království a 1 ze Švýcarska. Centra nedostanou žádnou kompenzaci, ale jejich výdaje budou hrazeny z prostředků projektu.

Vývoj a validace modelu eCREAM_LM.

eCREAM_LM bude vyvíjen prostřednictvím školení a vyladění nejlepšího celkového modelu mezi těmi open source a bude probíhat v částečně paralelních fázích. Kandidátské modely budou vystaveny obrovskému množství (miliardám) lékařských textů z vědecké literatury nebo jiných veřejných zdrojů. Současně budou modely také vystaveny obrovskému množství (milionů) volných textových poznámek získaných z lékařských záznamů používaných v zúčastněných nemocnicích. Poté přejdeme k dolaďování, kde bude použito velké množství (tisíce) klinických záznamů, získaných opět z lékařské dokumentace zúčastněných center. Tyto poznámky budou opatřeny anotací zkušených lékařů, která spočívá v extrakci informací z poznámek k vyplnění datových položek uvedených ve formuláři pro virtuální sběr dat (vCRF). VCRF byl vytvořen pro související studii a obsahuje soubor proměnných užitečných při predikci hospitalizace pacientů s dušností nebo přechodnou ztrátou vědomí, což je cílem související studie. V této studii bude vCRF sloužit jako nástroj pro validaci jazykového modelu.

Validace eCREAM_LM bude provedena pomocí sady 1 000 klinických poznámek anotovaných, jak je popsáno výše, ale nepoužívaných ve fázi vývoje. Tyto poznámky budou odeslány do modelu eCREAM_LM s úkolem sestavit vCRF. Měřítkem konečné validace eCREAM_LM bude shoda při vyplňování vCRF mezi odbornými lékaři a eCREAM_LM.

Sběr a anonymizace dat

Každá zúčastněná nemocnice poskytne bezplatné textové poznámky obsažené ve zdravotních záznamech 150–300 000 dospělých pacientů léčených v letech 2021 až 2023. Poznámky týkající se různých aspektů téhož pacienta (např. anamnéza, objektivní vyšetření, výsledky testů) budou od sebe odděleny, takže nebude možné rekonstruovat úplný profil pacienta. Kromě toho budou poznámky zbaveny všech odkazů na pacienta (např. jméno, příjmení, datum narození) a kontextu (např. nemocnice, datum a čas příjezdu do centra). Tento proces minimalizuje pravděpodobnost opětovné identifikace pacientů a maximalizuje ochranu jejich práv. Pravděpodobnost opětovné identifikace pacienta v databázi závisí na tom, jak jedinečné jsou jeho charakteristiky od ostatních osob v databázi. Pravděpodobnost jedinečných, a tedy identifikovatelných pacientů se zvyšuje s množstvím informací dostupných v databázi a klesá s její velikostí. Odstraněním všech osobních a kontextových informací z klinických poznámek a oddělením každé poznámky od ostatních bude každá poznámka obsahovat pouze několik charakteristik pacienta. Data shromážděná z nemocnic ve stejné zemi budou navíc sloučena, takže pro každý jazyk bude existovat jedna velká databáze. To účinně vynuluje pravděpodobnost, že existují jednotlivci jednoznačně identifikovatelní z bankovek.

A konečně, aby se vyloučila možnost, že poznámky budou obsahovat informace o třetích stranách, jako jsou jména a telefonní čísla příbuzných pacientů, bude v každé nemocnici nainstalován certifikovaný anonymizační software, speciálně navržený k odstranění osobních údajů z volného textu.

Po anonymizaci budou data centralizována pro analýzu a budou také nahrána na hlavní evropské platformy pro sdílení jazykových zdrojů ve vědecké komunitě.

Statistická analýza

Při validaci eCREAM_LM posoudíme shodu mezi odbornými pohotovostními lékaři a samotným eCREAM_LM při vyplňování vCRF. Údaje se budou vztahovat na vzorek 1 000 poznámek pro každý studijní jazyk. Shoda bude hodnocena pro každou proměnnou vCRF pomocí Cohenova κ jako míry shody. eCREAM_LM bude považován za platný, pokud je Cohenovo κ větší než 0,75.

Velikost vzorku

Za předpokladu vynikající shody (κ=0,80) mezi eCREAM_LM a zkušenými pohotovostními lékaři při vyplňování vCRF bude k dosažení dostatečné přesnosti pro zaručení dobré shody nezbytný vzorek alespoň 735 poznámek (spodní mez spolehlivosti 95% interval spolehlivosti Cohenovo K větší než 0,75). Toto číslo je maximální velikost vzorku získaná v různých scénářích zahrnujících různý počet kategorií (2 až 5) pro každou proměnnou a různé okrajové rozdělení kategorií ve vzorku, včetně vyváženého rozdělení (např. 5 kategorií s 20 % vzorku v každé kategorii) a velmi nevyvážené výsledky (např. 5 kategorií s 1,8 %, 7,3 %, 16,4 %, 29,1 % a 45,5 % vzorku). Vzhledem k tomu, že v některých poznámkách mohou chybět zajímavé informace, provedeme vyhodnocení ověření dat na 1 000 poznámkách.

Typ studie

Pozorovací

Zápis (Odhadovaný)

300000

Kontakty a umístění

Tato část poskytuje kontaktní údaje pro ty, kteří studii provádějí, a informace o tom, kde se tato studie provádí.

Studijní kontakt

Jméno: Chiara Pandolfini
Telefonní číslo: 0039 02 39014 253
E-mail: chiara.pandolfini@marionegri.it

Studijní záloha kontaktů

Jméno: Giulia Ghilardi
Telefonní číslo: 0039 035 4535 313
E-mail: giulia.ghilardi@marionegri.it

Studijní místa

Itálie
- - Catania, Itálie
    - Zatím nenabíráme
    - AOU Policlinico 'G.Rodolico - San Marco'
    - Kontakt:
      
      Giuseppe Carpinteri
      
      Telefonní číslo: +39 095 378 1111
      
      E-mail: gicarpinteri@gmail.com
  - Milan, Itálie
    - Zatím nenabíráme
    - Ospedale Luigi Sacco
    - Kontakt:
      
      Anna Maria Brambilla
      
      Telefonní číslo: +39 02 39041
      
      E-mail: brambilla.annamaria@asst-fbf-sacco.it
  - Milan, Itálie
    - Zatím nenabíráme
    - ASST Grande Ospedale Metropolitano Niguarda
    - Kontakt:
      
      Nicolò Capsoni
      
      Telefonní číslo: +39 02 64441
      
      E-mail: nicolo.capsoni@gmail.com
  - Orbassano, Itálie
    - Zatím nenabíráme
    - Ospedale San Luigi Gonzaga
    - Kontakt:
      
      Valeria Caramello
      
      Telefonní číslo: v.caramello@sa +39 011 90261
  - Pozzuoli, Itálie
    - Zatím nenabíráme
    - Ospedale Santa Maria delle Grazie
    - Kontakt:
      
      Giovanni Porta
      
      Telefonní číslo: +39 081 855 2320
      
      E-mail: dottorgiovanniporta@gmail.com
  - Torino, Itálie
    - Nábor
    - Ospedale San Giovanni Bosco
    - Kontakt:
      
      Franco Aprà
      
      Telefonní číslo: +39 011 240 2210
      
      E-mail: franco.apra@aslcittaditorino.it
  - Vercelli, Itálie
    - Nábor
    - Ospedale Sant'Andrea
    - Kontakt:
      
      Sergio Tartaglia
      
      Telefonní číslo: +39 0161 593111
      
      E-mail: srtartaglia@gmail.com
- Milan
  - Milan, Milan, Itálie, 20156
    - Zatím nenabíráme
    - Istituto di Ricerche Farmacologiche Mario Negri IRCCS
    - Kontakt:
      
      Guido Bertolini, MD
      
      E-mail: guido.bertolini@marionegri.it

Kritéria účasti

Výzkumníci hledají lidi, kteří odpovídají určitému popisu, kterému se říká kritéria způsobilosti. Některé příklady těchto kritérií jsou celkový zdravotní stav osoby nebo předchozí léčba.

Kritéria způsobilosti

Věk způsobilý ke studiu

Dospělý
Starší dospělý

Přijímá zdravé dobrovolníky

Ano

Metoda odběru vzorků

Ukázka pravděpodobnosti

Studijní populace

Všichni dospělí pacienti, kteří dorazili na zúčastněná pohotovostní oddělení mezi 1. lednem 2021 a 31. prosincem 2023

Popis

Kritéria pro zařazení:

Dospělý
Dorazil na pohotovost mezi 1. lednem 2021 a 31. prosincem 2023

Kritéria vyloučení:

Žádný

Studijní plán

Tato část poskytuje podrobnosti o studijním plánu, včetně toho, jak je studie navržena a co studie měří.

Jak je studie koncipována?

Detaily designu

Počet skupin / kohort

Kohorty a intervence

Skupina / kohorta	Intervence / Léčba
Dospělí, kteří navštívili pohotovost	Jiný: žádný zásah žádný zásah

Co je měření studie?

Primární výstupní opatření

Měření výsledku	Popis opatření	Časové okno
Shoda ve vyplnění formuláře virtuální kazuistiky Časové okno: 1 měsíc	Míra shody při vyplňování formuláře virtuální kazuistiky mezi odbornými lékaři a jazykovým modelem eCREAM_LM	1 měsíc

Spolupracovníci a vyšetřovatelé

Zde najdete lidi a organizace zapojené do této studie.

Sponzor

Mario Negri Institute for Pharmacological Research

Spolupracovníci

Fondazione Bruno Kessler

Astir s.r.l.

Orobix Life S.r.l.

Vyšetřovatelé

Vrchní vyšetřovatel: Guido Bertolini, Istituto Di Ricerche Farmacologiche Mario Negri

Termíny studijních záznamů

Tato data sledují průběh záznamů studie a předkládání souhrnných výsledků na ClinicalTrials.gov. Záznamy ze studií a hlášené výsledky jsou před zveřejněním na veřejné webové stránce přezkoumány Národní lékařskou knihovnou (NLM), aby se ujistily, že splňují specifické standardy kontroly kvality.

Hlavní termíny studia

Začátek studia (Aktuální)

1. října 2024

Primární dokončení (Odhadovaný)

1. ledna 2027

Dokončení studie (Odhadovaný)

1. září 2027

Termíny zápisu do studia

První předloženo

26. ledna 2024

První předloženo, které splnilo kritéria kontroly kvality

26. ledna 2024

První zveřejněno (Aktuální)

5. února 2024

Aktualizace studijních záznamů

Poslední zveřejněná aktualizace (Aktuální)

20. května 2026

Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality

18. května 2026

Naposledy ověřeno

1. května 2025

Více informací

Termíny související s touto studií

Další relevantní podmínky MeSH

Další identifikační čísla studie

8780

Plán pro data jednotlivých účastníků (IPD)

Plánujete sdílet data jednotlivých účastníků (IPD)?

ANO

Popis plánu IPD

Anonymizovaná data jednotlivých účastníků budou nahrána na hlavní evropské platformy pro sdílení jazykových zdrojů ve vědecké komunitě, včetně úložiště European Language Grid (https://live.europeanlanguage-grid.eu), virtuální jazykové observatoře CLARIN (https: //vlo.clarin.eu/?2) a iniciativa European Language Equality (ELE) (https://european-language-equality.eu).

Časový rámec sdílení IPD

Počínaje prosincem 2025

Typ podpůrných informací pro sdílení IPD

PROTOKOL STUDY
CSR

Informace o lécích a zařízeních, studijní dokumenty

Studuje lékový produkt regulovaný americkým FDA

Studuje produkt zařízení regulovaný americkým úřadem FDA

produkt vyrobený a vyvážený z USA

Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .

Klinické studie na žádný zásah

Nicolas Brogly

Nábor

Prediction of Platelet Function Using Viscoelastic Test (ROTEM® Sigma) in Obstetric Anesthesia.

Trombocytopenie | Poporodní krvácení (PPH)

Španělsko
Nicolas Brogly

Nábor

Selhání epidurální analgezie během porodu (FEA25)

Neúspěšná epidurální analgezie | Zotavení po porodu

Španělsko
Tepecik Training and Research Hospital

Dokončeno

Vliv kvality spánku, úzkosti a digitálního chování na průběh porodu u prvorodiček v termínu: Prospektivní observační studie (SAD-LABOR)

Těhotenství | Průběh porodu

Turecko (Türkiye)
Heinrich-Heine University, Duesseldorf
Roche Pharma AG; Maria Hilf Clinics GmbH, Mönchengladbach; German Multiple Sclerosis...

Nábor

Kognitivní výkon, poruchy spánku a únava u roztroušené sklerózy

Roztroušená skleróza | Únavový syndrom, chronický | Poruchy spánku | Primární progresivní roztroušená skleróza | Sekundární progrese roztroušené sklerózy | Remitující-recidivující roztroušená skleróza

Německo
CSA Medical, Inc.

Ukončeno

Studie kryosprejové ablace dysplazie nízkého nebo vysokého stupně v Barrettově jícnu (ICE)

Barrettův jícen | Dysplazie nízkého stupně | Dysplazie vysokého stupně

Spojené státy
University of Pittsburgh
National Institute of Mental Health (NIMH)

Nábor

Riziko a odolnost vůči sebevraždě po pozdním manželském úmrtí (RISE)

Sebevražda | Úmrtí

Spojené státy
Otsuka Pharmaceutical Factory, Inc.
Celerion

Dokončeno

Studie k vyhodnocení bezpečnosti, snášenlivosti, farmakokinetiky a potravinového účinku NO-13065 u zdravých a obézních dospělých subjektů

Obezita

Spojené státy
Universitat Jaume I

Dokončeno

Internetová léčba fobie z létání

Fóbie z létání

Španělsko
Oregon Research Institute

Dokončeno

Přechodná léčba dospívajících v rodinné terapii (Transitions)

Zneužívání návykových látek

Spojené státy
Sarah Blaylock
VA Office of Research and Development

Dokončeno

Zvýšení dostupnosti preventivního zásahu proti pádům pro starší dospělé se slabým zrakem v komunitě

Podzim | Nízké vidění

Spojené státy

Vývoj nástroje pro zpracování přirozeného jazyka, který umožní klinický výzkum v urgentní medicíně (NLP-DeVal)

Vývoj a ověření nástroje pro zpracování přirozeného jazyka, který umožní klinický výzkum v urgentní a akutní medicíně: retrospektivní kohortová studie

Přehled studie

Postavení

Podmínky

Intervence / Léčba

Detailní popis

Typ studie

Zápis (Odhadovaný)

Kontakty a umístění

Studijní kontakt

Studijní záloha kontaktů

Studijní místa

Kritéria účasti

Kritéria způsobilosti

Věk způsobilý ke studiu

Přijímá zdravé dobrovolníky

Metoda odběru vzorků

Studijní populace

Popis

Studijní plán

Jak je studie koncipována?

Detaily designu

Počet skupin / kohort

Kohorty a intervence

Skupina / kohorta

Intervence / Léčba

Co je měření studie?

Primární výstupní opatření

Měření výsledku

Popis opatření

Časové okno

Spolupracovníci a vyšetřovatelé

Sponzor

Spolupracovníci

Vyšetřovatelé

Termíny studijních záznamů

Hlavní termíny studia

Začátek studia (Aktuální)

Primární dokončení (Odhadovaný)

Dokončení studie (Odhadovaný)

Termíny zápisu do studia

První předloženo

První předloženo, které splnilo kritéria kontroly kvality

První zveřejněno (Aktuální)

Aktualizace studijních záznamů

Poslední zveřejněná aktualizace (Aktuální)

Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality

Naposledy ověřeno

Více informací

Termíny související s touto studií

Další relevantní podmínky MeSH

Další identifikační čísla studie

Plán pro data jednotlivých účastníků (IPD)

Plánujete sdílet data jednotlivých účastníků (IPD)?

Popis plánu IPD

Časový rámec sdílení IPD

Typ podpůrných informací pro sdílení IPD

Informace o lécích a zařízeních, studijní dokumenty

Studuje lékový produkt regulovaný americkým FDA

Studuje produkt zařízení regulovaný americkým úřadem FDA

produkt vyrobený a vyvážený z USA

Klinické studie na žádný zásah

Prohledejte podobné pokusy

Sponzoři a spolupracovníci

Zdravotní podmínky

Drogové intervence

CROs by country

CROs in Liberia

Podmínky

Vzácné nemoci

Drogové intervence

Doplňky stravy

Sponzor / Spolupracovníci

Místa