- ICH GCP
- Registr klinických studií v USA
- Klinická studie NCT06183944
Studie získávání dat pomocí umělé inteligence a fenotypizace pacientů s akutní plicní embolií (PEPITE)
Studie získávání dat s umělou inteligencí a fenotypizací pacientů s akutní plicní embolií
Prvotním cílem je vytvořit a ověřit nástroje umělé inteligence (strojové učení a zpracování přirozeného jazyka) pro získávání a strukturování dat z lékařských zpráv v Centre Hospitalier Intercommunal de Toulon – la Seyne sur mer (CHITS). Tento projekt bude stavět na práci, kterou dříve provedlo Oddělení epidemiologie, biostatistiky a zdravotních údajů (DEBDS) v Centru Antoine Lacassagne (CAL) v Nice, se zaměřením na rakovinu prsu a štítné žlázy. Cílem je ověřit přenositelnost těchto nástrojů do jiného zařízení s různými patologiemi a praktiky, konkrétně na oddělení cévní medicíny na CHITS.
Následně bude cílem identifikovat klinicky relevantní fenotypy u pacientů s akutní plicní embolií. K získání skupin pacientů, kteří jsou při diagnóze homogenní, budou použity metody hierarchického shlukování kombinované s nekontrolovaným učením (strojové učení). Hodnocení jejich prognózy v 6. měsíci (recidiva nebo chronická tromboembolická plicní hypertenze), zohledňující první 3 měsíce antikoagulační léčby, by poskytlo pomůcku pro lékařské rozhodování.
Tento výzkum bude zahrnovat retrospektivní a prospektivní část. Retrospektivní část bude zahrnovat pacienty, kteří byli od roku 2019 přijati na CHITS pro akutní plicní embolii. Pro prospektivní část se plánuje zahrnutí pacientů se stejnými charakteristikami v letech 2024 a 2025. Očekává se, že bude zahrnuto více než 2 500 pacientů.
Tento výzkum nebude mít žádný dopad na současnou péči o pacienty. Údaje z konzultací a různých vyšetření prováděných v rámci péče budou shromažďovány po dobu šesti měsíců po stanovení diagnózy, aby byly splněny cíle výzkumu.
Přehled studie
Detailní popis
kontext:
Umělá inteligence: NLP, shlukování a učení bez dozoru:
Umělá inteligence (AI) je obor, který kombinuje informatiku se soubory dat s cílem umožnit stroji napodobovat kognitivní schopnosti člověka. Strojové učení (ML) a jeho subdoménové hluboké učení, které využívá vrstvy neuronů, jsou dvě hlavní subdomény AI. Rozdíl spočívá v trénování každého algoritmu. ML používá dvě odlišné metody: učení pod dohledem, které zahrnuje trénování modelu na známých vstupních a výstupních datech, aby bylo možné předvídat budoucí výstupy, a učení bez dozoru zahrnuje objevování skrytých vzorců a vnitřních základních struktur ve vstupních datech. Zpracování přirozeného jazyka (NLP) je také podpolí umělé inteligence, ale obecně vyžaduje ML, aby bylo efektivní. NLP zpracovává reálná lingvistická data, aby jim dávala smysl způsobem, kterému počítač rozumí.
NLP má dvě hlavní fáze: předzpracování dat a vývoj algoritmu. Pro tyto techniky jsou široce používány programovací jazyky jako Python nebo R.
Cílem shlukovacích metod je seskupit množinu jedinců do homogenních tříd. Ke klasifikaci masivních dat lze použít nehierarchické metody, ale vyžadují předem stanovit počet tříd. Hierarchické metody, jejichž výpočet je časově náročnější, se skládají z řady vnořených oddílů reprezentovaných shlukovacím stromem. Optimální počet tříd lze určit a posteriori čtením stromu. V přítomnosti velkého počtu jedinců je běžné kombinovat nehierarchické a hierarchické techniky. Nejsou-li třídy předem jasně známy, používají se shlukovací metody s učením bez dozoru (ML) [1]. Datové sady jsou obecně rozděleny do tří oddělených datových sad: trénovací data, používaná k trénování zvoleného algoritmu(ů); validační údaje, používané ke kontrole výkonnosti výsledku; a testovací data, která se používají pouze na konci procesu.
Žilní tromboembolické onemocnění:
Žilní tromboembolická nemoc (VTE) je běžná patologie, jejíž incidence není zcela známa, ale s věkem se zvyšuje a dosahuje 1 % u subjektů starších 75 let. Ve Francii se odhaduje, že každý rok se u více než 100 000 lidí vyvine VTE, což je zodpovědné za 5 000 až 10 000 úmrtí. Hluboká žilní trombóza (DVT) a plicní embolie (PE) jsou dva hlavní typy VTE. HŽT odpovídá částečnému nebo úplnému uzávěru hluboké žíly trombem, lokalizovaným nejčastěji na dolních končetinách. PE je definována jako částečná nebo úplná okluze plicních tepen nebo jejich větví. Hlavním rizikem DVT je výskyt PE, která může být život ohrožující. Mezi další komplikace specifické pro VTE a možné nepříznivé důsledky patří tromboembolická recidiva (buď DVT nebo PE), chronická tromboembolická plicní hypertenze a posttrombotický syndrom u DVT. Současná léčba VTE je založena především na antikoagulační léčbě. Délka léčby se liší podle odhadovaného rizika recidivy, pokud je léčba přerušena, v podstatě v závislosti na tom, zda existuje nebo neexistuje předchozí hlavní rizikový faktor [2]. V této podskupině pacientů s PE se při absenci hlavních rizikových faktorů riziko recidivy považuje za střední a liší se podle toho, zda se jedná o první epizodu nebo o recidivu a zda se jedná o obstrukční plicní následky či nikoli [3]. V poslední době se terapeutická strategie stala složitější a zahrnuje méně významné rizikové faktory, které upravují délku léčby bez relevantních důkazů. Navíc, bez ohledu na délku léčby, není dávkování antikoagulancií po šestém měsíci u přímých perorálních antikoagulancií jisté.
hypotézy:
Tento výzkum je prezentován ve dvou odlišných osách:
OSA 1: Cílem této práce bude zpočátku vyvinout a ověřit nástroje umělé inteligence, využívající ML a NLP, pro získávání a strukturování dat z textových lékařských zpráv na oddělení cévní medicíny v Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS). Tento projekt bude navazovat na práci, kterou dříve provedlo Oddělení epidemiologie, biostatistiky a zdravotních dat (DEBDS) v Centru Antoine Lacassagne (CAL) se zaměřením na rakovinu prsu a štítné žlázy [5,6,7]. Cílem je ověřit přenositelnost těchto nástrojů do jiného zařízení s různými patologiemi a praktiky, konkrétně na oddělení cévní medicíny CHITS.
Implementace metody získávání strukturovaných dat pomocí technik umělé inteligence přímo z textových lékařských zpráv v rámci naší nemocnice je výzvou. Pokud by se prokázala jeho výkonnost a tento nástroj je implementován trvale rutinně, představoval by snadno využitelný zdroj informací. Různorodost oborů a zájmů v klinickém výzkumu v našem zařízení může učinit nasazení na jiných odděleních dosažitelným cílem. Pro CHITS je to první krok v procesu budování Health Data Warehouse (HDW).
OSA 2: Následně bude cílem využít databázi k identifikaci klinicky relevantních fenotypů u pacientů s akutní plicní embolií. K získání skupin pacientů, kteří jsou při diagnóze homogenní, budou použity metody hierarchického shlukování kombinované s nekontrolovaným učením (strojové učení). Hodnocení jejich prognózy v 6. měsíci (recidiva nebo chronická tromboembolická plicní hypertenze), zohledňující první 3 měsíce antikoagulační léčby, by poskytlo pomůcku pro lékařské rozhodování.
Analýza šestiměsíčního vývoje homogenních skupin pacientů s akutní plicní embolií, konstruovaná pomocí shlukových metod s učením bez dozoru, nebyla nikdy předtím provedena. Tento inovativní projekt v rámci rozsáhlé nemocniční infrastruktury pravděpodobně nabídne lékařům pomoc při rozhodování a pacientům vědecky ověřenou formu terapeutického managementu.
Materiály a metody :
Tento výzkum bude zahrnovat retrospektivní a prospektivní část. Retrospektivní část bude zahrnovat pacienty, kteří byli od roku 2019 přijati na CHITS pro akutní plicní embolii (kolem 1900 pacientů). Pro prospektivní část je plánováno zařazení pacientů se stejnými charakteristikami v letech 2024 a 2025 (cca 765 pacientů). Pokud nejsou k dispozici individuální informace nebo mají námitky proti zpracování svých údajů u 25 % pacientů, mohl by být v této studii potenciálně analyzován velký objem údajů o více než 2 500 pacientech. Tento výzkum nebude mít žádný dopad na současnou péči o pacienty. Údaje z konzultací a různých vyšetření prováděných v rámci péče budou shromažďovány po dobu šesti měsíců po stanovení diagnózy, aby byly splněny cíle výzkumu.
OSA 1: Metoda získávání dat použitá v tomto výzkumu bude dvojí. Data od pacientů zařazených do klinického výzkumu budou shromažďována konvenčně pomocí formuláře kazuistiky, poté centralizována a organizována v referenční databázi nazvané „Zlatý standard“ a vkládána technikem klinického výzkumu. Druhá technika získávání dat pomocí metod NLP bude probíhat v několika fázích, paralelně s předchozím přístupem. Nejprve po extrakci lékařských zpráv (MR) v textovém formátu bude následovat fáze pseudonymizace. Soubor dat MR bude poté připraven pro školení a ověření odstraněním speciálních znaků a identifikací segmentu zájmů. Poté bude MR opatřena poznámkami BRAT, aby bylo možné identifikovat termíny, které budou použity k naplnění databáze. Tréninkové skripty budou aplikovány na 70 % pacientů za účelem vytvoření NLP modelů. Během této tréninkové fáze budou napsána lékařská pravidla pro následné zpracování, aby se informace identifikované modely převedly do strukturovaných dat. Takto finalizovaný skript je aplikován na validační základnu s vyhodnocením jeho výkonu. Po nezbytných úpravách je výkon výsledného skriptu vyhodnocen na testovací databázi. Výkon bude hodnocen porovnáním dat získaných automaticky s manuální databází Gold Standard.
OSA 2: Metody neřízeného shlukování použité v této studii kombinují hierarchické a nehierarchické metody. Po hierarchickém vzestupném shlukování se k určení počtu zájmových skupin používá Wardův index. Centroidy těchto skupin jsou pak považovány za inicializační algoritmus rozdělení, jako je algoritmus k-means. Jakmile byla určena většina lékařsky relevantních skupin, porovná se šestiměsíční evoluce (stabilní, zhoršení nebo pokrok). Faktory ovlivňující progresi během prvních tří měsíců léčby lze také zahrnout do statistického modelu v závislosti na jejich schopnosti předpovídat zhoršení. Všechny tyto průzkumy by měly poskytnout základ pro lékařské rozhodování.
Typ studie
Zápis (Odhadovaný)
Kontakty a umístění
Studijní kontakt
- Jméno: Sophie Lafond
- Telefonní číslo: +33 04 83 77 20 62
- E-mail: sophie.lafond@ch-toulon.fr
Studijní záloha kontaktů
- Jméno: Jean-Philippe Suppini
- Telefonní číslo: +33 04 94 14 55 25
- E-mail: recherche.promotion@ch-toulon.fr
Studijní místa
-
-
-
Toulon, Francie, 83100
- Nábor
- centre hospitalier intercommunal Toulon La Seyne sur Mer - Internal and vascular medicine
-
Kontakt:
- Jean-Noël POGGI, MD
- Telefonní číslo: +33 04 94 14 57 87
- E-mail: jeannoel.poggi@ch-toulon.fr
-
-
Kritéria účasti
Kritéria způsobilosti
Věk způsobilý ke studiu
- Dospělý
- Starší dospělý
Přijímá zdravé dobrovolníky
Metoda odběru vzorků
Studijní populace
Popis
Kritéria pro zařazení:
- Věk ≥ 18 let;
- Pacient s akutní plicní embolií při CHITS (hospitalizovaný nebo ne).
Kritéria vyloučení:
- subsegmentální plicní embolie;
- Opozice pacientů.
Studijní plán
Jak je studie koncipována?
Detaily designu
Kohorty a intervence
Skupina / kohorta |
Intervence / Léčba |
|---|---|
|
Pacient s akutní plicní embolií
Pacient s akutní plicní embolií v Center Hospitalier Intercommunal Toulon La Seyne sur Mer, hospitalizovaný nebo ne od roku 2019
|
Metody hierarchického shlukování budou použity k vytvoření homogenních skupin pacientů na základě jejich dat při diagnóze: přítomnost nebo nepřítomnost symptomů, klinická a biologická data a přítomnost nebo nepřítomnost favorizujících faktorů.
Vývoj pacienta po 6 měsících může spadat do kategorií: stabilní, zhoršení nebo progrese, které jsou určovány událostmi, jako je recidiva, krvácení, funkční následky nebo smrt.
|
Co je měření studie?
Primární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
|---|---|---|
|
Primární: Identifikujte homogenní skupiny pacientů na základě jejich lékařských charakteristik při diagnostice a poté porovnejte jejich vývoj po 6 měsících.
Časové okno: 6 měsíců
|
Meerarchické shlukovací metody budou použity k vytvoření homogenních skupin pacientů na základě jejich údajů při diagnostice: přítomnost nebo absence symptomů, klinických a biologických údajů a přítomnosti nebo absence upřednostňujících faktorů.
Vývoj pacientů po 6 měsících může spadat do kategorií: stabilní, zhoršení nebo pokrok, které jsou určovány událostmi, jako je recidiva, krvácení, funkční následky nebo smrt.
|
6 měsíců
|
Sekundární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
|---|---|---|
|
Sekundární: Stanovení faktorů predikujících šestiměsíční progresi během prvních tří měsíců léčby.
Časové okno: 3 měsíce
|
A priori budou zachovány skupiny definované pro primární cíl.
Mezi faktory zvažované během prvních tří měsíců léčby budou zahrnovat: klinická a biologická data, přítomnost nebo absence symptomů, příznivé faktory nebo komplikace.
|
3 měsíce
|
Spolupracovníci a vyšetřovatelé
Spolupracovníci
Vyšetřovatelé
- Ředitel studie: Jean-Noël POGGI, MD, Centre Hospitalier Intercommunal Toulon La Seyne sur Mer
Publikace a užitečné odkazy
Obecné publikace
- Gal J, Bailleux C, Chardin D, Pourcher T, Gilhodes J, Jing L, Guigonis JM, Ferrero JM, Milano G, Mograbi B, Brest P, Chateau Y, Humbert O, Chamorey E. Comparison of unsupervised machine-learning methods to identify metabolomic signatures in patients with localized breast cancer. Comput Struct Biotechnol J. 2020 Jun 3;18:1509-1524. doi: 10.1016/j.csbj.2020.05.021. eCollection 2020.
- Gallo A, Valerio L, Barco S. The 2019 European guidelines on pulmonary embolism illustrated with the aid of an exemplary case report. Eur Heart J Case Rep. 2021 Jan 4;5(2):ytaa542. doi: 10.1093/ehjcr/ytaa542. eCollection 2021 Feb.
- Duffett L, Castellucci LA, Forgie MA. Pulmonary embolism: update on management and controversies. BMJ. 2020 Aug 5;370:m2177. doi: 10.1136/bmj.m2177.
- Yu T, Shen R, You G, Lv L, Kang S, Wang X, Xu J, Zhu D, Xia Z, Zheng J, Huang K. Machine learning-based prediction of the post-thrombotic syndrome: Model development and validation study. Front Cardiovasc Med. 2022 Sep 16;9:990788. doi: 10.3389/fcvm.2022.990788. eCollection 2022.
Termíny studijních záznamů
Hlavní termíny studia
Začátek studia (Aktuální)
Primární dokončení (Odhadovaný)
Dokončení studie (Odhadovaný)
Termíny zápisu do studia
První předloženo
První předloženo, které splnilo kritéria kontroly kvality
První zveřejněno (Aktuální)
Aktualizace studijních záznamů
Poslední zveřejněná aktualizace (Aktuální)
Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality
Naposledy ověřeno
Více informací
Termíny související s touto studií
Další relevantní podmínky MeSH
Další identifikační čísla studie
- 2023-CHITS-016
Plán pro data jednotlivých účastníků (IPD)
Plánujete sdílet data jednotlivých účastníků (IPD)?
Informace o lécích a zařízeních, studijní dokumenty
Studuje lékový produkt regulovaný americkým FDA
Studuje produkt zařízení regulovaný americkým úřadem FDA
Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .
Klinické studie na Hierarchické metody shlukování
-
Medical University of GrazDokončenoBolest v noze, blíže neurčená | Podvrtnutí kolenaRakousko