Tato stránka byla automaticky přeložena a přesnost překladu není zaručena. Podívejte se prosím na anglická verze pro zdrojový text.

Studie získávání dat pomocí umělé inteligence a fenotypizace pacientů s akutní plicní embolií (PEPITE)

Studie získávání dat s umělou inteligencí a fenotypizací pacientů s akutní plicní embolií

Prvotním cílem je vytvořit a ověřit nástroje umělé inteligence (strojové učení a zpracování přirozeného jazyka) pro získávání a strukturování dat z lékařských zpráv v Centre Hospitalier Intercommunal de Toulon – la Seyne sur mer (CHITS). Tento projekt bude stavět na práci, kterou dříve provedlo Oddělení epidemiologie, biostatistiky a zdravotních údajů (DEBDS) v Centru Antoine Lacassagne (CAL) v Nice, se zaměřením na rakovinu prsu a štítné žlázy. Cílem je ověřit přenositelnost těchto nástrojů do jiného zařízení s různými patologiemi a praktiky, konkrétně na oddělení cévní medicíny na CHITS.

Následně bude cílem identifikovat klinicky relevantní fenotypy u pacientů s akutní plicní embolií. K získání skupin pacientů, kteří jsou při diagnóze homogenní, budou použity metody hierarchického shlukování kombinované s nekontrolovaným učením (strojové učení). Hodnocení jejich prognózy v 6. měsíci (recidiva nebo chronická tromboembolická plicní hypertenze), zohledňující první 3 měsíce antikoagulační léčby, by poskytlo pomůcku pro lékařské rozhodování.

Tento výzkum bude zahrnovat retrospektivní a prospektivní část. Retrospektivní část bude zahrnovat pacienty, kteří byli od roku 2019 přijati na CHITS pro akutní plicní embolii. Pro prospektivní část se plánuje zahrnutí pacientů se stejnými charakteristikami v letech 2024 a 2025. Očekává se, že bude zahrnuto více než 2 500 pacientů.

Tento výzkum nebude mít žádný dopad na současnou péči o pacienty. Údaje z konzultací a různých vyšetření prováděných v rámci péče budou shromažďovány po dobu šesti měsíců po stanovení diagnózy, aby byly splněny cíle výzkumu.

Přehled studie

Postavení

Nábor

Podmínky

Detailní popis

kontext:

Umělá inteligence: NLP, shlukování a učení bez dozoru:

Umělá inteligence (AI) je obor, který kombinuje informatiku se soubory dat s cílem umožnit stroji napodobovat kognitivní schopnosti člověka. Strojové učení (ML) a jeho subdoménové hluboké učení, které využívá vrstvy neuronů, jsou dvě hlavní subdomény AI. Rozdíl spočívá v trénování každého algoritmu. ML používá dvě odlišné metody: učení pod dohledem, které zahrnuje trénování modelu na známých vstupních a výstupních datech, aby bylo možné předvídat budoucí výstupy, a učení bez dozoru zahrnuje objevování skrytých vzorců a vnitřních základních struktur ve vstupních datech. Zpracování přirozeného jazyka (NLP) je také podpolí umělé inteligence, ale obecně vyžaduje ML, aby bylo efektivní. NLP zpracovává reálná lingvistická data, aby jim dávala smysl způsobem, kterému počítač rozumí.

NLP má dvě hlavní fáze: předzpracování dat a vývoj algoritmu. Pro tyto techniky jsou široce používány programovací jazyky jako Python nebo R.

Cílem shlukovacích metod je seskupit množinu jedinců do homogenních tříd. Ke klasifikaci masivních dat lze použít nehierarchické metody, ale vyžadují předem stanovit počet tříd. Hierarchické metody, jejichž výpočet je časově náročnější, se skládají z řady vnořených oddílů reprezentovaných shlukovacím stromem. Optimální počet tříd lze určit a posteriori čtením stromu. V přítomnosti velkého počtu jedinců je běžné kombinovat nehierarchické a hierarchické techniky. Nejsou-li třídy předem jasně známy, používají se shlukovací metody s učením bez dozoru (ML) [1]. Datové sady jsou obecně rozděleny do tří oddělených datových sad: trénovací data, používaná k trénování zvoleného algoritmu(ů); validační údaje, používané ke kontrole výkonnosti výsledku; a testovací data, která se používají pouze na konci procesu.

Žilní tromboembolické onemocnění:

Žilní tromboembolická nemoc (VTE) je běžná patologie, jejíž incidence není zcela známa, ale s věkem se zvyšuje a dosahuje 1 % u subjektů starších 75 let. Ve Francii se odhaduje, že každý rok se u více než 100 000 lidí vyvine VTE, což je zodpovědné za 5 000 až 10 000 úmrtí. Hluboká žilní trombóza (DVT) a plicní embolie (PE) jsou dva hlavní typy VTE. HŽT odpovídá částečnému nebo úplnému uzávěru hluboké žíly trombem, lokalizovaným nejčastěji na dolních končetinách. PE je definována jako částečná nebo úplná okluze plicních tepen nebo jejich větví. Hlavním rizikem DVT je výskyt PE, která může být život ohrožující. Mezi další komplikace specifické pro VTE a možné nepříznivé důsledky patří tromboembolická recidiva (buď DVT nebo PE), chronická tromboembolická plicní hypertenze a posttrombotický syndrom u DVT. Současná léčba VTE je založena především na antikoagulační léčbě. Délka léčby se liší podle odhadovaného rizika recidivy, pokud je léčba přerušena, v podstatě v závislosti na tom, zda existuje nebo neexistuje předchozí hlavní rizikový faktor [2]. V této podskupině pacientů s PE se při absenci hlavních rizikových faktorů riziko recidivy považuje za střední a liší se podle toho, zda se jedná o první epizodu nebo o recidivu a zda se jedná o obstrukční plicní následky či nikoli [3]. V poslední době se terapeutická strategie stala složitější a zahrnuje méně významné rizikové faktory, které upravují délku léčby bez relevantních důkazů. Navíc, bez ohledu na délku léčby, není dávkování antikoagulancií po šestém měsíci u přímých perorálních antikoagulancií jisté.

hypotézy:

Tento výzkum je prezentován ve dvou odlišných osách:

OSA 1: Cílem této práce bude zpočátku vyvinout a ověřit nástroje umělé inteligence, využívající ML a NLP, pro získávání a strukturování dat z textových lékařských zpráv na oddělení cévní medicíny v Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS). Tento projekt bude navazovat na práci, kterou dříve provedlo Oddělení epidemiologie, biostatistiky a zdravotních dat (DEBDS) v Centru Antoine Lacassagne (CAL) se zaměřením na rakovinu prsu a štítné žlázy [5,6,7]. Cílem je ověřit přenositelnost těchto nástrojů do jiného zařízení s různými patologiemi a praktiky, konkrétně na oddělení cévní medicíny CHITS.

Implementace metody získávání strukturovaných dat pomocí technik umělé inteligence přímo z textových lékařských zpráv v rámci naší nemocnice je výzvou. Pokud by se prokázala jeho výkonnost a tento nástroj je implementován trvale rutinně, představoval by snadno využitelný zdroj informací. Různorodost oborů a zájmů v klinickém výzkumu v našem zařízení může učinit nasazení na jiných odděleních dosažitelným cílem. Pro CHITS je to první krok v procesu budování Health Data Warehouse (HDW).

OSA 2: Následně bude cílem využít databázi k identifikaci klinicky relevantních fenotypů u pacientů s akutní plicní embolií. K získání skupin pacientů, kteří jsou při diagnóze homogenní, budou použity metody hierarchického shlukování kombinované s nekontrolovaným učením (strojové učení). Hodnocení jejich prognózy v 6. měsíci (recidiva nebo chronická tromboembolická plicní hypertenze), zohledňující první 3 měsíce antikoagulační léčby, by poskytlo pomůcku pro lékařské rozhodování.

Analýza šestiměsíčního vývoje homogenních skupin pacientů s akutní plicní embolií, konstruovaná pomocí shlukových metod s učením bez dozoru, nebyla nikdy předtím provedena. Tento inovativní projekt v rámci rozsáhlé nemocniční infrastruktury pravděpodobně nabídne lékařům pomoc při rozhodování a pacientům vědecky ověřenou formu terapeutického managementu.

Materiály a metody :

Tento výzkum bude zahrnovat retrospektivní a prospektivní část. Retrospektivní část bude zahrnovat pacienty, kteří byli od roku 2019 přijati na CHITS pro akutní plicní embolii (kolem 1900 pacientů). Pro prospektivní část je plánováno zařazení pacientů se stejnými charakteristikami v letech 2024 a 2025 (cca 765 pacientů). Pokud nejsou k dispozici individuální informace nebo mají námitky proti zpracování svých údajů u 25 % pacientů, mohl by být v této studii potenciálně analyzován velký objem údajů o více než 2 500 pacientech. Tento výzkum nebude mít žádný dopad na současnou péči o pacienty. Údaje z konzultací a různých vyšetření prováděných v rámci péče budou shromažďovány po dobu šesti měsíců po stanovení diagnózy, aby byly splněny cíle výzkumu.

OSA 1: Metoda získávání dat použitá v tomto výzkumu bude dvojí. Data od pacientů zařazených do klinického výzkumu budou shromažďována konvenčně pomocí formuláře kazuistiky, poté centralizována a organizována v referenční databázi nazvané „Zlatý standard“ a vkládána technikem klinického výzkumu. Druhá technika získávání dat pomocí metod NLP bude probíhat v několika fázích, paralelně s předchozím přístupem. Nejprve po extrakci lékařských zpráv (MR) v textovém formátu bude následovat fáze pseudonymizace. Soubor dat MR bude poté připraven pro školení a ověření odstraněním speciálních znaků a identifikací segmentu zájmů. Poté bude MR opatřena poznámkami BRAT, aby bylo možné identifikovat termíny, které budou použity k naplnění databáze. Tréninkové skripty budou aplikovány na 70 % pacientů za účelem vytvoření NLP modelů. Během této tréninkové fáze budou napsána lékařská pravidla pro následné zpracování, aby se informace identifikované modely převedly do strukturovaných dat. Takto finalizovaný skript je aplikován na validační základnu s vyhodnocením jeho výkonu. Po nezbytných úpravách je výkon výsledného skriptu vyhodnocen na testovací databázi. Výkon bude hodnocen porovnáním dat získaných automaticky s manuální databází Gold Standard.

OSA 2: Metody neřízeného shlukování použité v této studii kombinují hierarchické a nehierarchické metody. Po hierarchickém vzestupném shlukování se k určení počtu zájmových skupin používá Wardův index. Centroidy těchto skupin jsou pak považovány za inicializační algoritmus rozdělení, jako je algoritmus k-means. Jakmile byla určena většina lékařsky relevantních skupin, porovná se šestiměsíční evoluce (stabilní, zhoršení nebo pokrok). Faktory ovlivňující progresi během prvních tří měsíců léčby lze také zahrnout do statistického modelu v závislosti na jejich schopnosti předpovídat zhoršení. Všechny tyto průzkumy by měly poskytnout základ pro lékařské rozhodování.

Typ studie

Pozorovací

Zápis (Odhadovaný)

2500

Kontakty a umístění

Tato část poskytuje kontaktní údaje pro ty, kteří studii provádějí, a informace o tom, kde se tato studie provádí.

Studijní kontakt

Studijní záloha kontaktů

Studijní místa

      • Toulon, Francie, 83100
        • Nábor
        • centre hospitalier intercommunal Toulon La Seyne sur Mer - Internal and vascular medicine
        • Kontakt:

Kritéria účasti

Výzkumníci hledají lidi, kteří odpovídají určitému popisu, kterému se říká kritéria způsobilosti. Některé příklady těchto kritérií jsou celkový zdravotní stav osoby nebo předchozí léčba.

Kritéria způsobilosti

Věk způsobilý ke studiu

  • Dospělý
  • Starší dospělý

Přijímá zdravé dobrovolníky

Ne

Metoda odběru vzorků

Vzorek nepravděpodobnosti

Studijní populace

Tento výzkum bude zahrnovat retrospektivní a prospektivní část. Retrospektivní část bude zahrnovat pacienty, kteří byli od roku 2019 přijati na CHITS pro akutní plicní embolii (kolem 1900 pacientů). Pro prospektivní část se plánuje zahrnutí pacientů se stejnými charakteristikami v letech 2024 a 2025.

Popis

Kritéria pro zařazení:

  • Věk ≥ 18 let;
  • Pacient s akutní plicní embolií při CHITS (hospitalizovaný nebo ne).

Kritéria vyloučení:

  • subsegmentální plicní embolie;
  • Opozice pacientů.

Studijní plán

Tato část poskytuje podrobnosti o studijním plánu, včetně toho, jak je studie navržena a co studie měří.

Jak je studie koncipována?

Detaily designu

Kohorty a intervence

Skupina / kohorta
Intervence / Léčba
Pacient s akutní plicní embolií
Pacient s akutní plicní embolií v Center Hospitalier Intercommunal Toulon La Seyne sur Mer, hospitalizovaný nebo ne od roku 2019
Metody hierarchického shlukování budou použity k vytvoření homogenních skupin pacientů na základě jejich dat při diagnóze: přítomnost nebo nepřítomnost symptomů, klinická a biologická data a přítomnost nebo nepřítomnost favorizujících faktorů. Vývoj pacienta po 6 měsících může spadat do kategorií: stabilní, zhoršení nebo progrese, které jsou určovány událostmi, jako je recidiva, krvácení, funkční následky nebo smrt.

Co je měření studie?

Primární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Primární: Identifikujte homogenní skupiny pacientů na základě jejich lékařských charakteristik při diagnostice a poté porovnejte jejich vývoj po 6 měsících.
Časové okno: 6 měsíců
Meerarchické shlukovací metody budou použity k vytvoření homogenních skupin pacientů na základě jejich údajů při diagnostice: přítomnost nebo absence symptomů, klinických a biologických údajů a přítomnosti nebo absence upřednostňujících faktorů. Vývoj pacientů po 6 měsících může spadat do kategorií: stabilní, zhoršení nebo pokrok, které jsou určovány událostmi, jako je recidiva, krvácení, funkční následky nebo smrt.
6 měsíců

Sekundární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Sekundární: Stanovení faktorů predikujících šestiměsíční progresi během prvních tří měsíců léčby.
Časové okno: 3 měsíce
A priori budou zachovány skupiny definované pro primární cíl. Mezi faktory zvažované během prvních tří měsíců léčby budou zahrnovat: klinická a biologická data, přítomnost nebo absence symptomů, příznivé faktory nebo komplikace.
3 měsíce

Spolupracovníci a vyšetřovatelé

Zde najdete lidi a organizace zapojené do této studie.

Spolupracovníci

Vyšetřovatelé

  • Ředitel studie: Jean-Noël POGGI, MD, Centre Hospitalier Intercommunal Toulon La Seyne sur Mer

Publikace a užitečné odkazy

Osoba odpovědná za zadávání informací o studiu tyto publikace poskytuje dobrovolně. Mohou se týkat čehokoli, co souvisí se studiem.

Termíny studijních záznamů

Tato data sledují průběh záznamů studie a předkládání souhrnných výsledků na ClinicalTrials.gov. Záznamy ze studií a hlášené výsledky jsou před zveřejněním na veřejné webové stránce přezkoumány Národní lékařskou knihovnou (NLM), aby se ujistily, že splňují specifické standardy kontroly kvality.

Hlavní termíny studia

Začátek studia (Aktuální)

11. prosince 2023

Primární dokončení (Odhadovaný)

1. července 2026

Dokončení studie (Odhadovaný)

1. července 2026

Termíny zápisu do studia

První předloženo

13. prosince 2023

První předloženo, které splnilo kritéria kontroly kvality

26. prosince 2023

První zveřejněno (Aktuální)

28. prosince 2023

Aktualizace studijních záznamů

Poslední zveřejněná aktualizace (Aktuální)

13. dubna 2026

Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality

10. dubna 2026

Naposledy ověřeno

1. dubna 2026

Více informací

Termíny související s touto studií

Plán pro data jednotlivých účastníků (IPD)

Plánujete sdílet data jednotlivých účastníků (IPD)?

NE

Informace o lécích a zařízeních, studijní dokumenty

Studuje lékový produkt regulovaný americkým FDA

Ne

Studuje produkt zařízení regulovaný americkým úřadem FDA

Ne

Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .

Klinické studie na Hierarchické metody shlukování

Předplatit