- ICH GCP
- US Clinical Trials Registry
- Klinisk utprøving NCT06183944
Datainnsamlingsstudie med kunstig intelligens og fenotyping av pasienter med akutt lungeemboli (PEPITE)
Datainnsamlingsstudie med kunstig intelligens og fenotyping av pasienter som presenterte med akutt lungeemboli
Det første målet er å bygge og validere kunstig intelligensverktøy (maskinlæring og naturlig språkbehandling) for å skaffe og strukturere data fra medisinske rapporter ved Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS). Dette prosjektet vil bygge på arbeid tidligere utført av Institutt for epidemiologi, biostatistikk og helsedata (DEBDS) ved Centre Antoine Lacassagne (CAL) i Nice, med fokus på bryst- og skjoldbruskkjertelkreft. Tanken er å validere overførbarheten av disse verktøyene til en annen virksomhet med forskjellige patologier og utøvere, nærmere bestemt den vaskulære medisinavdelingen ved CHITS.
Deretter vil målet være å identifisere klinisk relevante fenotyper hos pasienter med akutt lungeemboli. Hierarkiske klyngemetoder kombinert med uovervåket læring (maskinlæring) vil bli brukt for å oppnå grupper av pasienter som er homogene ved diagnose. Evaluering av prognosen deres etter 6 måneder (residiv eller kronisk tromboembolisk pulmonal hypertensjon), med tanke på de første 3 månedene med antikoagulantbehandling, vil hjelpe til med medisinske beslutninger.
Denne forskningen vil inkludere en retrospektiv og en prospektiv del. Den retrospektive delen vil inkludere pasienter som har vært innlagt på CHITS for akutt lungeemboli siden 2019. For den prospektive delen er det planlagt å inkludere pasienter med samme egenskaper over årene 2024 og 2025. Mer enn 2500 pasienter forventes å bli inkludert.
Denne forskningen vil ikke ha noen innvirkning på dagens pasientbehandling. Data fra konsultasjoner og ulike undersøkelser utført som ledd i omsorgen vil bli samlet inn i seks måneder etter diagnose for å oppfylle forskningsmålene.
Studieoversikt
Detaljert beskrivelse
Kontekst:
Kunstig intelligens: NLP, clustering og uovervåket læring:
Artificial Intelligence (AI) er et felt som kombinerer informatikk med datasett, med mål om å gjøre det mulig for en maskin å etterligne menneskets kognitive evner. Maskinlæring (ML) og dets underdomene dyplæring, som bruker lag av nevroner, er to store underdomener av AI. Forskjellen ligger i trening av hver algoritme. To utmerkede metoder brukes av ML: overvåket læring, som innebærer å trene en modell på kjente input- og outputdata for å forutsi fremtidige utdata, og uovervåket læring involverer oppdagelsen av skjulte mønstre og iboende underliggende strukturer i inputdataene. Natural Language Processing (NLP) er også et underfelt av AI, men det krever generelt at ML er effektiv. NLP behandler lingvistiske data fra den virkelige verden for å forstå dem på en måte som en datamaskin kan forstå.
NLP har to hovedtrinn: dataforbehandling og algoritmeutvikling. Programmeringsspråk som Python eller R er mye brukt for disse teknikkene.
Målet med klyngemetoder er å gruppere et sett med individer i homogene klasser. Ikke-hierarkiske metoder kan brukes til å klassifisere massive data, men krever å fikse antallet klasser på forhånd. Hierarkiske metoder, som er mer tidkrevende å beregne, består av en serie nestede partisjoner representert av et grupperingstre. Det optimale antallet klasser kan bestemmes i etterkant ved å lese treet. I nærvær av et stort antall individer er det vanlig å kombinere ikke-hierarkiske og hierarkiske teknikker. Når klasser ikke er klart kjent på forhånd, brukes klyngemetoder med uovervåket læring (ML) [1]. Datasett er generelt delt inn i tre usammenhengende datasett: treningsdata, brukt til å trene den(e) valgte algoritmen(e); valideringsdata, brukt til å sjekke ytelsen til resultatet; og testdata, kun brukt på slutten av prosessen.
Venøs tromboembolisk sykdom:
Venøs tromboembolisk sykdom (VTE) er en vanlig patologi hvis forekomst er ufullkommen kjent, men øker med alderen og når 1 % hos personer over 75 år. I Frankrike anslås det at hvert år utvikler over 100 000 mennesker VTE, som er ansvarlig for mellom 5 000 og 10 000 dødsfall. Dyp venetrombose (DVT) og lungeemboli (PE) er de to hovedtypene av VTE. DVT tilsvarer delvis eller total okklusjon av en dyp vene av en trombe, oftest lokalisert i underekstremitetene. PE er definert som delvis eller total okklusjon av lungearteriene eller deres forgreninger. Hovedrisikoen for DVT er forekomsten av PE, som kan være livstruende. Andre VTE-spesifikke komplikasjoner og mulige uønskede utfall inkluderer tromboembolisk tilbakefall (enten DVT eller PE), kronisk tromboembolisk pulmonal hypertensjon og posttrombotisk syndrom ved DVT. Dagens behandling av VTE er hovedsakelig basert på antikoagulantbehandling. Behandlingsvarigheten varierer i henhold til den estimerte risikoen for tilbakefall dersom behandlingen avbrytes, hovedsakelig avhengig av om det er en tidligere stor risikofaktor eller ikke [2]. I denne undergruppen av PE-pasienter, i fravær av store risikofaktorer, anses risiko for tilbakefall som middels og varierer etter om hendelsen er en første episode eller et tilbakefall, og om det er obstruktive lungefølger eller ikke [3]. Nylig har den terapeutiske strategien blitt mer kompleks, med inkludering av mindre risikofaktorer som modulerer behandlingsvarigheten uten relevant bevis. Dessuten, uavhengig av behandlingens varighet, er doseringen av antikoagulasjon utover den sjette måneden usikker for direkte orale antikoagulantia.
Hypoteser :
Denne forskningen presenteres under to distinkte akser:
AKSE 1: Målet med dette arbeidet vil i første omgang være å utvikle og validere kunstig intelligensverktøy, ved bruk av ML og NLP, for å innhente og strukturere data fra tekstbaserte medisinske rapporter ved avdelingen for vaskulær medisin ved Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS). Dette prosjektet vil bygge på arbeid tidligere utført av Institutt for epidemiologi, biostatistikk og helsedata (DEBDS) ved Centre Antoine Lacassagne (CAL) med fokus på bryst- og skjoldbruskkjertelkreft [5,6,7]. Tanken er å validere overførbarheten av disse verktøyene til en annen virksomhet med forskjellige patologier og utøvere, spesielt den vaskulære medisinavdelingen til CHITS.
Å implementere en metode for å innhente strukturerte data ved hjelp av kunstig intelligens-teknikker direkte fra tekstlige medisinske rapporter på sykehuset vårt er en utfordring. Hvis ytelsen er bevist og dette verktøyet implementeres på en permanent rutinebasis, vil det være en lett utnyttelig informasjonskilde. Mangfoldet av felt og interesser innen klinisk forskning i vår virksomhet kan gjøre utplassering i andre avdelinger til et oppnåelig mål. For CHITS er dette det første trinnet i prosessen med å bygge et helsedatavarehus (HDW).
AKSE 2: Deretter vil målet være å bruke databasen til å identifisere klinisk relevante fenotyper hos pasienter med akutt lungeemboli. Hierarkiske klyngemetoder kombinert med uovervåket læring (maskinlæring) vil bli brukt for å oppnå grupper av pasienter som er homogene ved diagnose. Evaluering av prognosen deres etter 6 måneder (residiv eller kronisk tromboembolisk pulmonal hypertensjon), med tanke på de første 3 månedene med antikoagulantbehandling, vil hjelpe til med medisinske beslutninger.
En analyse av den seks måneder lange utviklingen av homogene pasientgrupper med akutt lungeemboli, konstruert ved bruk av klyngemetoder med uovervåket læring, har aldri blitt utført før. Dette innovative prosjektet innenfor en storstilt sykehusinfrastruktur vil sannsynligvis tilby leger en beslutningshjelp, og pasienter en vitenskapelig validert form for terapeutisk ledelse.
Materialer og metoder :
Denne forskningen vil inkludere en retrospektiv og en prospektiv del. Den retrospektive delen vil inkludere pasienter som har vært innlagt på CHITS for akutt lungeemboli siden 2019 (rundt 1900 pasienter). For den prospektive delen er det planlagt å inkludere pasienter med samme egenskaper i årene 2024 og 2025 (ca. 765 pasienter). Hvis individuell informasjon ikke er tilgjengelig eller de protesterer mot behandlingen av dataene deres for 25 % av pasientene, kan et stort datavolum om over 2500 pasienter potensielt analyseres i denne studien. Denne forskningen vil ikke ha noen innvirkning på dagens pasientbehandling. Data fra konsultasjoner og ulike undersøkelser utført som en del av omsorgen vil bli samlet inn i seks måneder etter diagnose for å oppfylle forskningsmålene.
AKSE 1: Datainnsamlingsmetoden som brukes i denne forskningen vil være todelt. Data fra pasienter som inngår i klinisk forskning vil bli samlet inn på vanlig måte ved hjelp av et case-rapportskjema, deretter sentralisert og organisert i en referansedatabase kalt "Gold Standard", og lagt inn av en klinisk forskningstekniker. Den andre teknikken for datainnsamling, ved bruk av NLP-metoder, vil foregå i flere stadier, parallelt med tidligere tilnærming. Først vil utvinningen av medisinske rapporter (MR) i tekstformat bli fulgt av et pseudonymiseringsstadium. MR-datasettet vil deretter forberedes for opplæring og validering ved å fjerne spesialtegn og identifisere interessesegmenter. Deretter vil MR bli kommentert med BRAT for å identifisere begrepene som vil bli brukt for å fylle ut databasen. Opplæringsskript vil bli brukt på 70 % av pasientene for å lage NLP-modeller. I løpet av denne opplæringsfasen vil etterbehandlingsmedisinske regler bli skrevet for å oversette informasjonen identifisert av modellene til strukturerte data. Skriptet som er ferdigstilt, blir brukt på valideringsbasen med en evaluering av ytelsen. Etter eventuelle nødvendige justeringer, blir ytelsen til det endelige skriptet evaluert på testdatabasen. Ytelsen vil bli vurdert ved å sammenligne data innhentet automatisk med den manuelle Gold Standard-databasen.
AKSE 2: Uovervåket klyngemetoder brukt i denne studien kombinerer hierarkiske og ikke-hierarkiske metoder. Etter den hierarkiske stigende klyngingen, brukes Wards indeks for å bestemme antall interessegrupper. Sentroidene til disse gruppene anses deretter for å initialisere en partisjoneringsalgoritme, slik som k-middelalgoritmen. Når de fleste medisinsk relevante grupper er bestemt, sammenlignes seks måneders evolusjon (stabil, forverring eller fremgang). Faktorer som påvirker progresjon i løpet av de første tre månedene av behandlingen kan også inkluderes i en statistisk modell, avhengig av deres evne til å forutsi forverring. Alle disse undersøkelsene skal gi grunnlag for medisinske beslutninger.
Studietype
Registrering (Antatt)
Kontakter og plasseringer
Studiekontakt
- Navn: Sophie Lafond
- Telefonnummer: +33 04 83 77 20 62
- E-post: sophie.lafond@ch-toulon.fr
Studer Kontakt Backup
- Navn: Jean-Philippe Suppini
- Telefonnummer: +33 04 94 14 55 25
- E-post: recherche.promotion@ch-toulon.fr
Studiesteder
-
-
-
Toulon, Frankrike, 83100
- Rekruttering
- centre hospitalier intercommunal Toulon La Seyne sur Mer - Internal and vascular medicine
-
Ta kontakt med:
- Jean-Noël POGGI, MD
- Telefonnummer: +33 04 94 14 57 87
- E-post: jeannoel.poggi@ch-toulon.fr
-
-
Deltakelseskriterier
Kvalifikasjonskriterier
Alder som er kvalifisert for studier
- Voksen
- Eldre voksen
Tar imot friske frivillige
Prøvetakingsmetode
Studiepopulasjon
Beskrivelse
Inklusjonskriterier:
- Alder ≥ 18 år;
- Pasient med akutt lungeemboli i CHITS (innlagt på sykehus eller ikke).
Ekskluderingskriterier:
- Sub-segmentelle lungeemboli ;
- Tålmodig motstand.
Studieplan
Hvordan er studiet utformet?
Designdetaljer
Kohorter og intervensjoner
Gruppe / Kohort |
Intervensjon / Behandling |
---|---|
Pasient med akutt lungeemboli
Pasient med akutt lungeemboli i Centre Hospitalier Intercommunal Toulon La Seyne sur Mer, innlagt eller ikke siden 2019
|
Hierarkiske grupperingsmetoder vil bli brukt for å danne homogene grupper av pasienter basert på deres data ved diagnose: tilstedeværelse eller fravær av symptomer, kliniske og biologiske data, og tilstedeværelse eller fravær av begunstigende faktorer.
Pasientutvikling etter 6 måneder kan falle inn i kategorier: stabil, forverring eller fremgang, som bestemmes av hendelser som tilbakefall, blødning, funksjonelle følgetilstander eller død.
|
Hva måler studien?
Primære resultatmål
Resultatmål |
Tiltaksbeskrivelse |
Tidsramme |
---|---|---|
AXIS 1 - Primær: Utvikle et robust verktøy for å innhente strukturerte data direkte fra tekstbaserte medisinske rapporter
Tidsramme: 30 måneder
|
Verktøyet skal implementeres ved hjelp av NLP-metoder, hovedsakelig utviklet i PYTHON.
Ytelsen til det implementerte verktøyet vil bli evaluert ved å sammenligne data generert av dette verktøyet med data som legges inn manuelt ('Gold Standard' database).
|
30 måneder
|
AKSE 2 - Primær: Identifiser homogene grupper av pasienter basert på deres medisinske egenskaper ved diagnose, og sammenlign deretter utviklingen deres etter 6 måneder.
Tidsramme: 6 måneder
|
Hierarkiske grupperingsmetoder vil bli brukt for å danne homogene grupper av pasienter basert på deres data ved diagnose: tilstedeværelse eller fravær av symptomer, kliniske og biologiske data, og tilstedeværelse eller fravær av begunstigende faktorer.
Pasientutvikling etter 6 måneder kan falle inn i kategorier: stabil, forverring eller fremgang, som bestemmes av hendelser som tilbakefall, blødning, funksjonelle følgetilstander eller død.
|
6 måneder
|
Sekundære resultatmål
Resultatmål |
Tiltaksbeskrivelse |
Tidsramme |
---|---|---|
AKSE 2 - Sekundær: Bestem faktorer som predikerer 6-måneders progresjon innen de første tre månedene av behandlingen.
Tidsramme: 3 måneder
|
A priori vil grupper definert for primærmål opprettholdes.
Faktorer som vurderes i løpet av de første tre månedene av behandlingen vil omfatte: kliniske og biologiske data, tilstedeværelse eller fravær av symptomer, gunstige faktorer eller komplikasjoner.
|
3 måneder
|
Samarbeidspartnere og etterforskere
Samarbeidspartnere
Etterforskere
- Studieleder: Jean-Noël POGGI, MD, Centre Hospitalier Intercommunal Toulon La Seyne sur Mer
Publikasjoner og nyttige lenker
Generelle publikasjoner
- Gal J, Bailleux C, Chardin D, Pourcher T, Gilhodes J, Jing L, Guigonis JM, Ferrero JM, Milano G, Mograbi B, Brest P, Chateau Y, Humbert O, Chamorey E. Comparison of unsupervised machine-learning methods to identify metabolomic signatures in patients with localized breast cancer. Comput Struct Biotechnol J. 2020 Jun 3;18:1509-1524. doi: 10.1016/j.csbj.2020.05.021. eCollection 2020.
- Gallo A, Valerio L, Barco S. The 2019 European guidelines on pulmonary embolism illustrated with the aid of an exemplary case report. Eur Heart J Case Rep. 2021 Jan 4;5(2):ytaa542. doi: 10.1093/ehjcr/ytaa542. eCollection 2021 Feb.
- Duffett L, Castellucci LA, Forgie MA. Pulmonary embolism: update on management and controversies. BMJ. 2020 Aug 5;370:m2177. doi: 10.1136/bmj.m2177.
- Yu T, Shen R, You G, Lv L, Kang S, Wang X, Xu J, Zhu D, Xia Z, Zheng J, Huang K. Machine learning-based prediction of the post-thrombotic syndrome: Model development and validation study. Front Cardiovasc Med. 2022 Sep 16;9:990788. doi: 10.3389/fcvm.2022.990788. eCollection 2022.
- Schiappa R, Contu S, Culie D, Chateau Y, Gal J, Pace-Loscos T, Bailleux C, Haudebourg J, Ferrero JM, Barranger E, Chamorey E. Validation of RUBY for Breast Cancer Knowledge Extraction From a Large French Electronic Medical Record System. JCO Clin Cancer Inform. 2023 May;7:e2200130. doi: 10.1200/CCI.22.00130.
Studierekorddatoer
Studer hoveddatoer
Studiestart (Faktiske)
Primær fullføring (Antatt)
Studiet fullført (Antatt)
Datoer for studieregistrering
Først innsendt
Først innsendt som oppfylte QC-kriteriene
Først lagt ut (Faktiske)
Oppdateringer av studieposter
Sist oppdatering lagt ut (Faktiske)
Siste oppdatering sendt inn som oppfylte QC-kriteriene
Sist bekreftet
Mer informasjon
Begreper knyttet til denne studien
Nøkkelord
Ytterligere relevante MeSH-vilkår
Andre studie-ID-numre
- 2023-CHITS-016
Plan for individuelle deltakerdata (IPD)
Planlegger du å dele individuelle deltakerdata (IPD)?
Legemiddel- og utstyrsinformasjon, studiedokumenter
Studerer et amerikansk FDA-regulert medikamentprodukt
Studerer et amerikansk FDA-regulert enhetsprodukt
Denne informasjonen ble hentet direkte fra nettstedet clinicaltrials.gov uten noen endringer. Hvis du har noen forespørsler om å endre, fjerne eller oppdatere studiedetaljene dine, vennligst kontakt register@clinicaltrials.gov. Så snart en endring er implementert på clinicaltrials.gov, vil denne også bli oppdatert automatisk på nettstedet vårt. .
Kliniske studier på Lungeemboli
-
Beijing Aerospace General HospitalFullførtSutur | Videoassistert thorakoskopisk kirurgi | Nodule, Solitary PulmonaryKina
-
Shenzhen Third People's HospitalFullførtPerifer Solitary Pulmonary Nodule eller TuberculomaKina
Kliniske studier på Hierarkiske klyngemetoder
-
Université de MontréalFullførtPrematur baby 26 til 32 ukerCanada
-
Yousheng XiaoHar ikke rekruttert ennå
-
Aydin Adnan Menderes UniversityHar ikke rekruttert ennå
-
Aydin Adnan Menderes UniversityHar ikke rekruttert ennåUtdanning | SykepleierstudenterTyrkia
-
Icahn School of Medicine at Mount SinaiNational Institute of Mental Health (NIMH)RekrutteringFørste episode psykose (FEP) | Klinisk høy risiko for psykose (CHR)Forente stater
-
Zuyderland Medisch CentrumAktiv, ikke rekrutterendeFraktur i øvre ekstremitet | Brudd i den distale enden av radius | Brudd i proksimal ende av Humerus | Fraktur i øvre lemNederland
-
Avacen, Inc.University of California, San Diego; San Diego Veterans Healthcare SystemFullførtFibromyalgiForente stater
-
University of Modena and Reggio EmiliaUkjentDemens | Grå stær | Senil grå stær | Mild kognitiv svikt | Post-Op komplikasjon | Delirium i alderdommen | Delirium Forvirringstilstand | Katarakt i alderdommenItalia
-
Istanbul UniversityAktiv, ikke rekrutterendeKarpaltunellsyndrom | Perifer nevropati | Median nerveklemmingTyrkia