Denne siden ble automatisk oversatt og nøyaktigheten av oversettelsen er ikke garantert. Vennligst referer til engelsk versjon for en kildetekst.

Datainnsamlingsstudie med kunstig intelligens og fenotyping av pasienter med akutt lungeemboli (PEPITE)

Datainnsamlingsstudie med kunstig intelligens og fenotyping av pasienter som presenterte med akutt lungeemboli

Det første målet er å bygge og validere kunstig intelligensverktøy (maskinlæring og naturlig språkbehandling) for å skaffe og strukturere data fra medisinske rapporter ved Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS). Dette prosjektet vil bygge på arbeid tidligere utført av Institutt for epidemiologi, biostatistikk og helsedata (DEBDS) ved Centre Antoine Lacassagne (CAL) i Nice, med fokus på bryst- og skjoldbruskkjertelkreft. Tanken er å validere overførbarheten av disse verktøyene til en annen virksomhet med forskjellige patologier og utøvere, nærmere bestemt den vaskulære medisinavdelingen ved CHITS.

Deretter vil målet være å identifisere klinisk relevante fenotyper hos pasienter med akutt lungeemboli. Hierarkiske klyngemetoder kombinert med uovervåket læring (maskinlæring) vil bli brukt for å oppnå grupper av pasienter som er homogene ved diagnose. Evaluering av prognosen deres etter 6 måneder (residiv eller kronisk tromboembolisk pulmonal hypertensjon), med tanke på de første 3 månedene med antikoagulantbehandling, vil hjelpe til med medisinske beslutninger.

Denne forskningen vil inkludere en retrospektiv og en prospektiv del. Den retrospektive delen vil inkludere pasienter som har vært innlagt på CHITS for akutt lungeemboli siden 2019. For den prospektive delen er det planlagt å inkludere pasienter med samme egenskaper over årene 2024 og 2025. Mer enn 2500 pasienter forventes å bli inkludert.

Denne forskningen vil ikke ha noen innvirkning på dagens pasientbehandling. Data fra konsultasjoner og ulike undersøkelser utført som ledd i omsorgen vil bli samlet inn i seks måneder etter diagnose for å oppfylle forskningsmålene.

Studieoversikt

Status

Rekruttering

Forhold

Intervensjon / Behandling

Detaljert beskrivelse

Kontekst:

Kunstig intelligens: NLP, clustering og uovervåket læring:

Artificial Intelligence (AI) er et felt som kombinerer informatikk med datasett, med mål om å gjøre det mulig for en maskin å etterligne menneskets kognitive evner. Maskinlæring (ML) og dets underdomene dyplæring, som bruker lag av nevroner, er to store underdomener av AI. Forskjellen ligger i trening av hver algoritme. To utmerkede metoder brukes av ML: overvåket læring, som innebærer å trene en modell på kjente input- og outputdata for å forutsi fremtidige utdata, og uovervåket læring involverer oppdagelsen av skjulte mønstre og iboende underliggende strukturer i inputdataene. Natural Language Processing (NLP) er også et underfelt av AI, men det krever generelt at ML er effektiv. NLP behandler lingvistiske data fra den virkelige verden for å forstå dem på en måte som en datamaskin kan forstå.

NLP har to hovedtrinn: dataforbehandling og algoritmeutvikling. Programmeringsspråk som Python eller R er mye brukt for disse teknikkene.

Målet med klyngemetoder er å gruppere et sett med individer i homogene klasser. Ikke-hierarkiske metoder kan brukes til å klassifisere massive data, men krever å fikse antallet klasser på forhånd. Hierarkiske metoder, som er mer tidkrevende å beregne, består av en serie nestede partisjoner representert av et grupperingstre. Det optimale antallet klasser kan bestemmes i etterkant ved å lese treet. I nærvær av et stort antall individer er det vanlig å kombinere ikke-hierarkiske og hierarkiske teknikker. Når klasser ikke er klart kjent på forhånd, brukes klyngemetoder med uovervåket læring (ML) [1]. Datasett er generelt delt inn i tre usammenhengende datasett: treningsdata, brukt til å trene den(e) valgte algoritmen(e); valideringsdata, brukt til å sjekke ytelsen til resultatet; og testdata, kun brukt på slutten av prosessen.

Venøs tromboembolisk sykdom:

Venøs tromboembolisk sykdom (VTE) er en vanlig patologi hvis forekomst er ufullkommen kjent, men øker med alderen og når 1 % hos personer over 75 år. I Frankrike anslås det at hvert år utvikler over 100 000 mennesker VTE, som er ansvarlig for mellom 5 000 og 10 000 dødsfall. Dyp venetrombose (DVT) og lungeemboli (PE) er de to hovedtypene av VTE. DVT tilsvarer delvis eller total okklusjon av en dyp vene av en trombe, oftest lokalisert i underekstremitetene. PE er definert som delvis eller total okklusjon av lungearteriene eller deres forgreninger. Hovedrisikoen for DVT er forekomsten av PE, som kan være livstruende. Andre VTE-spesifikke komplikasjoner og mulige uønskede utfall inkluderer tromboembolisk tilbakefall (enten DVT eller PE), kronisk tromboembolisk pulmonal hypertensjon og posttrombotisk syndrom ved DVT. Dagens behandling av VTE er hovedsakelig basert på antikoagulantbehandling. Behandlingsvarigheten varierer i henhold til den estimerte risikoen for tilbakefall dersom behandlingen avbrytes, hovedsakelig avhengig av om det er en tidligere stor risikofaktor eller ikke [2]. I denne undergruppen av PE-pasienter, i fravær av store risikofaktorer, anses risiko for tilbakefall som middels og varierer etter om hendelsen er en første episode eller et tilbakefall, og om det er obstruktive lungefølger eller ikke [3]. Nylig har den terapeutiske strategien blitt mer kompleks, med inkludering av mindre risikofaktorer som modulerer behandlingsvarigheten uten relevant bevis. Dessuten, uavhengig av behandlingens varighet, er doseringen av antikoagulasjon utover den sjette måneden usikker for direkte orale antikoagulantia.

Hypoteser :

Denne forskningen presenteres under to distinkte akser:

AKSE 1: Målet med dette arbeidet vil i første omgang være å utvikle og validere kunstig intelligensverktøy, ved bruk av ML og NLP, for å innhente og strukturere data fra tekstbaserte medisinske rapporter ved avdelingen for vaskulær medisin ved Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS). Dette prosjektet vil bygge på arbeid tidligere utført av Institutt for epidemiologi, biostatistikk og helsedata (DEBDS) ved Centre Antoine Lacassagne (CAL) med fokus på bryst- og skjoldbruskkjertelkreft [5,6,7]. Tanken er å validere overførbarheten av disse verktøyene til en annen virksomhet med forskjellige patologier og utøvere, spesielt den vaskulære medisinavdelingen til CHITS.

Å implementere en metode for å innhente strukturerte data ved hjelp av kunstig intelligens-teknikker direkte fra tekstlige medisinske rapporter på sykehuset vårt er en utfordring. Hvis ytelsen er bevist og dette verktøyet implementeres på en permanent rutinebasis, vil det være en lett utnyttelig informasjonskilde. Mangfoldet av felt og interesser innen klinisk forskning i vår virksomhet kan gjøre utplassering i andre avdelinger til et oppnåelig mål. For CHITS er dette det første trinnet i prosessen med å bygge et helsedatavarehus (HDW).

AKSE 2: Deretter vil målet være å bruke databasen til å identifisere klinisk relevante fenotyper hos pasienter med akutt lungeemboli. Hierarkiske klyngemetoder kombinert med uovervåket læring (maskinlæring) vil bli brukt for å oppnå grupper av pasienter som er homogene ved diagnose. Evaluering av prognosen deres etter 6 måneder (residiv eller kronisk tromboembolisk pulmonal hypertensjon), med tanke på de første 3 månedene med antikoagulantbehandling, vil hjelpe til med medisinske beslutninger.

En analyse av den seks måneder lange utviklingen av homogene pasientgrupper med akutt lungeemboli, konstruert ved bruk av klyngemetoder med uovervåket læring, har aldri blitt utført før. Dette innovative prosjektet innenfor en storstilt sykehusinfrastruktur vil sannsynligvis tilby leger en beslutningshjelp, og pasienter en vitenskapelig validert form for terapeutisk ledelse.

Materialer og metoder :

Denne forskningen vil inkludere en retrospektiv og en prospektiv del. Den retrospektive delen vil inkludere pasienter som har vært innlagt på CHITS for akutt lungeemboli siden 2019 (rundt 1900 pasienter). For den prospektive delen er det planlagt å inkludere pasienter med samme egenskaper i årene 2024 og 2025 (ca. 765 pasienter). Hvis individuell informasjon ikke er tilgjengelig eller de protesterer mot behandlingen av dataene deres for 25 % av pasientene, kan et stort datavolum om over 2500 pasienter potensielt analyseres i denne studien. Denne forskningen vil ikke ha noen innvirkning på dagens pasientbehandling. Data fra konsultasjoner og ulike undersøkelser utført som en del av omsorgen vil bli samlet inn i seks måneder etter diagnose for å oppfylle forskningsmålene.

AKSE 1: Datainnsamlingsmetoden som brukes i denne forskningen vil være todelt. Data fra pasienter som inngår i klinisk forskning vil bli samlet inn på vanlig måte ved hjelp av et case-rapportskjema, deretter sentralisert og organisert i en referansedatabase kalt "Gold Standard", og lagt inn av en klinisk forskningstekniker. Den andre teknikken for datainnsamling, ved bruk av NLP-metoder, vil foregå i flere stadier, parallelt med tidligere tilnærming. Først vil utvinningen av medisinske rapporter (MR) i tekstformat bli fulgt av et pseudonymiseringsstadium. MR-datasettet vil deretter forberedes for opplæring og validering ved å fjerne spesialtegn og identifisere interessesegmenter. Deretter vil MR bli kommentert med BRAT for å identifisere begrepene som vil bli brukt for å fylle ut databasen. Opplæringsskript vil bli brukt på 70 % av pasientene for å lage NLP-modeller. I løpet av denne opplæringsfasen vil etterbehandlingsmedisinske regler bli skrevet for å oversette informasjonen identifisert av modellene til strukturerte data. Skriptet som er ferdigstilt, blir brukt på valideringsbasen med en evaluering av ytelsen. Etter eventuelle nødvendige justeringer, blir ytelsen til det endelige skriptet evaluert på testdatabasen. Ytelsen vil bli vurdert ved å sammenligne data innhentet automatisk med den manuelle Gold Standard-databasen.

AKSE 2: Uovervåket klyngemetoder brukt i denne studien kombinerer hierarkiske og ikke-hierarkiske metoder. Etter den hierarkiske stigende klyngingen, brukes Wards indeks for å bestemme antall interessegrupper. Sentroidene til disse gruppene anses deretter for å initialisere en partisjoneringsalgoritme, slik som k-middelalgoritmen. Når de fleste medisinsk relevante grupper er bestemt, sammenlignes seks måneders evolusjon (stabil, forverring eller fremgang). Faktorer som påvirker progresjon i løpet av de første tre månedene av behandlingen kan også inkluderes i en statistisk modell, avhengig av deres evne til å forutsi forverring. Alle disse undersøkelsene skal gi grunnlag for medisinske beslutninger.

Studietype

Observasjonsmessig

Registrering (Antatt)

2500

Kontakter og plasseringer

Denne delen inneholder kontaktinformasjon for de som utfører studien, og informasjon om hvor denne studien blir utført.

Studiekontakt

Studer Kontakt Backup

Studiesteder

      • Toulon, Frankrike, 83100
        • Rekruttering
        • centre hospitalier intercommunal Toulon La Seyne sur Mer - Internal and vascular medicine
        • Ta kontakt med:

Deltakelseskriterier

Forskere ser etter personer som passer til en bestemt beskrivelse, kalt kvalifikasjonskriterier. Noen eksempler på disse kriteriene er en persons generelle helsetilstand eller tidligere behandlinger.

Kvalifikasjonskriterier

Alder som er kvalifisert for studier

  • Voksen
  • Eldre voksen

Tar imot friske frivillige

Nei

Prøvetakingsmetode

Ikke-sannsynlighetsprøve

Studiepopulasjon

Denne forskningen vil inkludere en retrospektiv og en prospektiv del. Den retrospektive delen vil inkludere pasienter som har vært innlagt på CHITS for akutt lungeemboli siden 2019 (rundt 1900 pasienter). For den prospektive delen er det planlagt å inkludere pasienter med samme egenskaper over årene 2024 og 2025.

Beskrivelse

Inklusjonskriterier:

  • Alder ≥ 18 år;
  • Pasient med akutt lungeemboli i CHITS (innlagt på sykehus eller ikke).

Ekskluderingskriterier:

  • Sub-segmentelle lungeemboli ;
  • Tålmodig motstand.

Studieplan

Denne delen gir detaljer om studieplanen, inkludert hvordan studien er utformet og hva studien måler.

Hvordan er studiet utformet?

Designdetaljer

Kohorter og intervensjoner

Gruppe / Kohort
Intervensjon / Behandling
Pasient med akutt lungeemboli
Pasient med akutt lungeemboli i Centre Hospitalier Intercommunal Toulon La Seyne sur Mer, innlagt eller ikke siden 2019
Hierarkiske grupperingsmetoder vil bli brukt for å danne homogene grupper av pasienter basert på deres data ved diagnose: tilstedeværelse eller fravær av symptomer, kliniske og biologiske data, og tilstedeværelse eller fravær av begunstigende faktorer. Pasientutvikling etter 6 måneder kan falle inn i kategorier: stabil, forverring eller fremgang, som bestemmes av hendelser som tilbakefall, blødning, funksjonelle følgetilstander eller død.

Hva måler studien?

Primære resultatmål

Resultatmål
Tiltaksbeskrivelse
Tidsramme
AXIS 1 - Primær: Utvikle et robust verktøy for å innhente strukturerte data direkte fra tekstbaserte medisinske rapporter
Tidsramme: 30 måneder
Verktøyet skal implementeres ved hjelp av NLP-metoder, hovedsakelig utviklet i PYTHON. Ytelsen til det implementerte verktøyet vil bli evaluert ved å sammenligne data generert av dette verktøyet med data som legges inn manuelt ('Gold Standard' database).
30 måneder
AKSE 2 - Primær: Identifiser homogene grupper av pasienter basert på deres medisinske egenskaper ved diagnose, og sammenlign deretter utviklingen deres etter 6 måneder.
Tidsramme: 6 måneder
Hierarkiske grupperingsmetoder vil bli brukt for å danne homogene grupper av pasienter basert på deres data ved diagnose: tilstedeværelse eller fravær av symptomer, kliniske og biologiske data, og tilstedeværelse eller fravær av begunstigende faktorer. Pasientutvikling etter 6 måneder kan falle inn i kategorier: stabil, forverring eller fremgang, som bestemmes av hendelser som tilbakefall, blødning, funksjonelle følgetilstander eller død.
6 måneder

Sekundære resultatmål

Resultatmål
Tiltaksbeskrivelse
Tidsramme
AKSE 2 - Sekundær: Bestem faktorer som predikerer 6-måneders progresjon innen de første tre månedene av behandlingen.
Tidsramme: 3 måneder
A priori vil grupper definert for primærmål opprettholdes. Faktorer som vurderes i løpet av de første tre månedene av behandlingen vil omfatte: kliniske og biologiske data, tilstedeværelse eller fravær av symptomer, gunstige faktorer eller komplikasjoner.
3 måneder

Samarbeidspartnere og etterforskere

Det er her du vil finne personer og organisasjoner som er involvert i denne studien.

Samarbeidspartnere

Etterforskere

  • Studieleder: Jean-Noël POGGI, MD, Centre Hospitalier Intercommunal Toulon La Seyne sur Mer

Publikasjoner og nyttige lenker

Den som er ansvarlig for å legge inn informasjon om studien leverer frivillig disse publikasjonene. Disse kan handle om alt relatert til studiet.

Studierekorddatoer

Disse datoene sporer fremdriften for innsending av studieposter og sammendragsresultater til ClinicalTrials.gov. Studieposter og rapporterte resultater gjennomgås av National Library of Medicine (NLM) for å sikre at de oppfyller spesifikke kvalitetskontrollstandarder før de legges ut på det offentlige nettstedet.

Studer hoveddatoer

Studiestart (Faktiske)

11. desember 2023

Primær fullføring (Antatt)

1. juli 2026

Studiet fullført (Antatt)

1. juli 2026

Datoer for studieregistrering

Først innsendt

13. desember 2023

Først innsendt som oppfylte QC-kriteriene

26. desember 2023

Først lagt ut (Faktiske)

28. desember 2023

Oppdateringer av studieposter

Sist oppdatering lagt ut (Faktiske)

2. april 2024

Siste oppdatering sendt inn som oppfylte QC-kriteriene

29. mars 2024

Sist bekreftet

1. mars 2024

Mer informasjon

Begreper knyttet til denne studien

Plan for individuelle deltakerdata (IPD)

Planlegger du å dele individuelle deltakerdata (IPD)?

NEI

Legemiddel- og utstyrsinformasjon, studiedokumenter

Studerer et amerikansk FDA-regulert medikamentprodukt

Nei

Studerer et amerikansk FDA-regulert enhetsprodukt

Nei

Denne informasjonen ble hentet direkte fra nettstedet clinicaltrials.gov uten noen endringer. Hvis du har noen forespørsler om å endre, fjerne eller oppdatere studiedetaljene dine, vennligst kontakt register@clinicaltrials.gov. Så snart en endring er implementert på clinicaltrials.gov, vil denne også bli oppdatert automatisk på nettstedet vårt. .

Kliniske studier på Lungeemboli

Kliniske studier på Hierarkiske klyngemetoder

3
Abonnere