- ICH GCP
- US Clinical Trials Registry
- Klinisk forsøg NCT06183944
Dataopsamlingsundersøgelse med kunstig intelligens og fænotypning af patienter med akut lungeemboli (PEPITE)
Dataopsamlingsundersøgelse med kunstig intelligens og fænotypning af patienter, der præsenterede med akut lungeemboli
Det oprindelige mål er at bygge og validere kunstig intelligens-værktøjer (maskinlæring og naturlig sprogbehandling) til at erhverve og strukturere data fra medicinske rapporter på Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS). Dette projekt vil bygge på arbejde tidligere udført af afdelingen for epidemiologi, biostatistik og sundhedsdata (DEBDS) ved Centre Antoine Lacassagne (CAL) i Nice, med fokus på bryst- og skjoldbruskkirtelkræft. Idéen er at validere overførbarheden af disse værktøjer til en anden virksomhed med forskellige patologier og praktiserende læger, specifikt den vaskulære medicinafdeling på CHITS.
Efterfølgende vil målet være at identificere klinisk relevante fænotyper hos patienter med akut lungeemboli. Hierarkiske klyngemetoder kombineret med uovervåget læring (machine learning) vil blive brugt til at opnå grupper af patienter, der er homogene ved diagnosticering. Evaluering af deres prognose efter 6 måneder (tilbagevendende eller kronisk tromboembolisk pulmonal hypertension), som tager højde for de første 3 måneder af antikoagulerende behandling, ville være en hjælp til medicinsk beslutningstagning.
Denne forskning vil omfatte en retrospektiv og en prospektiv del. Den retrospektive del vil omfatte patienter, der har været indlagt på CHITS for akut lungeemboli siden 2019. For den prospektive del er det planlagt at inkludere patienter med samme karakteristika i årene 2024 og 2025. Mere end 2.500 patienter forventes at blive inkluderet.
Denne forskning vil ikke have nogen indflydelse på den nuværende patientbehandling. Data fra konsultationer og forskellige undersøgelser udført som led i plejen vil blive indsamlet i seks måneder efter diagnosen for at opfylde forskningsmålene.
Studieoversigt
Status
Betingelser
Intervention / Behandling
Detaljeret beskrivelse
Kontekst:
Kunstig intelligens: NLP, klyngedannelse og uovervåget læring:
Artificial Intelligence (AI) er et felt, der kombinerer datalogi med datasæt, med det formål at gøre det muligt for en maskine at efterligne menneskets kognitive evner. Maskinlæring (ML) og dets underdomæne dyb læring, som bruger lag af neuroner, er to store underdomæner af AI. Forskellen ligger i træning af hver algoritme. To adskilte metoder bruges af ML: overvåget læring, som involverer træning af en model på kendte input- og outputdata til at forudsige fremtidige output, og uovervåget læring involverer opdagelsen af skjulte mønstre og iboende underliggende strukturer i inputdataene. Natural Language Processing (NLP) er også et underområde af AI, men det kræver generelt, at ML er effektiv. NLP behandler sproglige data fra den virkelige verden for at give mening ud af det på en måde, som en computer kan forstå.
NLP har to hovedfaser: dataforbehandling og algoritmeudvikling. Programmeringssprog som Python eller R er meget brugt til disse teknikker.
Formålet med klyngemetoder er at gruppere et sæt individer i homogene klasser. Ikke-hierarkiske metoder kan bruges til at klassificere massive data, men kræver på forhånd at fastsætte antallet af klasser. Hierarkiske metoder, som er mere tidskrævende at beregne, består af en række indlejrede partitioner repræsenteret af et klyngetræ. Det optimale antal klasser kan bestemmes efterfølgende ved at læse træet. I nærværelse af et stort antal individer er det almindeligt at kombinere ikke-hierarkiske og hierarkiske teknikker. Når klasserne ikke er klart kendte på forhånd, bruges klyngemetoder med uovervåget læring (ML) [1]. Datasæt er generelt opdelt i tre usammenhængende datasæt: træningsdata, der bruges til at træne den eller de valgte algoritmer; valideringsdata, der bruges til at kontrollere resultatets ydeevne; og testdata, der kun bruges i slutningen af processen.
Venøs tromboembolisk sygdom:
Venøs tromboembolisk sygdom (VTE) er en almindelig patologi, hvis forekomst er ufuldstændig kendt, men som stiger med alderen og når 1 % hos personer over 75 år. I Frankrig anslås det, at over 100.000 mennesker hvert år udvikler VTE, som er ansvarlig for mellem 5.000 og 10.000 dødsfald. Dyb venetrombose (DVT) og lungeemboli (PE) er de to hovedtyper af VTE. DVT svarer til delvis eller total okklusion af en dyb vene af en trombe, oftest lokaliseret i underekstremiteterne. PE er defineret som delvis eller total okklusion af lungearterierne eller deres forgreninger. Den største risiko for DVT er forekomsten af PE, som kan være livstruende. Andre VTE-specifikke komplikationer og mulige uønskede resultater omfatter tromboembolisk tilbagefald (enten DVT eller PE), kronisk tromboembolisk pulmonal hypertension og posttrombotisk syndrom i DVT. Den nuværende behandling af VTE er hovedsageligt baseret på antikoagulantbehandling. Behandlingsvarigheden varierer i henhold til den estimerede risiko for tilbagefald, hvis behandlingen seponeres, i det væsentlige afhængigt af, om der er en tidligere væsentlig risikofaktor [2]. I denne undergruppe af PE-patienter, i fravær af større risikofaktorer, anses risikoen for recidiv som mellemliggende og varierer alt efter, om hændelsen er en første episode eller et recidiv, og om der er obstruktive lungefølger eller ej [3]. For nylig er den terapeutiske strategi blevet mere kompleks, med inklusion af mindre risikofaktorer, der modulerer behandlingsvarigheden uden relevant evidens. Uanset behandlingens varighed er doseringen af antikoagulantia ud over den sjette måned desuden usikker for direkte orale antikoagulantia.
Hypoteser:
Denne forskning præsenteres under to adskilte akser:
AKSE 1: Målet med dette arbejde vil i første omgang være at udvikle og validere kunstig intelligens-værktøjer, ved hjælp af ML og NLP, til at indhente og strukturere data fra tekstbaserede medicinske rapporter i afdelingen for vaskulær medicin på Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS). Dette projekt vil bygge på arbejde tidligere udført af afdelingen for epidemiologi, biostatistik og sundhedsdata (DEBDS) ved Centre Antoine Lacassagne (CAL) med fokus på bryst- og skjoldbruskkirtelkræft [5,6,7]. Ideen er at validere overførbarheden af disse værktøjer til en anden virksomhed med forskellige patologier og praktiserende læger, specifikt den vaskulære medicinafdeling af CHITS.
Det er en udfordring at implementere en metode til at erhverve strukturerede data ved hjælp af kunstig intelligens-teknikker direkte fra tekstlige medicinske rapporter på vores hospital. Hvis dets ydeevne er bevist, og dette værktøj implementeres på en permanent rutinebasis, ville det være en let udnyttelig informationskilde. Mangfoldigheden af felter og interesser inden for klinisk forskning i vores virksomhed kan gøre indsættelse i andre afdelinger til et opnåeligt mål. For CHITS er dette det første skridt i processen med at bygge et Health Data Warehouse (HDW).
AKSE 2: Efterfølgende vil formålet være at bruge databasen til at identificere klinisk relevante fænotyper hos patienter med akut lungeemboli. Hierarkiske klyngemetoder kombineret med uovervåget læring (machine learning) vil blive brugt til at opnå grupper af patienter, der er homogene ved diagnosticering. Evaluering af deres prognose efter 6 måneder (tilbagevendende eller kronisk tromboembolisk pulmonal hypertension), som tager højde for de første 3 måneder af antikoagulerende behandling, ville være en hjælp til medicinsk beslutningstagning.
En analyse af den seks måneder lange udvikling af homogene patientgrupper med akut lungeemboli, konstrueret ved hjælp af klyngemetoder med uovervåget læring, er aldrig blevet udført før. Dette innovative projekt inden for en storstilet hospitalsinfrastruktur vil sandsynligvis tilbyde læger en beslutningstagningshjælp og patienter en videnskabeligt valideret form for terapeutisk ledelse.
Materialer og metoder :
Denne forskning vil omfatte en retrospektiv og en prospektiv del. Den retrospektive del vil omfatte patienter, der har været indlagt på CHITS for akut lungeemboli siden 2019 (omkring 1900 patienter). For den prospektive del er det planlagt at inkludere patienter med samme karakteristika i årene 2024 og 2025 (ca. 765 patienter). Hvis individuelle oplysninger ikke er tilgængelige, eller de gør indsigelse mod behandlingen af deres data for 25 % af patienterne, kan en stor mængde data om over 2.500 patienter potentielt analyseres i dette forsøg. Denne forskning vil ikke have nogen indflydelse på den nuværende patientbehandling. Data fra konsultationer og forskellige undersøgelser udført som led i plejen vil blive indsamlet i seks måneder efter diagnosen for at opfylde forskningsmålene.
AKSE 1: Den dataindsamlingsmetode, der anvendes i denne forskning, vil være todelt. Data fra patienter, der indgår i klinisk forskning, vil blive indsamlet konventionelt ved hjælp af en case-rapportformular, derefter centraliseret og organiseret i en referencedatabase kaldet "Gold Standard", og indtastet af en klinisk forskningstekniker. Den anden teknik til dataindsamling, ved hjælp af NLP-metoder, vil forløbe i flere faser, parallelt med tidligere tilgang. For det første vil udtrækningen af medicinske rapporter (MR) i tekstformat blive efterfulgt af en pseudonymiseringsfase. MR-datasættet vil derefter blive forberedt til træning og validering ved at fjerne specialtegn og identificere interessesegmenter. Derefter vil MR blive kommenteret med BRAT for at identificere de termer, der vil blive brugt til at udfylde databasen. Træningsscripts vil blive anvendt på 70 % af patienterne for at skabe NLP-modeller. I løbet af denne træningsfase vil efterbehandlingsmedicinske regler blive skrevet for at omsætte den information, som modellerne identificerer, til strukturerede data. Det således færdiggjorte script påføres valideringsgrundlaget med en evaluering af dets ydeevne. Efter eventuelle nødvendige justeringer evalueres ydeevnen af det endelige script på testdatabasen. Ydeevnen vil blive vurderet ved at sammenligne data opnået automatisk med den manuelle Gold Standard-database.
AKSE 2: Uovervågede klyngemetoder anvendt i denne undersøgelse kombinerer hierarkiske og ikke-hierarkiske metoder. Efter den hierarkiske stigende klyngedannelse, bruges Wards indeks til at bestemme antallet af interessegrupper. Centroiderne af disse grupper anses derefter for at initialisere en partitioneringsalgoritme, såsom k-middelalgoritmen. Når de fleste medicinsk relevante grupper er blevet bestemt, sammenlignes seks måneders udvikling (stabil, forværring eller fremskridt). Faktorer, der påvirker progressionen i løbet af de første tre måneder af behandlingen, kan også indgå i en statistisk model, afhængigt af deres evne til at forudsige forværring. Alle disse udforskninger skulle danne grundlag for medicinsk beslutningstagning.
Undersøgelsestype
Tilmelding (Anslået)
Kontakter og lokationer
Studiekontakt
- Navn: Sophie Lafond
- Telefonnummer: +33 04 83 77 20 62
- E-mail: sophie.lafond@ch-toulon.fr
Undersøgelse Kontakt Backup
- Navn: Jean-Philippe Suppini
- Telefonnummer: +33 04 94 14 55 25
- E-mail: recherche.promotion@ch-toulon.fr
Studiesteder
-
-
-
Toulon, Frankrig, 83100
- Rekruttering
- centre hospitalier intercommunal Toulon La Seyne sur Mer - Internal and vascular medicine
-
Kontakt:
- Jean-Noël POGGI, MD
- Telefonnummer: +33 04 94 14 57 87
- E-mail: jeannoel.poggi@ch-toulon.fr
-
-
Deltagelseskriterier
Berettigelseskriterier
Aldre berettiget til at studere
- Voksen
- Ældre voksen
Tager imod sunde frivillige
Prøveudtagningsmetode
Studiebefolkning
Beskrivelse
Inklusionskriterier:
- Alder ≥ 18 år;
- Patient med akut lungeemboli i CHITS (indlagt eller ej).
Ekskluderingskriterier:
- Sub-segmentelle lungeemboli;
- Tålmodig modstand.
Studieplan
Hvordan er undersøgelsen tilrettelagt?
Design detaljer
Kohorter og interventioner
Gruppe / kohorte |
Intervention / Behandling |
|---|---|
|
Patient med akut lungeemboli
Patient med akut lungeemboli i Centre Hospitalier Intercommunal Toulon La Seyne sur Mer, indlagt eller ej siden 2019
|
Hierarkiske klyngemetoder vil blive brugt til at danne homogene grupper af patienter baseret på deres data ved diagnosen: tilstedeværelse eller fravær af symptomer, kliniske og biologiske data og tilstedeværelse eller fravær af begunstigende faktorer.
Patientudvikling efter 6 måneder kan falde i kategorier: stabil, forværring eller fremskridt, som bestemmes af hændelser såsom tilbagefald, blødning, funktionelle følgesygdomme eller død.
|
Hvad måler undersøgelsen?
Primære resultatmål
Resultatmål |
Foranstaltningsbeskrivelse |
Tidsramme |
|---|---|---|
|
Primær: Identificer homogene grupper af patienter baseret på deres medicinske egenskaber ved diagnose, og sammenlign derefter deres udvikling efter 6 måneder.
Tidsramme: 6 måneder
|
Hierarkiske klyngemetoder vil blive brugt til at danne homogene grupper af patienter baseret på deres data ved diagnose: tilstedeværelse eller fravær af symptomer, kliniske og biologiske data og tilstedeværelse eller fravær af favoriserende faktorer.
Patientudvikling efter 6 måneder kan falde i kategorier: stabil, forværring eller fremskridt, som bestemmes af begivenheder som gentagelse, blødning, funktionelle følger eller død.
|
6 måneder
|
Sekundære resultatmål
Resultatmål |
Foranstaltningsbeskrivelse |
Tidsramme |
|---|---|---|
|
Sekundær: Bestem faktorer, der er forudsigelig for 6-måneders progression inden for de første tre måneder efter behandlingen.
Tidsramme: 3 måneder
|
En priori, grupper defineret for det primære mål vil blive opretholdt.
Faktorer, der overvejes i løbet af de første tre måneder af behandlingen, vil omfatte: kliniske og biologiske data, tilstedeværelse eller fravær af symptomer, gunstige faktorer eller komplikationer.
|
3 måneder
|
Samarbejdspartnere og efterforskere
Samarbejdspartnere
Efterforskere
- Studieleder: Jean-Noël POGGI, MD, Centre Hospitalier Intercommunal Toulon La Seyne sur Mer
Publikationer og nyttige links
Generelle publikationer
- Gal J, Bailleux C, Chardin D, Pourcher T, Gilhodes J, Jing L, Guigonis JM, Ferrero JM, Milano G, Mograbi B, Brest P, Chateau Y, Humbert O, Chamorey E. Comparison of unsupervised machine-learning methods to identify metabolomic signatures in patients with localized breast cancer. Comput Struct Biotechnol J. 2020 Jun 3;18:1509-1524. doi: 10.1016/j.csbj.2020.05.021. eCollection 2020.
- Gallo A, Valerio L, Barco S. The 2019 European guidelines on pulmonary embolism illustrated with the aid of an exemplary case report. Eur Heart J Case Rep. 2021 Jan 4;5(2):ytaa542. doi: 10.1093/ehjcr/ytaa542. eCollection 2021 Feb.
- Duffett L, Castellucci LA, Forgie MA. Pulmonary embolism: update on management and controversies. BMJ. 2020 Aug 5;370:m2177. doi: 10.1136/bmj.m2177.
- Yu T, Shen R, You G, Lv L, Kang S, Wang X, Xu J, Zhu D, Xia Z, Zheng J, Huang K. Machine learning-based prediction of the post-thrombotic syndrome: Model development and validation study. Front Cardiovasc Med. 2022 Sep 16;9:990788. doi: 10.3389/fcvm.2022.990788. eCollection 2022.
Datoer for undersøgelser
Studer store datoer
Studiestart (Faktiske)
Primær færdiggørelse (Anslået)
Studieafslutning (Anslået)
Datoer for studieregistrering
Først indsendt
Først indsendt, der opfyldte QC-kriterier
Først opslået (Faktiske)
Opdateringer af undersøgelsesjournaler
Sidste opdatering sendt (Faktiske)
Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier
Sidst verificeret
Mere information
Begreber relateret til denne undersøgelse
Yderligere relevante MeSH-vilkår
Andre undersøgelses-id-numre
- 2023-CHITS-016
Plan for individuelle deltagerdata (IPD)
Planlægger du at dele individuelle deltagerdata (IPD)?
Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter
Studerer et amerikansk FDA-reguleret lægemiddelprodukt
Studerer et amerikansk FDA-reguleret enhedsprodukt
Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .
Kliniske forsøg med Hierarkiske klyngemetoder
-
Maastricht University Medical CenterAfsluttetDyspepsi | Dyspepsi og andre specificerede forstyrrelser i mavens funktionHolland
-
Aydin Adnan Menderes UniversityIkke rekrutterer endnuUddannelse | Sygeplejestuderende
-
Aydin Adnan Menderes UniversityIkke rekrutterer endnu
-
Aydin Adnan Menderes UniversityIkke rekrutterer endnuUddannelse | SygeplejestuderendeKalkun
-
Sarah Wragge WellnessAfsluttetMetabolisk syndrom | Fedme & Overvægt | Forebyggelse af type 2 diabetes | Overvågning af blodsukkerForenede Stater
-
University Diego PortalesIkke rekrutterer endnu
-
Zuyderland Medisch CentrumAfsluttetFraktur i øvre ekstremitet | Brud i den distale ende af radius | Brud af proksimale ende af Humerus | Fraktur af øvre lemmerHolland
-
Avacen, Inc.University of California, San Diego; San Diego Veterans Healthcare SystemAfsluttetFibromyalgiForenede Stater
-
Assistance Publique - Hôpitaux de ParisAfsluttet