Denne side blev automatisk oversat, og nøjagtigheden af ​​oversættelsen er ikke garanteret. Der henvises til engelsk version for en kildetekst.

Dataopsamlingsundersøgelse med kunstig intelligens og fænotypning af patienter med akut lungeemboli (PEPITE)

Dataopsamlingsundersøgelse med kunstig intelligens og fænotypning af patienter, der præsenterede med akut lungeemboli

Det oprindelige mål er at bygge og validere kunstig intelligens-værktøjer (maskinlæring og naturlig sprogbehandling) til at erhverve og strukturere data fra medicinske rapporter på Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS). Dette projekt vil bygge på arbejde tidligere udført af afdelingen for epidemiologi, biostatistik og sundhedsdata (DEBDS) ved Centre Antoine Lacassagne (CAL) i Nice, med fokus på bryst- og skjoldbruskkirtelkræft. Idéen er at validere overførbarheden af ​​disse værktøjer til en anden virksomhed med forskellige patologier og praktiserende læger, specifikt den vaskulære medicinafdeling på CHITS.

Efterfølgende vil målet være at identificere klinisk relevante fænotyper hos patienter med akut lungeemboli. Hierarkiske klyngemetoder kombineret med uovervåget læring (machine learning) vil blive brugt til at opnå grupper af patienter, der er homogene ved diagnosticering. Evaluering af deres prognose efter 6 måneder (tilbagevendende eller kronisk tromboembolisk pulmonal hypertension), som tager højde for de første 3 måneder af antikoagulerende behandling, ville være en hjælp til medicinsk beslutningstagning.

Denne forskning vil omfatte en retrospektiv og en prospektiv del. Den retrospektive del vil omfatte patienter, der har været indlagt på CHITS for akut lungeemboli siden 2019. For den prospektive del er det planlagt at inkludere patienter med samme karakteristika i årene 2024 og 2025. Mere end 2.500 patienter forventes at blive inkluderet.

Denne forskning vil ikke have nogen indflydelse på den nuværende patientbehandling. Data fra konsultationer og forskellige undersøgelser udført som led i plejen vil blive indsamlet i seks måneder efter diagnosen for at opfylde forskningsmålene.

Studieoversigt

Status

Rekruttering

Betingelser

Intervention / Behandling

Detaljeret beskrivelse

Kontekst:

Kunstig intelligens: NLP, klyngedannelse og uovervåget læring:

Artificial Intelligence (AI) er et felt, der kombinerer datalogi med datasæt, med det formål at gøre det muligt for en maskine at efterligne menneskets kognitive evner. Maskinlæring (ML) og dets underdomæne dyb læring, som bruger lag af neuroner, er to store underdomæner af AI. Forskellen ligger i træning af hver algoritme. To adskilte metoder bruges af ML: overvåget læring, som involverer træning af en model på kendte input- og outputdata til at forudsige fremtidige output, og uovervåget læring involverer opdagelsen af ​​skjulte mønstre og iboende underliggende strukturer i inputdataene. Natural Language Processing (NLP) er også et underområde af AI, men det kræver generelt, at ML er effektiv. NLP behandler sproglige data fra den virkelige verden for at give mening ud af det på en måde, som en computer kan forstå.

NLP har to hovedfaser: dataforbehandling og algoritmeudvikling. Programmeringssprog som Python eller R er meget brugt til disse teknikker.

Formålet med klyngemetoder er at gruppere et sæt individer i homogene klasser. Ikke-hierarkiske metoder kan bruges til at klassificere massive data, men kræver på forhånd at fastsætte antallet af klasser. Hierarkiske metoder, som er mere tidskrævende at beregne, består af en række indlejrede partitioner repræsenteret af et klyngetræ. Det optimale antal klasser kan bestemmes efterfølgende ved at læse træet. I nærværelse af et stort antal individer er det almindeligt at kombinere ikke-hierarkiske og hierarkiske teknikker. Når klasserne ikke er klart kendte på forhånd, bruges klyngemetoder med uovervåget læring (ML) [1]. Datasæt er generelt opdelt i tre usammenhængende datasæt: træningsdata, der bruges til at træne den eller de valgte algoritmer; valideringsdata, der bruges til at kontrollere resultatets ydeevne; og testdata, der kun bruges i slutningen af ​​processen.

Venøs tromboembolisk sygdom:

Venøs tromboembolisk sygdom (VTE) er en almindelig patologi, hvis forekomst er ufuldstændig kendt, men som stiger med alderen og når 1 % hos personer over 75 år. I Frankrig anslås det, at over 100.000 mennesker hvert år udvikler VTE, som er ansvarlig for mellem 5.000 og 10.000 dødsfald. Dyb venetrombose (DVT) og lungeemboli (PE) er de to hovedtyper af VTE. DVT svarer til delvis eller total okklusion af en dyb vene af en trombe, oftest lokaliseret i underekstremiteterne. PE er defineret som delvis eller total okklusion af lungearterierne eller deres forgreninger. Den største risiko for DVT er forekomsten af ​​PE, som kan være livstruende. Andre VTE-specifikke komplikationer og mulige uønskede resultater omfatter tromboembolisk tilbagefald (enten DVT eller PE), kronisk tromboembolisk pulmonal hypertension og posttrombotisk syndrom i DVT. Den nuværende behandling af VTE er hovedsageligt baseret på antikoagulantbehandling. Behandlingsvarigheden varierer i henhold til den estimerede risiko for tilbagefald, hvis behandlingen seponeres, i det væsentlige afhængigt af, om der er en tidligere væsentlig risikofaktor [2]. I denne undergruppe af PE-patienter, i fravær af større risikofaktorer, anses risikoen for recidiv som mellemliggende og varierer alt efter, om hændelsen er en første episode eller et recidiv, og om der er obstruktive lungefølger eller ej [3]. For nylig er den terapeutiske strategi blevet mere kompleks, med inklusion af mindre risikofaktorer, der modulerer behandlingsvarigheden uden relevant evidens. Uanset behandlingens varighed er doseringen af ​​antikoagulantia ud over den sjette måned desuden usikker for direkte orale antikoagulantia.

Hypoteser:

Denne forskning præsenteres under to adskilte akser:

AKSE 1: Målet med dette arbejde vil i første omgang være at udvikle og validere kunstig intelligens-værktøjer, ved hjælp af ML og NLP, til at indhente og strukturere data fra tekstbaserede medicinske rapporter i afdelingen for vaskulær medicin på Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS). Dette projekt vil bygge på arbejde tidligere udført af afdelingen for epidemiologi, biostatistik og sundhedsdata (DEBDS) ved Centre Antoine Lacassagne (CAL) med fokus på bryst- og skjoldbruskkirtelkræft [5,6,7]. Ideen er at validere overførbarheden af ​​disse værktøjer til en anden virksomhed med forskellige patologier og praktiserende læger, specifikt den vaskulære medicinafdeling af CHITS.

Det er en udfordring at implementere en metode til at erhverve strukturerede data ved hjælp af kunstig intelligens-teknikker direkte fra tekstlige medicinske rapporter på vores hospital. Hvis dets ydeevne er bevist, og dette værktøj implementeres på en permanent rutinebasis, ville det være en let udnyttelig informationskilde. Mangfoldigheden af ​​felter og interesser inden for klinisk forskning i vores virksomhed kan gøre indsættelse i andre afdelinger til et opnåeligt mål. For CHITS er dette det første skridt i processen med at bygge et Health Data Warehouse (HDW).

AKSE 2: Efterfølgende vil formålet være at bruge databasen til at identificere klinisk relevante fænotyper hos patienter med akut lungeemboli. Hierarkiske klyngemetoder kombineret med uovervåget læring (machine learning) vil blive brugt til at opnå grupper af patienter, der er homogene ved diagnosticering. Evaluering af deres prognose efter 6 måneder (tilbagevendende eller kronisk tromboembolisk pulmonal hypertension), som tager højde for de første 3 måneder af antikoagulerende behandling, ville være en hjælp til medicinsk beslutningstagning.

En analyse af den seks måneder lange udvikling af homogene patientgrupper med akut lungeemboli, konstrueret ved hjælp af klyngemetoder med uovervåget læring, er aldrig blevet udført før. Dette innovative projekt inden for en storstilet hospitalsinfrastruktur vil sandsynligvis tilbyde læger en beslutningstagningshjælp og patienter en videnskabeligt valideret form for terapeutisk ledelse.

Materialer og metoder :

Denne forskning vil omfatte en retrospektiv og en prospektiv del. Den retrospektive del vil omfatte patienter, der har været indlagt på CHITS for akut lungeemboli siden 2019 (omkring 1900 patienter). For den prospektive del er det planlagt at inkludere patienter med samme karakteristika i årene 2024 og 2025 (ca. 765 patienter). Hvis individuelle oplysninger ikke er tilgængelige, eller de gør indsigelse mod behandlingen af ​​deres data for 25 % af patienterne, kan en stor mængde data om over 2.500 patienter potentielt analyseres i dette forsøg. Denne forskning vil ikke have nogen indflydelse på den nuværende patientbehandling. Data fra konsultationer og forskellige undersøgelser udført som led i plejen vil blive indsamlet i seks måneder efter diagnosen for at opfylde forskningsmålene.

AKSE 1: Den dataindsamlingsmetode, der anvendes i denne forskning, vil være todelt. Data fra patienter, der indgår i klinisk forskning, vil blive indsamlet konventionelt ved hjælp af en case-rapportformular, derefter centraliseret og organiseret i en referencedatabase kaldet "Gold Standard", og indtastet af en klinisk forskningstekniker. Den anden teknik til dataindsamling, ved hjælp af NLP-metoder, vil forløbe i flere faser, parallelt med tidligere tilgang. For det første vil udtrækningen af ​​medicinske rapporter (MR) i tekstformat blive efterfulgt af en pseudonymiseringsfase. MR-datasættet vil derefter blive forberedt til træning og validering ved at fjerne specialtegn og identificere interessesegmenter. Derefter vil MR blive kommenteret med BRAT for at identificere de termer, der vil blive brugt til at udfylde databasen. Træningsscripts vil blive anvendt på 70 % af patienterne for at skabe NLP-modeller. I løbet af denne træningsfase vil efterbehandlingsmedicinske regler blive skrevet for at omsætte den information, som modellerne identificerer, til strukturerede data. Det således færdiggjorte script påføres valideringsgrundlaget med en evaluering af dets ydeevne. Efter eventuelle nødvendige justeringer evalueres ydeevnen af ​​det endelige script på testdatabasen. Ydeevnen vil blive vurderet ved at sammenligne data opnået automatisk med den manuelle Gold Standard-database.

AKSE 2: Uovervågede klyngemetoder anvendt i denne undersøgelse kombinerer hierarkiske og ikke-hierarkiske metoder. Efter den hierarkiske stigende klyngedannelse, bruges Wards indeks til at bestemme antallet af interessegrupper. Centroiderne af disse grupper anses derefter for at initialisere en partitioneringsalgoritme, såsom k-middelalgoritmen. Når de fleste medicinsk relevante grupper er blevet bestemt, sammenlignes seks måneders udvikling (stabil, forværring eller fremskridt). Faktorer, der påvirker progressionen i løbet af de første tre måneder af behandlingen, kan også indgå i en statistisk model, afhængigt af deres evne til at forudsige forværring. Alle disse udforskninger skulle danne grundlag for medicinsk beslutningstagning.

Undersøgelsestype

Observationel

Tilmelding (Anslået)

2500

Kontakter og lokationer

Dette afsnit indeholder kontaktoplysninger for dem, der udfører undersøgelsen, og oplysninger om, hvor denne undersøgelse udføres.

Studiekontakt

Undersøgelse Kontakt Backup

Studiesteder

      • Toulon, Frankrig, 83100
        • Rekruttering
        • centre hospitalier intercommunal Toulon La Seyne sur Mer - Internal and vascular medicine
        • Kontakt:

Deltagelseskriterier

Forskere leder efter personer, der passer til en bestemt beskrivelse, kaldet berettigelseskriterier. Nogle eksempler på disse kriterier er en persons generelle helbredstilstand eller tidligere behandlinger.

Berettigelseskriterier

Aldre berettiget til at studere

  • Voksen
  • Ældre voksen

Tager imod sunde frivillige

Ingen

Prøveudtagningsmetode

Ikke-sandsynlighedsprøve

Studiebefolkning

Denne forskning vil omfatte en retrospektiv og en prospektiv del. Den retrospektive del vil omfatte patienter, der har været indlagt på CHITS for akut lungeemboli siden 2019 (omkring 1900 patienter). For den prospektive del er det planlagt at inkludere patienter med samme karakteristika i årene 2024 og 2025.

Beskrivelse

Inklusionskriterier:

  • Alder ≥ 18 år;
  • Patient med akut lungeemboli i CHITS (indlagt eller ej).

Ekskluderingskriterier:

  • Sub-segmentelle lungeemboli;
  • Tålmodig modstand.

Studieplan

Dette afsnit indeholder detaljer om studieplanen, herunder hvordan undersøgelsen er designet, og hvad undersøgelsen måler.

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

Kohorter og interventioner

Gruppe / kohorte
Intervention / Behandling
Patient med akut lungeemboli
Patient med akut lungeemboli i Centre Hospitalier Intercommunal Toulon La Seyne sur Mer, indlagt eller ej siden 2019
Hierarkiske klyngemetoder vil blive brugt til at danne homogene grupper af patienter baseret på deres data ved diagnosen: tilstedeværelse eller fravær af symptomer, kliniske og biologiske data og tilstedeværelse eller fravær af begunstigende faktorer. Patientudvikling efter 6 måneder kan falde i kategorier: stabil, forværring eller fremskridt, som bestemmes af hændelser såsom tilbagefald, blødning, funktionelle følgesygdomme eller død.

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Primær: Identificer homogene grupper af patienter baseret på deres medicinske egenskaber ved diagnose, og sammenlign derefter deres udvikling efter 6 måneder.
Tidsramme: 6 måneder
Hierarkiske klyngemetoder vil blive brugt til at danne homogene grupper af patienter baseret på deres data ved diagnose: tilstedeværelse eller fravær af symptomer, kliniske og biologiske data og tilstedeværelse eller fravær af favoriserende faktorer. Patientudvikling efter 6 måneder kan falde i kategorier: stabil, forværring eller fremskridt, som bestemmes af begivenheder som gentagelse, blødning, funktionelle følger eller død.
6 måneder

Sekundære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Sekundær: Bestem faktorer, der er forudsigelig for 6-måneders progression inden for de første tre måneder efter behandlingen.
Tidsramme: 3 måneder
En priori, grupper defineret for det primære mål vil blive opretholdt. Faktorer, der overvejes i løbet af de første tre måneder af behandlingen, vil omfatte: kliniske og biologiske data, tilstedeværelse eller fravær af symptomer, gunstige faktorer eller komplikationer.
3 måneder

Samarbejdspartnere og efterforskere

Det er her, du vil finde personer og organisationer, der er involveret i denne undersøgelse.

Samarbejdspartnere

Efterforskere

  • Studieleder: Jean-Noël POGGI, MD, Centre Hospitalier Intercommunal Toulon La Seyne sur Mer

Publikationer og nyttige links

Den person, der er ansvarlig for at indtaste oplysninger om undersøgelsen, leverer frivilligt disse publikationer. Disse kan handle om alt relateret til undersøgelsen.

Datoer for undersøgelser

Disse datoer sporer fremskridtene for indsendelser af undersøgelsesrekord og resumeresultater til ClinicalTrials.gov. Studieregistreringer og rapporterede resultater gennemgås af National Library of Medicine (NLM) for at sikre, at de opfylder specifikke kvalitetskontrolstandarder, før de offentliggøres på den offentlige hjemmeside.

Studer store datoer

Studiestart (Faktiske)

11. december 2023

Primær færdiggørelse (Anslået)

1. juli 2026

Studieafslutning (Anslået)

1. juli 2026

Datoer for studieregistrering

Først indsendt

13. december 2023

Først indsendt, der opfyldte QC-kriterier

26. december 2023

Først opslået (Faktiske)

28. december 2023

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

13. april 2026

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

10. april 2026

Sidst verificeret

1. april 2026

Mere information

Begreber relateret til denne undersøgelse

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

INGEN

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Ingen

Studerer et amerikansk FDA-reguleret enhedsprodukt

Ingen

Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .

Kliniske forsøg med Hierarkiske klyngemetoder

Abonner