- ICH GCP
- US-Register für klinische Studien
- Klinische Studie NCT06183944
Datenerfassungsstudie mit künstlicher Intelligenz und Phänotypisierung von Patienten mit akuter Lungenembolie (PEPITE)
Das ursprüngliche Ziel besteht darin, Werkzeuge der künstlichen Intelligenz (maschinelles Lernen und Verarbeitung natürlicher Sprache) zu entwickeln und zu validieren, um Daten aus medizinischen Berichten am Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS) zu erfassen und zu strukturieren. Dieses Projekt baut auf der bisherigen Arbeit der Abteilung für Epidemiologie, Biostatistik und Gesundheitsdaten (DEBDS) am Centre Antoine Lacassagne (CAL) in Nizza auf und konzentriert sich dabei auf Brust- und Schilddrüsenkrebs. Die Idee besteht darin, die Übertragbarkeit dieser Instrumente auf eine andere Einrichtung mit anderen Pathologien und Praktikern zu validieren, insbesondere auf die Abteilung für Gefäßmedizin am CHITS.
Anschließend soll es darum gehen, klinisch relevante Phänotypen bei Patienten mit akuter Lungenembolie zu identifizieren. Hierarchische Clustering-Methoden in Kombination mit unüberwachtem Lernen (maschinelles Lernen) werden verwendet, um Gruppen von Patienten zu erhalten, die zum Zeitpunkt der Diagnose homogen sind. Eine Bewertung ihrer Prognose nach 6 Monaten (Rezidiv oder chronisch thromboembolische pulmonale Hypertonie), also unter Berücksichtigung der ersten 3 Monate der Antikoagulanzienbehandlung, würde bei der medizinischen Entscheidungsfindung hilfreich sein.
Diese Forschung wird einen retrospektiven und einen prospektiven Teil umfassen. Der retrospektive Teil umfasst Patienten, die seit 2019 wegen einer akuten Lungenembolie in das CHITS aufgenommen wurden. Für den prospektiven Teil ist geplant, Patienten mit gleichen Merkmalen über die Jahre 2024 und 2025 einzubeziehen. Es wird erwartet, dass mehr als 2.500 Patienten eingeschlossen werden.
Diese Forschung wird keine Auswirkungen auf die aktuelle Patientenversorgung haben. Um die Forschungsziele zu erreichen, werden sechs Monate nach der Diagnose Daten aus Konsultationen und verschiedenen Untersuchungen im Rahmen der Pflege erhoben.
Studienübersicht
Status
Bedingungen
Intervention / Behandlung
Detaillierte Beschreibung
Kontext:
Künstliche Intelligenz: NLP, Clustering und unüberwachtes Lernen:
Künstliche Intelligenz (KI) ist ein Bereich, der Informatik mit Datensätzen verbindet, mit dem Ziel, eine Maschine in die Lage zu versetzen, die kognitiven Fähigkeiten des Menschen nachzuahmen. Maschinelles Lernen (ML) und sein Unterbereich Deep Learning, der Schichten von Neuronen nutzt, sind zwei wichtige Unterbereiche der KI. Der Unterschied liegt im Training jedes Algorithmus. Zwei unterschiedliche Methoden werden von ML verwendet: überwachtes Lernen, bei dem ein Modell anhand bekannter Eingabe- und Ausgabedaten trainiert wird, um zukünftige Ausgaben vorherzusagen, und unüberwachtes Lernen, bei dem verborgene Muster und intrinsische zugrunde liegende Strukturen in den Eingabedaten entdeckt werden. Natural Language Processing (NLP) ist ebenfalls ein Teilgebiet der KI, erfordert jedoch im Allgemeinen ML, um effektiv zu sein. NLP verarbeitet reale Sprachdaten, um sie so zu verstehen, dass ein Computer sie verstehen kann.
NLP besteht aus zwei Hauptphasen: Datenvorverarbeitung und Algorithmusentwicklung. Für diese Techniken werden häufig Programmiersprachen wie Python oder R verwendet.
Das Ziel von Clustering-Methoden besteht darin, eine Menge von Individuen in homogene Klassen zu gruppieren. Nicht-hierarchische Methoden können zur Klassifizierung großer Datenmengen verwendet werden, erfordern jedoch eine vorherige Festlegung der Anzahl der Klassen. Hierarchische Methoden, deren Berechnung zeitaufwändiger ist, bestehen aus einer Reihe verschachtelter Partitionen, die durch einen Clusterbaum dargestellt werden. Die optimale Anzahl von Klassen kann im Nachhinein durch Lesen des Baums bestimmt werden. Bei einer großen Anzahl von Personen ist es üblich, nicht-hierarchische und hierarchische Techniken zu kombinieren. Wenn Klassen im Voraus nicht klar bekannt sind, werden Clustering-Methoden beim unüberwachten Lernen (ML) verwendet [1]. Datensätze werden im Allgemeinen in drei disjunkte Datensätze unterteilt: Trainingsdaten, die zum Trainieren der ausgewählten Algorithmen verwendet werden; Validierungsdaten, die zur Überprüfung der Ergebnisleistung verwendet werden; und Testdaten, die erst am Ende des Prozesses verwendet werden.
Venöse thromboembolische Erkrankung:
Venöse thromboembolische Erkrankungen (VTE) sind eine häufige Pathologie, deren Inzidenz nur unvollständig bekannt ist, die jedoch mit zunehmendem Alter zunimmt und bei Personen über 75 Jahren 1 % erreicht. In Frankreich erkranken schätzungsweise jedes Jahr über 100.000 Menschen an VTE, was für 5.000 bis 10.000 Todesfälle verantwortlich ist. Tiefe Venenthrombose (TVT) und Lungenembolie (PE) sind die beiden Haupttypen von VTE. Bei einer TVT handelt es sich um einen teilweisen oder vollständigen Verschluss einer tiefen Vene durch einen Thrombus, der am häufigsten in den unteren Extremitäten lokalisiert ist. Unter PE versteht man einen teilweisen oder vollständigen Verschluss der Lungenarterien oder ihrer Äste. Das Hauptrisiko einer TVT ist das Auftreten einer LE, die lebensbedrohlich sein kann. Zu weiteren VTE-spezifischen Komplikationen und möglichen unerwünschten Folgen zählen thromboembolische Rezidive (entweder TVT oder LE), chronische thromboembolische pulmonale Hypertonie und das postthrombotische Syndrom bei TVT. Die derzeitige Behandlung von VTE basiert hauptsächlich auf einer gerinnungshemmenden Therapie. Die Behandlungsdauer variiert je nach dem geschätzten Risiko eines erneuten Auftretens bei Absetzen der Behandlung und hängt im Wesentlichen davon ab, ob zuvor ein schwerwiegender Risikofaktor bestand oder nicht [2]. In dieser Untergruppe von PE-Patienten wird das Risiko eines erneuten Auftretens bei Fehlen wesentlicher Risikofaktoren als mittelmäßig eingestuft und hängt davon ab, ob es sich bei dem Ereignis um eine erste Episode oder ein erneutes Auftreten handelt und ob obstruktive pulmonale Folgeerscheinungen vorliegen oder nicht [3]. In jüngerer Zeit ist die Therapiestrategie komplexer geworden, wobei kleinere Risikofaktoren einbezogen wurden, die die Behandlungsdauer ohne relevante Beweise beeinflussen. Darüber hinaus ist unabhängig von der Behandlungsdauer die Dosierung der Antikoagulation über den sechsten Monat hinaus bei direkten oralen Antikoagulanzien ungewiss.
Hypothesen:
Diese Forschung wird unter zwei unterschiedlichen Achsen präsentiert:
ACHSE 1: Ziel dieser Arbeit wird zunächst die Entwicklung und Validierung von Werkzeugen der künstlichen Intelligenz unter Verwendung von ML und NLP für die Erfassung und Strukturierung von Daten aus textbasierten medizinischen Berichten in der Abteilung für Gefäßmedizin am Centre Hospitalier Intercommunal de Toulon – la Seyne sein sur mer (CHITS). Dieses Projekt wird auf der Arbeit aufbauen, die zuvor von der Abteilung für Epidemiologie, Biostatistik und Gesundheitsdaten (DEBDS) am Centre Antoine Lacassagne (CAL) mit Schwerpunkt auf Brust- und Schilddrüsenkrebs durchgeführt wurde [5,6,7]. Die Idee besteht darin, die Übertragbarkeit dieser Instrumente auf eine andere Einrichtung mit anderen Pathologien und Praktikern zu validieren, insbesondere auf die Abteilung für Gefäßmedizin des CHITS.
Die Implementierung einer Methode zur Erfassung strukturierter Daten mithilfe von Techniken der künstlichen Intelligenz direkt aus medizinischen Textberichten in unserem Krankenhaus ist eine Herausforderung. Wenn seine Leistungsfähigkeit nachgewiesen ist und dieses Tool dauerhaft und routinemäßig eingesetzt wird, wäre es eine leicht nutzbare Informationsquelle. Die Vielfalt der Bereiche und Interessen an der klinischen Forschung in unserer Einrichtung macht den Einsatz in anderen Abteilungen möglicherweise zu einem erreichbaren Ziel. Für CHITS ist dies der erste Schritt beim Aufbau eines Health Data Warehouse (HDW).
ACHSE 2: Anschließend soll die Datenbank genutzt werden, um klinisch relevante Phänotypen bei Patienten mit akuter Lungenembolie zu identifizieren. Hierarchische Clustering-Methoden in Kombination mit unüberwachtem Lernen (maschinelles Lernen) werden verwendet, um Gruppen von Patienten zu erhalten, die zum Zeitpunkt der Diagnose homogen sind. Eine Bewertung ihrer Prognose nach 6 Monaten (Rezidiv oder chronisch thromboembolische pulmonale Hypertonie), also unter Berücksichtigung der ersten 3 Monate der Antikoagulanzienbehandlung, würde bei der medizinischen Entscheidungsfindung hilfreich sein.
Eine Analyse der sechsmonatigen Entwicklung homogener Patientengruppen mit akuter Lungenembolie, die mithilfe von Clustering-Methoden und unüberwachtem Lernen erstellt wurden, wurde noch nie zuvor durchgeführt. Dieses innovative Projekt innerhalb einer großen Krankenhausinfrastruktur dürfte Ärzten eine Entscheidungshilfe und Patienten eine wissenschaftlich abgesicherte Form des Therapiemanagements bieten.
Material und Methoden :
Diese Forschung wird einen retrospektiven und einen prospektiven Teil umfassen. Der retrospektive Teil umfasst Patienten, die seit 2019 wegen einer akuten Lungenembolie in das CHITS aufgenommen wurden (ca. 1900 Patienten). Für den prospektiven Teil ist geplant, Patienten mit gleichen Merkmalen über die Jahre 2024 und 2025 einzubeziehen (ca. 765 Patienten). Liegen für 25 % der Patienten keine individuellen Informationen vor oder widersprechen sie der Verarbeitung ihrer Daten, könnte in dieser Studie möglicherweise eine große Datenmenge von über 2.500 Patienten analysiert werden. Diese Forschung wird keine Auswirkungen auf die aktuelle Patientenversorgung haben. Um die Forschungsziele zu erreichen, werden sechs Monate nach der Diagnose Daten aus Konsultationen und verschiedenen Untersuchungen im Rahmen der Pflege erhoben.
ACHSE 1: Die in dieser Forschung verwendete Datenerfassungsmethode wird zweitrangig sein. Daten von Patienten, die in die klinische Forschung einbezogen werden, werden auf herkömmliche Weise mithilfe eines Fallberichtsformulars gesammelt, dann zentralisiert und in einer Referenzdatenbank namens „Gold Standard“ organisiert und von einem Techniker für klinische Forschung eingegeben. Die zweite Technik der Datenerfassung, die NLP-Methoden verwendet, wird in mehreren Schritten parallel zum vorherigen Ansatz erfolgen. Zunächst erfolgt die Extraktion medizinischer Berichte (MR) im Textformat, gefolgt von einer Pseudonymisierungsphase. Der MR-Datensatz wird dann für das Training und die Validierung vorbereitet, indem Sonderzeichen entfernt und Interessensegmente identifiziert werden. Anschließend wird MR mit BRAT annotiert, um die Begriffe zu identifizieren, die zum Auffüllen der Datenbank verwendet werden. Bei 70 % der Patienten werden Trainingsskripte angewendet, um NLP-Modelle zu erstellen. Während dieser Trainingsphase werden medizinische Nachbearbeitungsregeln geschrieben, um die von den Modellen identifizierten Informationen in strukturierte Daten zu übersetzen. Das so fertiggestellte Skript wird mit einer Bewertung seiner Leistung auf die Validierungsbasis angewendet. Nach allen erforderlichen Anpassungen wird die Leistung des endgültigen Skripts in der Testdatenbank bewertet. Die Leistung wird durch den Vergleich der automatisch erhaltenen Daten mit der manuellen Gold-Standard-Datenbank bewertet.
ACHSE 2: Die in dieser Studie verwendeten unbeaufsichtigten Clustering-Methoden kombinieren hierarchische und nicht-hierarchische Methoden. Nach der hierarchisch aufsteigenden Clusterbildung wird der Ward-Index verwendet, um die Anzahl der interessierenden Gruppen zu bestimmen. Die Schwerpunkte dieser Gruppen werden dann berücksichtigt, um einen Partitionierungsalgorithmus zu initialisieren, beispielsweise den k-means-Algorithmus. Sobald die meisten medizinisch relevanten Gruppen ermittelt wurden, wird die sechsmonatige Entwicklung (stabil, Verschlimmerung oder Fortschritt) verglichen. Faktoren, die den Krankheitsverlauf während der ersten drei Monate der Behandlung beeinflussen, können ebenfalls in ein statistisches Modell einbezogen werden, abhängig von ihrer Fähigkeit, eine Verschlimmerung vorherzusagen. All diese Untersuchungen sollen eine Grundlage für medizinische Entscheidungen liefern.
Studientyp
Einschreibung (Geschätzt)
Kontakte und Standorte
Studienkontakt
- Name: Sophie Lafond
- Telefonnummer: +33 04 83 77 20 62
- E-Mail: sophie.lafond@ch-toulon.fr
Studieren Sie die Kontaktsicherung
- Name: Jean-Philippe Suppini
- Telefonnummer: +33 04 94 14 55 25
- E-Mail: recherche.promotion@ch-toulon.fr
Studienorte
-
-
-
Toulon, Frankreich, 83100
- Rekrutierung
- centre hospitalier intercommunal Toulon La Seyne sur Mer - Internal and vascular medicine
-
Kontakt:
- Jean-Noël POGGI, MD
- Telefonnummer: +33 04 94 14 57 87
- E-Mail: jeannoel.poggi@ch-toulon.fr
-
-
Teilnahmekriterien
Zulassungskriterien
Studienberechtigtes Alter
- Erwachsene
- Älterer Erwachsener
Akzeptiert gesunde Freiwillige
Probenahmeverfahren
Studienpopulation
Beschreibung
Einschlusskriterien:
- Alter ≥ 18 Jahre;
- Patient mit akuter Lungenembolie in CHITS (hospitalisiert oder nicht).
Ausschlusskriterien:
- Subsegmentale Lungenembolien;
- Geduldiger Widerstand.
Studienplan
Wie ist die Studie aufgebaut?
Designdetails
Kohorten und Interventionen
Gruppe / Kohorte |
Intervention / Behandlung |
|---|---|
|
Patient mit akuter Lungenembolie
Patient mit akuter Lungenembolie im Centre Hospitalier Intercommunal Toulon La Seyne sur Mer, seit 2019 im Krankenhaus oder nicht
|
Hierarchische Clustering-Methoden werden verwendet, um homogene Gruppen von Patienten auf der Grundlage ihrer Daten zum Zeitpunkt der Diagnose zu bilden: Vorhandensein oder Fehlen von Symptomen, klinische und biologische Daten sowie Vorhandensein oder Fehlen begünstigender Faktoren.
Die Patientenentwicklung nach 6 Monaten kann in die folgenden Kategorien eingeteilt werden: stabil, Verschlimmerung oder Fortschritt, die durch Ereignisse wie Wiederauftreten, Blutung, funktionelle Folgeerscheinungen oder Tod bestimmt werden.
|
Was misst die Studie?
Primäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Primär: Identifizieren Sie homogene Gruppen von Patienten anhand ihrer medizinischen Merkmale bei der Diagnose und vergleichen Sie ihre Entwicklung nach 6 Monaten.
Zeitfenster: 6 Monate
|
Hierarchische Clustering -Methoden werden verwendet, um homogene Gruppen von Patienten zu bilden, die auf ihren Daten zur Diagnose basieren: Vorhandensein oder Fehlen von Symptomen, klinischen und biologischen Daten sowie Vorhandensein oder Fehlen von Faktoren.
Die Patientenentwicklung nach 6 Monaten können in Kategorien fallen: stabil, Verschlechterung oder Fortschritt, die durch Ereignisse wie Rezidive, Blutung, funktionelle Folgen oder Tod bestimmt werden.
|
6 Monate
|
Sekundäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Sekundär: Bestimmen Sie die Faktoren, die das 6-monatige Fortschreiten innerhalb der ersten drei Monate der Behandlung vorhersagen.
Zeitfenster: 3 Monate
|
A priori werden Gruppen, die für das primäre Ziel definiert sind, beibehalten.
Zu den Faktoren, die während der ersten drei Monate der Behandlung berücksichtigt werden, gehören: klinische und biologische Daten, Vorhandensein oder Fehlen von Symptomen, günstigen Faktoren oder Komplikationen.
|
3 Monate
|
Mitarbeiter und Ermittler
Mitarbeiter
Ermittler
- Studienleiter: Jean-Noël POGGI, MD, Centre Hospitalier Intercommunal Toulon La Seyne sur Mer
Publikationen und hilfreiche Links
Allgemeine Veröffentlichungen
- Gal J, Bailleux C, Chardin D, Pourcher T, Gilhodes J, Jing L, Guigonis JM, Ferrero JM, Milano G, Mograbi B, Brest P, Chateau Y, Humbert O, Chamorey E. Comparison of unsupervised machine-learning methods to identify metabolomic signatures in patients with localized breast cancer. Comput Struct Biotechnol J. 2020 Jun 3;18:1509-1524. doi: 10.1016/j.csbj.2020.05.021. eCollection 2020.
- Gallo A, Valerio L, Barco S. The 2019 European guidelines on pulmonary embolism illustrated with the aid of an exemplary case report. Eur Heart J Case Rep. 2021 Jan 4;5(2):ytaa542. doi: 10.1093/ehjcr/ytaa542. eCollection 2021 Feb.
- Duffett L, Castellucci LA, Forgie MA. Pulmonary embolism: update on management and controversies. BMJ. 2020 Aug 5;370:m2177. doi: 10.1136/bmj.m2177.
- Yu T, Shen R, You G, Lv L, Kang S, Wang X, Xu J, Zhu D, Xia Z, Zheng J, Huang K. Machine learning-based prediction of the post-thrombotic syndrome: Model development and validation study. Front Cardiovasc Med. 2022 Sep 16;9:990788. doi: 10.3389/fcvm.2022.990788. eCollection 2022.
Studienaufzeichnungsdaten
Haupttermine studieren
Studienbeginn (Tatsächlich)
Primärer Abschluss (Geschätzt)
Studienabschluss (Geschätzt)
Studienanmeldedaten
Zuerst eingereicht
Zuerst eingereicht, das die QC-Kriterien erfüllt hat
Zuerst gepostet (Tatsächlich)
Studienaufzeichnungsaktualisierungen
Letztes Update gepostet (Tatsächlich)
Letztes eingereichtes Update, das die QC-Kriterien erfüllt
Zuletzt verifiziert
Mehr Informationen
Begriffe im Zusammenhang mit dieser Studie
Schlüsselwörter
Zusätzliche relevante MeSH-Bedingungen
Andere Studien-ID-Nummern
- 2023-CHITS-016
Plan für individuelle Teilnehmerdaten (IPD)
Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?
Arzneimittel- und Geräteinformationen, Studienunterlagen
Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt
Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt
Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .
Klinische Studien zur Hierarchische Clustering-Methoden
-
Université de MontréalAbgeschlossenFrühgeborenes 26 bis 32 WochenKanada
-
Maastricht University Medical CenterUniversity Hospital, Antwerp; Zuyderland HospitalUnbekanntÜberaktive Blase | Syndrom der überaktiven BlaseNiederlande
-
University Hospital, GhentRekrutierungÜbergewicht und AdipositasBelgien
-
University Hospital, MontpellierAbgeschlossenFettleibigkeit | Betonen | AngstFrankreich
-
Aydin Adnan Menderes UniversityNoch keine RekrutierungAusbildung | Studenten der Krankenpflege
-
Aydin Adnan Menderes UniversityNoch keine Rekrutierung
-
Aydin Adnan Menderes UniversityNoch keine RekrutierungAusbildung | Studenten der KrankenpflegeTruthahn
-
Sarah Wragge WellnessAbgeschlossenMetabolisches Syndrom | Adipositas & Übergewicht | Prävention von Typ-2-Diabetes | BlutzuckerüberwachungVereinigte Staaten
-
Avacen, Inc.University of California, San Diego; San Diego Veterans Healthcare SystemAbgeschlossenFibromyalgieVereinigte Staaten
-
University of California, San DiegoFerrosan Medical Devices, Roskilde, DenmarkAbgeschlossenRegionalanästhesie | Blockade des IschiasnervsVereinigte Staaten