Diese Seite wurde automatisch übersetzt und die Genauigkeit der Übersetzung wird nicht garantiert. Bitte wende dich an die englische Version für einen Quelltext.

Datenerfassungsstudie mit künstlicher Intelligenz und Phänotypisierung von Patienten mit akuter Lungenembolie (PEPITE)

Das ursprüngliche Ziel besteht darin, Werkzeuge der künstlichen Intelligenz (maschinelles Lernen und Verarbeitung natürlicher Sprache) zu entwickeln und zu validieren, um Daten aus medizinischen Berichten am Centre Hospitalier Intercommunal de Toulon - la Seyne sur mer (CHITS) zu erfassen und zu strukturieren. Dieses Projekt baut auf der bisherigen Arbeit der Abteilung für Epidemiologie, Biostatistik und Gesundheitsdaten (DEBDS) am Centre Antoine Lacassagne (CAL) in Nizza auf und konzentriert sich dabei auf Brust- und Schilddrüsenkrebs. Die Idee besteht darin, die Übertragbarkeit dieser Instrumente auf eine andere Einrichtung mit anderen Pathologien und Praktikern zu validieren, insbesondere auf die Abteilung für Gefäßmedizin am CHITS.

Anschließend soll es darum gehen, klinisch relevante Phänotypen bei Patienten mit akuter Lungenembolie zu identifizieren. Hierarchische Clustering-Methoden in Kombination mit unüberwachtem Lernen (maschinelles Lernen) werden verwendet, um Gruppen von Patienten zu erhalten, die zum Zeitpunkt der Diagnose homogen sind. Eine Bewertung ihrer Prognose nach 6 Monaten (Rezidiv oder chronisch thromboembolische pulmonale Hypertonie), also unter Berücksichtigung der ersten 3 Monate der Antikoagulanzienbehandlung, würde bei der medizinischen Entscheidungsfindung hilfreich sein.

Diese Forschung wird einen retrospektiven und einen prospektiven Teil umfassen. Der retrospektive Teil umfasst Patienten, die seit 2019 wegen einer akuten Lungenembolie in das CHITS aufgenommen wurden. Für den prospektiven Teil ist geplant, Patienten mit gleichen Merkmalen über die Jahre 2024 und 2025 einzubeziehen. Es wird erwartet, dass mehr als 2.500 Patienten eingeschlossen werden.

Diese Forschung wird keine Auswirkungen auf die aktuelle Patientenversorgung haben. Um die Forschungsziele zu erreichen, werden sechs Monate nach der Diagnose Daten aus Konsultationen und verschiedenen Untersuchungen im Rahmen der Pflege erhoben.

Studienübersicht

Status

Rekrutierung

Bedingungen

Detaillierte Beschreibung

Kontext:

Künstliche Intelligenz: NLP, Clustering und unüberwachtes Lernen:

Künstliche Intelligenz (KI) ist ein Bereich, der Informatik mit Datensätzen verbindet, mit dem Ziel, eine Maschine in die Lage zu versetzen, die kognitiven Fähigkeiten des Menschen nachzuahmen. Maschinelles Lernen (ML) und sein Unterbereich Deep Learning, der Schichten von Neuronen nutzt, sind zwei wichtige Unterbereiche der KI. Der Unterschied liegt im Training jedes Algorithmus. Zwei unterschiedliche Methoden werden von ML verwendet: überwachtes Lernen, bei dem ein Modell anhand bekannter Eingabe- und Ausgabedaten trainiert wird, um zukünftige Ausgaben vorherzusagen, und unüberwachtes Lernen, bei dem verborgene Muster und intrinsische zugrunde liegende Strukturen in den Eingabedaten entdeckt werden. Natural Language Processing (NLP) ist ebenfalls ein Teilgebiet der KI, erfordert jedoch im Allgemeinen ML, um effektiv zu sein. NLP verarbeitet reale Sprachdaten, um sie so zu verstehen, dass ein Computer sie verstehen kann.

NLP besteht aus zwei Hauptphasen: Datenvorverarbeitung und Algorithmusentwicklung. Für diese Techniken werden häufig Programmiersprachen wie Python oder R verwendet.

Das Ziel von Clustering-Methoden besteht darin, eine Menge von Individuen in homogene Klassen zu gruppieren. Nicht-hierarchische Methoden können zur Klassifizierung großer Datenmengen verwendet werden, erfordern jedoch eine vorherige Festlegung der Anzahl der Klassen. Hierarchische Methoden, deren Berechnung zeitaufwändiger ist, bestehen aus einer Reihe verschachtelter Partitionen, die durch einen Clusterbaum dargestellt werden. Die optimale Anzahl von Klassen kann im Nachhinein durch Lesen des Baums bestimmt werden. Bei einer großen Anzahl von Personen ist es üblich, nicht-hierarchische und hierarchische Techniken zu kombinieren. Wenn Klassen im Voraus nicht klar bekannt sind, werden Clustering-Methoden beim unüberwachten Lernen (ML) verwendet [1]. Datensätze werden im Allgemeinen in drei disjunkte Datensätze unterteilt: Trainingsdaten, die zum Trainieren der ausgewählten Algorithmen verwendet werden; Validierungsdaten, die zur Überprüfung der Ergebnisleistung verwendet werden; und Testdaten, die erst am Ende des Prozesses verwendet werden.

Venöse thromboembolische Erkrankung:

Venöse thromboembolische Erkrankungen (VTE) sind eine häufige Pathologie, deren Inzidenz nur unvollständig bekannt ist, die jedoch mit zunehmendem Alter zunimmt und bei Personen über 75 Jahren 1 % erreicht. In Frankreich erkranken schätzungsweise jedes Jahr über 100.000 Menschen an VTE, was für 5.000 bis 10.000 Todesfälle verantwortlich ist. Tiefe Venenthrombose (TVT) und Lungenembolie (PE) sind die beiden Haupttypen von VTE. Bei einer TVT handelt es sich um einen teilweisen oder vollständigen Verschluss einer tiefen Vene durch einen Thrombus, der am häufigsten in den unteren Extremitäten lokalisiert ist. Unter PE versteht man einen teilweisen oder vollständigen Verschluss der Lungenarterien oder ihrer Äste. Das Hauptrisiko einer TVT ist das Auftreten einer LE, die lebensbedrohlich sein kann. Zu weiteren VTE-spezifischen Komplikationen und möglichen unerwünschten Folgen zählen thromboembolische Rezidive (entweder TVT oder LE), chronische thromboembolische pulmonale Hypertonie und das postthrombotische Syndrom bei TVT. Die derzeitige Behandlung von VTE basiert hauptsächlich auf einer gerinnungshemmenden Therapie. Die Behandlungsdauer variiert je nach dem geschätzten Risiko eines erneuten Auftretens bei Absetzen der Behandlung und hängt im Wesentlichen davon ab, ob zuvor ein schwerwiegender Risikofaktor bestand oder nicht [2]. In dieser Untergruppe von PE-Patienten wird das Risiko eines erneuten Auftretens bei Fehlen wesentlicher Risikofaktoren als mittelmäßig eingestuft und hängt davon ab, ob es sich bei dem Ereignis um eine erste Episode oder ein erneutes Auftreten handelt und ob obstruktive pulmonale Folgeerscheinungen vorliegen oder nicht [3]. In jüngerer Zeit ist die Therapiestrategie komplexer geworden, wobei kleinere Risikofaktoren einbezogen wurden, die die Behandlungsdauer ohne relevante Beweise beeinflussen. Darüber hinaus ist unabhängig von der Behandlungsdauer die Dosierung der Antikoagulation über den sechsten Monat hinaus bei direkten oralen Antikoagulanzien ungewiss.

Hypothesen:

Diese Forschung wird unter zwei unterschiedlichen Achsen präsentiert:

ACHSE 1: Ziel dieser Arbeit wird zunächst die Entwicklung und Validierung von Werkzeugen der künstlichen Intelligenz unter Verwendung von ML und NLP für die Erfassung und Strukturierung von Daten aus textbasierten medizinischen Berichten in der Abteilung für Gefäßmedizin am Centre Hospitalier Intercommunal de Toulon – la Seyne sein sur mer (CHITS). Dieses Projekt wird auf der Arbeit aufbauen, die zuvor von der Abteilung für Epidemiologie, Biostatistik und Gesundheitsdaten (DEBDS) am Centre Antoine Lacassagne (CAL) mit Schwerpunkt auf Brust- und Schilddrüsenkrebs durchgeführt wurde [5,6,7]. Die Idee besteht darin, die Übertragbarkeit dieser Instrumente auf eine andere Einrichtung mit anderen Pathologien und Praktikern zu validieren, insbesondere auf die Abteilung für Gefäßmedizin des CHITS.

Die Implementierung einer Methode zur Erfassung strukturierter Daten mithilfe von Techniken der künstlichen Intelligenz direkt aus medizinischen Textberichten in unserem Krankenhaus ist eine Herausforderung. Wenn seine Leistungsfähigkeit nachgewiesen ist und dieses Tool dauerhaft und routinemäßig eingesetzt wird, wäre es eine leicht nutzbare Informationsquelle. Die Vielfalt der Bereiche und Interessen an der klinischen Forschung in unserer Einrichtung macht den Einsatz in anderen Abteilungen möglicherweise zu einem erreichbaren Ziel. Für CHITS ist dies der erste Schritt beim Aufbau eines Health Data Warehouse (HDW).

ACHSE 2: Anschließend soll die Datenbank genutzt werden, um klinisch relevante Phänotypen bei Patienten mit akuter Lungenembolie zu identifizieren. Hierarchische Clustering-Methoden in Kombination mit unüberwachtem Lernen (maschinelles Lernen) werden verwendet, um Gruppen von Patienten zu erhalten, die zum Zeitpunkt der Diagnose homogen sind. Eine Bewertung ihrer Prognose nach 6 Monaten (Rezidiv oder chronisch thromboembolische pulmonale Hypertonie), also unter Berücksichtigung der ersten 3 Monate der Antikoagulanzienbehandlung, würde bei der medizinischen Entscheidungsfindung hilfreich sein.

Eine Analyse der sechsmonatigen Entwicklung homogener Patientengruppen mit akuter Lungenembolie, die mithilfe von Clustering-Methoden und unüberwachtem Lernen erstellt wurden, wurde noch nie zuvor durchgeführt. Dieses innovative Projekt innerhalb einer großen Krankenhausinfrastruktur dürfte Ärzten eine Entscheidungshilfe und Patienten eine wissenschaftlich abgesicherte Form des Therapiemanagements bieten.

Material und Methoden :

Diese Forschung wird einen retrospektiven und einen prospektiven Teil umfassen. Der retrospektive Teil umfasst Patienten, die seit 2019 wegen einer akuten Lungenembolie in das CHITS aufgenommen wurden (ca. 1900 Patienten). Für den prospektiven Teil ist geplant, Patienten mit gleichen Merkmalen über die Jahre 2024 und 2025 einzubeziehen (ca. 765 Patienten). Liegen für 25 % der Patienten keine individuellen Informationen vor oder widersprechen sie der Verarbeitung ihrer Daten, könnte in dieser Studie möglicherweise eine große Datenmenge von über 2.500 Patienten analysiert werden. Diese Forschung wird keine Auswirkungen auf die aktuelle Patientenversorgung haben. Um die Forschungsziele zu erreichen, werden sechs Monate nach der Diagnose Daten aus Konsultationen und verschiedenen Untersuchungen im Rahmen der Pflege erhoben.

ACHSE 1: Die in dieser Forschung verwendete Datenerfassungsmethode wird zweitrangig sein. Daten von Patienten, die in die klinische Forschung einbezogen werden, werden auf herkömmliche Weise mithilfe eines Fallberichtsformulars gesammelt, dann zentralisiert und in einer Referenzdatenbank namens „Gold Standard“ organisiert und von einem Techniker für klinische Forschung eingegeben. Die zweite Technik der Datenerfassung, die NLP-Methoden verwendet, wird in mehreren Schritten parallel zum vorherigen Ansatz erfolgen. Zunächst erfolgt die Extraktion medizinischer Berichte (MR) im Textformat, gefolgt von einer Pseudonymisierungsphase. Der MR-Datensatz wird dann für das Training und die Validierung vorbereitet, indem Sonderzeichen entfernt und Interessensegmente identifiziert werden. Anschließend wird MR mit BRAT annotiert, um die Begriffe zu identifizieren, die zum Auffüllen der Datenbank verwendet werden. Bei 70 % der Patienten werden Trainingsskripte angewendet, um NLP-Modelle zu erstellen. Während dieser Trainingsphase werden medizinische Nachbearbeitungsregeln geschrieben, um die von den Modellen identifizierten Informationen in strukturierte Daten zu übersetzen. Das so fertiggestellte Skript wird mit einer Bewertung seiner Leistung auf die Validierungsbasis angewendet. Nach allen erforderlichen Anpassungen wird die Leistung des endgültigen Skripts in der Testdatenbank bewertet. Die Leistung wird durch den Vergleich der automatisch erhaltenen Daten mit der manuellen Gold-Standard-Datenbank bewertet.

ACHSE 2: Die in dieser Studie verwendeten unbeaufsichtigten Clustering-Methoden kombinieren hierarchische und nicht-hierarchische Methoden. Nach der hierarchisch aufsteigenden Clusterbildung wird der Ward-Index verwendet, um die Anzahl der interessierenden Gruppen zu bestimmen. Die Schwerpunkte dieser Gruppen werden dann berücksichtigt, um einen Partitionierungsalgorithmus zu initialisieren, beispielsweise den k-means-Algorithmus. Sobald die meisten medizinisch relevanten Gruppen ermittelt wurden, wird die sechsmonatige Entwicklung (stabil, Verschlimmerung oder Fortschritt) verglichen. Faktoren, die den Krankheitsverlauf während der ersten drei Monate der Behandlung beeinflussen, können ebenfalls in ein statistisches Modell einbezogen werden, abhängig von ihrer Fähigkeit, eine Verschlimmerung vorherzusagen. All diese Untersuchungen sollen eine Grundlage für medizinische Entscheidungen liefern.

Studientyp

Beobachtungs

Einschreibung (Geschätzt)

2500

Kontakte und Standorte

Dieser Abschnitt enthält die Kontaktdaten derjenigen, die die Studie durchführen, und Informationen darüber, wo diese Studie durchgeführt wird.

Studienkontakt

Studieren Sie die Kontaktsicherung

Studienorte

      • Toulon, Frankreich, 83100
        • Rekrutierung
        • centre hospitalier intercommunal Toulon La Seyne sur Mer - Internal and vascular medicine
        • Kontakt:

Teilnahmekriterien

Forscher suchen nach Personen, die einer bestimmten Beschreibung entsprechen, die als Auswahlkriterien bezeichnet werden. Einige Beispiele für diese Kriterien sind der allgemeine Gesundheitszustand einer Person oder frühere Behandlungen.

Zulassungskriterien

Studienberechtigtes Alter

  • Erwachsene
  • Älterer Erwachsener

Akzeptiert gesunde Freiwillige

Nein

Probenahmeverfahren

Nicht-Wahrscheinlichkeitsprobe

Studienpopulation

Diese Forschung wird einen retrospektiven und einen prospektiven Teil umfassen. Der retrospektive Teil umfasst Patienten, die seit 2019 wegen einer akuten Lungenembolie in das CHITS aufgenommen wurden (ca. 1900 Patienten). Für den prospektiven Teil ist geplant, Patienten mit gleichen Merkmalen über die Jahre 2024 und 2025 einzubeziehen.

Beschreibung

Einschlusskriterien:

  • Alter ≥ 18 Jahre;
  • Patient mit akuter Lungenembolie in CHITS (hospitalisiert oder nicht).

Ausschlusskriterien:

  • Subsegmentale Lungenembolien;
  • Geduldiger Widerstand.

Studienplan

Dieser Abschnitt enthält Einzelheiten zum Studienplan, einschließlich des Studiendesigns und der Messung der Studieninhalte.

Wie ist die Studie aufgebaut?

Designdetails

Kohorten und Interventionen

Gruppe / Kohorte
Intervention / Behandlung
Patient mit akuter Lungenembolie
Patient mit akuter Lungenembolie im Centre Hospitalier Intercommunal Toulon La Seyne sur Mer, seit 2019 im Krankenhaus oder nicht
Hierarchische Clustering-Methoden werden verwendet, um homogene Gruppen von Patienten auf der Grundlage ihrer Daten zum Zeitpunkt der Diagnose zu bilden: Vorhandensein oder Fehlen von Symptomen, klinische und biologische Daten sowie Vorhandensein oder Fehlen begünstigender Faktoren. Die Patientenentwicklung nach 6 Monaten kann in die folgenden Kategorien eingeteilt werden: stabil, Verschlimmerung oder Fortschritt, die durch Ereignisse wie Wiederauftreten, Blutung, funktionelle Folgeerscheinungen oder Tod bestimmt werden.

Was misst die Studie?

Primäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Primär: Identifizieren Sie homogene Gruppen von Patienten anhand ihrer medizinischen Merkmale bei der Diagnose und vergleichen Sie ihre Entwicklung nach 6 Monaten.
Zeitfenster: 6 Monate
Hierarchische Clustering -Methoden werden verwendet, um homogene Gruppen von Patienten zu bilden, die auf ihren Daten zur Diagnose basieren: Vorhandensein oder Fehlen von Symptomen, klinischen und biologischen Daten sowie Vorhandensein oder Fehlen von Faktoren. Die Patientenentwicklung nach 6 Monaten können in Kategorien fallen: stabil, Verschlechterung oder Fortschritt, die durch Ereignisse wie Rezidive, Blutung, funktionelle Folgen oder Tod bestimmt werden.
6 Monate

Sekundäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Sekundär: Bestimmen Sie die Faktoren, die das 6-monatige Fortschreiten innerhalb der ersten drei Monate der Behandlung vorhersagen.
Zeitfenster: 3 Monate
A priori werden Gruppen, die für das primäre Ziel definiert sind, beibehalten. Zu den Faktoren, die während der ersten drei Monate der Behandlung berücksichtigt werden, gehören: klinische und biologische Daten, Vorhandensein oder Fehlen von Symptomen, günstigen Faktoren oder Komplikationen.
3 Monate

Mitarbeiter und Ermittler

Hier finden Sie Personen und Organisationen, die an dieser Studie beteiligt sind.

Ermittler

  • Studienleiter: Jean-Noël POGGI, MD, Centre Hospitalier Intercommunal Toulon La Seyne sur Mer

Publikationen und hilfreiche Links

Die Bereitstellung dieser Publikationen erfolgt freiwillig durch die für die Eingabe von Informationen über die Studie verantwortliche Person. Diese können sich auf alles beziehen, was mit dem Studium zu tun hat.

Studienaufzeichnungsdaten

Diese Daten verfolgen den Fortschritt der Übermittlung von Studienaufzeichnungen und zusammenfassenden Ergebnissen an ClinicalTrials.gov. Studienaufzeichnungen und gemeldete Ergebnisse werden von der National Library of Medicine (NLM) überprüft, um sicherzustellen, dass sie bestimmten Qualitätskontrollstandards entsprechen, bevor sie auf der öffentlichen Website veröffentlicht werden.

Haupttermine studieren

Studienbeginn (Tatsächlich)

11. Dezember 2023

Primärer Abschluss (Geschätzt)

1. Juli 2026

Studienabschluss (Geschätzt)

1. Juli 2026

Studienanmeldedaten

Zuerst eingereicht

13. Dezember 2023

Zuerst eingereicht, das die QC-Kriterien erfüllt hat

26. Dezember 2023

Zuerst gepostet (Tatsächlich)

28. Dezember 2023

Studienaufzeichnungsaktualisierungen

Letztes Update gepostet (Tatsächlich)

13. April 2026

Letztes eingereichtes Update, das die QC-Kriterien erfüllt

10. April 2026

Zuletzt verifiziert

1. April 2026

Mehr Informationen

Begriffe im Zusammenhang mit dieser Studie

Plan für individuelle Teilnehmerdaten (IPD)

Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?

NEIN

Arzneimittel- und Geräteinformationen, Studienunterlagen

Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt

Nein

Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt

Nein

Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .

Klinische Studien zur Hierarchische Clustering-Methoden

Abonnieren