- ICH GCP
- US-Register für klinische Studien
- Klinische Studie NCT04991987
Multizentrische Validierungsstudie eines künstlichen Intelligenztools zur automatischen Klassifizierung von Röntgenaufnahmen des Brustkorbs
Studienübersicht
Status
Bedingungen
Detaillierte Beschreibung
Ein aktuelles Problem in Radiologieabteilungen ist die stetig steigende Zahl durchgeführter Untersuchungen. Diese ständig wachsende Informationsmenge führt zu einem Anstieg der Zeit, die medizinische Fachkräfte für die Berichterstattung über diese Studien aufwenden müssen. Die für die Berichterstattung angewandte Methodik variiert je nach Bildgebungsmodalität, zu der in Zentren mit hoher Komplexität unter anderem Radiologie, Computertomographie, Magnetresonanztomographie und Ultraschall gehören. Der größte Umfang an Studien entfällt derzeit auf einfache Röntgenaufnahmen. Im Hospital Italiano de Buenos Aires (HIBA) wurden im Jahr 2019 mehr als 220.000 Röntgenaufnahmen durchgeführt, und in dieser Gruppe handelt es sich bei mehr als 50 % der Untersuchungen um Röntgenaufnahmen des Brustkorbs, die als Methode zur Ersterkennung potenziell schwerwiegender Pathologien durchgeführt werden (Lungenknoten, Lungenentzündung, Pneumothorax).
Diese Bildgebungsmodalität ist nicht attraktiv und wird von der neuen Generation von Bildgebungsspezialisten nicht erforscht, die lieber auf modernere und komplexere Methoden wie Computertomographie oder Magnetresonanztomographie umsteigen. Daher wird das Problem der zunehmenden Menge an zu analysierenden einfachen Röntgenbildern durch den Mangel an Spezialisten mit Engagement und Erfahrung in deren Interpretation verschärft.
Im Bereich der Informatik hat sich ein Forschungsgebiet namens Künstliche Intelligenz (KI) herausgebildet, bei dem es sich um ein Computersystem handelt, das lernt, bestimmte Routineaufgaben auszuführen und menschliche Arbeit ergänzen oder imitieren kann. Der Entwickler muss dem KI-System mitteilen, welche Reaktion auf einen bestimmten Reiz gewünscht wird. Ein Beispiel hierfür ist die Rechtschreibprüfung in einem Textverarbeitungsprogramm.
Der Bereich der KI umfasst eine Vielzahl von Teilbereichen und spezifischen Techniken, wie zum Beispiel Machine Learning (ML) oder Deep Learning (DL). ML umfasst jedes Werkzeug, bei dem computergestützte Daten verwendet werden, um ein Modell anzupassen, das aus diesen Eingabedaten Schlussfolgerungen zieht. Algorithmen werden darauf trainiert, vorgegebene Aufgaben anhand einer Reihe zuvor klassifizierter Informationen zu erlernen. Dazu gehören auch traditionelle Techniken zur Erstellung von Vorhersagemodellen oder Klassifizierungsmodellen. E-Mail-Spam-Filterung ist ein Beispiel für ML. Neuronale Netze sind eines der in ML enthaltenen Werkzeuge.
Schließlich ist DL eine Art von ML, die seit 2015 auftaucht und darin besteht, Schichten zu einem traditionellen neuronalen Netzwerk hinzuzufügen und so ein nichtlineares Modell mit einem höheren Grad an Komplexität zu schaffen, da es die Anzahl der anzupassenden Parameter erhöht. Dieses Netzwerk wird einem Trainingsdatensatz ausgesetzt, der aus bereits gekennzeichneten Informationen besteht, und „lernt“, neue Informationen zu kennzeichnen, indem es die Kennzeichnungskriterien des Datensatzes nachahmt. Bei diesem Lernen handelt es sich tatsächlich um eine iterative Anpassung der Modellparameter, die entsprechend dem Fehler zwischen der ursprünglichen Kennzeichnung und der vom Netzwerk vorgeschlagenen Kennzeichnung iterativ geändert werden. Sobald das Modell trainiert ist, sind seine Parameter festgelegt und es kann verwendet werden, um Bezeichnungen neuer Informationen abzuleiten, deren Bezeichnung unbekannt ist. Es wurde festgestellt, dass DL-Methoden bei der Datenanalyse eine viel bessere Leistung erbringen als herkömmliche Methoden. DL hat bereits Anwendungen im Alltag, etwa Sprachassistenten in Smartphones oder automatische Gesichtserkennung und -kennzeichnung in sozialen Netzwerken.
Die auf die Bildverarbeitung angewendete DL basiert auf einer Methode namens Convolutional Neural Networks. Seine Anwendung wurde im Bereich der medizinischen Bildgebung untersucht und dabei Leistungsverbesserungen festgestellt, von der Objekterkennung (anatomische oder pathologische Strukturen in radiologischen Bildern) bis hin zu Segmentierungsaufgaben.
Seit 2018 führt das Hospital Italiano de Buenos Aires das TRx-Programm durch, das in der Entwicklung eines KI-basierten Tools zur Erkennung pathologischer Befunde in Röntgenaufnahmen des Brustkorbs besteht. Das Projekt ist Teil des Programms „Künstliche Intelligenz im Gesundheitswesen“ des Hospital Italiano de Buenos Aires und wird von einem multidisziplinären Team von Fachleuten durchgeführt, darunter biomedizinische Ingenieure, Datenwissenschaftler, Radiologen, klinisch-klinische Informatiker, Methodologen und Softwareentwickler. TRx ist ein am HIBA entwickeltes und validiertes DL-Modell, das vier Arten radiologischer Befunde auf Röntgenaufnahmen des Brustkorbs erkennt: Lungentrübungen (Knötchen, Raumforderungen, Lungenentzündung, Konsolidierungen, Mattglas oder Atelektasen), Pneumothorax, Pleuraergüsse und Rippen Brüche. Diese Erkennung erfolgt über vier unabhängige Module, die in ein einziges System integriert sind. Bei der Verarbeitung einer Röntgenaufnahme meldet TRx verschiedene Arten von Ergebnissen. Erstens zeigt das einheitliche TRx-System dichotom an, ob das Bild verdächtig auf einen pathologischen Befund ist oder ob es sich möglicherweise um eine normale Röntgenaufnahme des Brustkorbs handelt. Zweitens wird in jedem der vier Module insbesondere angegeben, ob jeweils ein Lungentrübungsbefund, ein Pneumothorax, ein Pleuraerguss oder ein Rippenbruch festgestellt wurde. Schließlich ermöglicht TRx die Visualisierung einer Wärmekarte über dem Bild, die farblich den Bereich des Thorax anzeigt, in dem ein vermuteter Befund festgestellt wurde.
Die beabsichtigte Verwendung dieses Tools besteht darin, Ärzte, die keine Bildgebung durchführen, bei der Diagnose von Röntgenaufnahmen des Brustkorbs durch die automatische Erkennung radiologischer Befunde zu unterstützen. TRx Version 1.0 (TRx v1) wertet frontale Röntgenaufnahmen des Brustkorbs von Patienten über 14 Jahren auf vier Arten von Befunden aus: Lungentrübungen, Pleuraerguss, Frakturen und Pneumothorax. Das Ziel dieses Tools besteht darin, die diagnostische Leistung von nicht bildgebenden Ärzten durch die Bereitstellung von Hilfestellungen oder einem „vorläufigen Bericht“ zu verbessern.
Eine Tatsache, die bei der KI betont wird, ist, dass Modelle reproduzierbar sein müssen; Das Modell muss bei gleichen Eingaben die gleichen oder bessere Ergebnisse liefern. Obwohl dies offensichtlich erscheint, steht es im Gegensatz zum Menschen, der häufig sowohl inter- als auch intra-beobachtervariabilität aufweist. Der Standard eines KI-Modells sollte mindestens der menschlichen Leistung entsprechen, die es unterstützen soll. Die Reproduzierbarkeit hängt vom Problem ab und das Ausmaß der Variabilität hängt von der konkreten Aufgabe ab.
Es gibt Autoren, die berichten, dass ein KI-Modell Schwierigkeiten bei der Bereitstellung genauer Vorhersagen bereiten kann, wenn es auf neue Situationen oder Populationen angewendet wird (d. h. denen es während des Trainings nicht ausgesetzt war). Während Radiologen in der Lage sind, sich erfolgreich an Unterschiede in Bildern anzupassen (sei es aufgrund der Schichtdicke, der Scannermarkierung, der Feldstärke, der Gradientenintensität oder der Kontrastzeit), ohne die Interpretation der Bilder zu beeinträchtigen, fehlt der KI diese Fähigkeit im Allgemeinen. Wenn ein KI-Agent beispielsweise nur mit Bildern von einem 3-Tesla-MRT-Scanner trainiert wurde, kann nicht a priori garantiert werden, dass er bei Scans, die bei 1,5 Tesla durchgeführt werden, die gleichen Ergebnisse erzielt. Eine Lösung besteht darin, mathematische Prozesse zu entwickeln, um die Daten zu erkennen, zu normalisieren und umzuwandeln, um Drift zu minimieren. Ein weiterer Ansatz zur Abschwächung dieses Phänomens besteht darin, Training und Validierung mit „vollständigen“ Datensätzen durchzuführen, die jede Art der Bilddatenerfassung und -rekonstruktion repräsentieren.
Um die diagnostische Leistung eines KI-Tools umfassend zu bewerten und damit seinen bestimmungsgemäßen Einsatz sicherzustellen, empfiehlt sich die Durchführung multizentrischer Studien, die es ermöglichen, diese Leistung bei unterschiedlichen Patientenpopulationen und unterschiedlichen Bildaufnahmeprotokollen zu messen. Die vorliegende multizentrische Studie zielt darauf ab, die Leistung eines KI-Tools (TRx v.1) als diagnostisches Hilfsmittel für Röntgenaufnahmen des Brustkorbs extern zu validieren.
Studientyp
Einschreibung (Voraussichtlich)
Kontakte und Standorte
Studienorte
-
-
-
Buenos Aires, Argentinien, 1199
- Hospital Italiano de Buenos Aires
-
-
Teilnahmekriterien
Zulassungskriterien
Studienberechtigtes Alter
Akzeptiert gesunde Freiwillige
Studienberechtigte Geschlechter
Probenahmeverfahren
Studienpopulation
Beschreibung
Einschlusskriterien:
Es werden Röntgenaufnahmen mitgeliefert, die folgende Anforderungen erfüllen:
- Brust Röntgen
- Gehören zu Patienten über 18 Jahren.
- Interessenvertretung und digitale Akquise
- Die Studie wurde in den oben genannten Institutionen durchgeführt und in deren jeweiligen Bildarchivierungs- und Kommunikationssystemen gespeichert
Ausschlusskriterien:
Ausgeschlossene Röntgenaufnahmen:
- Schlechte Technik (geringer Kontrast, verschleiert, außermittig)
- Vorliegen einer abnormalen Position des Patienten während der Aufnahme.
Studienplan
Wie ist die Studie aufgebaut?
Designdetails
Was misst die Studie?
Primäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Übereinstimmung zwischen KI-Tool und Referenzstandard
Zeitfenster: 5 Monate
|
Die Übereinstimmung zwischen der von den Fachleuten zugewiesenen Kategorie und der vom Algorithmus zugewiesenen Kategorie wird analysiert.
Zu diesem Zweck wird ein diagnostischer Test zur Feststellung einer Auffälligkeit ausgewertet (d. h. der Test ist positiv, wenn mindestens einer der vier Arten von Befunden beobachtet wird).
Unter Berücksichtigung der Spezialistendiagnose als Referenzstandard wird die Verwirrungsmatrix erstellt und die Diagnosemetriken des KI-Tools (Sensitivität, Spezifität und Vorhersagewerte) berechnet.
Die 95 %-Konfidenzintervalle werden mithilfe einer exakten Binomialverteilung berechnet.
|
5 Monate
|
Sekundäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Betriebskennlinien des Empfängers
Zeitfenster: 5 Monate
|
Für die globale Kategorie der Anomalien und für jeden einzelnen radiologischen Befund werden Receiver-Operating-Characteristic-Kurven erstellt, wobei jeweils die Fläche unter der Kurve (Wert zwischen 0 und 1) berechnet wird.
Ein Modell, dessen Vorhersagen zu 100 % falsch sind, hat eine Fläche unter der Kurve von 0,0; Ein anderer, dessen Vorhersagen zu 100 % richtig sind, hat eine Fläche unter der Kurve von 1,0.
Als Referenzmaßstab dient die Kategorisierung durch die Fachradiologen.
Es wird ausgewertet, ob ein signifikanter Unterschied zwischen der Fläche unter der Kurve des KI-Tools und dem für nicht bildgebende Ärzte geschätzten Referenzwert (d. h.
Notärzte oder Assistenzärzte).
Es wird der De-Long-Test mit einem Signifikanzniveau von 0,01 verwendet.
|
5 Monate
|
|
Qualitative Analyse
Zeitfenster: 5 Monate
|
Die Bilder mit fehlerhaften Diagnosen (falsch-negativ und falsch-positiv) und die entsprechenden vom Algorithmus generierten Heatmaps werden einzeln untersucht.
|
5 Monate
|
|
Konkordanzindex zwischen Beobachtern
Zeitfenster: 5 Monate
|
Die Inter-Beobachter-Konkordanz zwischen den teilnehmenden Spezialisten wird analysiert.
In Fällen, in denen das betreffende Bild von jedem der Beobachter unterschiedlich kategorisiert wird, werden sie gebeten, die Bilder gemeinsam zu überprüfen, um eine Kategorie zu definieren.
|
5 Monate
|
|
Analyse nach Institution
Zeitfenster: 5 Monate
|
Die Variablen der Punkte 1. und 2. werden für die Bilder jeder teilnehmenden Institution separat berechnet.
Mithilfe des De-Long-Tests werden wir beurteilen, ob zwischen den einzelnen Instituten ein signifikanter Unterschied in den unterschiedlichen Werten der Fläche unter der Kurve besteht.
Es wird ein Signifikanzniveau von 0,01 verwendet.
|
5 Monate
|
Mitarbeiter und Ermittler
Ermittler
- Hauptermittler: Sonia E Benitez, MD, MSc, Hospital Italiano de Buenos Aires
Publikationen und hilfreiche Links
Allgemeine Veröffentlichungen
- Calvert JS, Price DA, Chettipally UK, Barton CW, Feldman MD, Hoffman JL, Jay M, Das R. A computational approach to early sepsis detection. Comput Biol Med. 2016 Jul 1;74:69-73. doi: 10.1016/j.compbiomed.2016.05.003. Epub 2016 May 12.
- Kesselman A, Soroosh G, Mollura DJ; RAD-AID Conference Writing Group. 2015 RAD-AID Conference on International Radiology for Developing Countries: The Evolving Global Radiology Landscape. J Am Coll Radiol. 2016 Sep;13(9):1139-1144. doi: 10.1016/j.jacr.2016.03.028. Epub 2016 May 25.
- Chartrand G, Cheng PM, Vorontsov E, Drozdzal M, Turcotte S, Pal CJ, Kadoury S, Tang A. Deep Learning: A Primer for Radiologists. Radiographics. 2017 Nov-Dec;37(7):2113-2131. doi: 10.1148/rg.2017170077.
- Erickson BJ, Korfiatis P, Akkus Z, Kline TL. Machine Learning for Medical Imaging. Radiographics. 2017 Mar-Apr;37(2):505-515. doi: 10.1148/rg.2017160130. Epub 2017 Feb 17.
- Balthazar P, Harri P, Prater A, Safdar NM. Protecting Your Patients' Interests in the Era of Big Data, Artificial Intelligence, and Predictive Analytics. J Am Coll Radiol. 2018 Mar;15(3 Pt B):580-586. doi: 10.1016/j.jacr.2017.11.035. Epub 2018 Feb 6.
- Mosquera C, Diaz FN, Binder F, Rabellino JM, Benitez SE, Beresnak AD, Seehaus A, Ducrey G, Ocantos JA, Luna DR. Chest x-ray automated triage: A semiologic approach designed for clinical implementation, exploiting different types of labels through a combination of four Deep Learning architectures. Comput Methods Programs Biomed. 2021 Jul;206:106130. doi: 10.1016/j.cmpb.2021.106130. Epub 2021 May 2.
Nützliche Links
- Weakly Supervised Learning of Deep Convolutional Neural Networks [Internet]. 2016 Institute of Electrical and Electronics Engineers, Conference on Computer Vision and Pattern Recognition. 2016.
- Guest Editorial Deep Learning in Medical Imaging: Overview and Future Promise of an Exciting New Technique [Internet]. Vol. 35, Institute of Electrical and Electronics Engineers, Transactions on Medical Imaging. 2016. p. 1153-9.
- Dataset shift in machine learning. Neural Information Processing. 2008.
Studienaufzeichnungsdaten
Haupttermine studieren
Studienbeginn (Tatsächlich)
Primärer Abschluss (Voraussichtlich)
Studienabschluss (Voraussichtlich)
Studienanmeldedaten
Zuerst eingereicht
Zuerst eingereicht, das die QC-Kriterien erfüllt hat
Zuerst gepostet (Tatsächlich)
Studienaufzeichnungsaktualisierungen
Letztes Update gepostet (Tatsächlich)
Letztes eingereichtes Update, das die QC-Kriterien erfüllt
Zuletzt verifiziert
Mehr Informationen
Begriffe im Zusammenhang mit dieser Studie
Schlüsselwörter
Zusätzliche relevante MeSH-Bedingungen
Andere Studien-ID-Nummern
- 6025
Arzneimittel- und Geräteinformationen, Studienunterlagen
Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt
Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt
Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .
Klinische Studien zur Pneumothorax
-
Tabriz University of Medical SciencesAJA University of Medical SciencesUnbekanntVergleich der Wirksamkeit von Thoraxdrainage und Nadelaspiration bei der Behandlung von PneumothoraxPneumothorax, spontan | Pneumothorax spontan primär | Pneumothorax, rezidivierend | Pneumothorax Spontane SpannungIran, Islamische Republik
-
Zealand University HospitalAnmeldung auf EinladungPleuraerkrankungen | Pleuraerguss | Pleura-Infektion | Pneumothorax spontan sekundär | Pneumothorax spontan primärDänemark
-
Chung Shan Medical UniversityAbgeschlossenLungenknoten | Pneumothorax Iatrogen Postprozedural | Neigungsbewertung MatchingTaiwan
-
University of Health Sciences LahoreNoch keine RekrutierungPleuraerguss, bösartig | Pleurodese | Pneumothorax spontan sekundär | Pneumothorax spontan primärPakistan
-
University of RochesterZurückgezogenTraumatischer PneumothoraxVereinigte Staaten
-
IsalaAbgeschlossenPneumothorax und LuftleckNiederlande
-
Centre Hospitalier Universitaire de BesanconInstitut National de la Santé Et de la Recherche Médicale, FranceRekrutierungPneumothorax Iatrogen PostprozeduralFrankreich, Irland
-
University of MiamiZurückgezogenPneumothorax Iatrogen PostprozeduralVereinigte Staaten
-
University Hospital, AkershusRekrutierungComputertomographie, Biopsie, Pneumothorax, Thoraxdrainage, PlugNorwegen
-
National Taiwan University HospitalAbgeschlossenIatrogener Pneumothorax | Vakuumflaschen-unterstützte NadelaspirationTaiwan