- ICH GCP
- US-Register für klinische Studien
- Klinische Studie NCT07298252
Diagnostische Genauigkeit von Carebot AI MMG beim Mammographie-Screening: Multizentrische MRMC-Studie (CARE-MMG-MRMC)
Retrospektive multizentrische Multi-Reader-, Multi-Case-Diagnostikgenauigkeitsstudie von Carebot AI MMG im Vergleich mit Radiologen bei 2D-Vollfeld-Digitalmammografie im Brustkrebsscreening
Diese Studie bewertet die diagnostische Leistung von Carebot AI MMG, einem künstlichen Intelligenz (KI)-gestützten Medizinprodukt zur Auswertung von Mammogrammen. Die Software analysiert Standard-Bildgebungen der digitalen Vollfeldmammographie (FFDM) und klassifiziert jede Untersuchung als ohne verdächtigen Befund („Niedriges Risiko“), als wahrscheinlich gutartige Raumforderung („Mittleres Risiko“) oder als verdächtige maligne Raumforderung („Hohes Risiko“).
Die Studie ist retrospektiv und beobachtend. Sie verwendet anonymisierte Mammographie-Untersuchungen von vier Screening-Zentren, ohne zusätzliche Bildgebung oder Kontakt zu Patientinnen. Drei erfahrene Brustradiologen beurteilen unabhängig denselben Fallbestand, und ihre Bewertungen dienen als menschlicher Referenzstandard. Ein histopathologiebasierter Referenzstandard, ergänzt durch Radiologenkonsens und Follow-up-Informationen für negative Fälle, wird verwendet, um das Vorhandensein von Krebs zu bestimmen.
Das Hauptziel ist der Vergleich des KI-Systems mit menschlichen Radiologen hinsichtlich Sensitivität und Spezifität bei der Erkennung von Brustkrebs sowie die Bewertung, ob die KI eine nicht unterlegene Leistung an zwei vordefinierten Arbeitspunkten erreichen kann: einem, der höhere Sensitivität und negativen prädiktiven Wert (Ausschluss) begünstigt, und einem, der höhere Spezifität und positiven prädiktiven Wert (Einschluss) begünstigt.
Studienübersicht
Status
Intervention / Behandlung
Detaillierte Beschreibung
Design und Setting Dies ist eine retrospektive, multizentrische, Multi-Reader-Multi-Case (MRMC)-Studie zur diagnostischen Genauigkeit von Carebot AI MMG, durchgeführt an anonymisierten 2D-Vollfeld-Digitalmammographie (FFDM)-Untersuchungen, die im Rahmen des routinemäßigen Brustkrebsscreenings erworben wurden. Mammogramme wurden von vier Screening-Zentren über einen definierten Zeitraum gesammelt. Für diese Studie wurden keine zusätzlichen Bildgebungen durchgeführt, und es wurde kein Kontakt zu Probanden aufgenommen.
Datenquelle und Population Der Quelldatensatz umfasst 4.729 Screening-Mammographie-Untersuchungen von Frauen im Alter von 32 bis 88 Jahren (Durchschnittsalter etwa 57 Jahre). Es wurden nur 2D-FFDM-Studien mit einem vollständigen Satz von Standardprojektionen (LCC, RCC, LMLO, RMLO) eingeschlossen. Untersuchungen mit unvollständigen Serien, nicht lesbaren oder beschädigten DICOM-Dateien oder fehlenden/in konsistenten Schlüsselmetadaten wurden ausgeschlossen, ebenso wie Tomosynthese (DBT)-Studien, Männer und Frauen unter 18 Jahren. Um eine ausreichende Präzision der Leistungsschätzungen zu gewährleisten, wurde der Datensatz mit zusätzlichen biopsiegesicherten Krebsfällen angereichert. Die endgültige analytische Teilmenge umfasst 222 Untersuchungen, einschließlich 48 maligner und 174 nicht-maligner Studien, mit Vertretung über drei Mammographiegeräte (Hologic Selenia Dimensions, Hologic Lorad Selenia, Fujifilm FDR-3000AWS).
Untersuchungsgerät und Vergleichsgröße Das Untersuchungsgerät ist Carebot AI MMG (Softwareversion 2.9, Deep-Learning-Modelle v2.3), ein eigenständiges KI-System, das 2D-FFDM-Untersuchungen analysiert und eine fallbasierte Klassifizierung in drei Kategorien zusammen mit einem internen Risikoscore ausgibt. Zwei vordefinierte Betriebspunkte werden evaluiert: ein hochsensibler (HSe) Schwellenwert, bei dem sowohl benigne als auch maligne Läsionen als "positiv" behandelt werden (Rule-out-Einstellung), und ein hochspezifischer (HSp) Schwellenwert, bei dem nur maligne Läsionen als "positiv" gezählt werden (Rule-in-Einstellung).
Als menschliche Vergleichsgröße lasen drei erfahrene Radiologen (RAD 1-3) unabhängig voneinander dieselben anonymisierten Studien unter Verwendung eines speziellen DICOM-Viewers, der mit einer Labeling-Anwendung integriert war. Die Radiologen waren gegenüber KI-Ergebnissen, klinischen Informationen und Outcomes verblindet und zeichneten eine fallbasierte Klassifizierung in dieselben drei Kategorien (Negativ/Benigne/Maligne) auf. Für primäre Analysen werden ihre binären Entscheidungen unter Verwendung derselben HSe- und HSp-Regeln abgeleitet. Zusätzlich wird ein "Zufallsleser"-Benchmark für die balancierte Genauigkeit konstruiert, indem in einem Bootstrap-Rahmen (20.000 Iterationen) wiederholt die Entscheidung eines Radiologen pro Fall abgetastet wird.
Referenzstandard Der Referenzstandard wird auf Studienebene festgelegt. Ein Fall wird als "Maligne" gekennzeichnet, wenn eine histopathologische Bestätigung von Brustkrebs aus einer Biopsie vorliegt, die in zeitlichem Zusammenhang mit dem Index-Mammogramm durchgeführt wurde. Ein Fall wird als "Nicht-maligne" gekennzeichnet, wenn ein Konsens zwischen zwei lokalen Radiologen besteht, dass der Befund negativ oder stabil benigne ist, typischerweise bestätigt durch mindestens 2 Jahre Bildgebungs-Follow-up. Tumorstadien (z.B. TNM) werden in der vorliegenden Analyse nicht verwendet. Alle 48 malignen Fälle aus den teilnehmenden Zentren sind in der analytischen Teilmenge enthalten; keine krebspositiven Untersuchungen wurden ausgeschlossen.
Ziele und Endpunkte Die primären Ziele sind: (1) zu demonstrieren, dass die balancierte Genauigkeit (BA) von Carebot AI MMG in beiden Betriebspunkten HSe und HSp mindestens 0,80 beträgt; (2) die Nicht-Unterlegenheit der balancierten Genauigkeit der KI im Vergleich zum MRMC-"Zufallsleser"-Benchmark mit einer Nicht-Unterlegenheitsmarge von 0,05 zu demonstrieren; und (3) die Nicht-Unterlegenheit der Sensitivität (Se) der KI gegenüber jedem der drei Radiologen in beiden HSe und HSp mit einer Nicht-Unterlegenheitsmarge von 0,07 zu demonstrieren. Sekundäre Ziele sind die Beschreibung der Spezifität (Sp), des positiven prädiktiven Wertes (PPV), des negativen prädiktiven Wertes (NPV) sowie die Charakterisierung von Mustern falsch-negativer und falsch-positiver Entscheidungen und ihrer potenziellen Implikationen für das klinische Risikomanagement.
Statistische Analyse Diagnostische Leistungsmetriken (Se, Sp, PPV, NPV, BA) werden auf Fallbasis für Carebot AI MMG und jeden Radiologen in beiden HSe und HSp berechnet. Wilson-95%-Konfidenzintervalle werden für Proportionen verwendet. Gepaarte McNemar-Tests werden verwendet, um KI und einzelne Leser in Bezug auf Se und Sp zu vergleichen. Für die balancierte Genauigkeit wird ein MRMC-Bootstrap-Verfahren mit 20.000 Iterationen verwendet, um die Verteilung des Zufallslesers zu konstruieren und die Wahrscheinlichkeit zu schätzen, dass BA_KI größer oder gleich BA_zufällig minus der vordefinierten Marge ist. Die Nicht-Unterlegenheit in der Sensitivität wird unter Verwendung eines Nam-Blackwelder-ähnlichen Rahmens an diskordanten Paaren bewertet. Falsch-negative und falsch-positive Fälle werden qualitativ überprüft, mit Schwerpunkt auf Läsionsauffälligkeit, Brustdichte und typischen Fehlermustern (z.B. dichtes Parenchym, Läsionen in Nähe des Pektoralmuskels, benigne Gefäßstrukturen, Asymmetrien).
Risiken, Ethik und Datenschutz Die Studie ist nicht-interventionell und vollständig retrospektiv. Alle Mammographie-Untersuchungen wurden als Teil der routinemäßigen Versorgung vor der Studie erworben, und alle DICOM-Daten wurden auf Standortebene gemäß DSGVO und anwendbarem nationalem Recht irreversibel anonymisiert, bevor sie an den Sponsor übermittelt wurden. Es tritt keine zusätzliche Strahlenexposition oder Patientenkontakt auf, und keine unerwünschten Ereignisse werden erwartet. Aufgrund dieses Designs erfüllt die Studie nicht die MDR-Definition einer klinischen Untersuchung gemäß Artikel 62 und unterliegt nicht der vorherigen Anzeigepflicht gemäß Artikel 74(1); eine individuelle Einwilligung nach Aufklärung ist nicht erforderlich. Die Ergebnisse sollen die klinische Bewertung von Carebot AI MMG als Entscheidungsunterstützungswerkzeug im organisierten Mammographie-Screening unterstützen.
Studientyp
Einschreibung (Tatsächlich)
Kontakte und Standorte
Studienorte
-
-
-
Dolný Kubín, Slowakei, 026 14
- Dolnooravská nemocnica s poliklinikou MUDr. L. N. Jégého
-
Považská Bystrica, Slowakei, 017 01
- Nemocnica s poliklinikou Považská Bystrica
-
Stará Ľubovňa, Slowakei, 064 01
- Ľubovnianska nemocnica
-
-
-
-
-
Prague, Tschechien, 14000
- Poliklinika MEDICON Budějovická
-
-
Teilnahmekriterien
Zulassungskriterien
Studienberechtigtes Alter
- Erwachsene
- Älterer Erwachsener
Akzeptiert gesunde Freiwillige
Probenahmeverfahren
Studienpopulation
Beschreibung
Einschlusskriterien:
- Weibliches Geschlecht
- Alter ≥ 18 Jahre zum Zeitpunkt des Screening-Mammogramms
- Screening-Vollfeld-Digitalmammographie (FFDM)-Untersuchung mit allen vier Standardansichten (LCC, RCC, LMLO, RMLO) verfügbar
- Ausreichende Bildqualität und vollständige DICOM-Metadaten zur retrospektiven Analyse
Ausschlusskriterien:
- Männliches Geschlecht
- Alter < 18 Jahre
- Digitale Brust-Tomosynthese (DBT/3D)-Untersuchungen ohne entsprechende vollständige 2D-FFDM-Vier-Ansichten-Serie
- Unvollständige Mammographie-Serie (eine oder mehrere der Ansichten LCC, RCC, LMLO, RMLO fehlen)
- Beschädigte oder nicht lesbare DICOM-Dateien
- Fehlende oder inkonsistente Schlüsselmetadaten (z.B. Lateralität, Ansicht, Aufnahmedatum)
Studienplan
Wie ist die Studie aufgebaut?
Designdetails
Kohorten und Interventionen
Gruppe / Kohorte |
Intervention / Behandlung |
|---|---|
|
Bösartige Fälle
Frauen mit biopsiegesichertem Brustkrebs, die in die analytische Untergruppe (n = 48) eingeschlossen wurden.
Jeder Fall entspricht einer Screening-Vollfeld-Digitalmammografie (FFDM)-Untersuchung mit allen vier Standardansichten (LCC, RCC, LMLO, RMLO), die retrospektiv aus den teilnehmenden Screening-Zentren identifiziert wurden.
|
Retrospektive eigenständige KI-Analyse anonymisierter 2D-Vollfeld-Digitalmammographie (FFDM)-Untersuchungen.
Das KI-System (Carebot AI MMG, Version 2.9) verarbeitet vorhandene Bilder und gibt fallbezogene Risikoklassifikationen aus; im Rahmen dieser Studie erfolgen keine zusätzliche Bildgebung, Randomisierung oder Änderungen des Patientenmanagements.
|
|
Nicht-maligne Fälle
Frauen ohne histopathologischen Nachweis von Brustkrebs, klassifiziert als negativ oder stabil gutartig durch zwei unabhängige lokale Radiologen mit mindestens 2 Jahren Bildgebungs-Nachbeobachtung (n = 174).
Jeder Fall entspricht einer Screening-FFDM-Untersuchung mit allen vier Standardansichten (LCC, RCC, LMLO, RMLO), retrospektiv ausgewählt aus derselben Screening-Population.
|
Retrospektive eigenständige KI-Analyse anonymisierter 2D-Vollfeld-Digitalmammographie (FFDM)-Untersuchungen.
Das KI-System (Carebot AI MMG, Version 2.9) verarbeitet vorhandene Bilder und gibt fallbezogene Risikoklassifikationen aus; im Rahmen dieser Studie erfolgen keine zusätzliche Bildgebung, Randomisierung oder Änderungen des Patientenmanagements.
|
Was misst die Studie?
Primäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Ausgeglichene Genauigkeit (BA) von Carebot AI MMG für die Erkennung von malignen versus nicht-malignen Untersuchungen
Zeitfenster: Baseline (Index-Mammographie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung
|
Die ausgewogene Genauigkeit (BA) ist definiert als der Durchschnitt von Sensitivität und Spezifität für die Klassifizierung jeder Mammografie-Untersuchung als bösartig oder nicht-bösartig.
BA wird an zwei vorab festgelegten Betriebspunkten des KI-Systems berechnet: einer Einstellung mit hoher Sensitivität (HSe) und einer Einstellung mit hoher Spezifität (HSp).
Die Leistung wird mit 95%-Konfidenzintervallen geschätzt und mit einem Multi-Reader-Benchmark verglichen, der aus drei erfahrenen Radiologen und einer bootstrap-basierten "Zufallsleser"-Referenz konstruiert wurde.
|
Baseline (Index-Mammographie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung
|
|
Sensitivität (Se) von Carebot AI MMG gegenüber dem histopathologiebasierten Referenzstandard
Zeitfenster: Baseline (Index-Mammografie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)
|
Sensitivität ist definiert als der Anteil bösartiger Untersuchungen, die vom KI-System korrekt als positiv klassifiziert werden.
Die Sensitivität wird sowohl an den HSe- als auch an den HSp-Arbeitspunkten berechnet und paarweise mit der Sensitivität jedes der drei Radiologen unter Verwendung derselben Fall-basierten Grundwahrheit verglichen.
|
Baseline (Index-Mammografie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)
|
Sekundäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Spezifität (Sp) von Carebot AI MMG gegenüber histopathologisch basiertem Referenzstandard
Zeitfenster: Baseline (Index-Mammographie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)
|
Spezifität ist definiert als der Anteil der nicht-malignen Untersuchungen, die durch das KI-System korrekt als negativ klassifiziert werden.
Die Spezifität wird sowohl an den HSe- als auch an den HSp-Arbeitspunkten berechnet und paarweise mit der Spezifität jedes der drei Radiologen verglichen.
|
Baseline (Index-Mammographie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)
|
|
Positiver prädiktiver Wert (PPV) von Carebot AI MMG
Zeitfenster: Baseline (Index-Mammographie-Untersuchung; Untersuchungen zwischen 01-01-2025 und 14-11-2025 erworben; retrospektive Bewertung)
|
Der positive Vorhersagewert ist definiert als der Anteil der KI-positiven Untersuchungen, die laut Referenzstandard tatsächlich bösartig sind.
Der PPV wird sowohl für HSe- als auch für HSp-Betriebspunkte angegeben und deskriptiv mit den PPV-Werten jedes Radiologen verglichen. |
Baseline (Index-Mammographie-Untersuchung; Untersuchungen zwischen 01-01-2025 und 14-11-2025 erworben; retrospektive Bewertung)
|
|
Negativer prädiktiver Wert (NPV) von Carebot AI MMG
Zeitfenster: Baseline (Index-Mammographie-Untersuchung; Untersuchungen zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)
|
Der negative prädiktive Wert ist definiert als der Anteil der KI-negativen Untersuchungen, die gemäß dem Referenzstandard tatsächlich nicht bösartig sind.
Der NPV wird sowohl für die HSe- als auch für die HSp-Arbeitspunkte angegeben und deskriptiv mit den NPV-Werten jedes Radiologen verglichen.
|
Baseline (Index-Mammographie-Untersuchung; Untersuchungen zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)
|
Mitarbeiter und Ermittler
Sponsor
Studienaufzeichnungsdaten
Haupttermine studieren
Studienbeginn (Tatsächlich)
Primärer Abschluss (Tatsächlich)
Studienabschluss (Tatsächlich)
Studienanmeldedaten
Zuerst eingereicht
Zuerst eingereicht, das die QC-Kriterien erfüllt hat
Zuerst gepostet (Geschätzt)
Studienaufzeichnungsaktualisierungen
Letztes Update gepostet (Tatsächlich)
Letztes eingereichtes Update, das die QC-Kriterien erfüllt
Zuletzt verifiziert
Mehr Informationen
Begriffe im Zusammenhang mit dieser Studie
Schlüsselwörter
Zusätzliche relevante MeSH-Bedingungen
Andere Studien-ID-Nummern
- CB-MMG-02-MC (Andere Kennung: Carebot s.r.o.)
Plan für individuelle Teilnehmerdaten (IPD)
Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?
Beschreibung des IPD-Plans
Arzneimittel- und Geräteinformationen, Studienunterlagen
Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt
Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt
Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .
Klinische Studien zur Neoplasien der Brust
-
Xijing HospitalAktiv, nicht rekrutierendBrustkrebs | Brustkrebs (Triple Negative Breast Cancer (TNBC))China
-
Novartis PharmaceuticalsAbgeschlossenMetastasierter Brustkrebs (MBC) | Locally Advance Breast Cancer (LABC)Vereinigtes Königreich, Spanien
-
Shanghai Henlius BiotechNoch keine RekrutierungBrustkrebs (Triple Negative Breast Cancer (TNBC))China
-
BioNTech SESeventh Framework ProgrammeAbgeschlossenBrustkrebs (Triple Negative Breast Cancer (TNBC))Schweden, Deutschland
-
Filipa Lynce, MDAstraZeneca; Daiichi SankyoRekrutierungBrustkrebs | HER2-positiver Brustkrebs | Invasiver Brustkrebs | Entzündlicher Brustkrebs Stadium III | HER2 Low Breast AdenokarzinomVereinigte Staaten
-
John MascarenhasNational Cancer Institute (NCI); National Institutes of Health (NIH); Celgene... und andere MitarbeiterAbgeschlossenIDH2-Mutation | Accelerated/Blast-phase Myeloproliferative Neoplasm | Myelofibrose in der chronischen PhaseVereinigte Staaten, Kanada
-
Jessica Mezzanotte SharpeRekrutierungNicht-kleinzelligem Lungenkrebs | Klassisches Hodgkin-Lymphom | Plattenepithelkarzinom Mund | Melanom (Hautkrebs) | Brustkrebs (Triple Negative Breast Cancer (TNBC)) | Invasives Mammakarzinom | Nierenzellkarzinom (Nierenkrebs) | MSI-H/dMMR RektumkarzinomVereinigte Staaten
Klinische Studien zur Carebot AI MMG-Softwareanalyse
-
Carebot s.r.o.AbgeschlossenBrustkrebs | Gutartiger BrusttumorTschechien
-
Carebot s.r.o.AbgeschlossenLungenentzündung | Lungenkrankheit | Pneumothorax | Lungenkrebs | Kardiomegalie | Künstliche Intelligenz | Lungenödem | Pleuraerguss | Atelektase | Konsolidierung | Hilar Verkalkung | RippenbruchTschechien
-
Karolinska University HospitalKarolinska Institutet; Lunit Inc.; Capio Sankt Görans HospitalAktiv, nicht rekrutierendBrusttumor weiblichSchweden
-
Carebot s.r.o.AbgeschlossenPneumothorax | Subkutanes Emphysem | Kardiomegalie | Pleuraerguss | Atelektase | Lungenknoten, einzeln | KonsolidierungTschechien