Diese Seite wurde automatisch übersetzt und die Genauigkeit der Übersetzung wird nicht garantiert. Bitte wende dich an die englische Version für einen Quelltext.

Diagnostische Genauigkeit von Carebot AI MMG beim Mammographie-Screening: Multizentrische MRMC-Studie (CARE-MMG-MRMC)

13. Januar 2026 aktualisiert von: Carebot s.r.o.

Retrospektive multizentrische Multi-Reader-, Multi-Case-Diagnostikgenauigkeitsstudie von Carebot AI MMG im Vergleich mit Radiologen bei 2D-Vollfeld-Digitalmammografie im Brustkrebsscreening

Diese Studie bewertet die diagnostische Leistung von Carebot AI MMG, einem künstlichen Intelligenz (KI)-gestützten Medizinprodukt zur Auswertung von Mammogrammen. Die Software analysiert Standard-Bildgebungen der digitalen Vollfeldmammographie (FFDM) und klassifiziert jede Untersuchung als ohne verdächtigen Befund („Niedriges Risiko“), als wahrscheinlich gutartige Raumforderung („Mittleres Risiko“) oder als verdächtige maligne Raumforderung („Hohes Risiko“).

Die Studie ist retrospektiv und beobachtend. Sie verwendet anonymisierte Mammographie-Untersuchungen von vier Screening-Zentren, ohne zusätzliche Bildgebung oder Kontakt zu Patientinnen. Drei erfahrene Brustradiologen beurteilen unabhängig denselben Fallbestand, und ihre Bewertungen dienen als menschlicher Referenzstandard. Ein histopathologiebasierter Referenzstandard, ergänzt durch Radiologenkonsens und Follow-up-Informationen für negative Fälle, wird verwendet, um das Vorhandensein von Krebs zu bestimmen.

Das Hauptziel ist der Vergleich des KI-Systems mit menschlichen Radiologen hinsichtlich Sensitivität und Spezifität bei der Erkennung von Brustkrebs sowie die Bewertung, ob die KI eine nicht unterlegene Leistung an zwei vordefinierten Arbeitspunkten erreichen kann: einem, der höhere Sensitivität und negativen prädiktiven Wert (Ausschluss) begünstigt, und einem, der höhere Spezifität und positiven prädiktiven Wert (Einschluss) begünstigt.

Studienübersicht

Detaillierte Beschreibung

Design und Setting Dies ist eine retrospektive, multizentrische, Multi-Reader-Multi-Case (MRMC)-Studie zur diagnostischen Genauigkeit von Carebot AI MMG, durchgeführt an anonymisierten 2D-Vollfeld-Digitalmammographie (FFDM)-Untersuchungen, die im Rahmen des routinemäßigen Brustkrebsscreenings erworben wurden. Mammogramme wurden von vier Screening-Zentren über einen definierten Zeitraum gesammelt. Für diese Studie wurden keine zusätzlichen Bildgebungen durchgeführt, und es wurde kein Kontakt zu Probanden aufgenommen.

Datenquelle und Population Der Quelldatensatz umfasst 4.729 Screening-Mammographie-Untersuchungen von Frauen im Alter von 32 bis 88 Jahren (Durchschnittsalter etwa 57 Jahre). Es wurden nur 2D-FFDM-Studien mit einem vollständigen Satz von Standardprojektionen (LCC, RCC, LMLO, RMLO) eingeschlossen. Untersuchungen mit unvollständigen Serien, nicht lesbaren oder beschädigten DICOM-Dateien oder fehlenden/in konsistenten Schlüsselmetadaten wurden ausgeschlossen, ebenso wie Tomosynthese (DBT)-Studien, Männer und Frauen unter 18 Jahren. Um eine ausreichende Präzision der Leistungsschätzungen zu gewährleisten, wurde der Datensatz mit zusätzlichen biopsiegesicherten Krebsfällen angereichert. Die endgültige analytische Teilmenge umfasst 222 Untersuchungen, einschließlich 48 maligner und 174 nicht-maligner Studien, mit Vertretung über drei Mammographiegeräte (Hologic Selenia Dimensions, Hologic Lorad Selenia, Fujifilm FDR-3000AWS).

Untersuchungsgerät und Vergleichsgröße Das Untersuchungsgerät ist Carebot AI MMG (Softwareversion 2.9, Deep-Learning-Modelle v2.3), ein eigenständiges KI-System, das 2D-FFDM-Untersuchungen analysiert und eine fallbasierte Klassifizierung in drei Kategorien zusammen mit einem internen Risikoscore ausgibt. Zwei vordefinierte Betriebspunkte werden evaluiert: ein hochsensibler (HSe) Schwellenwert, bei dem sowohl benigne als auch maligne Läsionen als "positiv" behandelt werden (Rule-out-Einstellung), und ein hochspezifischer (HSp) Schwellenwert, bei dem nur maligne Läsionen als "positiv" gezählt werden (Rule-in-Einstellung).

Als menschliche Vergleichsgröße lasen drei erfahrene Radiologen (RAD 1-3) unabhängig voneinander dieselben anonymisierten Studien unter Verwendung eines speziellen DICOM-Viewers, der mit einer Labeling-Anwendung integriert war. Die Radiologen waren gegenüber KI-Ergebnissen, klinischen Informationen und Outcomes verblindet und zeichneten eine fallbasierte Klassifizierung in dieselben drei Kategorien (Negativ/Benigne/Maligne) auf. Für primäre Analysen werden ihre binären Entscheidungen unter Verwendung derselben HSe- und HSp-Regeln abgeleitet. Zusätzlich wird ein "Zufallsleser"-Benchmark für die balancierte Genauigkeit konstruiert, indem in einem Bootstrap-Rahmen (20.000 Iterationen) wiederholt die Entscheidung eines Radiologen pro Fall abgetastet wird.

Referenzstandard Der Referenzstandard wird auf Studienebene festgelegt. Ein Fall wird als "Maligne" gekennzeichnet, wenn eine histopathologische Bestätigung von Brustkrebs aus einer Biopsie vorliegt, die in zeitlichem Zusammenhang mit dem Index-Mammogramm durchgeführt wurde. Ein Fall wird als "Nicht-maligne" gekennzeichnet, wenn ein Konsens zwischen zwei lokalen Radiologen besteht, dass der Befund negativ oder stabil benigne ist, typischerweise bestätigt durch mindestens 2 Jahre Bildgebungs-Follow-up. Tumorstadien (z.B. TNM) werden in der vorliegenden Analyse nicht verwendet. Alle 48 malignen Fälle aus den teilnehmenden Zentren sind in der analytischen Teilmenge enthalten; keine krebspositiven Untersuchungen wurden ausgeschlossen.

Ziele und Endpunkte Die primären Ziele sind: (1) zu demonstrieren, dass die balancierte Genauigkeit (BA) von Carebot AI MMG in beiden Betriebspunkten HSe und HSp mindestens 0,80 beträgt; (2) die Nicht-Unterlegenheit der balancierten Genauigkeit der KI im Vergleich zum MRMC-"Zufallsleser"-Benchmark mit einer Nicht-Unterlegenheitsmarge von 0,05 zu demonstrieren; und (3) die Nicht-Unterlegenheit der Sensitivität (Se) der KI gegenüber jedem der drei Radiologen in beiden HSe und HSp mit einer Nicht-Unterlegenheitsmarge von 0,07 zu demonstrieren. Sekundäre Ziele sind die Beschreibung der Spezifität (Sp), des positiven prädiktiven Wertes (PPV), des negativen prädiktiven Wertes (NPV) sowie die Charakterisierung von Mustern falsch-negativer und falsch-positiver Entscheidungen und ihrer potenziellen Implikationen für das klinische Risikomanagement.

Statistische Analyse Diagnostische Leistungsmetriken (Se, Sp, PPV, NPV, BA) werden auf Fallbasis für Carebot AI MMG und jeden Radiologen in beiden HSe und HSp berechnet. Wilson-95%-Konfidenzintervalle werden für Proportionen verwendet. Gepaarte McNemar-Tests werden verwendet, um KI und einzelne Leser in Bezug auf Se und Sp zu vergleichen. Für die balancierte Genauigkeit wird ein MRMC-Bootstrap-Verfahren mit 20.000 Iterationen verwendet, um die Verteilung des Zufallslesers zu konstruieren und die Wahrscheinlichkeit zu schätzen, dass BA_KI größer oder gleich BA_zufällig minus der vordefinierten Marge ist. Die Nicht-Unterlegenheit in der Sensitivität wird unter Verwendung eines Nam-Blackwelder-ähnlichen Rahmens an diskordanten Paaren bewertet. Falsch-negative und falsch-positive Fälle werden qualitativ überprüft, mit Schwerpunkt auf Läsionsauffälligkeit, Brustdichte und typischen Fehlermustern (z.B. dichtes Parenchym, Läsionen in Nähe des Pektoralmuskels, benigne Gefäßstrukturen, Asymmetrien).

Risiken, Ethik und Datenschutz Die Studie ist nicht-interventionell und vollständig retrospektiv. Alle Mammographie-Untersuchungen wurden als Teil der routinemäßigen Versorgung vor der Studie erworben, und alle DICOM-Daten wurden auf Standortebene gemäß DSGVO und anwendbarem nationalem Recht irreversibel anonymisiert, bevor sie an den Sponsor übermittelt wurden. Es tritt keine zusätzliche Strahlenexposition oder Patientenkontakt auf, und keine unerwünschten Ereignisse werden erwartet. Aufgrund dieses Designs erfüllt die Studie nicht die MDR-Definition einer klinischen Untersuchung gemäß Artikel 62 und unterliegt nicht der vorherigen Anzeigepflicht gemäß Artikel 74(1); eine individuelle Einwilligung nach Aufklärung ist nicht erforderlich. Die Ergebnisse sollen die klinische Bewertung von Carebot AI MMG als Entscheidungsunterstützungswerkzeug im organisierten Mammographie-Screening unterstützen.

Studientyp

Beobachtungs

Einschreibung (Tatsächlich)

222

Kontakte und Standorte

Dieser Abschnitt enthält die Kontaktdaten derjenigen, die die Studie durchführen, und Informationen darüber, wo diese Studie durchgeführt wird.

Studienorte

      • Dolný Kubín, Slowakei, 026 14
        • Dolnooravská nemocnica s poliklinikou MUDr. L. N. Jégého
      • Považská Bystrica, Slowakei, 017 01
        • Nemocnica s poliklinikou Považská Bystrica
      • Stará Ľubovňa, Slowakei, 064 01
        • Ľubovnianska nemocnica
      • Prague, Tschechien, 14000
        • Poliklinika MEDICON Budějovická

Teilnahmekriterien

Forscher suchen nach Personen, die einer bestimmten Beschreibung entsprechen, die als Auswahlkriterien bezeichnet werden. Einige Beispiele für diese Kriterien sind der allgemeine Gesundheitszustand einer Person oder frühere Behandlungen.

Zulassungskriterien

Studienberechtigtes Alter

  • Erwachsene
  • Älterer Erwachsener

Akzeptiert gesunde Freiwillige

Ja

Probenahmeverfahren

Nicht-Wahrscheinlichkeitsprobe

Studienpopulation

Frauen, die sich in vier teilnehmenden Zentren in Mitteleuropa einer routinemäßigen Screening-Mammographie unterziehen. Der analytische Datensatz besteht aus einer retrospektiv zusammengestellten Fall-Kontroll-Teilmenge von 222 anonymisierten 2D-FFDM-Untersuchungen (48 maligne und 174 nicht-maligne), die aus einer Quellkohorte von 4.729 Screening-Studien ausgewählt wurden.

Beschreibung

Einschlusskriterien:

  • Weibliches Geschlecht
  • Alter ≥ 18 Jahre zum Zeitpunkt des Screening-Mammogramms
  • Screening-Vollfeld-Digitalmammographie (FFDM)-Untersuchung mit allen vier Standardansichten (LCC, RCC, LMLO, RMLO) verfügbar
  • Ausreichende Bildqualität und vollständige DICOM-Metadaten zur retrospektiven Analyse

Ausschlusskriterien:

  • Männliches Geschlecht
  • Alter < 18 Jahre
  • Digitale Brust-Tomosynthese (DBT/3D)-Untersuchungen ohne entsprechende vollständige 2D-FFDM-Vier-Ansichten-Serie
  • Unvollständige Mammographie-Serie (eine oder mehrere der Ansichten LCC, RCC, LMLO, RMLO fehlen)
  • Beschädigte oder nicht lesbare DICOM-Dateien
  • Fehlende oder inkonsistente Schlüsselmetadaten (z.B. Lateralität, Ansicht, Aufnahmedatum)

Studienplan

Dieser Abschnitt enthält Einzelheiten zum Studienplan, einschließlich des Studiendesigns und der Messung der Studieninhalte.

Wie ist die Studie aufgebaut?

Designdetails

Kohorten und Interventionen

Gruppe / Kohorte
Intervention / Behandlung
Bösartige Fälle
Frauen mit biopsiegesichertem Brustkrebs, die in die analytische Untergruppe (n = 48) eingeschlossen wurden. Jeder Fall entspricht einer Screening-Vollfeld-Digitalmammografie (FFDM)-Untersuchung mit allen vier Standardansichten (LCC, RCC, LMLO, RMLO), die retrospektiv aus den teilnehmenden Screening-Zentren identifiziert wurden.
Retrospektive eigenständige KI-Analyse anonymisierter 2D-Vollfeld-Digitalmammographie (FFDM)-Untersuchungen. Das KI-System (Carebot AI MMG, Version 2.9) verarbeitet vorhandene Bilder und gibt fallbezogene Risikoklassifikationen aus; im Rahmen dieser Studie erfolgen keine zusätzliche Bildgebung, Randomisierung oder Änderungen des Patientenmanagements.
Nicht-maligne Fälle
Frauen ohne histopathologischen Nachweis von Brustkrebs, klassifiziert als negativ oder stabil gutartig durch zwei unabhängige lokale Radiologen mit mindestens 2 Jahren Bildgebungs-Nachbeobachtung (n = 174). Jeder Fall entspricht einer Screening-FFDM-Untersuchung mit allen vier Standardansichten (LCC, RCC, LMLO, RMLO), retrospektiv ausgewählt aus derselben Screening-Population.
Retrospektive eigenständige KI-Analyse anonymisierter 2D-Vollfeld-Digitalmammographie (FFDM)-Untersuchungen. Das KI-System (Carebot AI MMG, Version 2.9) verarbeitet vorhandene Bilder und gibt fallbezogene Risikoklassifikationen aus; im Rahmen dieser Studie erfolgen keine zusätzliche Bildgebung, Randomisierung oder Änderungen des Patientenmanagements.

Was misst die Studie?

Primäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Ausgeglichene Genauigkeit (BA) von Carebot AI MMG für die Erkennung von malignen versus nicht-malignen Untersuchungen
Zeitfenster: Baseline (Index-Mammographie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung
Die ausgewogene Genauigkeit (BA) ist definiert als der Durchschnitt von Sensitivität und Spezifität für die Klassifizierung jeder Mammografie-Untersuchung als bösartig oder nicht-bösartig. BA wird an zwei vorab festgelegten Betriebspunkten des KI-Systems berechnet: einer Einstellung mit hoher Sensitivität (HSe) und einer Einstellung mit hoher Spezifität (HSp). Die Leistung wird mit 95%-Konfidenzintervallen geschätzt und mit einem Multi-Reader-Benchmark verglichen, der aus drei erfahrenen Radiologen und einer bootstrap-basierten "Zufallsleser"-Referenz konstruiert wurde.
Baseline (Index-Mammographie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung
Sensitivität (Se) von Carebot AI MMG gegenüber dem histopathologiebasierten Referenzstandard
Zeitfenster: Baseline (Index-Mammografie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)
Sensitivität ist definiert als der Anteil bösartiger Untersuchungen, die vom KI-System korrekt als positiv klassifiziert werden. Die Sensitivität wird sowohl an den HSe- als auch an den HSp-Arbeitspunkten berechnet und paarweise mit der Sensitivität jedes der drei Radiologen unter Verwendung derselben Fall-basierten Grundwahrheit verglichen.
Baseline (Index-Mammografie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)

Sekundäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Spezifität (Sp) von Carebot AI MMG gegenüber histopathologisch basiertem Referenzstandard
Zeitfenster: Baseline (Index-Mammographie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)
Spezifität ist definiert als der Anteil der nicht-malignen Untersuchungen, die durch das KI-System korrekt als negativ klassifiziert werden. Die Spezifität wird sowohl an den HSe- als auch an den HSp-Arbeitspunkten berechnet und paarweise mit der Spezifität jedes der drei Radiologen verglichen.
Baseline (Index-Mammographie-Untersuchung; Untersuchungen durchgeführt zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)
Positiver prädiktiver Wert (PPV) von Carebot AI MMG
Zeitfenster: Baseline (Index-Mammographie-Untersuchung; Untersuchungen zwischen 01-01-2025 und 14-11-2025 erworben; retrospektive Bewertung)
Der positive Vorhersagewert ist definiert als der Anteil der KI-positiven Untersuchungen, die laut Referenzstandard tatsächlich bösartig sind.
Der PPV wird sowohl für HSe- als auch für HSp-Betriebspunkte angegeben und deskriptiv mit den PPV-Werten jedes Radiologen verglichen.
Baseline (Index-Mammographie-Untersuchung; Untersuchungen zwischen 01-01-2025 und 14-11-2025 erworben; retrospektive Bewertung)
Negativer prädiktiver Wert (NPV) von Carebot AI MMG
Zeitfenster: Baseline (Index-Mammographie-Untersuchung; Untersuchungen zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)
Der negative prädiktive Wert ist definiert als der Anteil der KI-negativen Untersuchungen, die gemäß dem Referenzstandard tatsächlich nicht bösartig sind. Der NPV wird sowohl für die HSe- als auch für die HSp-Arbeitspunkte angegeben und deskriptiv mit den NPV-Werten jedes Radiologen verglichen.
Baseline (Index-Mammographie-Untersuchung; Untersuchungen zwischen 01-01-2025 und 14-11-2025; retrospektive Bewertung)

Mitarbeiter und Ermittler

Hier finden Sie Personen und Organisationen, die an dieser Studie beteiligt sind.

Sponsor

Studienaufzeichnungsdaten

Diese Daten verfolgen den Fortschritt der Übermittlung von Studienaufzeichnungen und zusammenfassenden Ergebnissen an ClinicalTrials.gov. Studienaufzeichnungen und gemeldete Ergebnisse werden von der National Library of Medicine (NLM) überprüft, um sicherzustellen, dass sie bestimmten Qualitätskontrollstandards entsprechen, bevor sie auf der öffentlichen Website veröffentlicht werden.

Haupttermine studieren

Studienbeginn (Tatsächlich)

1. Januar 2025

Primärer Abschluss (Tatsächlich)

3. November 2025

Studienabschluss (Tatsächlich)

3. November 2025

Studienanmeldedaten

Zuerst eingereicht

14. November 2025

Zuerst eingereicht, das die QC-Kriterien erfüllt hat

17. Dezember 2025

Zuerst gepostet (Geschätzt)

23. Dezember 2025

Studienaufzeichnungsaktualisierungen

Letztes Update gepostet (Tatsächlich)

14. Januar 2026

Letztes eingereichtes Update, das die QC-Kriterien erfüllt

13. Januar 2026

Zuletzt verifiziert

1. Januar 2026

Mehr Informationen

Begriffe im Zusammenhang mit dieser Studie

Plan für individuelle Teilnehmerdaten (IPD)

Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?

NEIN

Beschreibung des IPD-Plans

Dies ist eine retrospektive, multizentrische diagnostische Genauigkeitsstudie unter Verwendung anonymisierter Vollfeld-Digitalmammographie (FFDM)-Bilder und zugehöriger Metadaten, die gemäß lokalen Datennutzungsvereinbarungen erhoben wurden. Individualisierte Bildgebungsdaten sollen aufgrund vertraglicher, datenschutzrechtlicher und regulatorischer Einschränkungen nicht außerhalb der teilnehmenden Einrichtungen geteilt werden. Aggregierte, anonymisierte Zusammenfassungsergebnisse (einschließlich Leistungskennzahlen und wichtiger Subgruppenanalysen) können in Veröffentlichungen und auf angemessene Anfrage hin geteilt werden, jedoch ist kein IPD-Repository geplant.

Arzneimittel- und Geräteinformationen, Studienunterlagen

Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt

Nein

Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt

Nein

Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .

Klinische Studien zur Neoplasien der Brust

Klinische Studien zur Carebot AI MMG-Softwareanalyse

Abonnieren