Denne side blev automatisk oversat, og nøjagtigheden af ​​oversættelsen er ikke garanteret. Der henvises til engelsk version for en kildetekst.

Diagnostisk Nøjagtighed af Carebot AI MMG i Mammografiscreening: Multicenter MRMC-undersøgelse (CARE-MMG-MRMC)

13. januar 2026 opdateret af: Carebot s.r.o.

Retrospektiv Multicenter Multi-Læser, Multi-Tilfælde Diagnostisk Nøjagtighedsstudie af Carebot AI MMG Sammenlignet med Radiologer på 2D Full-Field Digital Mammografi i Brystkræftscreening

Denne undersøgelse evaluerer den diagnostiske præstation af Carebot AI MMG, en kunstig intelligens (AI)-drevet medicinsk enhed til evaluering af mammogrammer. Softwaren analyserer standard fuldfelts digitale mammografi (FFDM)-billeder og klassificerer hver undersøgelse som enten uden mistænkelige fund ("Lav risiko"), en sandsynligvis godartet masse ("Medium risiko") eller en mistænkelig ondartet masse ("Høj risiko").

Undersøgelsen er retrospektiv og observationel. Den anvender anonymiserede mammografiundersøgelser fra fire screeningscentre uden yderligere billeddannelse eller kontakt med patienter. Tre erfarne brystradiologer læser uafhængigt det samme sæt af tilfælde, og deres vurderinger bruges som den menneskelige reference. En histopatologibaseret referencestandard, suppleret med radiologkonsensus og opfølgende oplysninger for negative tilfælde, bruges til at afgøre, om der er kræft til stede.

Hovedmålet er at sammenligne AI-systemet med menneskelige radiologer med hensyn til følsomhed og specificitet for detektion af brystkræft og at vurdere, om AI kan opnå ikke-underlegen præstation ved to foruddefinerede driftspunkter: ét, der favoriserer højere følsomhed og negativ prædiktiv værdi (udelukkelse), og ét, der favoriserer højere specificitet og positiv prædiktiv værdi (inklusion).

Studieoversigt

Detaljeret beskrivelse

Design og ramme Dette er en retrospektiv, multicenter, multi-reader, multi-case (MRMC) diagnostisk nøjagtighedsundersøgelse af Carebot AI MMG, udført på anonymiserede 2D full-field digital mammografi (FFDM) undersøgelser, der er indsamlet som en del af rutinemæssig brystkræftscreening. Mammogrammer blev indsamlet fra fire screeningscentre over en defineret tidsperiode. Der blev ikke udført yderligere billeddannelse med henblik på denne undersøgelse, og ingen deltagere blev kontaktet.

Datakilde og population Kilde-datasættet består af 4.729 screeningsmammografiundersøgelser fra kvinder i alderen 32 til 88 år (gennemsnit ca. 57 år). Kun 2D FFDM-undersøgelser med et komplet sæt standardprojektioner (LCC, RCC, LMLO, RMLO) blev inkluderet. Undersøgelser med ufuldstændige serier, ulæselige eller korrupte DICOM-filer eller manglende/inconsistente nøglemetadata blev ekskluderet, ligesom tomosyntese (DBT)-undersøgelser, mænd og kvinder under 18 år. For at sikre tilstrækkelig præcision af præstationsestimater blev datasættet beriget med yderligere biopsibekræftede kræfttilfælde. Det endelige analytiske undersæt omfatter 222 undersøgelser, herunder 48 maligne og 174 ikke-maligne undersøgelser, med repræsentation på tværs af tre mammografi-enheder (Hologic Selenia Dimensions, Hologic Lorad Selenia, Fujifilm FDR-3000AWS).

Undersøgelsesenhed og komparator Undersøgelsesenheden er Carebot AI MMG (softwareversion 2.9, deep-learning-modeller v2.3), et fritstående AI-system, der analyserer 2D FFDM-undersøgelser og outputter en sag-niveau klassifikation i tre kategorier sammen med en intern risikoscore. To foruddefinerede driftspunkter evalueres: en højfølsomhed (HSe) tærskel, hvor både godartede og ondartede masser behandles som "positive" (rule-out setting), og en højspecifik (HSp) tærskel, hvor kun ondartede masser tælles som "positive" (rule-in setting).

Som en menneskelig komparator læste tre erfarne radiologer (RAD 1-3) uafhængigt de samme anonymiserede undersøgelser ved hjælp af en dedikeret DICOM-viewer integreret med en mærkningsapplikation. Radiologer var blindede for AI-output, kliniske oplysninger og udfald og registrerede en sag-niveau klassifikation i de samme tre kategorier (Negativ/Godartet/Ondartet). For primære analyser afledes deres binære beslutninger ved hjælp af de samme HSe- og HSp-regler. Derudover konstrueres et "tilfældig læser" benchmark for afbalanceret nøjagtighed ved gentagne gange at udtage en radiologs beslutning pr. sag i en bootstrap-ramme (20.000 iterationer).

Referencestandard Reference standarden etableres på undersøgelsesniveau. En sag mærkes "Ondartet", hvis der er histopatologisk bekræftelse af brystkræft fra biopsi udført i tidsmæssig sammenhæng med indeks-mammogrammet. En sag mærkes "Ikke-ondartet", hvis der er konsensus mellem to lokale radiologer om, at fundet er negativt eller stabilt godartet, typisk bekræftet af mindst 2 års billedfølgning. Tumorstadie (f.eks. TNM) bruges ikke i den nuværende analyse. Alle 48 ondartede sager fra de deltagende centre er inkluderet i det analytiske undersæt; ingen kræft-positive undersøgelser blev ekskluderet.

Mål og endpoints De primære mål er: (1) at demonstrere, at den afbalancerede nøjagtighed (BA) af Carebot AI MMG er mindst 0,80 i både HSe- og HSp-driftspunkter; (2) at demonstrere ikke-underlegenhed af AI's afbalancerede nøjagtighed sammenlignet med MRMC "tilfældig læser" benchmark med en ikke-underlegenhedsmargin på 0,05; og (3) at demonstrere ikke-underlegenhed af følsomhed (Se) af AI versus hver af de tre radiologer i både HSe og HSp, med en ikke-underlegenhedsmargin på 0,07. Sekundære mål er at beskrive specificitet (Sp), positiv prædiktiv værdi (PPV), negativ prædiktiv værdi (NPV) og at karakterisere mønstre af falsk-negative og falsk-positive beslutninger og deres potentielle implikationer for klinisk risikostyring.

Statistisk analyse Diagnostiske præstationsmålinger (Se, Sp, PPV, NPV, BA) beregnes på sagniveau for Carebot AI MMG og hver radiolog i både HSe og HSp. Wilson 95% konfidensintervaller anvendes for proportioner. Parrede McNemar-tests bruges til at sammenligne AI og individuelle læsere med hensyn til Se og Sp. For afbalanceret nøjagtighed anvendes en MRMC bootstrap-procedure med 20.000 iterationer til at konstruere fordelingen af den tilfældige læser og estimere sandsynligheden for, at BA_AI er større end eller lig med BA_tilfældig minus den foruddefinerede margin. Ikke-underlegenhed i følsomhed vurderes ved hjælp af et Nam-Blackwelder-type rammeværk på diskordante par. Falsk-negative og falsk-positive sager gennemgås kvalitativt med vægt på læsionssynlighed, brysttæthed og typiske fejlmønstre (f.eks. tæt parenchym, læsioner nær pectoral-musklen, godartede vaskulære strukturer, asymmetrier).

Risiko, etik og databeskyttelse Undersøgelsen er ikke-interventionel og helt retrospektiv. Alle mammografiundersøgelser blev indsamlet som en del af rutinemæssig pleje før undersøgelsen, og alle DICOM-data blev irreversibelt anonymiseret på stedniveau i overensstemmelse med GDPR og gældende national lovgivning før overførsel til sponsor. Der sker ingen yderligere strålingseksponering eller patientkontakt, og der forventes ingen bivirkninger. Givet dette design opfylder undersøgelsen ikke MDR-definitionen af en klinisk undersøgelse i henhold til artikel 62 og er ikke underlagt forudgående meddelelse i henhold til artikel 74(1); individuel informeret samtykke er ikke påkrævet. Resultaterne er beregnet til at understøtte den kliniske evaluering af Carebot AI MMG som et beslutningsstøtteværktøj i organiseret mammografiscreening.

Undersøgelsestype

Observationel

Tilmelding (Faktiske)

222

Kontakter og lokationer

Dette afsnit indeholder kontaktoplysninger for dem, der udfører undersøgelsen, og oplysninger om, hvor denne undersøgelse udføres.

Studiesteder

      • Dolný Kubín, Slovakiet, 026 14
        • Dolnooravská nemocnica s poliklinikou MUDr. L. N. Jégého
      • Považská Bystrica, Slovakiet, 017 01
        • Nemocnica s poliklinikou Považská Bystrica
      • Stará Ľubovňa, Slovakiet, 064 01
        • Ľubovnianska nemocnica
      • Prague, Tjekkiet, 14000
        • Poliklinika MEDICON Budějovická

Deltagelseskriterier

Forskere leder efter personer, der passer til en bestemt beskrivelse, kaldet berettigelseskriterier. Nogle eksempler på disse kriterier er en persons generelle helbredstilstand eller tidligere behandlinger.

Berettigelseskriterier

Aldre berettiget til at studere

  • Voksen
  • Ældre voksen

Tager imod sunde frivillige

Ja

Prøveudtagningsmetode

Ikke-sandsynlighedsprøve

Studiebefolkning

Kvinder, der gennemgår rutinemæssigt screeningsmammografi på fire deltagende centre i Centraleuropa. Det analytiske datasæt består af et retrospektivt sammensat case-control-undersæt af 222 anonymiserede 2D FFDM-undersøgelser (48 maligne og 174 ikke-maligne), udvalgt fra en kildepopulation på 4.729 screeningsstudier.

Beskrivelse

Inklusionskriterier:

  • Kvindelig køn
  • Alder ≥ 18 år på tidspunktet for screeningsmammografien
  • Screeningsundersøgelse med fuldt digitalt mammografi (FFDM) med alle fire standardprojektioner (LCC, RCC, LMLO, RMLO) tilgængelige
  • Tilstrækkelig billedkvalitet og komplet DICOM-metadata til at muliggøre retrospektiv analyse

Eksklusionskriterier:

  • Mandligt køn
  • Alder < 18 år
  • Digital brysttomosyntese (DBT/3D) undersøgelser uden en tilsvarende fuld 2D FFDM fire-projektions serie
  • Ufuldstændig mammografiserie (manglende en eller flere af LCC, RCC, LMLO, RMLO)
  • Korrumperede eller ulæselige DICOM-filer
  • Manglende eller inkonsistente nøglemetadata (f.eks. lateralitet, projektion, oprettelsesdato)

Studieplan

Dette afsnit indeholder detaljer om studieplanen, herunder hvordan undersøgelsen er designet, og hvad undersøgelsen måler.

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

Kohorter og interventioner

Gruppe / kohorte
Intervention / Behandling
Maligne tilfælde
Kvinder med biopsibekræftet brystkræft inkluderet i det analytiske undersæt (n = 48). Hvert tilfælde svarer til en screening med fuldfelt digital mammografi (FFDM) med alle fire standardprojektioner (LCC, RCC, LMLO, RMLO), retrospektivt identificeret fra deltagende screeningscentre.
Retrospektiv, frittstående AI-analyse af anonymiserede 2D fuldfelt digitale mammografiundersøgelser (FFDM). AI-systemet (Carebot AI MMG, version 2.9) behandler eksisterende billeder og leverer risikoklassifikationer på caseniveau; ingen yderligere billeddannelse, randomisering eller ændringer i patienthåndteringen forekommer som en del af denne undersøgelse.
Ikke-maligne tilfælde
Kvinder uden histopatologisk evidens for brystkræft, klassificeret som negative eller stabilt benigne af to uafhængige lokale radiologer med mindst 2 års billedfølgning (n = 174). Hver sag svarer til en screening FFDM-undersøgelse med alle fire standardbilleder (LCC, RCC, LMLO, RMLO), retrospektivt udvalgt fra samme screeningspopulation.
Retrospektiv, frittstående AI-analyse af anonymiserede 2D fuldfelt digitale mammografiundersøgelser (FFDM). AI-systemet (Carebot AI MMG, version 2.9) behandler eksisterende billeder og leverer risikoklassifikationer på caseniveau; ingen yderligere billeddannelse, randomisering eller ændringer i patienthåndteringen forekommer som en del af denne undersøgelse.

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Balanceret nøjagtighed (BA) af Carebot AI MMG til at detektere maligne versus ikke-maligne undersøgelser
Tidsramme: Baseline (indeksmammografiundersøgelse; undersøgelser indhentet mellem 01-01-2025 og 14-11-2025; retrospektiv vurdering)
Balanceret nøjagtighed (BA) er defineret som gennemsnittet af følsomhed og specificitet for at klassificere hver mammografiundersøgelse som ondartet eller ikke-ondartet. BA vil blive beregnet ved to forudbestemte driftspunkter for AI-systemet: en højfølsomhedsindstilling (HSe) og en højspecificitetsindstilling (HSp). Ydeevnen vil blive estimeret med 95% konfidensintervaller og sammenlignet med en multi-læser benchmark konstrueret fra tre erfarne radiologer og en bootstrap-baseret "tilfældig læser" reference.
Baseline (indeksmammografiundersøgelse; undersøgelser indhentet mellem 01-01-2025 og 14-11-2025; retrospektiv vurdering)
Sensitivitet (Se) for Carebot AI MMG versus histopatologisk referencestandard
Tidsramme: Baseline (indeksmammografiundersøgelse; undersøgelser foretaget mellem 01-01-2025 og 14-11-2025; retrospektiv vurdering
Sensitivitet defineres som andelen af maligne undersøgelser, der korrekt klassificeres som positive af AI-systemet. Sensitivitet vil blive beregnet ved både HSe- og HSp-driftspunkterne og sammenlignet parvis med sensitiviteten for hver af de tre radiologer ved brug af den samme case-niveau grundsandhed.
Baseline (indeksmammografiundersøgelse; undersøgelser foretaget mellem 01-01-2025 og 14-11-2025; retrospektiv vurdering

Sekundære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Specificitet (Sp) for Carebot AI MMG versus histopatologisk referencestandard
Tidsramme: Baseline (indeksmammografiundersøgelse; undersøgelser indhentet mellem 01-01-2025 og 14-11-2025; retrospektiv vurdering
Specificitet defineres som andelen af ikke-maligne undersøgelser, der korrekt klassificeres som negative af AI-systemet. Specificitet beregnes ved både HSe- og HSp-driftspunkterne og sammenlignes parvist med specificiteten for hver af de tre radiologer.
Baseline (indeksmammografiundersøgelse; undersøgelser indhentet mellem 01-01-2025 og 14-11-2025; retrospektiv vurdering
Positivt prædiktiv værdi (PPV) for Carebot AI MMG
Tidsramme: Baseline (indeksmammografiundersøgelse; undersøgelser indhentet mellem 01-01-2025 og 14-11-2025; retrospektiv vurdering)
Positivt prædiktiv værdi defineres som andelen af AI-positive undersøgelser, der er virkelig maligne ifølge referencesstandard.
PPV vil blive rapporteret for både HSe og HSp driftspunkter og beskrivende sammenlignet med PPV-værdier for hver radiolog.
Baseline (indeksmammografiundersøgelse; undersøgelser indhentet mellem 01-01-2025 og 14-11-2025; retrospektiv vurdering)
Negativ prædiktiv værdi (NPV) af Carebot AI MMG
Tidsramme: Baseline (indeksmammografiundersøgelse; undersøgelser foretaget mellem 01-01-2025 og 14-11-2025; retrospektiv vurdering
Den negative prædiktive værdi defineres som andelen af AI-negative undersøgelser, der er virkelig ikke-maligne ifølge referencestandarden. NPV rapporteres for både HSe- og HSp-driftspunkter og sammenlignes deskriptivt med NPV-værdier for hver radiolog.
Baseline (indeksmammografiundersøgelse; undersøgelser foretaget mellem 01-01-2025 og 14-11-2025; retrospektiv vurdering

Samarbejdspartnere og efterforskere

Det er her, du vil finde personer og organisationer, der er involveret i denne undersøgelse.

Sponsor

Datoer for undersøgelser

Disse datoer sporer fremskridtene for indsendelser af undersøgelsesrekord og resumeresultater til ClinicalTrials.gov. Studieregistreringer og rapporterede resultater gennemgås af National Library of Medicine (NLM) for at sikre, at de opfylder specifikke kvalitetskontrolstandarder, før de offentliggøres på den offentlige hjemmeside.

Studer store datoer

Studiestart (Faktiske)

1. januar 2025

Primær færdiggørelse (Faktiske)

3. november 2025

Studieafslutning (Faktiske)

3. november 2025

Datoer for studieregistrering

Først indsendt

14. november 2025

Først indsendt, der opfyldte QC-kriterier

17. december 2025

Først opslået (Anslået)

23. december 2025

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

14. januar 2026

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

13. januar 2026

Sidst verificeret

1. januar 2026

Mere information

Begreber relateret til denne undersøgelse

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

INGEN

IPD-planbeskrivelse

Dette er et retrospektivt, multicentrisk diagnostisk nøjagtighedsstudie, der anvender anonymiserede fuldfelts digitale mammografi (FFDM) billeder og tilhørende metadata, der er indhentet under lokale dataanvendelsesaftaler. Individuelle billeddata er ikke planlagt delt uden for de deltagende institutioner på grund af kontraktmæssige, privatlivs- og regulatoriske begrænsninger. Aggregerede, de-identificerede sammenfattende resultater (herunder ydeevnemål og vigtige undergruppeeksperimenter) kan deles i publikationer og efter rimelig anmodning, men der er ikke planlagt noget IPD-repositorium.

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Ingen

Studerer et amerikansk FDA-reguleret enhedsprodukt

Ingen

Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .

Kliniske forsøg med Brystneoplasmer

Kliniske forsøg med Carebot AI MMG-softwareanalyse

Abonner