Denne side blev automatisk oversat, og nøjagtigheden af oversættelsen er ikke garanteret. Der henvises til engelsk version for en kildetekst.

Udarbejdelse af et benchmark til brystultralyd AI-tolkning og ydeevnevurdering af multimodal AI-modeller (BUST-AI Bench)

24. marts 2026 opdateret af: Qingli Zhu, Peking Union Medical College Hospital

Udarbejdelse af et standardiseret benchmark-evalueringssystem til intelligent brystultralydsbilledfortolkning og systematisk ydeevnevurdering af multimodal kunstig intelligens-modeller baseret på ACR BI-RADS v2025-kriterier

Dette single-center, retrospektive, observationsstudie har til formål at konstruere et standardiseret benchmark-evaluationssystem for intelligent brystultralydsbilledfortolkning og systematisk at vurdere den diagnostiske præstation af nuværende mainstream multimodal kunstig intelligens (AI)-modeller.

De-identificerede B-mode brystultralydsbilleder med bekræftede patologiske diagnoser vil blive indsamlet retrospektivt fra institutionens arkiv (2018-2025) og suppleret med billeder fra offentliggjorte åbne adgangsdatasæt. Ekspertradiologer med varierende erfaring vil uafhængigt annotere alle billeder i henhold til American College of Radiology (ACR) Breast Imaging Reporting and Data System (BI-RADS) v2025-kriterier, herunder kirtelvævsammensætning, læsionskarakteristik (masse vs. ikke-masse læsion), morfologiske deskriptorer og endelig BI-RADS-klassifikation.

Baseline deep learning-modeller (CNN-baserede ResNet-50 og Transformer-baserede USFM) vil blive trænet for at etablere ydelsesbaselines og stratificere tilfælde efter diagnostisk vanskelighed gennem tværarhitekturkonsensus. Flere multimodale store sprogmodeller (MLLMs), inklusive både generelle og medicinske domænemodeller, vil derefter blive evalueret via standardiserede API-kald ved hjælp af BI-RADS-styrede chain-of-thought-prompts ved temperatur 0 for reproducerbarhed.

Primære endpoints inkluderer BI-RADS-klassifikationsnøjagtighed og diagnostisk AUC for benign-malign differentiering. Modellernes robusthed og sikkerhed vil blive vurderet gennem out-of-distribution-afvisningstest, temperaturstabilitetseksperimenter og tænkemåde-ablation-studier. Dette studie overholder FLAIR- og TRIPOD-LLM-rapporteringsretningslinjerne.

Studieoversigt

Status

Rekruttering

Betingelser

Intervention / Behandling

Diagnostisk test: Multimodal AI-model diagnostisk evaluering

Detaljeret beskrivelse

Baggrund: Brystkræft er den mest udbredte ondartede svulst blandt kvinder på verdensplan. Ultralyd er en første-linjes screeningsmetode, især hos asiatiske befolkningsgrupper med tæt brystvæv, hvor mammografisk sensitivitet er begrænset. Dog er ultralydsfortolkning stærkt operatørafhængig, med betydelig variation mellem observatører i BI-RADS-klassifikation, især for kategorier 4A-4B læsioner. Multimodale store sprogmodeller (MLLM'er) er opstået som et lovende værktøj til medicinsk billedanalyse på grund af deres zero-shot diagnostiske evne, fortolkelig kæde-af-tænkning ræsonnement og struktureret rapportgenerering. Ikke desto mindre er der i øjeblikket ingen standardiseret benchmark til evaluering af AI-præstation i brystultralydsfortolkning.

Studiedesign: Cirka 1.380 brystultralydsbilleder vil blive kurateret (1.200 evalueringssæt + 150 out-of-distribution sikkerhedstestsæt + 30 prompt-udviklingssæt), omfattende tre diagnostiske kategorier: normalt bryst, godartede læsioner (BI-RADS 2-4B) og ondartede læsioner (BI-RADS 3-5). To junior radiologer (<5 års erfaring) og to senior radiologer (>15 år) vil uafhængigt annotere billeder pr. ACR BI-RADS v2025 med voldgift af en femte ekspert for uenige tilfælde.

Diagnostisk vanskelighed vil blive stratificeret i tre niveauer ved hjælp af tværarkitektur deep learning konsensus: Niveau 1 (ligetil, begge modeller korrekte), Niveau 2 (tvetydig, én korrekt/en forkert) og Niveau 3 (vanskelig, begge forkerte, med senior ekspert validering). MLLM'er vil blive evalueret på tværs af flere dimensioner: klassifikationsnøjagtighed, sensitivitet, specificitet, F1-score, AUC, Cohen's kappa overensstemmelse med ekspertkonsensus, forventet kalibreringsfejl (ECE), morfologisk funktionsbeskrivelsesnøjagtighed og kæde-af-tænkning ræsonnementkvalitet.

Sikkerhedsvurdering: (1) Out-of-distribution afvisningstest ved brug af 150 ikke-diagnostiske billeder (forringede billeder, ikke-bryst ultralyd, andre billedmodaliteter); (2) Temperaturstabilitetsforsøg forud for eksperimentet på tværs af parameterindstillinger; (3) Tænkemode ablation sammenligning af standard vs. kæde-af-tænkning ræsonnementtilstande. Alle eksperimenter bruger faste modelsnapshots, system fingeraftryk overvågning og komplet logning for reproducerbarhed.

Undersøgelsestype

Observationel

Tilmelding (Anslået)

1380

Kontakter og lokationer

Dette afsnit indeholder kontaktoplysninger for dem, der udfører undersøgelsen, og oplysninger om, hvor denne undersøgelse udføres.

Studiekontakt

Navn: Qingli Zhu, MD
Telefonnummer: +86 13621376699
E-mail: zqlpumch@126.com

Undersøgelse Kontakt Backup

Navn: Yinglan Wu, MD
Telefonnummer: +86 15626121076
E-mail: wuylan7@gmail.com

Studiesteder

Kina
- - Beijing, Kina, 100730
    - Rekruttering
    - Peking Union Medical College Hospital
    - Kontakt:
      
      Qingli Zhu, MD
      
      Telefonnummer: +86 13621376699
      
      E-mail: zqlpumch@126.com

Deltagelseskriterier

Forskere leder efter personer, der passer til en bestemt beskrivelse, kaldet berettigelseskriterier. Nogle eksempler på disse kriterier er en persons generelle helbredstilstand eller tidligere behandlinger.

Berettigelseskriterier

Aldre berettiget til at studere

Voksen
Ældre voksen

Tager imod sunde frivillige

Prøveudtagningsmetode

Ikke-sandsynlighedsprøve

Studiebefolkning

De-identifierede brystultralyds billeder fra voksne patienter, som blev undersøgt med brystultralyd på Peking Union Medical College Hospital mellem 2018 og 2025 med efterfølgende patologisk bekræftelse, suppleret med billeder fra offentliggjorte, etisk godkendte, åbent tilgængelige brystultralyds datasæt (f.eks. BUSI, BrEaST).

Beskrivelse

Inklusionskriterier:

B-mode brystultralyd gråtonebilleder fra institutionens PACS-database eller fra offentliggjorte åbne adgangs brystultralyd-datasæt med dokumenteret oprindelig institutionel etisk godkendelse
Billedkvalitet tilstrækkelig til klinisk diagnose med klar visualisering af interesseområdet
Patologisk diagnose bekræftet (for godartede og ondartede læsionsgrupper), eller normal bryststatus bekræftet af en senior radiolog med >15 års erfaring med brystultralyd (for normalgruppen)
Fuld de-identifikation med fjernelse af al personligt identificerbar information

Eksklusionskriterier:

Alvorligt forringet billedkvalitet, der forhindrer meningsfuld BI-RADS-vurdering
Duplikatbilleder fra samme patient (kun det mest repræsentative billede beholdt pr. læsion)
Billeder med resterende personligt identificerbar information efter de-identifikationsbehandling
Tilfælde med tvetydige, omstridte eller utilgængelige patologiske resultater
Ikke-B-mode ultralydbilleder, herunder elastografi, kontrastforstærket ultralyd og Doppler-billeddannelse

Studieplan

Dette afsnit indeholder detaljer om studieplanen, herunder hvordan undersøgelsen er designet, og hvad undersøgelsen måler.

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

Antal grupper/kohorter

Kohorter og interventioner

Gruppe / kohorte	Intervention / Behandling
Normal Bryst Brystultralydbilleder, der viser normalt kirtelvæv på tværs af forskellige vævssammensætningstyper, uden identificerede fokale læsioner. Bekræftet af seniorradiolog gennemgang.	Diagnostisk test: Multimodal AI-model diagnostisk evaluering Retrospektiv evaluering af anonymiserede brystultralydsbilleder ved hjælp af flere AI-systemer, inklusive baseline deep learning-modeller (ResNet-50, USFM) og multimodale store sprogmodeller, ved brug af standardiserede BI-RADS-styrede chain-of-thought-prompts via API. Ingen patientkontakt eller klinisk beslutningstagning er involveret.
Godartet læsion Brystultralydbilleder med patologisk bekræftede godartede læsioner (BI-RADS 2-4B), herunder fibroadenom, cyste, lipom, skleroserende adenose, intraduktalt papillom og udvalgte ikke-masse læsioner (NML).	Diagnostisk test: Multimodal AI-model diagnostisk evaluering Retrospektiv evaluering af anonymiserede brystultralydsbilleder ved hjælp af flere AI-systemer, inklusive baseline deep learning-modeller (ResNet-50, USFM) og multimodale store sprogmodeller, ved brug af standardiserede BI-RADS-styrede chain-of-thought-prompts via API. Ingen patientkontakt eller klinisk beslutningstagning er involveret.
Malign læsion Brystultralydbilleder, der indeholder patologisk bekræftede maligne læsioner (BI-RADS 3-5), herunder invasiv duktalcarcinom, invasiv lobulært carcinom, mucinøst carcinom og udvalgte ikke-masse læsioner (NML).	Diagnostisk test: Multimodal AI-model diagnostisk evaluering Retrospektiv evaluering af anonymiserede brystultralydsbilleder ved hjælp af flere AI-systemer, inklusive baseline deep learning-modeller (ResNet-50, USFM) og multimodale store sprogmodeller, ved brug af standardiserede BI-RADS-styrede chain-of-thought-prompts via API. Ingen patientkontakt eller klinisk beslutningstagning er involveret.

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål	Foranstaltningsbeskrivelse	Tidsramme
Diagnostisk nøjagtighed for patologisk diagnose Tidsramme: Ved afslutningen af undersøgelsen, cirka 12 måneder	Sensitivitet, specificitet, positiv prædiktiv værdi (PPV), negativ prædiktiv værdi (NPV) og F1-score for AI-modeller til godartet-malign klassifikation, med histopatologisk diagnose som guldstandarden.	Ved afslutningen af undersøgelsen, cirka 12 måneder
BI-RADS Klassifikationsnøjagtighed Tidsramme: Ved afslutning af undersøgelsen, cirka 12 måneder	Den samlede nøjagtighed af AI-modeller i tildeling af BI-RADS-kategorier (2, 3, 4A, 4B, 4C, 5) til brystultralydsbilleder, sammenlignet med ekspertkonsensusannotation som referencestandard.	Ved afslutning af undersøgelsen, cirka 12 måneder

Sekundære resultatmål

Resultatmål	Foranstaltningsbeskrivelse	Tidsramme
Overensstemmelse med ekspertkonsensus (Cohen's Kappa) Tidsramme: Ved afslutning af undersøgelsen, cirka 12 måneder	Cohen's kappa-koefficient, der måler overensstemmelsen mellem hver AI-model's BI-RADS-klassifikation og ekspertkonsensusannotationen, rapporteret med 95% konfidensintervaller.	Ved afslutning af undersøgelsen, cirka 12 måneder
Rate for Afvisning uden for Distributionen Tidsramme: Ved afslutningen af studiet, ca. 12 måneder	Andel af ikke-diagnostiske billeder (forringet kvalitet, ikke-brystultralyd, andre billeddannelsesmetoder) korrekt identificeret og afvist af AI-modeller, som vurderer domænesikkerhed.	Ved afslutningen af studiet, ca. 12 måneder
Sensitivitet, Specificitet, PPV, NPV og F1-score Tidsramme: Ved afslutningen af undersøgelsen, cirka 12 måneder	Standard diagnostiske ydeevnemål for godartet-kræftsvulst klassificering, rapporteret for hver AI-model individuelt.	Ved afslutningen af undersøgelsen, cirka 12 måneder

Samarbejdspartnere og efterforskere

Det er her, du vil finde personer og organisationer, der er involveret i denne undersøgelse.

Sponsor

Peking Union Medical College Hospital

Samarbejdspartnere

Chinese Academy of Medical Sciences

Efterforskere

Ledende efterforsker: Qingli Zhu, MD, Peking Union Medical College Hospital

Publikationer og nyttige links

Den person, der er ansvarlig for at indtaste oplysninger om undersøgelsen, leverer frivilligt disse publikationer. Disse kan handle om alt relateret til undersøgelsen.

Generelle publikationer

Datoer for undersøgelser

Disse datoer sporer fremskridtene for indsendelser af undersøgelsesrekord og resumeresultater til ClinicalTrials.gov. Studieregistreringer og rapporterede resultater gennemgås af National Library of Medicine (NLM) for at sikre, at de opfylder specifikke kvalitetskontrolstandarder, før de offentliggøres på den offentlige hjemmeside.

Studer store datoer

Studiestart (Faktiske)

12. marts 2026

Primær færdiggørelse (Anslået)

1. december 2026

Studieafslutning (Anslået)

1. marts 2027

Datoer for studieregistrering

Først indsendt

24. marts 2026

Først indsendt, der opfyldte QC-kriterier

24. marts 2026

Først opslået (Faktiske)

30. marts 2026

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

30. marts 2026

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

24. marts 2026

Sidst verificeret

1. marts 2026

Mere information

Begreber relateret til denne undersøgelse

Nøgleord

Yderligere relevante MeSH-vilkår

Andre undersøgelses-id-numre

K10349
2024-I2M-CT-B-035 (Andet bevillings-/finansieringsnummer: CAMS Innovation Fund for Medical Sciences)
I-26PJ0568 (Anden identifikator: Ethics Committee, Peking Union Medical College Hospital)

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

IPD-planbeskrivelse

Den de-identificerede referencevurderingsdatasæt, som inkluderer ekspertannoterede brystultralydsbilleder med tilhørende BI-RADS-læserapporter, er planlagt til offentlig frigivelse for at fremme akademisk reproducerbarhed og samarbejdsforskning.

IPD-delingstidsramme

Inden for 6 måneder efter primær publikation, tilgængelig på ubestemt tid

IPD-delingsadgangskriterier

Open access via en anerkendt datarepository (nærmere at fastsætte)

IPD-deling Understøttende informationstype

STUDY_PROTOCOL
SAP
ANALYTIC_CODE

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Ingen

Studerer et amerikansk FDA-reguleret enhedsprodukt

Ingen

Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .

Kliniske forsøg med Brystneoplasmer

Guangzhou First People's Hospital

Afsluttet

Intranasal dexmedetomidin præmedicinering

Benign Neoplasm of Vocal Fold - Glottis

Kina
Cairo University

Ikke rekrutterer endnu

Gyldighed og pålidelighed af arabisk version af brystspørgeskema

BREAST-Q
Abouqir General Hospital
Alexandria University

Rekruttering

Øjeblikkelig brystrekonstruktion med hybrid fedtoverførsel

Breast Udseende Rekonstruktion Disproportion

Egypten
The First Affiliated Hospital of Xiamen University

Ikke rekrutterer endnu

Pyrotinib maleat -tabletter i kombination med dalpiciclib isethionate tabletter og standard endokrin terapi

Locally Advanced Breast Cancer (LABC)
Beijing Bio-Targeting Therapeutics Technology Co...

Trukket tilbage

En klinisk undersøgelse for at undersøge sikkerheden, tolerabiliteten og effektiviteten af rekombinant human NSIL12 Oncolytisk adenovirusinjektion (BIOTTT001) kombineret med neoadjuvansbehandling til lokalt avanceret brystkræft

Locally Advanced Breast Cancer (LABC)

Kina
Indonesia University

Ikke rekrutterer endnu

Præoperative skulderøvelser og postoperativ inflammation, smerte og funktion efter modificeret radikal mastektomi

Præhabilitering | Postoperativ inflammation | Locally Advanced Breast Cancer (LABC)

Indonesien
Tianjin Medical University Cancer Institute and...
Guangxi Medical University; Sun Yat-sen University; Chinese PLA General Hospital og andre samarbejdspartnere

Afsluttet

De tekniske operationer og standard klinisk anvendelsesprotokol for CBBCT i diagnostisk proces af brystkræft (CBBCT)

Den kliniske anvendelsesvejledning af Conebeam Breast CT

Kina
Asan Medical Center

Rekruttering

Lenvatinib i kombination med nivolumab plus kemoterapi hos metastatiske gastriske kræftpatienter med ondartede ascites

Mavekræft | Mavekræft Adenocarcinom Metastatisk | MAVE NEOPLASM

Sydkorea
Atlas University

Ikke rekrutterer endnu

Patient-afledte organoider til funktionel karakterisering af kemoterapiresistens i brystkræft (BC-PDO)

Brystkræft | Locally Advanced Breast Cancer (LABC)

Tyrkiet (Türkiye)
Peking Union Medical College Hospital

Rekruttering

Forudsigelse af lægemiddelrespons i mavekræft baseret på 3D-bioprint

MAVE NEOPLASM

Kina

Kliniske forsøg med Multimodal AI-model diagnostisk evaluering

Huazhong University of Science and Technology

Rekruttering

Multicenterobservationsundersøgelse af multimodal AI til øvre GI mesenchymal tumordiagnose

Leiomyom | Schwannoma | Gastrointestinal stromal tumor (GIST) | Submucosal tumor

Kina
Qun Zhao

Afsluttet

Multimodal model forudsiger gentagelse (FUTURE12)

Gastrisk Adenocarcinom

Kina
Qun Zhao

Afsluttet

Udvikling af et multimodalt AI-system til GIST-behandling

Gastrointestinale stromale tumorer | Gastriske subepiteliale tumorer | Kunstig intelligens (AI) | Gastrisk Leiomyom | Multimodal billeddannelse

Kina
Jilan Adel yousef

Afsluttet

Vurdering af Upper Cross Syndrome og Cervicogen Hovedpine hos Smart Phone-bruger

Postural; Defekt

Egypten
Anhui Provincial Hospital
The First Affiliated Hospital of Soochow University; Ningbo No. 1 Hospital

Rekruttering

Kunstig intelligens til patologidiagnose og prognoseforudsigelse af lungeknudepunkt ved hjælp af smartphone -fotos

Kunstig intelligens | Lungeknude

Kina
Tsinghua University

Rekruttering

Klinisk intelligent styringssystem - Flersproget efterforskning

Primærplejesygdomme

Kina
The Eye Hospital of Wenzhou Medical University

Afsluttet

AI-drevne screening af mental sundhed hos universitetsstuderende

Psykisk sygdom

Kina
Cairo University

Ikke rekrutterer endnu

Development and Validation of a Deep Learning Model to Predict Endodontic Retreatment Difficulty From Periapical Radiographs (Ai Retreatment)

Endodonti | AI (kunstig intelligens) | Deep Learning Model | Perforering | Missede kanaler | Endodontisk genbehandling | Non-surgical Retreatment | DIFFICULTY ASSESSMENT | SEPARATED INSTRUMENT | Poor Obturation | Obturation Quality
Valentina Cerrone
Federico II University; University of Salerno, Italy

Rekruttering

Raffinering af flere kunstige intelligensstrategier til efterforskning af automatisk smertevurdering: Ruggi -undersøgelse (RUGGI)

Kronisk smerte | Neuropatisk smerte | Kræftsmerter | Smertevurdering

Italien
The Eye Hospital of Wenzhou Medical University

Rekruttering

AI-drevet genotype forudsigelse ved hjælp af EPJ og multimodale data

Genotype

Kina

Udarbejdelse af et benchmark til brystultralyd AI-tolkning og ydeevnevurdering af multimodal AI-modeller (BUST-AI Bench)

Udarbejdelse af et standardiseret benchmark-evalueringssystem til intelligent brystultralydsbilledfortolkning og systematisk ydeevnevurdering af multimodal kunstig intelligens-modeller baseret på ACR BI-RADS v2025-kriterier

Studieoversigt

Status

Betingelser

Intervention / Behandling

Detaljeret beskrivelse

Undersøgelsestype

Tilmelding (Anslået)

Kontakter og lokationer

Studiekontakt

Undersøgelse Kontakt Backup

Studiesteder

Deltagelseskriterier

Berettigelseskriterier

Aldre berettiget til at studere

Tager imod sunde frivillige

Prøveudtagningsmetode

Studiebefolkning

Beskrivelse

Studieplan

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

Antal grupper/kohorter

Kohorter og interventioner

Gruppe / kohorte

Intervention / Behandling

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål

Foranstaltningsbeskrivelse

Tidsramme

Sekundære resultatmål

Resultatmål

Foranstaltningsbeskrivelse

Tidsramme

Samarbejdspartnere og efterforskere

Sponsor

Samarbejdspartnere

Efterforskere

Publikationer og nyttige links

Generelle publikationer

Datoer for undersøgelser

Studer store datoer

Studiestart (Faktiske)

Primær færdiggørelse (Anslået)

Studieafslutning (Anslået)

Datoer for studieregistrering

Først indsendt

Først indsendt, der opfyldte QC-kriterier

Først opslået (Faktiske)

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

Sidst verificeret

Mere information

Begreber relateret til denne undersøgelse

Nøgleord

Yderligere relevante MeSH-vilkår

Andre undersøgelses-id-numre

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

IPD-planbeskrivelse

IPD-delingstidsramme

IPD-delingsadgangskriterier

IPD-deling Understøttende informationstype

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Studerer et amerikansk FDA-reguleret enhedsprodukt

Kliniske forsøg med Brystneoplasmer

Kliniske forsøg med Multimodal AI-model diagnostisk evaluering

Søg i lignende forsøg

Sponsorer og samarbejdspartnere

Medicinske tilstande

Narkotikainterventioner

CROs by country

CROs in Luxembourg

Betingelser

Sjældne sygdomme

Narkotikainterventioner