Tato stránka byla automaticky přeložena a přesnost překladu není zaručena. Podívejte se prosím na anglická verze pro zdrojový text.

Hodnocení jednorázové vizuální diferenciální diagnózy (OSVDE) a vícestupňové konverzační nerovnocennosti (MSCNE) v umělé inteligenci pro lékařské rozhovory. (OSVDE-MSCNE)

20. března 2026 aktualizováno: Magic Health Inc. (d.b.a. Nolla Health)

Hodnocení výkonu systému AI pro lékařské rozhovory a diagnostiku: Jednorázová vizuální diferenciální diagnóza (OSVDE) a konverzační hodnotící postup v několika krocích pro prokázání nehorší účinnosti (MSCNE).

Tato studie hodnotí diagnostickou výkonnost multimodálního systému umělé inteligence (AI) (AIMD.1) využívajícího anonymizované lékařské snímky a polosyntetické simulace pacientů. Studie kombinuje retrospektivní analýzu stávajících veřejně dostupných datových sad snímků s prospektivním sběrem dat od klinických lékařů s atestací, kteří plní úkoly diagnostického hodnocení.

Ve fázi One-Shot Vision Differential Evaluation (OSVDE) kliničtí lékaři posuzují jednotlivé anonymizované lékařské snímky a vytvářejí seřazený seznam možných diagnóz výhradně na základě vizuálních znaků. Ve fázi Multi-Step Conversational Non-Inferiority Evaluation (MSCNE) kliničtí lékaři provádějí diagnostická hodnocení pomocí polosyntetických simulací pacientů odvozených od anonymizovaných lékařských snímků. Výkonnost klinických lékařů bude porovnána s AI systémem na stejných diagnostických úkolech.

Lidskí účastníci se skládají výhradně z klinických lékařů s atestací, kteří poskytují diagnostické odpovědi. Lékařské snímky a simulované případy jsou studijní materiály a nepovažují se za účastníky studie. Nepoužívají se žádná identifikovatelná data pacientů a AI systém je hodnocen v offline výzkumném prostředí a nepoužívá se pro klinické rozhodování nebo péči o pacienty.

Přehled studie

Detailní popis

Systémy umělé inteligence (AI) prokázaly slibné schopnosti v lékařské diagnostice; nicméně před klinickým nasazením je nutné důkladné srovnávací vyhodnocení. AIMD.1 je multimodální AI diagnostický systém navržený k podpoře klinického uvažování prostřednictvím analýzy lékařských snímků a konverzačních diagnostických interakcí.

Tato studie vyhodnocuje diagnostickou výkonnost AIMD.1 pomocí kombinace retrospektivních souborů snímků a prospektivních úloh hodnocení kliniky. Cílem je zjistit, zda AI systém dosahuje diagnostické přesnosti srovnatelné s kliniky s atestací za kontrolovaných srovnávacích podmínek.

Vyhodnocení zahrnuje dvě doplňující se fáze.

Jednorázové vizuální diferenciální vyhodnocení (OSVDE):

V této fázi AI systém a klinici nezávisle posuzují jednotlivé anonymizované lékařské snímky a generují seřazené seznamy možných diagnóz výhradně na základě vizuálních znaků. Vyhodnocení využije přibližně 11 500–15 000 anonymizovaných lékařských snímků napříč více lékařskými specializacemi a kategoriemi onemocnění s ověřenými referenčními diagnózami.

Vícekrokové konverzační vyhodnocení nehorší kvality (MSCNE):

V této fázi AI systém a klinici plní diagnostické úlohy pomocí polosyntetických simulací pacientů odvozených od anonymizovaných lékařských snímků. Tyto simulace poskytují strukturované klinické informace prostřednictvím konverzačních interakcí, což umožňuje posouzení diagnostického uvažování napříč více kroky. Bude vyhodnoceno přibližně 380–500 simulovaných případů.

Studie se zúčastní přibližně 10–30 kliniků s atestací. Klinici budou plnit diagnostické hodnotící sezení vzdáleně a poskytnou diferenciální diagnózy pro podmnožiny případů snímků a simulací. Lidskými účastníky jsou výhradně klinici poskytující diagnostické odpovědi. Soubor snímků a syntetické případy slouží jako studijní materiály a nejsou považovány za účastníky.

Všechny snímky použité ve studii jsou anonymizovány a pocházejí z veřejně dostupných zdrojů nebo souborů dat splňujících standardy anonymizace. Dodatečné kroky předzpracování zajišťují odstranění jakýchkoli potenciálně identifikovatelných informací před zařazením do výzkumného souboru dat.

AI systém je hodnocen v offline výzkumném prostředí a není používán k vedení reálné klinické péče nebo řízení pacientů. Studie je navržena jako srovnávací vyhodnocení výkonnosti před jakýmkoli prospektivním ověřením zahrnujícím skutečné pacienty.

Primární výstupní měřítka zahrnují metriky diagnostické přesnosti, jako je diagnostická přesnost Top-1, definovaná jako podíl případů, ve kterých primární diagnóza AI systému odpovídá referenční diagnóze. Sekundární výsledky zahrnují diagnostickou přesnost Top-5, metriky kalibrace, senzitivitu a specificitu napříč kategoriemi onemocnění a měření času do diagnózy v konverzačních diagnostických scénářích.

Analýza dat odhadne diagnostickou přesnost s intervaly spolehlivosti a porovná výkonnost AI systému s výkonností kliniků pomocí spárovaných statistických testů a analýz nehorší kvality.

Odpovědi kliniků jsou zaznamenány pomocí anonymních identifikátorů studie a budou hlášeny pouze agregované výsledky výkonnosti. Nebudou shromažďovány ani publikovány žádné identifikovatelné informace o klinicích nebo pacientech.

Očekávaná délka studie je přibližně šest měsíců, včetně přípravy souboru dat, hodnotících sezení kliniků a statistické analýzy.

Protokol ID 1026 byl ověřen jako osvobozený podle 45CFR46.104(d) Ex dne 03/10/2026 řešitelským IRB (855) 226-4472 (www.solutionsirb.com)

Typ studie

Pozorovací

Zápis (Odhadovaný)

30

Kontakty a umístění

Tato část poskytuje kontaktní údaje pro ty, kteří studii provádějí, a informace o tom, kde se tato studie provádí.

Studijní kontakt

Studijní záloha kontaktů

Studijní místa

    • New York
      • New York, New York, Spojené státy, 10003
        • Nábor
        • Nolla Health (Magic Health Inc.)
        • Kontakt:
        • Kontakt:
        • Vrchní vyšetřovatel:
          • Luis R Soenksen, MSE, PhD
        • Dílčí vyšetřovatel:
          • Sean Geiger, B.S.
        • Dílčí vyšetřovatel:
          • Luis Wenus

Kritéria účasti

Výzkumníci hledají lidi, kteří odpovídají určitému popisu, kterému se říká kritéria způsobilosti. Některé příklady těchto kritérií jsou celkový zdravotní stav osoby nebo předchozí léčba.

Kritéria způsobilosti

Věk způsobilý ke studiu

  • Dospělý
  • Starší dospělý

Přijímá zdravé dobrovolníky

Ano

Metoda odběru vzorků

Vzorek nepravděpodobnosti

Studijní populace

Studijní populace se skládá z lékařů s platnou atestací z různých lékařských specializací, kteří se účastní diagnostických hodnotících úkolů pomocí anonymizovaných lékařských snímků a polosyntetických simulací pacientů. Účastníci jsou rekrutováni prostřednictvím profesionálních sítí a lékařských asociací. V této studii nejsou zapojeni žádní pacienti.

Popis

Kritéria zařazení:

  • Aktivní specializační atestace v oboru Dermatologie, Vnitřní lékařství, Otorinolaryngologie, Gynekologie, Ortopedie, Pediatrie, Geriatrie, Urgentní medicína, Oftalmologie, Psychiatrie, Endokrinologie, Všeobecné lékařství nebo příbuzné specializace
  • Věk 18 let nebo starší
  • Schopnost absolvovat diagnostická vyšetření na dálku pomocí počítače nebo tabletu s spolehlivým připojením k internetu

Kritéria vyloučení:

  • Ztráta aktivní specializační atestace v příslušném oboru
  • Neschopnost absolvovat vyšetření na dálku

Studijní plán

Tato část poskytuje podrobnosti o studijním plánu, včetně toho, jak je studie navržena a co studie měří.

Jak je studie koncipována?

Detaily designu

Kohorty a intervence

Skupina / kohorta
Intervence / Léčba
Účastníci klinici
Lékaři s licencí, kteří se účastní úloh diagnostického hodnocení s využitím anonymizovaných lékařských snímků a polosyntetických simulací pacientů k posouzení diagnostické přesnosti. Lékaři poskytují diferenciální diagnózy pro srovnávací analýzu s diagnostickým systémem využívajícím umělou inteligenci.
AIMD.1 (také známý jako agent NollaMD) je multimodální systém umělé inteligence (AI) pro diagnostiku, navržený pro generování diferenciálních diagnóz na základě analýzy lékařských snímků a strukturovaných klinických informací. V této studii je systém hodnocen pomocí anonymizovaných lékařských snímků a polosyntetických simulací pacientů za kontrolovaných výzkumných podmínek. Systém AI generuje seřazené diagnostické výstupy a přidružené skóre spolehlivosti, které jsou porovnávány s referenčními diagnózami a metrikami výkonu klinického lékaře. Systém je hodnocen v offline výzkumném prostředí. Výstupy AI nejsou používány pro klinické rozhodování, správu pacientů ani reálnou lékařskou péči.
Ostatní jména:
  • Umělá inteligence diferenciální diagnostický systém
  • Systém klinické podpory rozhodování založený na umělé inteligenci
  • AI konverzační klinický systém
  • NollaMD

Co je měření studie?

Primární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Přesnost diagnostiky Top-1
Časové okno: Po dokončení diagnostických vyšetření (až 6 měsíců)
Podíl vyhodnocených případů, ve kterých se primární diagnóza generovaná systémem AI Diagnostic System shoduje s referenční (skutečnou) diagnózou. Přesnost bude vypočítána napříč anonymizovanými případy lékařských snímků a semisyntetickými případy simulace pacientů a porovnána s výkonem klinického lékaře.
Po dokončení diagnostických vyšetření (až 6 měsíců)

Sekundární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Nejvyšší 5 diagnostické přesnosti
Časové okno: Po dokončení diagnostických vyšetření (až 6 měsíců)
Podíl hodnocených případů, ve kterých se správná referenční diagnóza objeví mezi pěti nejlépe hodnocenými diagnózami vygenerovanými systémem AI pro diagnostiku.
Po dokončení diagnostických vyšetření (až 6 měsíců)
Diagnostická přesnost klinických účastníků
Časové okno: Po dokončení diagnostických vyšetření (až 6 měsíců)
Podíl hodnocených případů, kdy primární diagnóza klinického účastníka odpovídá referenční diagnóze, vypočtený napříč přiřazenými případy snímků a simulací.
Po dokončení diagnostických vyšetření (až 6 měsíců)
Nepodřadnost diagnostické přesnosti AI ve srovnání s klinickými lékaři
Časové okno: Po dokončení diagnostických vyšetření (až 6 měsíců)
Rozdíl v přesnosti diagnostiky Top-1 mezi systémem AI Diagnostic a klinickými účastníky. Nepodřadnost bude posuzována pomocí předem definované hranice 5 %.
Po dokončení diagnostických vyšetření (až 6 měsíců)
Kalibrace důvěry AI v diagnostice
Časové okno: Po dokončení diagnostických vyšetření (až 6 měsíců)
Kalibrační výkon diagnostických skóre důvěry generovaných umělou inteligencí hodnocený pomocí očekávané chyby kalibrace (ECE).
Po dokončení diagnostických vyšetření (až 6 měsíců)
Plocha pod křivkou ROC (AUC) a křivka přesnosti a úplnosti (PRC)
Časové okno: Po dokončení diagnostických vyšetření (až 6 měsíců)
Plocha pod křivkou charakteristiky přijímače (ROC) a křivkou přesnosti a úplnosti (Precision Recall) pro klasifikaci diagnostiky umělé inteligence napříč kategoriemi onemocnění.
Po dokončení diagnostických vyšetření (až 6 měsíců)
Čas do diagnózy v konverzačních simulacích
Časové okno: Po dokončení simulačních hodnocení (až 6 měsíců)
Počet konverzačních obratů vyžadovaných systémem umělé inteligence a účastníky z řad kliniků k dosažení konečné diagnózy v polosyntetických simulačních případech pacientů.
Po dokončení simulačních hodnocení (až 6 měsíců)

Spolupracovníci a vyšetřovatelé

Zde najdete lidi a organizace zapojené do této studie.

Vyšetřovatelé

  • Vrchní vyšetřovatel: Luis R Soenksen, MSE, PhD, Nolla Health

Termíny studijních záznamů

Tato data sledují průběh záznamů studie a předkládání souhrnných výsledků na ClinicalTrials.gov. Záznamy ze studií a hlášené výsledky jsou před zveřejněním na veřejné webové stránce přezkoumány Národní lékařskou knihovnou (NLM), aby se ujistily, že splňují specifické standardy kontroly kvality.

Hlavní termíny studia

Začátek studia (Aktuální)

19. března 2026

Primární dokončení (Odhadovaný)

19. září 2026

Dokončení studie (Odhadovaný)

19. září 2026

Termíny zápisu do studia

První předloženo

10. března 2026

První předloženo, které splnilo kritéria kontroly kvality

10. března 2026

První zveřejněno (Aktuální)

13. března 2026

Aktualizace studijních záznamů

Poslední zveřejněná aktualizace (Aktuální)

25. března 2026

Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality

20. března 2026

Naposledy ověřeno

1. března 2026

Více informací

Termíny související s touto studií

Plán pro data jednotlivých účastníků (IPD)

Plánujete sdílet data jednotlivých účastníků (IPD)?

NE

Popis plánu IPD

Data jednotlivých účastníků nebudou sdílena. Studie zahrnuje anonymizované lékařské snímky a anonymní diagnostické odpovědi lékařů. V publikacích a prezentacích budou uvedeny pouze souhrnné výsledky (např. metriky diagnostické přesnosti a statistické analýzy).

Informace o lécích a zařízeních, studijní dokumenty

Studuje lékový produkt regulovaný americkým FDA

Ne

Studuje produkt zařízení regulovaný americkým úřadem FDA

Ne

Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .

Klinické studie na Diferenciální diagnostika

Klinické studie na AI diagnostický systém (AIMD.1)

Předplatit