Ta strona została przetłumaczona automatycznie i dokładność tłumaczenia nie jest gwarantowana. Proszę odnieść się do angielska wersja za tekst źródłowy.

Ocena jednorazowej wizyjnej diagnozy różnicowej (OSVDE) i wieloetapowej rozmowy niegorszej (MSCNE) w wywiadzie medycznym z wykorzystaniem sztucznej inteligencji. (OSVDE-MSCNE)

20 marca 2026 zaktualizowane przez: Magic Health Inc. (d.b.a. Nolla Health)

Ocena Wydajności Systemu Sztucznej Inteligencji w Wywiadzie Medycznym i Diagnostyce: Jednorazowa Diagnostyka Różnicowa Wizualna (OSVDE) oraz Ocena Nieinferyjności Wieloetapowej Konwersacyjnej (MSCNE).

To badanie ocenia wydajność diagnostyczną multimodalnego systemu sztucznej inteligencji (AI) (AIMD.1) przy użyciu zanonimizowanych obrazów medycznych i półsyntetycznych symulacji pacjentów. Badanie łączy retrospektywną analizę istniejących publicznie dostępnych zbiorów danych obrazowych z prospektywnym zbieraniem danych od lekarzy posiadających certyfikaty specjalistyczne, którzy wykonują zadania oceny diagnostycznej.

W etapie Jednokrotnej Wizualnej Oceny Różnicowej (OSVDE) klinicyści przeglądają pojedyncze zanonimizowane obrazy medyczne i generują rankingową listę potencjalnych diagnoz wyłącznie na podstawie cech wizualnych. W etapie Wieloetapowej Konwersacyjnej Oceny Nieinferycyjności (MSCNE) klinicyści przeprowadzają oceny diagnostyczne przy użyciu półsyntetycznych symulacji pacjentów pochodzących z zanonimizowanych obrazów medycznych. Wyniki klinicystów będą porównywane z systemem AI w tych samych zadaniach diagnostycznych.

Uczestnicy ludzcy to wyłącznie lekarze posiadający certyfikaty specjalistyczne, którzy dostarczają odpowiedzi diagnostyczne. Obrazy medyczne i symulowane przypadki są materiałami badawczymi i nie są uważane za uczestników badania. Nie są wykorzystywane dane pacjentów umożliwiające ich identyfikację, a system AI jest oceniany w środowisku badawczym offline i nie jest używany do podejmowania decyzji klinicznych ani opieki nad pacjentem.

Przegląd badań

Szczegółowy opis

Systemy sztucznej inteligencji (SI) wykazały obiecujące możliwości w diagnostyce medycznej; jednak rygorystyczna ocena porównawcza jest konieczna przed wdrożeniem klinicznym. AIMD.1 to multimodalny system diagnostyczny SI zaprojektowany do wspomagania rozumowania klinicznego poprzez analizę obrazów medycznych i interakcje konwersacyjne diagnostyczne.

Niniejsze badanie ocenia wydajność diagnostyczną AIMD.1 przy użyciu kombinacji retrospektywnych zbiorów danych obrazowych i prospektywnych zadań oceny klinicystów. Celem jest ustalenie, czy system SI osiąga dokładność diagnostyczną porównywalną z certyfikowanymi klinicystami w kontrolowanych warunkach porównawczych.

Ocena obejmuje dwa uzupełniające się etapy.

Jednokrotna wizualna ocena różnicowa (OSVDE):

Na tym etapie system SI i uczestnicy-klinicyści niezależnie przeglądają pojedyncze zanonimizowane obrazy medyczne i generują rankingowe listy potencjalnych diagnoz opartych wyłącznie na cechach wizualnych. Ocena wykorzysta około 11 500-15 000 zanonimizowanych obrazów medycznych z wielu specjalności medycznych i kategorii chorób ze zweryfikowanymi diagnozami referencyjnymi.

Wieloetapowa konwersacyjna ocena nieróżniąca się istotnie (MSCNE):

Na tym etapie system SI i klinicyści wykonują zadania diagnostyczne przy użyciu półsyntetycznych symulacji pacjentów pochodzących z zanonimizowanych obrazów medycznych. Symulacje te dostarczają ustrukturyzowane informacje kliniczne poprzez interakcje konwersacyjne, umożliwiając ocenę rozumowania diagnostycznego na wielu etapach. Ocenionych zostanie około 380-500 symulowanych przypadków.

W badaniu weźmie udział około 10-30 certyfikowanych klinicystów. Klinicyści będą zdalnie wykonywać sesje oceny diagnostycznej i będą podawać diagnozy różnicowe dla podzbiorów przypadków obrazowych i symulacyjnych. Uczestnicy ludzcy składają się wyłącznie z klinicystów dostarczających odpowiedzi diagnostyczne. Zbiory danych obrazowych i przypadki syntetyczne służą jako materiały badawcze i nie są uważane za uczestników.

Wszystkie obrazy użyte w badaniu są zanonimizowane i pochodzą z publicznie dostępnych źródeł lub zbiorów danych spełniających standardy anonimizacji. Dodatkowe kroki wstępnego przetwarzania zapewniają usunięcie wszelkich potencjalnie identyfikowalnych informacji przed włączeniem do zbioru danych badawczych.

System SI jest oceniany w offline'owym środowisku badawczym i nie jest używany do kierowania rzeczywistą opieką kliniczną lub zarządzaniem pacjentami. Badanie jest zaprojektowane jako ocena wydajności porównawczej przed jakąkolwiek prospektywną walidacją obejmującą prawdziwych pacjentów.

Główne miary wyników obejmują metryki dokładności diagnostycznej, takie jak dokładność diagnostyczna Top-1, zdefiniowana jako odsetek przypadków, w których główna diagnoza systemu SI odpowiada diagnozie referencyjnej. Wyniki drugorzędne obejmują dokładność diagnostyczną Top-5, metryki kalibracji, czułość i specyficzność w kategoriach chorób oraz miary czasu do diagnozy w scenariuszach konwersacyjnych diagnostycznych.

Analiza danych oszacuje dokładność diagnostyczną z przedziałami ufności i porówna wydajność systemu SI z wydajnością klinicystów przy użyciu sparowanych testów statystycznych i analiz nieróżniących się istotnie.

Odpowiedzi klinicystów są rejestrowane przy użyciu anonimowych identyfikatorów badania, a raportowane będą tylko zagregowane wyniki wydajności. Żadne identyfikowalne informacje o klinicystach lub pacjentach nie będą zbierane ani publikowane.

Oczekiwany czas trwania badania to około sześć miesięcy, w tym przygotowanie zbioru danych, sesje oceny klinicystów i analiza statystyczna.

Identyfikator protokołu 1026 został zweryfikowany jako Zwolniony zgodnie z 45CFR46.104(d) Ex w dniu 03/10/2026 przez Solutions IRB (855) 226-4472 (www.solutionsirb.com)

Typ studiów

Obserwacyjny

Zapisy (Szacowany)

30

Kontakty i lokalizacje

Ta sekcja zawiera dane kontaktowe osób prowadzących badanie oraz informacje o tym, gdzie badanie jest przeprowadzane.

Kontakt w sprawie studiów

Kopia zapasowa kontaktu do badania

Lokalizacje studiów

    • New York
      • New York, New York, Stany Zjednoczone, 10003
        • Rekrutacyjny
        • Nolla Health (Magic Health Inc.)
        • Kontakt:
        • Kontakt:
        • Główny śledczy:
          • Luis R Soenksen, MSE, PhD
        • Pod-śledczy:
          • Sean Geiger, B.S.
        • Pod-śledczy:
          • Luis Wenus

Kryteria uczestnictwa

Badacze szukają osób, które pasują do określonego opisu, zwanego kryteriami kwalifikacyjnymi. Niektóre przykłady tych kryteriów to ogólny stan zdrowia danej osoby lub wcześniejsze leczenie.

Kryteria kwalifikacji

Wiek uprawniający do nauki

  • Dorosły
  • Starszy dorosły

Akceptuje zdrowych ochotników

Tak

Metoda próbkowania

Próbka bez prawdopodobieństwa

Badana populacja

Badana populacja składa się z lekarzy posiadających certyfikaty specjalizacyjne z różnych dziedzin medycyny, którzy uczestniczą w zadaniach diagnostycznej oceny wykorzystując anonimowe obrazy medyczne i półsyntetyczne symulacje pacjentów. Uczestnicy są rekrutowani poprzez sieci zawodowe i stowarzyszenia medyczne. W tym badaniu nie rekrutuje się pacjentów.

Opis

Kryteria włączenia:

  • Aktywna certyfikacja specjalizacyjna w dziedzinie Dermatologii, Medycyny Wewnętrznej, Otorynolaryngologii, Ginekologii, Ortopedii, Pediatrii, Geriatrii, Medycyny Ratunkowej, Okulistyki, Psychiatrii, Endokrynologii, Medycyny Rodzinnej lub w pokrewnej specjalności
  • Wiek 18 lat lub więcej
  • Możliwość zdalnego przeprowadzenia sesji diagnostycznych przy użyciu komputera lub tabletu z niezawodnym dostępem do internetu

Kryteria wykluczenia:

  • Utrata aktywnej certyfikacji specjalizacyjnej w kwalifikującej się specjalności
  • Niemożność zdalnego przeprowadzenia sesji diagnostycznej

Plan studiów

Ta sekcja zawiera szczegółowe informacje na temat planu badania, w tym sposób zaprojektowania badania i jego pomiary.

Jak projektuje się badanie?

Szczegóły projektu

Kohorty i interwencje

Grupa / Kohorta
Interwencja / Leczenie
Uczestnicy klinicyści
Licencjonowani klinicyści uczestniczący w zadaniach oceny diagnostycznej z wykorzystaniem zanonimizowanych obrazów medycznych i półsyntetycznych symulacji pacjentów w celu oceny dokładności diagnostycznej. Klinicyści przedstawiają diagnostykę różnicową do porównania porównawczego z systemem diagnostycznym sztucznej inteligencji.
AIMD.1 (znany również jako agent NollaMD) to multimodalny system diagnostyczny oparty na sztucznej inteligencji (AI), zaprojektowany do generowania diagnoz różnicowych na podstawie analizy obrazów medycznych i ustrukturyzowanych informacji klinicznych. W tym badaniu system jest oceniany przy użyciu zanonimizowanych obrazów medycznych i półsyntetycznych symulacji pacjentów w kontrolowanych warunkach badawczych. System AI generuje uporządkowane wyniki diagnostyczne i powiązane wyniki pewności, które są porównywane z referencyjnymi diagnozami i metrykami wydajności klinicystów. System jest oceniany w środowisku badawczym offline. Wyniki AI nie są wykorzystywane do podejmowania decyzji klinicznych, zarządzania pacjentami ani rzeczywistej opieki medycznej.
Inne nazwy:
  • System sztucznej inteligencji do diagnostyki różnicowej
  • System Wspomagania Decyzji Klinicznej Wspomagany Sztuczną Inteligencją
  • System Konwersacyjny Kliniczny Wspomagany Sztuczną Inteligencją
  • NollaMD

Co mierzy badanie?

Podstawowe miary wyniku

Miara wyniku
Opis środka
Ramy czasowe
Najwyższa dokładność diagnostyczna (Top-1)
Ramy czasowe: Po zakończeniu badań diagnostycznych (do 6 miesięcy)
Odsetek ocenianych przypadków, w których podstawowa diagnoza wygenerowana przez System Diagnostyczny AI pokrywa się z diagnozą referencyjną (diagnozą rzeczywistą).
Dokładność będzie obliczana na podstawie zanonimizowanych przypadków obrazów medycznych i półsyntetycznych przypadków symulacji pacjentów oraz porównywana z wynikami klinicystów.
Po zakończeniu badań diagnostycznych (do 6 miesięcy)

Miary wyników drugorzędnych

Miara wyniku
Opis środka
Ramy czasowe
Top-5 Dokładność Diagnostyczna
Ramy czasowe: Po zakończeniu badań diagnostycznych (do 6 miesięcy)
Proporcja ocenionych przypadków, w których prawidłowa diagnoza referencyjna pojawia się wśród pięciu najlepiej ocenionych diagnoz wygenerowanych przez system diagnostyczny AI.
Po zakończeniu badań diagnostycznych (do 6 miesięcy)
Dokładność diagnostyczna uczestników klinicystów
Ramy czasowe: Po zakończeniu badań diagnostycznych (do 6 miesięcy)
Proporcja ocenianych przypadków, w których podstawowa diagnoza uczestnika klinicysty pokrywa się z diagnozą referencyjną, obliczona na podstawie przypisanych przypadków obrazowych i symulacyjnych.
Po zakończeniu badań diagnostycznych (do 6 miesięcy)
Niegorszość dokładności diagnostycznej SI w porównaniu z klinicystami
Ramy czasowe: Po zakończeniu badań diagnostycznych (do 6 miesięcy)
Różnica w dokładności diagnostycznej Top-1 pomiędzy Systemem Diagnostycznym AI a uczestnikami badania (klinicystami). Niegorszość zostanie oceniona przy użyciu wcześniej zdefiniowanej granicy 5%.
Po zakończeniu badań diagnostycznych (do 6 miesięcy)
Kalibracja pewności diagnostycznej AI
Ramy czasowe: Po zakończeniu badań diagnostycznych (do 6 miesięcy)
Wydajność kalibracji wygenerowanych przez sztuczną inteligencję wyników pewności diagnostycznej oceniana za pomocą oczekiwanego błędu kalibracji (ECE).
Po zakończeniu badań diagnostycznych (do 6 miesięcy)
Obszar pod krzywą charakterystyki odbiorczej (AUC) i krzywą precyzji-przywołania (PRC)
Ramy czasowe: Po zakończeniu oceny diagnostycznej (do 6 miesięcy)
Pole pod krzywą ROC i krzywą Precyzja-Przywołanie dla klasyfikacji diagnostycznej AI w różnych kategoriach chorób.
Po zakończeniu oceny diagnostycznej (do 6 miesięcy)
Czas do diagnozy w symulacjach konwersacyjnych
Ramy czasowe: Po zakończeniu ocen symulacji (do 6 miesięcy)
Liczba interakcji konwersacyjnych wymaganych przez system AI i uczestników klinicystów do osiągnięcia ostatecznej diagnozy w półsyntetycznych przypadkach symulacji pacjentów.
Po zakończeniu ocen symulacji (do 6 miesięcy)

Współpracownicy i badacze

Tutaj znajdziesz osoby i organizacje zaangażowane w to badanie.

Śledczy

  • Główny śledczy: Luis R Soenksen, MSE, PhD, Nolla Health

Daty zapisu na studia

Daty te śledzą postęp w przesyłaniu rekordów badań i podsumowań wyników do ClinicalTrials.gov. Zapisy badań i zgłoszone wyniki są przeglądane przez National Library of Medicine (NLM), aby upewnić się, że spełniają określone standardy kontroli jakości, zanim zostaną opublikowane na publicznej stronie internetowej.

Główne daty studiów

Rozpoczęcie studiów (Rzeczywisty)

19 marca 2026

Zakończenie podstawowe (Szacowany)

19 września 2026

Ukończenie studiów (Szacowany)

19 września 2026

Daty rejestracji na studia

Pierwszy przesłany

10 marca 2026

Pierwszy przesłany, który spełnia kryteria kontroli jakości

10 marca 2026

Pierwszy wysłany (Rzeczywisty)

13 marca 2026

Aktualizacje rekordów badań

Ostatnia wysłana aktualizacja (Rzeczywisty)

25 marca 2026

Ostatnia przesłana aktualizacja, która spełniała kryteria kontroli jakości

20 marca 2026

Ostatnia weryfikacja

1 marca 2026

Więcej informacji

Terminy związane z tym badaniem

Plan dla danych uczestnika indywidualnego (IPD)

Planujesz udostępniać dane poszczególnych uczestników (IPD)?

NIE

Opis planu IPD

Dane poszczególnych uczestników nie będą udostępniane. Badanie obejmuje anonimowe obrazy medyczne i anonimowe odpowiedzi diagnostyczne klinicystów. Tylko zagregowane wyniki podsumowujące (np. wskaźniki dokładności diagnostycznej i analizy statystyczne) będą przedstawiane w publikacjach i prezentacjach.

Informacje o lekach i urządzeniach, dokumenty badawcze

Bada produkt leczniczy regulowany przez amerykańską FDA

Nie

Bada produkt urządzenia regulowany przez amerykańską FDA

Nie

Te informacje zostały pobrane bezpośrednio ze strony internetowej clinicaltrials.gov bez żadnych zmian. Jeśli chcesz zmienić, usunąć lub zaktualizować dane swojego badania, skontaktuj się z register@clinicaltrials.gov. Gdy tylko zmiana zostanie wprowadzona na stronie clinicaltrials.gov, zostanie ona automatycznie zaktualizowana również na naszej stronie internetowej .

Badania kliniczne na System Diagnostyczny SI (AIMD.1)

Subskrybuj