Ta strona została przetłumaczona automatycznie i dokładność tłumaczenia nie jest gwarantowana. Proszę odnieść się do angielska wersja za tekst źródłowy.

Skalowalny Nadzór Kliniczny nad Dużymi Modelami Językowymi Dzięki Triangulacji Niepewności (SCOUT)

14 lutego 2026 zaktualizowane przez: China National Center for Cardiovascular Diseases

Prospektywna ocena niezależnej od modelu meta-weryfikacyjnej platformy (SCOUT) do skalowalnego nadzoru klinicznego nad wynikami dużych modeli językowych w diagnostyce choroby wieńcowej serca: wieloośrodkowe, randomizowane, krzyżowe badanie

To prospektywne, wieloobserwatorowe, randomizowane badanie krzyżowe ocenia SCOUT (Skalowalny Nadzór Kliniczny poprzez Triangulację Niepewności), agnostyczny modelowo meta-weryfikacyjny framework, który selektywnie przekazuje niewiarygodne prognozy dużych modeli językowych (LLM) klinicystom poprzez triangulację trzech ortogonalnych sygnałów niepewności: heterogeniczności modelu, stochastycznej niespójności i krytyki rozumowania. Badanie ocenia, czy przegląd wspomagany SCOUT może skrócić czas przeglądu lekarzy w porównaniu ze standardowym ręcznym przeglądem diagnoz generowanych przez AI, przy jednoczesnym utrzymaniu niegorszej dokładności diagnostycznej w subtypowaniu choroby wieńcowej (CHD).

Przegląd badań

Status

Jeszcze nie rekrutacja

Warunki

Choroba niedokrwienna serca (CHD)

Interwencja / Leczenie

Szczegółowy opis

Tło: Duże modele językowe są coraz częściej wdrażane w klinicznych procesach pracy, jednak wymaganie przeglądu każdego wyniku AI przez klinicystę neguje zyski w zakresie efektywności, które motywują ich adopcję. SCOUT rozwiązuje ten paradoks efektywności i bezpieczeństwa poprzez algorytmiczną meta-weryfikację.

Framework SCOUT trianguluje trzy ortogonalne sygnały zewnętrzne, aby określić niepewność na poziomie przypadku: (1) Heterogeniczność modelu – czy strukturalnie różny pomocniczy LLM zgadza się z modelem podstawowym; (2) Niespójność stochastyczna – czy powtarzane próbkowanie z tego samego modelu daje rozbieżne wyniki; (3) Krytyka rozumowania – czy zewnętrzny model sprawdzający identyfikuje błędy logiczne w łańcuchu rozumowania (chain-of-thought).

W tym badaniu krzyżowym, 7 klinicystów o różnym stażu (2 młodszych rezydentów, 3 starszych rezydentów, 2 lekarzy prowadzących) każdy przegląda wszystkie 110 przypadków zarówno w standardowym ręcznym przeglądzie, jak i w procesach przeglądu wspomaganych przez SCOUT. Badanie ocenia efektywność procesu pracy (główny punkt końcowy) i dokładność diagnostyczną (drugorzędny punkt końcowy).

Typ studiów

Interwencyjne

Zapisy (Szacowany)

Faza

Nie dotyczy

Kontakty i lokalizacje

Ta sekcja zawiera dane kontaktowe osób prowadzących badanie oraz informacje o tym, gdzie badanie jest przeprowadzane.

Kontakt w sprawie studiów

Nazwa: Xiaojin Gao, Dr.
Numer telefonu: +86 010 88322415
E-mail: sophie_gao@sina.com

Kryteria uczestnictwa

Badacze szukają osób, które pasują do określonego opisu, zwanego kryteriami kwalifikacyjnymi. Niektóre przykłady tych kryteriów to ogólny stan zdrowia danej osoby lub wcześniejsze leczenie.

Kryteria kwalifikacji

Wiek uprawniający do nauki

Dorosły
Starszy dorosły

Akceptuje zdrowych ochotników

Nie

Opis

Kryteria włączenia:

Kardiolodzy z certyfikatem specjalizacji lub w trakcie specjalizacji w Szpitalu Fuwai
Obejmujący trzy poziomy doświadczenia: młodsi rezydenci, starsi rezydenci, lekarze prowadzący

Kryteria wyłączenia:

Klinicyści zaangażowani w rozwój lub optymalizację struktury SCOUT
Klinicyści zaangażowani w proces ustalania złotego standardu

Plan studiów

Ta sekcja zawiera szczegółowe informacje na temat planu badania, w tym sposób zaprojektowania badania i jego pomiary.

Jak projektuje się badanie?

Szczegóły projektu

Główny cel: Diagnostyczny
Przydział: Randomizowane
Model interwencyjny: Zadanie krzyżowe
Maskowanie: Brak (otwarta etykieta)

Liczba ramion

Broń i interwencje

Grupa uczestników / Arm	Interwencja / Leczenie
Aktywny komparator: Grupa kontrolna (standardowy przegląd ręczny) Lekarze ręcznie przeglądają wszystkie przypadki w zestawie kontrolnym (n=54) z dostępem do prognoz i uzasadnień AI. Brak selektywnego odroczenia.	Test diagnostyczny: Standardowy Przepływ Pracy Przeglądu Ręcznego Lekarze przeprowadzają pełny ręczny przegląd 54 przypadków, korzystając z surowych dokumentacji medycznych z dostępem do przewidywań i uzasadnień modelu AI, ale bez stratyfikacji niepewności SCOUT lub selektywnego odroczenia.
Eksperymentalny: Eksperymentalny (przegląd wspomagany SCOUT) Lekarze przetwarzają zestaw interwencji (n=56) za pomocą ramy SCOUT. Przypadki o niskiej niepewności są automatycznie akceptowane; przypadki o wysokiej niepewności przechodzą przez recenzję lekarza z pełnym śladem audytowym.	Test diagnostyczny: Przepływ pracy wspomagany przeglądem SCOUT SCOUT-Assisted Review (Intervention Arm): Lekarze przeglądają 56 przypadków przetworzonych w ramach struktury SCOUT. Dla przypadków sklasyfikowanych jako niskiej niepewności (D(x)=0), predykcja AI jest automatycznie akceptowana bez przeglądu lekarza. Dla przypadków wysokiej niepewności (D(x)=1), lekarz przegląda przypadek z dostępem do głównego modelu łańcucha rozumowania i wyników audytu metaweryfikacji. Głównym modelem jest DeepSeek-V3.1 z promptowaniem łańcucha rozumowania.

Grupa uczestników / Arm

Interwencja / Leczenie

Aktywny komparator: Grupa kontrolna (standardowy przegląd ręczny)

Lekarze ręcznie przeglądają wszystkie przypadki w zestawie kontrolnym (n=54) z dostępem do prognoz i uzasadnień AI. Brak selektywnego odroczenia.

Test diagnostyczny: Standardowy Przepływ Pracy Przeglądu Ręcznego

Lekarze przeprowadzają pełny ręczny przegląd 54 przypadków, korzystając z surowych dokumentacji medycznych z dostępem do przewidywań i uzasadnień modelu AI, ale bez stratyfikacji niepewności SCOUT lub selektywnego odroczenia.

Eksperymentalny: Eksperymentalny (przegląd wspomagany SCOUT)

Lekarze przetwarzają zestaw interwencji (n=56) za pomocą ramy SCOUT. Przypadki o niskiej niepewności są automatycznie akceptowane; przypadki o wysokiej niepewności przechodzą przez recenzję lekarza z pełnym śladem audytowym.

Test diagnostyczny: Przepływ pracy wspomagany przeglądem SCOUT

SCOUT-Assisted Review (Intervention Arm): Lekarze przeglądają 56 przypadków przetworzonych w ramach struktury SCOUT. Dla przypadków sklasyfikowanych jako niskiej niepewności (D(x)=0), predykcja AI jest automatycznie akceptowana bez przeglądu lekarza. Dla przypadków wysokiej niepewności (D(x)=1), lekarz przegląda przypadek z dostępem do głównego modelu łańcucha rozumowania i wyników audytu metaweryfikacji. Głównym modelem jest DeepSeek-V3.1 z promptowaniem łańcucha rozumowania.

Co mierzy badanie?

Podstawowe miary wyniku

Miara wyniku	Opis środka	Ramy czasowe
Średni czas przeglądu przypadku przez lekarza (minuty) Ramy czasowe: Do ukończenia badania, średnio 2 godziny.	Średni czas poświęcony przez każdego lekarza na przeanalizowanie i podjęcie decyzji diagnostycznej w każdym przypadku w ramach każdego ramienia badania. Mierzony w minutach.	Do ukończenia badania, średnio 2 godziny.

Miary wyników drugorzędnych

Miara wyniku	Opis środka	Ramy czasowe
Dokładność diagnostyczna (%) Ramy czasowe: Do zakończenia badania, średnio 2 godziny.	Proporcja prawidłowych klasyfikacji podtypów CHD (STEMI, NSTEMI, niestabilna dławica piersiowa, przewlekłe zespoły wieńcowe) w każdej grupie.	Do zakończenia badania, średnio 2 godziny.
Obliczeniowa Stopa Zwrotu z Inwestycji (ROI) Ramy czasowe: Przez cały okres trwania badania, średnio 2 godziny.	Stosunek oszczędności czasu lekarzy (wycenionych według ustandaryzowanych stawek minutowych z benchmarków reformy służby zdrowia w Sanming) do kosztów obliczeniowych wnioskowania SCOUT, warstwowany według poziomu doświadczenia klinicystów.	Przez cały okres trwania badania, średnio 2 godziny.

Współpracownicy i badacze

Tutaj znajdziesz osoby i organizacje zaangażowane w to badanie.

Sponsor

China National Center for Cardiovascular Diseases

Daty zapisu na studia

Daty te śledzą postęp w przesyłaniu rekordów badań i podsumowań wyników do ClinicalTrials.gov. Zapisy badań i zgłoszone wyniki są przeglądane przez National Library of Medicine (NLM), aby upewnić się, że spełniają określone standardy kontroli jakości, zanim zostaną opublikowane na publicznej stronie internetowej.

Główne daty studiów

Rozpoczęcie studiów (Szacowany)

19 lutego 2026

Zakończenie podstawowe (Szacowany)

28 lutego 2026

Ukończenie studiów (Szacowany)

28 lutego 2026

Daty rejestracji na studia

Pierwszy przesłany

9 lutego 2026

Pierwszy przesłany, który spełnia kryteria kontroli jakości

14 lutego 2026

Pierwszy wysłany (Rzeczywisty)

17 lutego 2026

Aktualizacje rekordów badań

Ostatnia wysłana aktualizacja (Rzeczywisty)

17 lutego 2026

Ostatnia przesłana aktualizacja, która spełniała kryteria kontroli jakości

14 lutego 2026

Ostatnia weryfikacja

1 lutego 2026

Więcej informacji

Terminy związane z tym badaniem

Słowa kluczowe

sztuczna inteligencja

Dodatkowe istotne warunki MeSH

Inne numery identyfikacyjne badania

2025-2702-1

Plan dla danych uczestnika indywidualnego (IPD)

Planujesz udostępniać dane poszczególnych uczestników (IPD)?

TAK

Opis planu IPD

Zanonimizowane dane indywidualnych uczestników, na których opierają się wyniki przedstawione w tym badaniu, zostaną udostępnione.

Ramy czasowe udostępniania IPD

Począwszy od 1 miesiąca po publikacji głównych wyników i dostępne przez okres do 60 miesięcy.

Kryteria dostępu do udostępniania IPD

Dane są dostępne od odpowiedniego autora po uzasadnionym wniosku. Wnioskodawcy będą musieli przedstawić metodologicznie uzasadniony projekt badawczy i podpisać umowę o wykorzystaniu danych.

Typ informacji pomocniczych dotyczących udostępniania IPD

PROTOKÓŁ BADANIA
SOK ROŚLINNY
ICF
ANALITYCZNY_KOD
CSR

Informacje o lekach i urządzeniach, dokumenty badawcze

Bada produkt leczniczy regulowany przez amerykańską FDA

Nie

Bada produkt urządzenia regulowany przez amerykańską FDA

Nie

Te informacje zostały pobrane bezpośrednio ze strony internetowej clinicaltrials.gov bez żadnych zmian. Jeśli chcesz zmienić, usunąć lub zaktualizować dane swojego badania, skontaktuj się z register@clinicaltrials.gov. Gdy tylko zmiana zostanie wprowadzona na stronie clinicaltrials.gov, zostanie ona automatycznie zaktualizowana również na naszej stronie internetowej .

Skalowalny Nadzór Kliniczny nad Dużymi Modelami Językowymi Dzięki Triangulacji Niepewności (SCOUT)

Prospektywna ocena niezależnej od modelu meta-weryfikacyjnej platformy (SCOUT) do skalowalnego nadzoru klinicznego nad wynikami dużych modeli językowych w diagnostyce choroby wieńcowej serca: wieloośrodkowe, randomizowane, krzyżowe badanie

Przegląd badań

Status

Warunki

Interwencja / Leczenie

Szczegółowy opis

Typ studiów

Zapisy (Szacowany)

Faza

Kontakty i lokalizacje

Kontakt w sprawie studiów

Kryteria uczestnictwa

Kryteria kwalifikacji

Wiek uprawniający do nauki

Akceptuje zdrowych ochotników

Opis

Plan studiów

Jak projektuje się badanie?

Szczegóły projektu

Liczba ramion

Broń i interwencje

Grupa uczestników / Arm

Interwencja / Leczenie

Co mierzy badanie?

Podstawowe miary wyniku

Miara wyniku

Opis środka

Ramy czasowe

Miary wyników drugorzędnych

Miara wyniku

Opis środka

Ramy czasowe

Współpracownicy i badacze

Sponsor

Daty zapisu na studia

Główne daty studiów

Rozpoczęcie studiów (Szacowany)

Zakończenie podstawowe (Szacowany)

Ukończenie studiów (Szacowany)

Daty rejestracji na studia

Pierwszy przesłany

Pierwszy przesłany, który spełnia kryteria kontroli jakości

Pierwszy wysłany (Rzeczywisty)

Aktualizacje rekordów badań

Ostatnia wysłana aktualizacja (Rzeczywisty)

Ostatnia przesłana aktualizacja, która spełniała kryteria kontroli jakości

Ostatnia weryfikacja

Więcej informacji

Terminy związane z tym badaniem

Słowa kluczowe

Dodatkowe istotne warunki MeSH

Inne numery identyfikacyjne badania

Plan dla danych uczestnika indywidualnego (IPD)

Planujesz udostępniać dane poszczególnych uczestników (IPD)?

Opis planu IPD

Ramy czasowe udostępniania IPD

Kryteria dostępu do udostępniania IPD

Typ informacji pomocniczych dotyczących udostępniania IPD

Informacje o lekach i urządzeniach, dokumenty badawcze

Bada produkt leczniczy regulowany przez amerykańską FDA

Bada produkt urządzenia regulowany przez amerykańską FDA

Wyszukaj podobne próby

Sponsorzy i współpracownicy

Warunki medyczne

Interwencje lekowe

CROs by country

CROs in Rwanda

Warunki

Rzadkie choroby

Interwencje lekowe

Suplementy diety

Sponsor / Współpracownicy

Lokalizacje