- ICH GCP
- US-Register für klinische Studien
- Klinische Studie NCT07414966
Skalierbare klinische Überwachung von großen Sprachmodellen durch Unsicherheitstriangulation (SCOUT)
Prospektive Evaluation eines modellagnostischen Meta-Verifizierungs-Frameworks (SCOUT) für skalierbare klinische Überwachung von Large Language Model-Outputs in der Diagnose koronarer Herzkrankheiten: Eine Multi-Reader-, randomisierte, Crossover-Studie
Studienübersicht
Status
Bedingungen
Intervention / Behandlung
Detaillierte Beschreibung
Hintergrund: Große Sprachmodelle werden zunehmend in klinischen Arbeitsabläufen eingesetzt, aber die Anforderung, jede KI-Ausgabe durch Kliniker überprüfen zu lassen, negiert die Effizienzgewinne, die ihre Einführung motivieren. SCOUT adressiert dieses Effizienz-Sicherheits-Paradoxon durch algorithmische Meta-Verifikation.
Das SCOUT-Framework trianguliert drei orthogonale externe Signale, um die Unsicherheit auf Fallbasis zu bestimmen: (1) Modellheterogenität - ob ein strukturell unterschiedliches Hilfs-LLM mit dem primären Modell übereinstimmt; (2) stochastische Inkonsistenz - ob wiederholtes Sampling aus demselben Modell divergierende Ausgaben liefert; (3) Argumentationskritik - ob ein externes Prüfmodell logische Fehler in der Gedankenketten-Argumentation identifiziert.
In dieser Crossover-Studie überprüfen 7 Kliniker unterschiedlicher Erfahrungsstufen (2 Assistenzärzte, 3 Oberärzte, 2 leitende Ärzte) jeweils alle 110 Fälle sowohl unter Standardmanueller Überprüfung als auch unter SCOUT-unterstützten Arbeitsabläufen. Die Studie bewertet die Arbeitsablaufeffizienz (primärer Endpunkt) und die diagnostische Genauigkeit (sekundärer Endpunkt).
Studientyp
Einschreibung (Geschätzt)
Phase
- Unzutreffend
Kontakte und Standorte
Studienkontakt
- Name: Xiaojin Gao, Dr.
- Telefonnummer: +86 010 88322415
- E-Mail: sophie_gao@sina.com
Teilnahmekriterien
Zulassungskriterien
Studienberechtigtes Alter
- Erwachsene
- Älterer Erwachsener
Akzeptiert gesunde Freiwillige
Beschreibung
Einschlusskriterien:
- Facharztzertifizierte oder in Ausbildung befindliche Kardiologen am Fuwai-Krankenhaus
- Umfasst drei Erfahrungsebenen: Assistenzärzte, Fachärzte in Weiterbildung, Oberärzte
Ausschlusskriterien:
- Kliniker, die an der Entwicklung oder Optimierung des SCOUT-Rahmens beteiligt waren
- Kliniker, die am Goldstandard-Bewertungsprozess beteiligt waren
Studienplan
Wie ist die Studie aufgebaut?
Designdetails
- Hauptzweck: Diagnose
- Zuteilung: Zufällig
- Interventionsmodell: Crossover-Aufgabe
- Maskierung: Keine (Offenes Etikett)
Waffen und Interventionen
Teilnehmergruppe / Arm |
Intervention / Behandlung |
|---|---|
|
Aktiver Komparator: Kontrollgruppe (Standard manuelle Überprüfung)
Die Ärzte überprüfen manuell alle Fälle in der Kontrollgruppe (n=54) mit Zugriff auf KI-Vorhersagen und -Begründungen.
Keine selektive Zurückstellung.
|
Ärzte führen eine vollständige manuelle Überprüfung von 54 Fällen durch, wobei sie auf Rohdaten medizinischer Aufzeichnungen zugreifen und die Vorhersagen und Begründungen des KI-Modells einsehen können, jedoch ohne SCOUT-Unsicherheitsstratifikation oder selektive Zurückstellung.
|
|
Experimental: Experimental (SCOUT-Assistierte Überprüfung)
Die Ärzte verarbeiten das Interventionsset (n=56) über das SCOUT-Framework.
Fälle mit geringer Unsicherheit werden automatisch akzeptiert; Fälle mit hoher Unsicherheit durchlaufen eine ärztliche Überprüfung mit vollständiger Prüfspur.
|
SCOUT-gestützte Überprüfung (Interventionsarm): Ärzte überprüfen 56 Fälle, die durch das SCOUT-Framework verarbeitet wurden.
Für Fälle, die als geringe Unsicherheit klassifiziert sind (D(x)=0), wird die KI-Vorhersage automatisch akzeptiert, ohne ärztliche Überprüfung.
Für Fälle mit hoher Unsicherheit (D(x)=1) überprüft der Arzt den Fall mit Zugriff auf die Chain-of-Thought-Begründung des Hauptmodells und die Ergebnisse der Meta-Verifizierungsprüfung.
Das Hauptmodell ist DeepSeek-V3.1 mit Chain-of-Thought-Prompting.
|
Was misst die Studie?
Primäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Durchschnittliche Prüfzeit pro Fall durch den Arzt (Minuten)
Zeitfenster: Bis zum Studienabschluss, durchschnittlich 2 Stunden.
|
Mittlere Zeit, die jeder Kliniker pro Fall in jeder Studiengruppe für die Überprüfung und Erstellung einer Diagnoseentscheidung aufwendet.
Gemessen in Minuten.
|
Bis zum Studienabschluss, durchschnittlich 2 Stunden.
|
Sekundäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Diagnostische Genauigkeit (%)
Zeitfenster: Bis zum Studienabschluss, durchschnittlich 2 Stunden.
|
Anteil korrekter KHK-Subtypklassifikationen (STEMI, NSTEMI, instabile Angina pectoris, chronische koronare Syndrome) in jedem Arm.
|
Bis zum Studienabschluss, durchschnittlich 2 Stunden.
|
|
Berechnete Kapitalrendite (ROI)
Zeitfenster: Bis zum Studienabschluss, durchschnittlich 2 Stunden.
|
Verhältnis der eingesparten Arztzeit (bewertet anhand standardisierter Minutenlöhne aus den Sanming-Gesundheitsreform-Benchmarks) zu den Berechnungskosten der SCOUT-Inferenz, nach klinischer Erfahrungsstufe geschichtet.
|
Bis zum Studienabschluss, durchschnittlich 2 Stunden.
|
Mitarbeiter und Ermittler
Studienaufzeichnungsdaten
Haupttermine studieren
Studienbeginn (Geschätzt)
Primärer Abschluss (Geschätzt)
Studienabschluss (Geschätzt)
Studienanmeldedaten
Zuerst eingereicht
Zuerst eingereicht, das die QC-Kriterien erfüllt hat
Zuerst gepostet (Tatsächlich)
Studienaufzeichnungsaktualisierungen
Letztes Update gepostet (Tatsächlich)
Letztes eingereichtes Update, das die QC-Kriterien erfüllt
Zuletzt verifiziert
Mehr Informationen
Begriffe im Zusammenhang mit dieser Studie
Schlüsselwörter
Zusätzliche relevante MeSH-Bedingungen
Andere Studien-ID-Nummern
- 2025-2702-1
Plan für individuelle Teilnehmerdaten (IPD)
Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?
Beschreibung des IPD-Plans
IPD-Sharing-Zeitrahmen
IPD-Sharing-Zugriffskriterien
Art der unterstützenden IPD-Freigabeinformationen
- STUDIENPROTOKOLL
- SAFT
- ICF
- ANALYTIC_CODE
- CSR
Arzneimittel- und Geräteinformationen, Studienunterlagen
Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt
Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt
Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .
Klinische Studien zur Standardisierter manueller Prüfungsablauf
-
Universitat Politècnica de CatalunyaUniversity of Liverpool; The BMJAbgeschlossenPeer-Review, Veröffentlichung | Vollständigkeit der BerichterstattungVereinigtes Königreich
-
Hospital El SalvadorNoch keine RekrutierungKünstliche Intelligenz (KI) in der DiagnoseEl Salvador