Diese Seite wurde automatisch übersetzt und die Genauigkeit der Übersetzung wird nicht garantiert. Bitte wende dich an die englische Version für einen Quelltext.

Evaluierung von One-Shot Vision Differentialdiagnose (OSVDE) und Multi-Step Conversational Non-Inferiority (MSCNE) in KI-gestützter medizinischer Anamneseerhebung. (OSVDE-MSCNE)

20. März 2026 aktualisiert von: Magic Health Inc. (d.b.a. Nolla Health)

Leistungsbewertung des KI-gestützten medizinischen Interview- und Diagnosesystems: One-Shot-Vision-Differentialdiagnose (OSVDE) und Multi-Step-Conversational-Non-Inferiority (MSCNE)-Bewertung.

Diese Studie bewertet die diagnostische Leistung eines multimodalen künstlichen Intelligenz (KI)-Systems (AIMD.1) unter Verwendung von anonymisierten medizinischen Bildern und halbsynthetischen Patientensimulationen. Die Studie kombiniert retrospektive Analysen bestehender öffentlich zugänglicher Bilddatensätze mit prospektiver Datenerhebung von fachärztlich zertifizierten Klinikern, die diagnostische Bewertungsaufgaben durchführen.

In der One-Shot Vision Differential Evaluation (OSVDE)-Phase überprüfen Kliniker einzelne anonymisierte medizinische Bilder und erstellen eine Rangliste möglicher Diagnosen ausschließlich basierend auf visuellen Merkmalen. In der Multi-Step Conversational Non-Inferiority Evaluation (MSCNE)-Phase führen Kliniker diagnostische Bewertungen mit halbsynthetischen Patientensimulationen durch, die aus anonymisierten medizinischen Bildern abgeleitet werden. Die Leistung der Kliniker wird mit dem KI-System bei denselben diagnostischen Aufgaben verglichen.

Menschliche Teilnehmer bestehen ausschließlich aus fachärztlich zertifizierten Klinikern, die diagnostische Antworten liefern. Medizinische Bilder und simulierte Fälle sind Studienmaterialien und gelten nicht als Studienteilnehmer. Es werden keine identifizierbaren Patientendaten verwendet, und das KI-System wird in einer Offline-Forschungsumgebung evaluiert und nicht für klinische Entscheidungsfindung oder Patientenversorgung eingesetzt.

Studienübersicht

Status

Rekrutierung

Detaillierte Beschreibung

Künstliche Intelligenz (KI)-Systeme haben vielversprechende Fähigkeiten in der medizinischen Diagnostik gezeigt; jedoch sind strenge Benchmark-Evaluierungen vor dem klinischen Einsatz notwendig. AIMD.1 ist ein multimodales KI-Diagnosesystem, das durch Analyse medizinischer Bilder und konversationaler diagnostischer Interaktionen die klinische Entscheidungsfindung unterstützen soll.

Diese Studie evaluiert die diagnostische Leistung von AIMD.1 unter Verwendung einer Kombination aus retrospektiven Bilddatensätzen und prospektiven klinischen Bewertungsaufgaben. Das Ziel ist festzustellen, ob das KI-System unter kontrollierten Benchmark-Bedingungen eine mit Fachärzten vergleichbare diagnostische Genauigkeit erreicht.

Die Evaluation umfasst zwei komplementäre Phasen.

One-Shot Vision Differential Evaluation (OSVDE):

In dieser Phase überprüfen das KI-System und klinische Teilnehmer unabhängig voneinander einzelne anonymisierte medizinische Bilder und erstellen basierend ausschließlich auf visuellen Merkmalen Ranglisten möglicher Diagnosen. Die Evaluation wird etwa 11.500-15.000 anonymisierte medizinische Bilder aus mehreren medizinischen Fachgebieten und Krankheitskategorien mit verifizierten Referenzdiagnosen verwenden.

Multi-Step Conversational Non-Inferiority Evaluation (MSCNE):

In dieser Phase absolvieren das KI-System und Kliniker diagnostische Aufgaben unter Verwendung halbsynthetischer Patienten-Simulationen, die aus anonymisierten medizinischen Bildern abgeleitet sind. Diese Simulationen bieten strukturierte klinische Informationen durch konversationale Interaktionen, wodurch die Bewertung der diagnostischen Entscheidungsfindung über mehrere Schritte hinweg ermöglicht wird. Etwa 380-500 simulierte Fälle werden evaluiert.

Etwa 10-30 Fachärzte werden an der Studie teilnehmen. Die Kliniker werden diagnostische Evaluierungssitzungen remote absolvieren und Differentialdiagnosen für Teilmengen der Bild- und Simulationsfälle liefern. Die menschlichen Teilnehmer bestehen ausschließlich aus Klinikern, die diagnostische Antworten liefern. Die Bilddatensätze und synthetischen Fälle dienen als Studienmaterial und werden nicht als Teilnehmer betrachtet.

Alle in der Studie verwendeten Bilder sind anonymisiert und stammen aus öffentlich zugänglichen Quellen oder Datensätzen, die Anonymisierungsstandards erfüllen. Zusätzliche Vorverarbeitungsschritte stellen sicher, dass alle potenziell identifizierbaren Informationen vor der Aufnahme in den Forschungsdatensatz entfernt werden.

Das KI-System wird in einer Offline-Forschungsumgebung evaluiert und nicht zur Führung realer klinischer Versorgung oder Patientenbetreuung verwendet. Die Studie ist als Benchmark-Leistungsevaluation vor jeder prospektiven Validierung mit echten Patienten konzipiert.

Primäre Endpunkte umfassen diagnostische Genauigkeitsmetriken wie Top-1-Diagnosegenauigkeit, definiert als der Anteil der Fälle, in denen die Primärdiagnose des KI-Systems mit der Referenzdiagnose übereinstimmt. Sekundäre Endpunkte umfassen Top-5-Diagnosegenauigkeit, Kalibrierungsmetriken, Sensitivität und Spezifität über Krankheitskategorien hinweg sowie Zeit-bis-zur-Diagnose-Messungen in konversationalen Diagnoseszenarien.

Die Datenanalyse wird die diagnostische Genauigkeit mit Konfidenzintervallen schätzen und die Leistung des KI-Systems mit der Leistung der Kliniker unter Verwendung gepaarter statistischer Tests und Non-Inferiority-Analysen vergleichen.

Klinikerantworten werden unter Verwendung anonymer Studienkennungen aufgezeichnet, und nur aggregierte Leistungsergebnisse werden berichtet. Keine identifizierbaren Informationen über Kliniker oder Patienten werden gesammelt oder veröffentlicht.

Die Studiendauer wird voraussichtlich etwa sechs Monate betragen, einschließlich Datensatzvorbereitung, klinischer Evaluierungssitzungen und statistischer Analyse.

Das Protokoll ID 1026 wurde als Exempt gemäß 45CFR46.104(d) Ex am 03.10.2026 von Solutions IRB (855) 226-4472 (www.solutionsirb.com) verifiziert.

Studientyp

Beobachtungs

Einschreibung (Geschätzt)

30

Kontakte und Standorte

Dieser Abschnitt enthält die Kontaktdaten derjenigen, die die Studie durchführen, und Informationen darüber, wo diese Studie durchgeführt wird.

Studienkontakt

Studieren Sie die Kontaktsicherung

Studienorte

    • New York
      • New York, New York, Vereinigte Staaten, 10003
        • Rekrutierung
        • Nolla Health (Magic Health Inc.)
        • Kontakt:
        • Kontakt:
        • Hauptermittler:
          • Luis R Soenksen, MSE, PhD
        • Unterermittler:
          • Sean Geiger, B.S.
        • Unterermittler:
          • Luis Wenus

Teilnahmekriterien

Forscher suchen nach Personen, die einer bestimmten Beschreibung entsprechen, die als Auswahlkriterien bezeichnet werden. Einige Beispiele für diese Kriterien sind der allgemeine Gesundheitszustand einer Person oder frühere Behandlungen.

Zulassungskriterien

Studienberechtigtes Alter

  • Erwachsene
  • Älterer Erwachsener

Akzeptiert gesunde Freiwillige

Ja

Probenahmeverfahren

Nicht-Wahrscheinlichkeitsprobe

Studienpopulation

Die Studienpopulation besteht aus fachärztlich zertifizierten Ärzten verschiedener medizinischer Fachrichtungen, die an diagnostischen Evaluierungsaufgaben teilnehmen, bei denen anonymisierte medizinische Bilder und halbsynthetische Patientensimulationen verwendet werden. Die Teilnehmer werden über professionelle Netzwerke und medizinische Fachverbände rekrutiertert. Es werden keine Patienten in diese Studie eingeschlossen.

Beschreibung

Einschlusskriterien:

  • Aktive Facharztanerkennung in Dermatologie, Innere Medizin, Hals-Nasen-Ohren-Heilkunde, Gynäkologie, Orthopädie, Pädiatrie, Geriatrie, Notfallmedizin, Ophthalmologie, Psychiatrie, Endokrinologie, Allgemeinmedizin oder einem eng verwandten Fachgebiet
  • Alter 18 Jahre oder älter
  • Fähigkeit, diagnostische Untersuchungssitzungen remote mit einem Computer oder Tablet mit zuverlässigem Internetzugang abzuschließen

Ausschlusskriterien:

  • Verlust der aktiven Facharztanerkennung in einem berechtigten Fachgebiet
  • Unfähigkeit, die Untersuchungssitzung remote abzuschließen

Studienplan

Dieser Abschnitt enthält Einzelheiten zum Studienplan, einschließlich des Studiendesigns und der Messung der Studieninhalte.

Wie ist die Studie aufgebaut?

Designdetails

Kohorten und Interventionen

Gruppe / Kohorte
Intervention / Behandlung
Klinische Teilnehmer
Lizenzierte Kliniker, die an diagnostischen Bewertungsaufgaben teilnehmen, indem sie anonymisierte medizinische Bilder und semi-synthetische Patientensimulationen verwenden, um die diagnostische Genauigkeit zu bewerten. Kliniker stellen Differentialdiagnosen für einen Benchmark-Vergleich mit einem KI-Diagnosesystem bereit.
AIMD.1 (auch bekannt als NollaMD-Agent) ist ein multimodales künstliches Intelligenz- (KI-) Diagnosesystem, das darauf ausgelegt ist, Differentialdiagnosen auf der Grundlage der Analyse medizinischer Bilder und strukturierter klinischer Informationen zu generieren. In dieser Studie wird das System unter kontrollierten Forschungsbedingungen anhand anonymisierter medizinischer Bilder und halbsynthetischer Patientensimulationen evaluiert. Das KI-System generiert bewertete diagnostische Ausgaben und zugehörige Konfidenzscores, die mit Referenzdiagnosen und Leistungsmetriken von Klinikern verglichen werden. Das System wird in einer Offline-Forschungsumgebung evaluiert. KI-Ausgaben werden nicht für klinische Entscheidungsfindung, Patientenmanagement oder reale medizinische Versorgung verwendet.
Andere Namen:
  • Künstliche Intelligenz Differenzialdiagnose-System
  • KI-unterstütztes klinisches Entscheidungssystem
  • KI-Konversationssystem für klinische Anwendungen
  • NollaMD

Was misst die Studie?

Primäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Top-1-Diagnosegenauigkeit
Zeitfenster: Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
Anteil der ausgewerteten Fälle, bei denen die vom KI-Diagnosesystem generierte Primärdiagnose mit der Referenzdiagnose (Ground Truth) übereinstimmt. Die Genauigkeit wird über anonymisierte medizinische Bildfälle und halbsynthetische Patientensimulationsfälle berechnet und mit der Leistung von Klinikern verglichen.
Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)

Sekundäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Top-5-Diagnosegenauigkeit
Zeitfenster: Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
Anteil der ausgewerteten Fälle, bei denen die korrekte Referenzdiagnose innerhalb der fünf bestplatzierten Diagnosen erscheint, die vom KI-Diagnosesystem generiert wurden.
Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
Diagnostische Genauigkeit der teilnehmenden Kliniker
Zeitfenster: Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
Anteil der ausgewerteten Fälle, in denen die primäre Diagnose des klinischen Teilnehmers mit der Referenzdiagnose übereinstimmt, berechnet über alle zugewiesenen Bild- und Simulationsfälle.
Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
Nicht-Unterlegenheit der KI-Diagnosegenauigkeit im Vergleich zu Klinikern
Zeitfenster: Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
Unterschied in der Top-1-Diagnosegenauigkeit zwischen dem KI-Diagnosesystem und den klinischen Teilnehmern. Die Nichtunterlegenheit wird anhand einer vordefinierten Marge von 5 % bewertet.
Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
Kalibrierung der KI-Diagnosekonfidenz
Zeitfenster: Am Abschluss der diagnostischen Untersuchungen (bis zu 6 Monaten)
Kalibrierungsleistung von KI-generierten diagnostischen Konfidenzscores, bewertet mithilfe des Expected Calibration Error (ECE).
Am Abschluss der diagnostischen Untersuchungen (bis zu 6 Monaten)
Fläche unter der Receiver-Operating-Characteristic-Kurve (AUC) und Precision-Recall-Kurve (PRC)
Zeitfenster: Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
Fläche unter der Receiver-Operating-Characteristic-Kurve und der Precision-Recall-Kurve für die KI-Diagnoseklassifikation über Krankheitskategorien hinweg.
Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
Zeit bis zur Diagnose in Konversationssimulationen
Zeitfenster: Am Ende der Simulationsauswertungen (bis zu 6 Monaten)
Anzahl der Konversationswechsel, die das KI-System und die klinischen Teilnehmer benötigen, um eine endgültige Diagnose in halbsynthetischen Patientensimulationsfällen zu erreichen.
Am Ende der Simulationsauswertungen (bis zu 6 Monaten)

Mitarbeiter und Ermittler

Hier finden Sie Personen und Organisationen, die an dieser Studie beteiligt sind.

Ermittler

  • Hauptermittler: Luis R Soenksen, MSE, PhD, Nolla Health

Studienaufzeichnungsdaten

Diese Daten verfolgen den Fortschritt der Übermittlung von Studienaufzeichnungen und zusammenfassenden Ergebnissen an ClinicalTrials.gov. Studienaufzeichnungen und gemeldete Ergebnisse werden von der National Library of Medicine (NLM) überprüft, um sicherzustellen, dass sie bestimmten Qualitätskontrollstandards entsprechen, bevor sie auf der öffentlichen Website veröffentlicht werden.

Haupttermine studieren

Studienbeginn (Tatsächlich)

19. März 2026

Primärer Abschluss (Geschätzt)

19. September 2026

Studienabschluss (Geschätzt)

19. September 2026

Studienanmeldedaten

Zuerst eingereicht

10. März 2026

Zuerst eingereicht, das die QC-Kriterien erfüllt hat

10. März 2026

Zuerst gepostet (Tatsächlich)

13. März 2026

Studienaufzeichnungsaktualisierungen

Letztes Update gepostet (Tatsächlich)

25. März 2026

Letztes eingereichtes Update, das die QC-Kriterien erfüllt

20. März 2026

Zuletzt verifiziert

1. März 2026

Mehr Informationen

Begriffe im Zusammenhang mit dieser Studie

Plan für individuelle Teilnehmerdaten (IPD)

Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?

NEIN

Beschreibung des IPD-Plans

Die Daten einzelner Teilnehmer werden nicht geteilt. Die Studie umfasst anonymisierte medizinische Bilder und anonyme diagnostische Antworten von Klinikern. Nur aggregierte Zusammenfassungsergebnisse (z.B. diagnostische Genauigkeitsmetriken und statistische Analysen) werden in Veröffentlichungen und Präsentationen berichtet.

Arzneimittel- und Geräteinformationen, Studienunterlagen

Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt

Nein

Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt

Nein

Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .

Klinische Studien zur KI-Diagnosesystem (AIMD.1)

Abonnieren