- ICH GCP
- US-Register für klinische Studien
- Klinische Studie NCT07470463
Evaluierung von One-Shot Vision Differentialdiagnose (OSVDE) und Multi-Step Conversational Non-Inferiority (MSCNE) in KI-gestützter medizinischer Anamneseerhebung. (OSVDE-MSCNE)
Leistungsbewertung des KI-gestützten medizinischen Interview- und Diagnosesystems: One-Shot-Vision-Differentialdiagnose (OSVDE) und Multi-Step-Conversational-Non-Inferiority (MSCNE)-Bewertung.
Diese Studie bewertet die diagnostische Leistung eines multimodalen künstlichen Intelligenz (KI)-Systems (AIMD.1) unter Verwendung von anonymisierten medizinischen Bildern und halbsynthetischen Patientensimulationen. Die Studie kombiniert retrospektive Analysen bestehender öffentlich zugänglicher Bilddatensätze mit prospektiver Datenerhebung von fachärztlich zertifizierten Klinikern, die diagnostische Bewertungsaufgaben durchführen.
In der One-Shot Vision Differential Evaluation (OSVDE)-Phase überprüfen Kliniker einzelne anonymisierte medizinische Bilder und erstellen eine Rangliste möglicher Diagnosen ausschließlich basierend auf visuellen Merkmalen. In der Multi-Step Conversational Non-Inferiority Evaluation (MSCNE)-Phase führen Kliniker diagnostische Bewertungen mit halbsynthetischen Patientensimulationen durch, die aus anonymisierten medizinischen Bildern abgeleitet werden. Die Leistung der Kliniker wird mit dem KI-System bei denselben diagnostischen Aufgaben verglichen.
Menschliche Teilnehmer bestehen ausschließlich aus fachärztlich zertifizierten Klinikern, die diagnostische Antworten liefern. Medizinische Bilder und simulierte Fälle sind Studienmaterialien und gelten nicht als Studienteilnehmer. Es werden keine identifizierbaren Patientendaten verwendet, und das KI-System wird in einer Offline-Forschungsumgebung evaluiert und nicht für klinische Entscheidungsfindung oder Patientenversorgung eingesetzt.
Studienübersicht
Status
Bedingungen
Intervention / Behandlung
Detaillierte Beschreibung
Künstliche Intelligenz (KI)-Systeme haben vielversprechende Fähigkeiten in der medizinischen Diagnostik gezeigt; jedoch sind strenge Benchmark-Evaluierungen vor dem klinischen Einsatz notwendig. AIMD.1 ist ein multimodales KI-Diagnosesystem, das durch Analyse medizinischer Bilder und konversationaler diagnostischer Interaktionen die klinische Entscheidungsfindung unterstützen soll.
Diese Studie evaluiert die diagnostische Leistung von AIMD.1 unter Verwendung einer Kombination aus retrospektiven Bilddatensätzen und prospektiven klinischen Bewertungsaufgaben. Das Ziel ist festzustellen, ob das KI-System unter kontrollierten Benchmark-Bedingungen eine mit Fachärzten vergleichbare diagnostische Genauigkeit erreicht.
Die Evaluation umfasst zwei komplementäre Phasen.
One-Shot Vision Differential Evaluation (OSVDE):
In dieser Phase überprüfen das KI-System und klinische Teilnehmer unabhängig voneinander einzelne anonymisierte medizinische Bilder und erstellen basierend ausschließlich auf visuellen Merkmalen Ranglisten möglicher Diagnosen. Die Evaluation wird etwa 11.500-15.000 anonymisierte medizinische Bilder aus mehreren medizinischen Fachgebieten und Krankheitskategorien mit verifizierten Referenzdiagnosen verwenden.
Multi-Step Conversational Non-Inferiority Evaluation (MSCNE):
In dieser Phase absolvieren das KI-System und Kliniker diagnostische Aufgaben unter Verwendung halbsynthetischer Patienten-Simulationen, die aus anonymisierten medizinischen Bildern abgeleitet sind. Diese Simulationen bieten strukturierte klinische Informationen durch konversationale Interaktionen, wodurch die Bewertung der diagnostischen Entscheidungsfindung über mehrere Schritte hinweg ermöglicht wird. Etwa 380-500 simulierte Fälle werden evaluiert.
Etwa 10-30 Fachärzte werden an der Studie teilnehmen. Die Kliniker werden diagnostische Evaluierungssitzungen remote absolvieren und Differentialdiagnosen für Teilmengen der Bild- und Simulationsfälle liefern. Die menschlichen Teilnehmer bestehen ausschließlich aus Klinikern, die diagnostische Antworten liefern. Die Bilddatensätze und synthetischen Fälle dienen als Studienmaterial und werden nicht als Teilnehmer betrachtet.
Alle in der Studie verwendeten Bilder sind anonymisiert und stammen aus öffentlich zugänglichen Quellen oder Datensätzen, die Anonymisierungsstandards erfüllen. Zusätzliche Vorverarbeitungsschritte stellen sicher, dass alle potenziell identifizierbaren Informationen vor der Aufnahme in den Forschungsdatensatz entfernt werden.
Das KI-System wird in einer Offline-Forschungsumgebung evaluiert und nicht zur Führung realer klinischer Versorgung oder Patientenbetreuung verwendet. Die Studie ist als Benchmark-Leistungsevaluation vor jeder prospektiven Validierung mit echten Patienten konzipiert.
Primäre Endpunkte umfassen diagnostische Genauigkeitsmetriken wie Top-1-Diagnosegenauigkeit, definiert als der Anteil der Fälle, in denen die Primärdiagnose des KI-Systems mit der Referenzdiagnose übereinstimmt. Sekundäre Endpunkte umfassen Top-5-Diagnosegenauigkeit, Kalibrierungsmetriken, Sensitivität und Spezifität über Krankheitskategorien hinweg sowie Zeit-bis-zur-Diagnose-Messungen in konversationalen Diagnoseszenarien.
Die Datenanalyse wird die diagnostische Genauigkeit mit Konfidenzintervallen schätzen und die Leistung des KI-Systems mit der Leistung der Kliniker unter Verwendung gepaarter statistischer Tests und Non-Inferiority-Analysen vergleichen.
Klinikerantworten werden unter Verwendung anonymer Studienkennungen aufgezeichnet, und nur aggregierte Leistungsergebnisse werden berichtet. Keine identifizierbaren Informationen über Kliniker oder Patienten werden gesammelt oder veröffentlicht.
Die Studiendauer wird voraussichtlich etwa sechs Monate betragen, einschließlich Datensatzvorbereitung, klinischer Evaluierungssitzungen und statistischer Analyse.
Das Protokoll ID 1026 wurde als Exempt gemäß 45CFR46.104(d) Ex am 03.10.2026 von Solutions IRB (855) 226-4472 (www.solutionsirb.com) verifiziert.
Studientyp
Einschreibung (Geschätzt)
Kontakte und Standorte
Studienkontakt
- Name: Luis R Soenksen, MSE, PhD
- Telefonnummer: (617) 936-9293
- E-Mail: soenksen@nollahealth.com
Studieren Sie die Kontaktsicherung
- Name: Sean Geiger, B.S.
- Telefonnummer: (412) 412-8786
- E-Mail: sean@nollahealth.com
Studienorte
-
-
New York
-
New York, New York, Vereinigte Staaten, 10003
- Rekrutierung
- Nolla Health (Magic Health Inc.)
-
Kontakt:
- Sean Geiger, B.S.
- Telefonnummer: (412) 412-8786
- E-Mail: sean@nollahealth.com
-
Kontakt:
- Luis R Soenksen, MSE, PhD
- Telefonnummer: (617)936-9293
- E-Mail: soenksen@nollahealth.com
-
Hauptermittler:
- Luis R Soenksen, MSE, PhD
-
Unterermittler:
- Sean Geiger, B.S.
-
Unterermittler:
- Luis Wenus
-
-
Teilnahmekriterien
Zulassungskriterien
Studienberechtigtes Alter
- Erwachsene
- Älterer Erwachsener
Akzeptiert gesunde Freiwillige
Probenahmeverfahren
Studienpopulation
Beschreibung
Einschlusskriterien:
- Aktive Facharztanerkennung in Dermatologie, Innere Medizin, Hals-Nasen-Ohren-Heilkunde, Gynäkologie, Orthopädie, Pädiatrie, Geriatrie, Notfallmedizin, Ophthalmologie, Psychiatrie, Endokrinologie, Allgemeinmedizin oder einem eng verwandten Fachgebiet
- Alter 18 Jahre oder älter
- Fähigkeit, diagnostische Untersuchungssitzungen remote mit einem Computer oder Tablet mit zuverlässigem Internetzugang abzuschließen
Ausschlusskriterien:
- Verlust der aktiven Facharztanerkennung in einem berechtigten Fachgebiet
- Unfähigkeit, die Untersuchungssitzung remote abzuschließen
Studienplan
Wie ist die Studie aufgebaut?
Designdetails
Kohorten und Interventionen
Gruppe / Kohorte |
Intervention / Behandlung |
|---|---|
|
Klinische Teilnehmer
Lizenzierte Kliniker, die an diagnostischen Bewertungsaufgaben teilnehmen, indem sie anonymisierte medizinische Bilder und semi-synthetische Patientensimulationen verwenden, um die diagnostische Genauigkeit zu bewerten.
Kliniker stellen Differentialdiagnosen für einen Benchmark-Vergleich mit einem KI-Diagnosesystem bereit.
|
AIMD.1 (auch bekannt als NollaMD-Agent) ist ein multimodales künstliches Intelligenz- (KI-) Diagnosesystem, das darauf ausgelegt ist, Differentialdiagnosen auf der Grundlage der Analyse medizinischer Bilder und strukturierter klinischer Informationen zu generieren.
In dieser Studie wird das System unter kontrollierten Forschungsbedingungen anhand anonymisierter medizinischer Bilder und halbsynthetischer Patientensimulationen evaluiert.
Das KI-System generiert bewertete diagnostische Ausgaben und zugehörige Konfidenzscores, die mit Referenzdiagnosen und Leistungsmetriken von Klinikern verglichen werden.
Das System wird in einer Offline-Forschungsumgebung evaluiert.
KI-Ausgaben werden nicht für klinische Entscheidungsfindung, Patientenmanagement oder reale medizinische Versorgung verwendet.
Andere Namen:
|
Was misst die Studie?
Primäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Top-1-Diagnosegenauigkeit
Zeitfenster: Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
|
Anteil der ausgewerteten Fälle, bei denen die vom KI-Diagnosesystem generierte Primärdiagnose mit der Referenzdiagnose (Ground Truth) übereinstimmt.
Die Genauigkeit wird über anonymisierte medizinische Bildfälle und halbsynthetische Patientensimulationsfälle berechnet und mit der Leistung von Klinikern verglichen.
|
Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
|
Sekundäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Top-5-Diagnosegenauigkeit
Zeitfenster: Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
|
Anteil der ausgewerteten Fälle, bei denen die korrekte Referenzdiagnose innerhalb der fünf bestplatzierten Diagnosen erscheint, die vom KI-Diagnosesystem generiert wurden.
|
Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
|
|
Diagnostische Genauigkeit der teilnehmenden Kliniker
Zeitfenster: Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
|
Anteil der ausgewerteten Fälle, in denen die primäre Diagnose des klinischen Teilnehmers mit der Referenzdiagnose übereinstimmt, berechnet über alle zugewiesenen Bild- und Simulationsfälle.
|
Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
|
|
Nicht-Unterlegenheit der KI-Diagnosegenauigkeit im Vergleich zu Klinikern
Zeitfenster: Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
|
Unterschied in der Top-1-Diagnosegenauigkeit zwischen dem KI-Diagnosesystem und den klinischen Teilnehmern.
Die Nichtunterlegenheit wird anhand einer vordefinierten Marge von 5 % bewertet.
|
Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
|
|
Kalibrierung der KI-Diagnosekonfidenz
Zeitfenster: Am Abschluss der diagnostischen Untersuchungen (bis zu 6 Monaten)
|
Kalibrierungsleistung von KI-generierten diagnostischen Konfidenzscores, bewertet mithilfe des Expected Calibration Error (ECE).
|
Am Abschluss der diagnostischen Untersuchungen (bis zu 6 Monaten)
|
|
Fläche unter der Receiver-Operating-Characteristic-Kurve (AUC) und Precision-Recall-Kurve (PRC)
Zeitfenster: Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
|
Fläche unter der Receiver-Operating-Characteristic-Kurve und der Precision-Recall-Kurve für die KI-Diagnoseklassifikation über Krankheitskategorien hinweg.
|
Nach Abschluss der diagnostischen Untersuchungen (bis zu 6 Monate)
|
|
Zeit bis zur Diagnose in Konversationssimulationen
Zeitfenster: Am Ende der Simulationsauswertungen (bis zu 6 Monaten)
|
Anzahl der Konversationswechsel, die das KI-System und die klinischen Teilnehmer benötigen, um eine endgültige Diagnose in halbsynthetischen Patientensimulationsfällen zu erreichen.
|
Am Ende der Simulationsauswertungen (bis zu 6 Monaten)
|
Mitarbeiter und Ermittler
Ermittler
- Hauptermittler: Luis R Soenksen, MSE, PhD, Nolla Health
Studienaufzeichnungsdaten
Haupttermine studieren
Studienbeginn (Tatsächlich)
Primärer Abschluss (Geschätzt)
Studienabschluss (Geschätzt)
Studienanmeldedaten
Zuerst eingereicht
Zuerst eingereicht, das die QC-Kriterien erfüllt hat
Zuerst gepostet (Tatsächlich)
Studienaufzeichnungsaktualisierungen
Letztes Update gepostet (Tatsächlich)
Letztes eingereichtes Update, das die QC-Kriterien erfüllt
Zuletzt verifiziert
Mehr Informationen
Begriffe im Zusammenhang mit dieser Studie
Schlüsselwörter
Andere Studien-ID-Nummern
- NH-OSVDE-MSCNE-1026
Plan für individuelle Teilnehmerdaten (IPD)
Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?
Beschreibung des IPD-Plans
Arzneimittel- und Geräteinformationen, Studienunterlagen
Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt
Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt
Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .
Klinische Studien zur KI-Diagnosesystem (AIMD.1)
-
Yale UniversityIcahn School of Medicine at Mount Sinai; National Institute on Aging (NIA); The...Anmeldung auf EinladungAortenstenoseVereinigte Staaten
-
Hazem Yassin ClinicsAhmed I ElSayeghAnmeldung auf EinladungKeratokonus | Maschinelles Lernen | Refraktive Chirurgie | Augenheilkunde | Diagnostische Genauigkeit | Klinische Entscheidungsunterstützung | Künstliche IntelligenzÄgypten
-
OncoC4, Inc.Avance Clinical Pty Ltd.; OncoC4 AU Pty LtdAktiv, nicht rekrutierendMelanom | Nierenzellkarzinom | Gebärmutterhalskrebs | Hepatozelluläres Karzinom | Magenkrebs | Darmkrebs | Speiseröhrenkrebs | Eileiterkrebs | Nicht-kleinzelligem Lungenkrebs | Gallenwegskrebs | Blasenkrebs | Endometriumkarzinom | Kopf-Hals-Plattenepithelkarzinom | Analkrebs | Primäres Peritonealkarzinom | Hochgradiges... und andere BedingungenAustralien
-
OncoC4, Inc.RekrutierungFortgeschrittener solider TumorVereinigte Staaten
-
Haseki Training and Research HospitalAbgeschlossenEntscheidungsunterstützungssysteme, Klinisch | Pädiatrie | Klinische Entscheidungsfindung | Künstliche Intelligenz (KI) in der DiagnoseTürkei (türkiye)
-
Novartis PharmaceuticalsAktiv, nicht rekrutierendRheumatoide Arthritis | Systemischer Lupus erythematodes | Sjögrens-KrankheitSpanien, Vereinigte Staaten, Ungarn, Italien, Kanada, Polen, Argentinien, Tschechien
-
Enimmune CorporationAbgeschlossenEnterovirus-InfektionenTaiwan
-
Tianjin Medical University Cancer Institute and...AbgeschlossenIntranasale Dexmedetomidin-Brustkrebs-Lokalanästhesie
-
Changzhou Cancer Hospital of Soochow UniversityAbgeschlossenNicht-kleinzelligem LungenkrebsChina
-
University of Alabama at BirminghamBracco CorporateAbgeschlossenBösartiger Tumor der Brust | Gutartiger BrusttumorVereinigte Staaten