- ICH GCP
- US-Register für klinische Studien
- Klinische Studie NCT07281066
LLM-Leistung in der endodontischen Diagnostik
Evaluierung von ChatGPT-4o, Gemini und Claude 3.7 in der endodontischen Diagnostik: Eine prospektive klinische Studie
Ziel dieser prospektiven Beobachtungsstudie ist es, die Fähigkeit von drei großen Sprachmodellen (ChatGPT-4o, Gemini Advanced und Claude 3.7) zu bewerten, die Diagnose und Behandlungsentscheidungsfindung bei erwachsenen Patienten mit häufigen endodontischen Erkrankungen zu unterstützen.
Die Hauptfragen, die die Studie zu beantworten versucht, sind:
Können LLMs die endodontische Diagnose genau bestimmen, wenn sie strukturierte klinische Informationen und periapikale Röntgenaufnahmen erhalten?
Können LLMs angemessene Behandlungspläne vorschlagen, die mit den Entscheidungen von Endodontiespezialisten vergleichbar sind?
Um diese Fragen zu beantworten, werden Forscher die diagnostische und therapeutische Genauigkeit der drei KI-Modelle vergleichen, wobei eine Konsensdiagnose von Endodontiespezialisten als Referenzstandard dient.
Teilnehmer werden:
Routinemäßige endodontische Untersuchungen und periapikale Röntgenaufnahmen im Rahmen der Standardversorgung erhalten.
Ihre anonymisierten Krankengeschichten und Röntgenaufnahmen in die drei KI-Modelle eingeben lassen.
Nicht direkt mit KI-Systemen interagieren; alle Auswertungen werden vom Forschungsteam durchgeführt.
Diese Studie zielt darauf ab zu verstehen, wie große Sprachmodelle unter realen klinischen Bedingungen abschneiden und ob diese Systeme in Zukunft eine unterstützende Rolle in der endodontischen Diagnostik spielen könnten.
Studienübersicht
Status
Intervention / Behandlung
Detaillierte Beschreibung
Diese prospektive Beobachtungsstudie zielt darauf ab, die Echtzeit-Diagnose- und Behandlungsentscheidungsleistung von drei großen Sprachmodellen – ChatGPT-4o, Gemini Advanced und Claude 3.7 – in einer endodontischen klinischen Umgebung zu bewerten. Insgesamt wurden 120 Patienten untersucht, die sich in der endodontischen Klinik vorstellten, und detaillierte medizinische/zahnmedizinische Anamnesen, klinische Befunde sowie periapikale Röntgenaufnahmen wurden erfasst. Jeder anonymisierte Fall wurde dann den drei LLMs mit einem standardisierten Prompt vorgelegt, der nach der Diagnose und dem geeigneten Behandlungsplan fragte.
Alle Modelle wurden in ihren standardmäßigen multimodalen Konfigurationen verwendet, ohne Web-Suchfunktionen, Plug-ins oder externe Datenabrufe zu aktivieren. Jede Frage wurde nur einmal in isolierten Chat-Sitzungen eingereicht, um ein Gedächtnisübertragen zu verhindern. Die Antworten wurden wortgetreu gespeichert und mit den Referenzdiagnosen und Behandlungsplänen verglichen, die von einem Gremium endodontischer Spezialisten festgelegt wurden.
Diese Studie wurde so konzipiert, dass sie realistische klinische Bedingungen so genau wie möglich nachahmt und eine realistische Bewertung bietet, wie diese Systeme bei der täglichen Anwendung durch Kliniker abschneiden könnten. Das Verständnis ihrer Fähigkeiten und Grenzen in authentischen klinischen Szenarien ist entscheidend, da erwartet wird, dass LLMs in der zukünftigen Zahnmedizin eine zunehmend wichtige Rolle spielen werden, insbesondere bei der Entscheidungsunterstützung, Triage und Patientenaufklärung. Indem identifiziert wird, wo diese Modelle gut funktionieren und wo sie Schwächen aufweisen, zielt diese Forschung darauf ab, eine sichere und effektive klinische Integration zu ermöglichen, während sich LLM-Technologien weiterentwickeln.
Studientyp
Einschreibung (Tatsächlich)
Kontakte und Standorte
Studienorte
-
-
Istanbul
-
Maltepe, Istanbul, Türkei (türkiye), 34856
- Faculty of Dentistry, Marmara University
-
-
Teilnahmekriterien
Zulassungskriterien
Studienberechtigtes Alter
- Erwachsene
- Älterer Erwachsener
Akzeptiert gesunde Freiwillige
Probenahmeverfahren
Studienpopulation
Beschreibung
Einschlusskriterien:
- Erwachsene Patienten (≥18 Jahre alt), die in der Endodontie-Klinik vorstellig werden oder dorthin überwiesen werden.
Patienten mit einem klinisch verifizierten endodontischen Zustand, der Diagnose und Behandlungsplanung erfordert.
Patienten, die zugestimmt haben teilzunehmen und eine informierte Einwilligung erteilt haben.
Patienten, bei denen während des klinischen Besuchs eine vollständige papierbasierte medizinische/zahnmedizinische Anamnese und ein periapikales Röntgenbild erhoben wurden.
Ausschlusskriterien:
- Ausschlusskriterien
Patienten, die die Teilnahme abgelehnt haben oder keine informierte Einwilligung erteilt haben.
Pädiatrische Patienten (<18 Jahre alt), die an die Kinderzahnheilkunde-Klinik überwiesen werden.
Patienten, die die Klinik mit nicht-endodontischen Beschwerden aufsuchen (z.B. Alveolitis nach Extraktion, Probleme bei Weisheitszahnextraktionen).
Fälle mit unvollständigen klinischen Informationen oder fehlenden Röntgenbildern.
Patienten, die sich nicht den standardmäßigen endodontischen Untersuchungsverfahren unterziehen können.
Studienplan
Wie ist die Studie aufgebaut?
Designdetails
Kohorten und Interventionen
Gruppe / Kohorte |
Intervention / Behandlung |
|---|---|
|
Endodontische Patienten-Kohorte
Diese Kohorte umfasst 120 aufeinanderfolgende Patienten, die sich mit klinisch verifizierten endodontischen Befunden in der endodontischen Klinik vorstellten.
Klinische Anamnese und periapikale Röntgenaufnahmen wurden gesammelt, und die von KI-Modellen generierten Diagnose-/Behandlungsempfehlungen wurden mit dem Expertenkonsens verglichen.
|
Die anonymisierten klinischen Informationen der Teilnehmer, einschließlich strukturierter Patientenanamnese und periapikaler Röntgenaufnahmen, wurden als Eingabe für drei große Sprachmodelle (ChatGPT-4o, Gemini Advanced, Claude 3.7) verwendet.
Die Modelle wurden aufgefordert, die endodontische Diagnose zu bestimmen und einen geeigneten Behandlungsplan vorzuschlagen.
Den Teilnehmern wurde keine Behandlung, kein Gerät und kein Medikament verabreicht.
Die Intervention besteht ausschließlich aus der KI-basierten Interpretation bereits vorhandener klinischer Daten.
|
Was misst die Studie?
Primäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Klinische Diagnosegenauigkeit basierend auf papierbasierter Anamnese und periapikaler Röntgenaufnahme
Zeitfenster: 7. Juli-5. August
|
Beurteilung der diagnostischen Entscheidung, die von endodontischen Klinikern getroffen wird, nachdem sie ein papierbasiertes Patientenanamneseformular und eine standardisierte periapikale Röntgenaufnahme überprüft haben.
Die Genauigkeit wird bestimmt, indem die Diagnose des Klinikers mit der Konsensdiagnose verglichen wird, die von drei unabhängigen endodontischen Spezialisten festgelegt wurde.
Die Daten werden für alle 120 Patienten zum Zeitpunkt der ersten klinischen Bewertung erhoben.
|
7. Juli-5. August
|
Sekundäre Ergebnismessungen
Ergebnis Maßnahme |
Maßnahmenbeschreibung |
Zeitfenster |
|---|---|---|
|
Leistung von KI-generierter Diagnose und Behandlungsplanung
Zeitfenster: august-september
|
Bewertung der von großen Sprachmodellen (LLMs) – ChatGPT-4o, Gemini Advanced und Claude 3.7 – generierten Diagnose- und Behandlungsempfehlungen, nachdem dieselbe papierbasierte Patientenanamnese und dasselbe periapikale Röntgenbild wie den Klinikern zur Verfügung gestellt wurden.
Die LLM-Antworten werden sowohl für die Diagnose als auch für die Behandlungsentscheidungen mit dem Goldstandard-Konsens von Spezialisten verglichen.
|
august-september
|
Mitarbeiter und Ermittler
Sponsor
Ermittler
- Studienleiter: ayşe karadayı, asst. prof., Marmara University Faculty of Dentistry
Publikationen und hilfreiche Links
Allgemeine Veröffentlichungen
- Abd-Alrazaq A, AlSaad R, Alhuwail D, Ahmed A, Healy PM, Latifi S, Aziz S, Damseh R, Alabed Alrazak S, Sheikh J. Large Language Models in Medical Education: Opportunities, Challenges, and Future Directions. JMIR Med Educ. 2023 Jun 1;9:e48291. doi: 10.2196/48291.
- Schwendicke F, Samek W, Krois J. Artificial Intelligence in Dentistry: Chances and Challenges. J Dent Res. 2020 Jul;99(7):769-774. doi: 10.1177/0022034520915714. Epub 2020 Apr 21.
Studienaufzeichnungsdaten
Haupttermine studieren
Studienbeginn (Tatsächlich)
Primärer Abschluss (Tatsächlich)
Studienabschluss (Tatsächlich)
Studienanmeldedaten
Zuerst eingereicht
Zuerst eingereicht, das die QC-Kriterien erfüllt hat
Zuerst gepostet (Tatsächlich)
Studienaufzeichnungsaktualisierungen
Letztes Update gepostet (Tatsächlich)
Letztes eingereichtes Update, das die QC-Kriterien erfüllt
Zuletzt verifiziert
Mehr Informationen
Begriffe im Zusammenhang mit dieser Studie
Schlüsselwörter
Andere Studien-ID-Nummern
- 2025-38
Plan für individuelle Teilnehmerdaten (IPD)
Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?
Arzneimittel- und Geräteinformationen, Studienunterlagen
Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt
Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt
Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .
Klinische Studien zur KI-basierte Diagnosebewertung
-
Johannes SchiefelbeinTechnomics Research; Deepeye Medical GmbH; M3 Macula Monitor MuensterNoch keine RekrutierungNeovaskuläre altersbedingte Makuladegeneration (nAMD)Deutschland
-
National Taiwan University HospitalRekrutierungDegenerative Erkrankungen der LendenwirbelsäuleTaiwan
-
University of HoustonUnbekanntAlkohol; Verwendung, Problem | Marihuana-Nutzung
-
Hazem Yassin ClinicsAhmed I ElSayeghAnmeldung auf EinladungKeratokonus | Maschinelles Lernen | Refraktive Chirurgie | Augenheilkunde | Diagnostische Genauigkeit | Klinische Entscheidungsunterstützung | Künstliche IntelligenzÄgypten
-
Martine PutsUniversity Health Network, Toronto; Sunnybrook Health Sciences CentreAktiv, nicht rekrutierendLymphom | Brustkrebs | Gynäkologischer Krebs | Lungenkrebs | Magen-Darm-Krebs | UrogenitalkrebsKanada