Diese Seite wurde automatisch übersetzt und die Genauigkeit der Übersetzung wird nicht garantiert. Bitte wende dich an die englische Version für einen Quelltext.

LLM-Leistung in der endodontischen Diagnostik

8. Dezember 2025 aktualisiert von: Marmara University

Evaluierung von ChatGPT-4o, Gemini und Claude 3.7 in der endodontischen Diagnostik: Eine prospektive klinische Studie

Ziel dieser prospektiven Beobachtungsstudie ist es, die Fähigkeit von drei großen Sprachmodellen (ChatGPT-4o, Gemini Advanced und Claude 3.7) zu bewerten, die Diagnose und Behandlungsentscheidungsfindung bei erwachsenen Patienten mit häufigen endodontischen Erkrankungen zu unterstützen.

Die Hauptfragen, die die Studie zu beantworten versucht, sind:

Können LLMs die endodontische Diagnose genau bestimmen, wenn sie strukturierte klinische Informationen und periapikale Röntgenaufnahmen erhalten?

Können LLMs angemessene Behandlungspläne vorschlagen, die mit den Entscheidungen von Endodontiespezialisten vergleichbar sind?

Um diese Fragen zu beantworten, werden Forscher die diagnostische und therapeutische Genauigkeit der drei KI-Modelle vergleichen, wobei eine Konsensdiagnose von Endodontiespezialisten als Referenzstandard dient.

Teilnehmer werden:

Routinemäßige endodontische Untersuchungen und periapikale Röntgenaufnahmen im Rahmen der Standardversorgung erhalten.

Ihre anonymisierten Krankengeschichten und Röntgenaufnahmen in die drei KI-Modelle eingeben lassen.

Nicht direkt mit KI-Systemen interagieren; alle Auswertungen werden vom Forschungsteam durchgeführt.

Diese Studie zielt darauf ab zu verstehen, wie große Sprachmodelle unter realen klinischen Bedingungen abschneiden und ob diese Systeme in Zukunft eine unterstützende Rolle in der endodontischen Diagnostik spielen könnten.

Studienübersicht

Detaillierte Beschreibung

Diese prospektive Beobachtungsstudie zielt darauf ab, die Echtzeit-Diagnose- und Behandlungsentscheidungsleistung von drei großen Sprachmodellen – ChatGPT-4o, Gemini Advanced und Claude 3.7 – in einer endodontischen klinischen Umgebung zu bewerten. Insgesamt wurden 120 Patienten untersucht, die sich in der endodontischen Klinik vorstellten, und detaillierte medizinische/zahnmedizinische Anamnesen, klinische Befunde sowie periapikale Röntgenaufnahmen wurden erfasst. Jeder anonymisierte Fall wurde dann den drei LLMs mit einem standardisierten Prompt vorgelegt, der nach der Diagnose und dem geeigneten Behandlungsplan fragte.

Alle Modelle wurden in ihren standardmäßigen multimodalen Konfigurationen verwendet, ohne Web-Suchfunktionen, Plug-ins oder externe Datenabrufe zu aktivieren. Jede Frage wurde nur einmal in isolierten Chat-Sitzungen eingereicht, um ein Gedächtnisübertragen zu verhindern. Die Antworten wurden wortgetreu gespeichert und mit den Referenzdiagnosen und Behandlungsplänen verglichen, die von einem Gremium endodontischer Spezialisten festgelegt wurden.

Diese Studie wurde so konzipiert, dass sie realistische klinische Bedingungen so genau wie möglich nachahmt und eine realistische Bewertung bietet, wie diese Systeme bei der täglichen Anwendung durch Kliniker abschneiden könnten. Das Verständnis ihrer Fähigkeiten und Grenzen in authentischen klinischen Szenarien ist entscheidend, da erwartet wird, dass LLMs in der zukünftigen Zahnmedizin eine zunehmend wichtige Rolle spielen werden, insbesondere bei der Entscheidungsunterstützung, Triage und Patientenaufklärung. Indem identifiziert wird, wo diese Modelle gut funktionieren und wo sie Schwächen aufweisen, zielt diese Forschung darauf ab, eine sichere und effektive klinische Integration zu ermöglichen, während sich LLM-Technologien weiterentwickeln.

Studientyp

Beobachtungs

Einschreibung (Tatsächlich)

120

Kontakte und Standorte

Dieser Abschnitt enthält die Kontaktdaten derjenigen, die die Studie durchführen, und Informationen darüber, wo diese Studie durchgeführt wird.

Studienorte

    • Istanbul
      • Maltepe, Istanbul, Türkei (türkiye), 34856
        • Faculty of Dentistry, Marmara University

Teilnahmekriterien

Forscher suchen nach Personen, die einer bestimmten Beschreibung entsprechen, die als Auswahlkriterien bezeichnet werden. Einige Beispiele für diese Kriterien sind der allgemeine Gesundheitszustand einer Person oder frühere Behandlungen.

Zulassungskriterien

Studienberechtigtes Alter

  • Erwachsene
  • Älterer Erwachsener

Akzeptiert gesunde Freiwillige

Nein

Probenahmeverfahren

Nicht-Wahrscheinlichkeitsprobe

Studienpopulation

Die Studienpopulation bestand aus erwachsenen Patienten, die die endodontische Klinik der Marmara-Universität aufsuchten oder dorthin überwiesen wurden. Alle Teilnehmer wiesen häufige endodontische Erkrankungen auf, wie Pulpitis, Nekrose, primäre oder sekundäre apikale Parodontitis oder den Bedarf an einer Nachbehandlung. Nach Einholung der Einwilligung wurde bei jedem Patienten eine strukturierte papierbasierte medizinische und zahnmedizinische Anamneseerhebung sowie eine periapikale Röntgenuntersuchung durchgeführt. Insgesamt wurden 120 klinisch verifizierte endodontische Fälle eingeschlossen.

Beschreibung

Einschlusskriterien:

  • Erwachsene Patienten (≥18 Jahre alt), die in der Endodontie-Klinik vorstellig werden oder dorthin überwiesen werden.

Patienten mit einem klinisch verifizierten endodontischen Zustand, der Diagnose und Behandlungsplanung erfordert.

Patienten, die zugestimmt haben teilzunehmen und eine informierte Einwilligung erteilt haben.

Patienten, bei denen während des klinischen Besuchs eine vollständige papierbasierte medizinische/zahnmedizinische Anamnese und ein periapikales Röntgenbild erhoben wurden.

Ausschlusskriterien:

  • Ausschlusskriterien

Patienten, die die Teilnahme abgelehnt haben oder keine informierte Einwilligung erteilt haben.

Pädiatrische Patienten (<18 Jahre alt), die an die Kinderzahnheilkunde-Klinik überwiesen werden.

Patienten, die die Klinik mit nicht-endodontischen Beschwerden aufsuchen (z.B. Alveolitis nach Extraktion, Probleme bei Weisheitszahnextraktionen).

Fälle mit unvollständigen klinischen Informationen oder fehlenden Röntgenbildern.

Patienten, die sich nicht den standardmäßigen endodontischen Untersuchungsverfahren unterziehen können.

Studienplan

Dieser Abschnitt enthält Einzelheiten zum Studienplan, einschließlich des Studiendesigns und der Messung der Studieninhalte.

Wie ist die Studie aufgebaut?

Designdetails

Kohorten und Interventionen

Gruppe / Kohorte
Intervention / Behandlung
Endodontische Patienten-Kohorte
Diese Kohorte umfasst 120 aufeinanderfolgende Patienten, die sich mit klinisch verifizierten endodontischen Befunden in der endodontischen Klinik vorstellten. Klinische Anamnese und periapikale Röntgenaufnahmen wurden gesammelt, und die von KI-Modellen generierten Diagnose-/Behandlungsempfehlungen wurden mit dem Expertenkonsens verglichen.
Die anonymisierten klinischen Informationen der Teilnehmer, einschließlich strukturierter Patientenanamnese und periapikaler Röntgenaufnahmen, wurden als Eingabe für drei große Sprachmodelle (ChatGPT-4o, Gemini Advanced, Claude 3.7) verwendet. Die Modelle wurden aufgefordert, die endodontische Diagnose zu bestimmen und einen geeigneten Behandlungsplan vorzuschlagen. Den Teilnehmern wurde keine Behandlung, kein Gerät und kein Medikament verabreicht. Die Intervention besteht ausschließlich aus der KI-basierten Interpretation bereits vorhandener klinischer Daten.

Was misst die Studie?

Primäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Klinische Diagnosegenauigkeit basierend auf papierbasierter Anamnese und periapikaler Röntgenaufnahme
Zeitfenster: 7. Juli-5. August
Beurteilung der diagnostischen Entscheidung, die von endodontischen Klinikern getroffen wird, nachdem sie ein papierbasiertes Patientenanamneseformular und eine standardisierte periapikale Röntgenaufnahme überprüft haben. Die Genauigkeit wird bestimmt, indem die Diagnose des Klinikers mit der Konsensdiagnose verglichen wird, die von drei unabhängigen endodontischen Spezialisten festgelegt wurde. Die Daten werden für alle 120 Patienten zum Zeitpunkt der ersten klinischen Bewertung erhoben.
7. Juli-5. August

Sekundäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Leistung von KI-generierter Diagnose und Behandlungsplanung
Zeitfenster: august-september
Bewertung der von großen Sprachmodellen (LLMs) – ChatGPT-4o, Gemini Advanced und Claude 3.7 – generierten Diagnose- und Behandlungsempfehlungen, nachdem dieselbe papierbasierte Patientenanamnese und dasselbe periapikale Röntgenbild wie den Klinikern zur Verfügung gestellt wurden. Die LLM-Antworten werden sowohl für die Diagnose als auch für die Behandlungsentscheidungen mit dem Goldstandard-Konsens von Spezialisten verglichen.
august-september

Mitarbeiter und Ermittler

Hier finden Sie Personen und Organisationen, die an dieser Studie beteiligt sind.

Ermittler

  • Studienleiter: ayşe karadayı, asst. prof., Marmara University Faculty of Dentistry

Publikationen und hilfreiche Links

Die Bereitstellung dieser Publikationen erfolgt freiwillig durch die für die Eingabe von Informationen über die Studie verantwortliche Person. Diese können sich auf alles beziehen, was mit dem Studium zu tun hat.

Studienaufzeichnungsdaten

Diese Daten verfolgen den Fortschritt der Übermittlung von Studienaufzeichnungen und zusammenfassenden Ergebnissen an ClinicalTrials.gov. Studienaufzeichnungen und gemeldete Ergebnisse werden von der National Library of Medicine (NLM) überprüft, um sicherzustellen, dass sie bestimmten Qualitätskontrollstandards entsprechen, bevor sie auf der öffentlichen Website veröffentlicht werden.

Haupttermine studieren

Studienbeginn (Tatsächlich)

7. Juli 2025

Primärer Abschluss (Tatsächlich)

5. August 2025

Studienabschluss (Tatsächlich)

3. Oktober 2025

Studienanmeldedaten

Zuerst eingereicht

24. November 2025

Zuerst eingereicht, das die QC-Kriterien erfüllt hat

8. Dezember 2025

Zuerst gepostet (Tatsächlich)

15. Dezember 2025

Studienaufzeichnungsaktualisierungen

Letztes Update gepostet (Tatsächlich)

15. Dezember 2025

Letztes eingereichtes Update, das die QC-Kriterien erfüllt

8. Dezember 2025

Zuletzt verifiziert

1. Dezember 2025

Mehr Informationen

Begriffe im Zusammenhang mit dieser Studie

Plan für individuelle Teilnehmerdaten (IPD)

Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?

UNENTSCHIEDEN

Arzneimittel- und Geräteinformationen, Studienunterlagen

Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt

Nein

Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt

Nein

Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .

Klinische Studien zur KI-basierte Diagnosebewertung

Abonnieren