Denne side blev automatisk oversat, og nøjagtigheden af ​​oversættelsen er ikke garanteret. Der henvises til engelsk version for en kildetekst.

LLM-præstation inden for endodontisk diagnostik

8. december 2025 opdateret af: Marmara University

Evaluering af ChatGPT-4o, Gemini og Claude 3.7 i endodontisk diagnostik: Et prospektivt klinisk studie

Formålet med denne prospektive observationsstudie er at evaluere tre store sprogmodellers (ChatGPT-4o, Gemini Advanced og Claude 3.7) evne til at støtte diagnosticering og behandlingsbeslutninger hos voksne patienter med almindelige endodontiske tilstande.

De vigtigste spørgsmål, som studiet sigter mod at besvare, er:

Kan LLM'er præcist bestemme den endodontiske diagnose, når de får struktureret klinisk information og periapikale røntgenbilleder?

Kan LLM'er foreslå passende behandlingsplaner, der er sammenlignelige med beslutninger truffet af endodontiske specialister?

For at besvare disse spørgsmål vil forskerne sammenligne de tre AI-modellers diagnostiske og behandlingsmæssige nøjagtighed ved at bruge en konsensusdiagnose fra endodontiske specialister som referencestandard.

Deltagerne vil:

Modtage rutinemæssig endodontisk undersøgelse og periapikale røntgenbilleder som en del af standard klinisk behandling.

Få deres anonymiserede kliniske historier og røntgenbilleder indtastet i de tre AI-modeller.

Ikke interagere direkte med noget AI-system; alle evalueringer vil blive udført af forskningsteamet.

Dette studie har til formål at forstå, hvordan store sprogmodeller klarer sig under reelle kliniske forhold, og om disse systemer i fremtiden kan spille en støtterolle inden for endodontisk diagnostik.

Studieoversigt

Detaljeret beskrivelse

Denne prospektive observationsstudie har til formål at evaluere den realtidsdiagnostiske og behandlingsbeslutningspraksis for tre store sprogmodeller - ChatGPT-4o, Gemini Advanced og Claude 3.7 - i en endodontisk klinisk sammenhæng. I alt 120 patienter, der kom til endodontiklinikken, blev undersøgt, og detaljerede medicinske/tandlægelige historier, kliniske fund og periapikale røntgenbilleder blev indsamlet. Hver anonymiseret sag blev derefter præsenteret for de tre LLM'er ved hjælp af en standardiseret prompt, der bad om diagnosen og den passende behandlingsplan.

Alle modeller blev brugt i deres standard multimodale konfigurationer uden at aktivere websøgefunktioner, plugins eller ekstern datahentning. Hvert spørgsmål blev kun indsendt én gang i isolerede chat-sessioner for at forhindre hukommelsesoverførsel. Svarene blev gemt ordret og sammenlignet med referencediagnoserne og behandlingsplanerne etableret af et panel af endodontiske specialister.

Dette studie var designet til at efterligne virkelige kliniske forhold så tæt som muligt, hvilket giver en realistisk vurdering af, hvordan disse systemer kan præstere, når de bruges af klinikere i hverdagen. At forstå deres evner og begrænsninger i autentiske kliniske scenarier er afgørende, da LLM'er forventes at spille en stadig vigtigere rolle i fremtidig tandpleje, især i beslutningsstøtte, triage og patientundervisning. Ved at identificere, hvor disse modeller klarer sig godt, og hvor de ikke lever op til forventningerne, sigter denne forskning mod at bidrage til sikker og effektiv klinisk integration, efterhånden som LLM-teknologier fortsat udvikler sig.

Undersøgelsestype

Observationel

Tilmelding (Faktiske)

120

Kontakter og lokationer

Dette afsnit indeholder kontaktoplysninger for dem, der udfører undersøgelsen, og oplysninger om, hvor denne undersøgelse udføres.

Studiesteder

    • Istanbul
      • Maltepe, Istanbul, Tyrkiet (Türkiye), 34856
        • Faculty of Dentistry, Marmara University

Deltagelseskriterier

Forskere leder efter personer, der passer til en bestemt beskrivelse, kaldet berettigelseskriterier. Nogle eksempler på disse kriterier er en persons generelle helbredstilstand eller tidligere behandlinger.

Berettigelseskriterier

Aldre berettiget til at studere

  • Voksen
  • Ældre voksen

Tager imod sunde frivillige

Ingen

Prøveudtagningsmetode

Ikke-sandsynlighedsprøve

Studiebefolkning

Undersøgelsespopulationen bestod af voksne patienter, der deltog i eller blev henvist til endodontiklinikken på Marmara Universitet. Alle deltagere præsenterede sig med almindelige endodontiske tilstande såsom pulpitis, nekrose, primær eller sekundær apikal periodontitis eller behov for genbehandling. Efter at have indhentet samtykke gennemgik hver patient en struktureret papirbaseret medicinsk og tandlægelig anamnesevurdering samt periapikal radiografisk undersøgelse. I alt blev 120 klinisk verificerede endodontiske tilfælde inkluderet.

Beskrivelse

Inklusionskriterier:

  • Voksne patienter (≥18 år gamle), der præsenterer sig på eller henvises til Endodontiklinikken.

Patienter med en klinisk verificeret endodontisk tilstand, der kræver diagnose og behandlingsplanlægning.

Patienter, der har givet samtykke til at deltage og har afgivet informeret samtykke.

Patienter, for hvem en komplet papirbaseret medicinsk/tandlægehistorik og periapikal røntgenbillede blev indhentet under det kliniske besøg.

Eksklusionskriterier:

  • Eksklusionskriterier

Patienter, der afviste deltagelse eller ikke afgav informeret samtykke.

Pædiatriske patienter (<18 år gamle) henvist til Pædodontiklinikken.

Patienter, der deltager på klinikken med ikke-endodontiske klager (f.eks. alveolitis efter ekstraktion, problemer med visdomstandsextraktion).

Tilfælde med ufuldstændig klinisk information eller manglende røntgenbilleder.

Patienter, der ikke er i stand til at gennemgå standard endodontiske undersøgelsesprocedurer.

Studieplan

Dette afsnit indeholder detaljer om studieplanen, herunder hvordan undersøgelsen er designet, og hvad undersøgelsen måler.

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

Kohorter og interventioner

Gruppe / kohorte
Intervention / Behandling
Kohorte af endodontiske patienter
Denne kohorte omfatter 120 på hinanden følgende patienter, der præsenterede sig på endodontiklinikken med klinisk verificerede endodontiske tilstande. Klinisk historik og periapikale røntgenbilleder blev indsamlet, og diagnostiske/behandlingsanbefalinger genereret af AI-modeller blev sammenlignet med ekspertkonsensus.
Deltagernes anonymiserede kliniske oplysninger, inklusive struktureret patienthistorie og periapikale røntgenbilleder, blev brugt som input til tre store sprogmodeller (ChatGPT-4o, Gemini Advanced, Claude 3.7). Modellerne blev bedt om at fastslå den endodontiske diagnose og foreslå en passende behandlingsplan. Ingen behandling, enhed eller medicin blev administreret til deltagerne. Interventionen udgøres udelukkende af AI-baseret fortolkning af allerede eksisterende kliniske data.

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Klinikers diagnosepræcision baseret på papirbaseret anamnese og periapikal røntgenbillede
Tidsramme: 7. juli-5. august
Vurdering af den diagnostiske beslutning truffet af endodontiske klinikere efter gennemgang af en papirbaseret patienthistorisk formular og en standardiseret periapikal røntgenbillede. Nøjagtigheden bestemmes ved at sammenligne klinikerens diagnose med konsensusdiagnosen etableret af tre uafhængige endodontiske specialister. Data vil blive indsamlet for alle 120 patienter på tidspunktet for den indledende kliniske evaluering.
7. juli-5. august

Sekundære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
LLM-genereret diagnose- og behandlingsplanlægningsydelse
Tidsramme: august-september
Evaluering af diagnostiske og behandlingsanbefalinger genereret af store sprogmodeller (LLMs)-ChatGPT-4o, Gemini Advanced og Claude 3.7-efter at have modtaget den samme papirbaserede patienthistorie og periapikale røntgenbillede, som blev givet til klinikere. LLM-svar vil blive sammenlignet med den guldstandard-specialistkonsensus for både diagnose og behandlingsbeslutninger.
august-september

Samarbejdspartnere og efterforskere

Det er her, du vil finde personer og organisationer, der er involveret i denne undersøgelse.

Efterforskere

  • Studieleder: ayşe karadayı, asst. prof., Marmara University Faculty of Dentistry

Publikationer og nyttige links

Den person, der er ansvarlig for at indtaste oplysninger om undersøgelsen, leverer frivilligt disse publikationer. Disse kan handle om alt relateret til undersøgelsen.

Datoer for undersøgelser

Disse datoer sporer fremskridtene for indsendelser af undersøgelsesrekord og resumeresultater til ClinicalTrials.gov. Studieregistreringer og rapporterede resultater gennemgås af National Library of Medicine (NLM) for at sikre, at de opfylder specifikke kvalitetskontrolstandarder, før de offentliggøres på den offentlige hjemmeside.

Studer store datoer

Studiestart (Faktiske)

7. juli 2025

Primær færdiggørelse (Faktiske)

5. august 2025

Studieafslutning (Faktiske)

3. oktober 2025

Datoer for studieregistrering

Først indsendt

24. november 2025

Først indsendt, der opfyldte QC-kriterier

8. december 2025

Først opslået (Faktiske)

15. december 2025

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

15. december 2025

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

8. december 2025

Sidst verificeret

1. december 2025

Mere information

Begreber relateret til denne undersøgelse

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

UBESLUTET

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Ingen

Studerer et amerikansk FDA-reguleret enhedsprodukt

Ingen

Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .

Kliniske forsøg med AI-baseret diagnostisk vurdering

Abonner