Denne side blev automatisk oversat, og nøjagtigheden af ​​oversættelsen er ikke garanteret. Der henvises til engelsk version for en kildetekst.

ChatGPT i diagnostik og behandling af komplekse polyneuropatier: Sammenlignende analyse med neurologer ved brug af virkelige tilfælde (REASON)

20. marts 2026 opdateret af: Istituto Clinico Humanitas

ChatGPTs rolle i den differentielle diagnose af polyneuropatier og sammenligning af dens præstation med perifere neuropati-specialister og ikke-specialister

BAGGGRUND OG FORMÅL Polyneuropatier er sygdomme, der påvirker de perifere nerver og forekommer hos cirka 1 % af den generelle befolkning, hvilket stiger til op til 13 % blandt ældre voksne. På trods af deres udbredelse er præcis diagnose ofte udfordrende og kræver specialiserede ekspertise, der ikke er ensartet tilgængelig. Patienter, der vurderes i primær sundhedspleje eller ikke-specialiserede indstillinger, oplever hyppigt diagnostiske forsinkelser eller fejldiagnoser, hvilket understreger behovet for innovative værktøjer til at støtte klinikere på kritiske punkter i den diagnostiske proces.

Kunstig intelligens (AI) store sprogmodeller (LLM'er), såsom ChatGPT, udforskes i stigende grad som potentielle hjælpemidler i klinisk diagnose. Disse værktøjer kan behandle kompleks klinisk information og generere diagnostiske forslag til lav pris og med bred tilgængelighed. Deres præstation i specialiserede neurologiske tilstande, især komplekse polyneuropatier, er dog endnu ikke blevet strengt evalueret i virkelige omgivelser.

STUDIE MÅL Dette studie har til formål at evaluere den diagnostiske præstation af ChatGPT-4o på virkelige polyneuropatitilfælde og sammenligne den med specialister i perifer nervesygdom og ikke-specialiserede neurologer. Et sekundært mål er at vurdere, om eksponering for ChatGPT-4o's output påvirker og potentielt forbedrer neurologers diagnostiske nøjagtighed.

STUDIEDESIGN Dette vil være en komparativ diagnostisk nøjagtighedsundersøgelse udført på to tertiære henvisningscentre for perifere neuropatier i Milano, Italien. Hundrede patienter med bekræftede polyneuropatidiagnoser vil blive tilfældigt udvalgt fra på hinanden følgende ambulante patienter. Hvert tilfælde vil blive opsummeret i et standardiseret format, der inkluderer demografi, symptomhistorie, neurologiske undersøgelsesfund, resultater fra nervekonduktionsundersøgelser og screeningslaboratoriedata. Kun tilfælde med en diagnose bekræftet efter mindst 12 måneders klinisk opfølgning vil blive inkluderet.

ChatGPT-4o vil blive præsenteret for hvert tilfælde ved hjælp af en struktureret prompt og vil blive bedt om at give: (1) en ledende diagnose, (2) to alternative differentialdiagnoser og (3) en enkelt anbefalet bekræftende diagnostisk test. Modellen vil blive kørt i to uafhængige forsøg for at vurdere svarkonsistens.

De samme 100 tilfælde vil også blive gennemgået af neurologer fra flere internationale centre. Deltagere vil blive klassificeret som enten specialister i perifer nervesygdom, neurologer, der rutinemæssigt praktiserer i tertiære polyneuropati-centre, eller ikke-specialister, herunder generelle neurologer eller dem, der er under-specialiserede inden for andre områder. Neurologer vil først give deres egne diagnostiske vurderinger uafhængigt, og vil efterfølgende blive vist ChatGPT-4o's output med mulighed for at revidere deres svar.

FORVENTET BETYDNING Dette studie vil give bevis for, om AI-baserede LLM'er kan tjene som pålidelige diagnostiske hjælpemidler i komplekse polyneuropatitilfælde.

Studieoversigt

Status

Afsluttet

Betingelser

Intervention / Behandling

Detaljeret beskrivelse

Baggrund og Rationale Polyneuropatier repræsenterer en heterogen gruppe af lidelser, der påvirker det perifere nervesystem og udgør en af de mest almindelige neurologiske tilstande, man støder på i klinisk praksis.
Deres prævalens anslås til cirka 1 % i den generelle befolkning og stiger betydeligt med alderen, når næsten 4 % blandt middelaldrende individer og op til 13 % blandt ældre.
Perifere neuropatier udgør derfor en stor bidragsyder til neurologisk morbiditet og sundhedsudnyttelse på verdensplan.

Etablering af den etiologiske diagnose af polyneuropati forbliver klinisk udfordrende.
På trods af fremskridt inden for laboratorieundersøgelser og neurofysiologiske teknikker fortsætter den diagnostiske proces med at stole tungt på omhyggelig klinisk evaluering, herunder detaljeret patienthistorie og neurologisk undersøgelse, efterfulgt af målrettet brug af elektrofysiologiske og laboratorieundersøgelser.
I mange tilfælde kræver præcis diagnose specialiseret ekspertise inden for neuromuskulære lidelser.

Adgangen til sådan ekspertise er ujævnt fordelt på tværs af sundhedssystemer.
En betydelig andel af patienter med perifere neuropatier vurderes oprindeligt af ikke-specialistlæger, herunder almindelige neurologer eller klinikere i primær- eller sekundærpleje.
Diagnostiske forsinkelser og fejlklassificering af neuropati-subtyper er derfor relativt almindelige, især for sjældne eller atypiske ætiologier.
Disse udfordringer fremhæver behovet for værktøjer, der er i stand til at støtte klinikere under den diagnostiske proces.

Seneste fremskridt inden for kunstig intelligens (AI), især udviklingen af store sprogmodeller (LLM'er), har skabt stigende interesse for deres potentielle anvendelser i klinisk medicin.
ChatGPT, udviklet af OpenAI og baseret på Generative Pre-trained Transformer-arkitekturen, er et samtale-AI-system, der er i stand til at generere kontekstbevidst medicinsk ræsonnement og diagnostiske forslag.
Fremvoksende undersøgelser antyder, at LLM'er kan opnå diagnostisk præstation, der kan sammenlignes med medicinske praktikanter eller læger i visse kliniske ræsonnementsoppgaver.

Dog er streng evaluering af LLM-præstation i komplekse neurologiske tilstande stadig begrænset.
Især findes der ringe bevis for deres præstation i diagnostisk udfordrende polyneuropatitilfælde, der typisk påtræffes i tertiære henvisningscentre.
Evaluering af sådanne værktøjers evner og begrænsninger i denne sammenhæng er afgørende, før man overvejer deres potentielle rolle som kliniske beslutningsstøttesystemer.

Denne undersøgelse har til formål systematisk at evaluere den diagnostiske præstation af ChatGPT-4o, når den anvendes på virkelige polyneuropatitilfælde, og sammenligne dens præstation med specialister og ikke-specialistneurologer.

Studiemål Den primære mål for denne undersøgelse er at evaluere den diagnostiske nøjagtighed af ChatGPT-4o i at identificere den førende etiologiske diagnose i komplekse polyneuropatitilfælde.

Specifikt har undersøgelsen til formål at sammenligne den diagnostiske præstation af ChatGPT-4o med specialister i perifer nervesygdom og ikke-specialistneurologer.

Sekundære mål inkluderer vurdering af ChatGPT-4os evne til at generere passende differentialdiagnoser og anbefale passende bekræftende diagnostiske tests.
Undersøgelsen vil også evaluere, om eksponering for AI-genererede diagnostiske forslag påvirker neurologers diagnostiske beslutninger.
Derudover vil undersøgelsen vurdere konsistensen af ChatGPT-4o-svar på tværs af gentagne uafhængige evalueringer og karakterisere de fejltyper, der produceres af modellen, når forkerte diagnoser genereres.

Studiedesign Dette er en komparativ diagnostisk nøjagtighedsundersøgelse designet til at evaluere præstationen af en kunstig intelligens-baseret stor sprogmodel i forhold til menneskelige neurologer.

Undersøgelsen vil blive gennemført på tværs af to tertiære henvisningscentre for perifere neuropatier beliggende i Milano, Italien: Humanitas Research Hospital (IRCCS) og Fondazione IRCCS Istituto Neurologico Carlo Besta.
Disse institutioner giver specialiseret pleje til patienter med et bredt udvalg af polyneuropatier, herunder inflammatoriske, arvelige, metaboliske, toksiske og paraneoplastiske ætiologier.

Studieprotokollen er blevet godkendt af etisk komité ved Humanitas Research Hospital og vil blive gennemført i overensstemmelse med principperne i Helsinkideklarationen.

Studiepopulation og tilfældsvalg Kliniske tilfælde vil blive retrospektivt identificeret fra patienter evalueret i polyneuropatiambulatorierne ved de deltagende institutioner.
Berettigede tilfælde vil inkludere patienter med en bekræftet diagnose af polyneuropati, for hvem en stabil etiologisk diagnose er blevet etableret efter mindst 12 måneders klinisk opfølgning.

Klinisk information vil blive uddraget fra medicinske journaler og brugt til at forberede standardiserede tilfældessammendrag.
Data inkluderet i sammendragene vil afspejle den information, der typisk er tilgængelig under tidlig diagnostisk evaluering, herunder patientdemografi, klinisk historie, neurologiske undersøgelsesfund, resultater af nervekonduktionsundersøgelser og resultater af standard laboratorie screenings tests.

Fra puljen af berettigede tilfælde vil 100 tilfælde blive tilfældigt udvalgt ved hjælp af en computer-genereret udvælgelsesmetode.
Alle tilfælde vil blive anonymiseret før analyse.

Det endelige datasæt forventes at inkludere et bredt spektrum af polyneuropatiætiologier, der afspejler henvisningsmønstrene i tertiære neuromuskulære centre, herunder inflammatoriske neuropatier, arvelige neuropatier, metaboliske neuropatier, toksiske neuropatier og andre mindre almindelige tilstande.

Tilfældsevaluering af ChatGPT-4o Det kunstige intelligenssystem evalueret i denne undersøgelse er ChatGPT-4o Enterprise, udviklet af OpenAI.

Hvert kliniske tilfældessammendrag vil blive præsenteret for modellen ved hjælp af standardiserede prompts, der instruerer modellen til at analysere det kliniske scenario og give diagnostisk ræsonnement.
For hvert tilfælde vil modellen blive bedt om at generere:

  • en førende etiologisk diagnose,
  • to mindre sandsynlige alternative diagnoser,
  • og en diagnostisk test i stand til at bekræfte den førende diagnose.
    For at minimere kontekstuel bias vil hvert tilfælde blive evalueret i en uafhængig session uden tidligere samtalehistorie.
    Hele datasættet vil blive evalueret to gange i to uafhængige kørsler for at vurdere reproducerbarheden og konsistensen af modellens svar.

Tilfældsevaluering af Neurologer Et panel af neurologer fra flere internationale centre vil deltage som menneskelige bedømmere i undersøgelsen.
Deltagere vil inkludere både specialister i perifer nervesygdom og neurologer uden specifik under-specialisering i neuromuskulære lidelser.

Neurologer vil gennemgå de samme standardiserede tilfældessammendrag ved hjælp af et webbaseret interface og vil blive bedt om at give en førende diagnose, to alternative differentialdiagnoser og en anbefalet bekræftende diagnostisk test for hvert tilfælde.

Evalueringen vil blive gennemført i to faser.
I den første fase vil neurologer uafhængigt gennemgå tilfældene og give deres diagnostiske vurderinger.
I den anden fase vil tilfældene blive præsenteret igen sammen med den diagnostiske output genereret af ChatGPT-4o, hvilket tillader neurologer at bekræfte eller ændre deres tidligere svar.
Dette design vil tillade vurdering af den potentielle indflydelse af AI-genererede forslag på lægers diagnostiske beslutninger.

Resultatvurdering Studiet primære resultat er diagnostisk nøjagtighed for den førende diagnose, defineret som andelen af tilfælde, hvor den foreslåede førende diagnose matcher den endelige bekræftede etiologiske diagnose.

Sekundære resultater inkluderer nøjagtigheden af differentialdiagnoser, egnemæssigheden af anbefalede bekræftende diagnostiske tests og ændringer i neurologers diagnostiske præstation efter gennemgang af AI-genererede output.

Alle svar vil blive evalueret mod den endelige bekræftede diagnose for hvert tilfælde.
Egnemæssigheden af differentialdiagnoser og diagnostiske testanbefalinger vil blive uafhængigt vurderet af ekspertneurologer med omfattende erfaring i polyneuropatidiagnose.

Klinisk Betydning Denne undersøgelse vil give empirisk bevis for den diagnostiske præstation af en stor sprogmodel i et komplekst neurologisk domæne.
Ved direkte at sammenligne AI-genereret diagnostisk ræsonnement med specialister og ikke-specialistneurologer har undersøgelsen til formål at klarlægge den potentielle rolle af store sprogmodeller som beslutningsstøtteværktøjer i neurologi.

Undersøgelsestype

Observationel

Tilmelding (Faktiske)

100

Kontakter og lokationer

Dette afsnit indeholder kontaktoplysninger for dem, der udfører undersøgelsen, og oplysninger om, hvor denne undersøgelse udføres.

Studiesteder

    • MI
      • Milan, MI, Italien, 20089
        • HUMANITAS Research Hospital

Deltagelseskriterier

Forskere leder efter personer, der passer til en bestemt beskrivelse, kaldet berettigelseskriterier. Nogle eksempler på disse kriterier er en persons generelle helbredstilstand eller tidligere behandlinger.

Berettigelseskriterier

Aldre berettiget til at studere

  • Barn
  • Voksen
  • Ældre voksen

Tager imod sunde frivillige

Ingen

Prøveudtagningsmetode

Ikke-sandsynlighedsprøve

Studiebefolkning

Tilfælde vil blive identificeret fra patienter med en bekræftet diagnose af polyneuropati, som konsekutivt deltager i polyneuropatiambulatorierne ved de to deltagende institutioner. Demografiske, kliniske og diagnostiske data vil blive uddraget fra patientjournaler på to tidspunkter: den indledende neurologiske konsultation og det første opfølgende besøg efter afslutning af standard screeningsundersøgelser, herunder laboratorietests og nervekonduktionsundersøgelser.

Beskrivelse

Inklusionskriterier

  • Be kræftet diagnose af polyneuropati af enhver ætiologi
  • Endelig ætiologisk diagnose bekræftet efter mindst 12 måneders klinisk opfølgning
  • Tilgængelighed af tilstrækkelig klinisk, elektrofysiologisk og laboratorieinformation i journalen til at muliggøre udarbejdelse af en standardiseret casesammendrag

Eksklusionskriterier

- Fravær af en bekræftet ætiologisk diagnose (idiopatisk neuropati)

Studieplan

Dette afsnit indeholder detaljer om studieplanen, herunder hvordan undersøgelsen er designet, og hvad undersøgelsen måler.

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

Kohorter og interventioner

Gruppe / kohorte
Intervention / Behandling
Polyneuropati patienter
Patienter med en bekræftet etiologisk diagnose af polyneuropati evalueret på tertiære neuromuskulære henvisningscentre. Kliniske data fra disse patienter vil blive brugt til at generere standardiserede anonymiserede casessammenfatninger, der vil blive evalueret af neurologer og af en kunstig intelligens-baseret stor sprogmodel (ChatGPT-4o) for diagnostisk nøjagtighed.
ChatGPT-4o Enterprise (OpenAI) evalueres som en kunstig intelligens-baseret stor sprogmodel til klinisk diagnostisk ræsonnering. Standardiserede anonymiserede kliniske casesammenfattninger vil blive præsenteret for modellen, som vil generere en førende diagnose, to alternative differentialdiagnoser og én anbefalet bekræftende diagnostisk test for hver case.
Sagsoversigter vil

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Diagnostisk nøjagtighed af førende diagnose
Tidsramme: gennem studiefærdiggørelsen, i gennemsnit 6 måneder
Andelen af tilfælde, hvor den førende diagnose foreslået af ChatGPT-4o, specialiserede neurologer eller ikke-specialiserede neurologer matcher patientens endelige bekræftede etiologiske diagnose.
gennem studiefærdiggørelsen, i gennemsnit 6 måneder

Sekundære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Nøjagtighed af differentialdiagnoser
Tidsramme: gennem studiet, i gennemsnit 6 måneder
Andel af tilfælde, hvor den korrekte etiologiske diagnose er inkluderet blandt de tre foreslåede diagnoser (én ledende diagnose og to alternative differentialdiagnoser).
gennem studiet, i gennemsnit 6 måneder
Ændring i Neurologers Diagnostiske Nøjagtighed Efter AI-gennemgang
Tidsramme: gennem hele studiet, i gennemsnit 6 måneder
Ændring i neurologens diagnostiske nøjagtighed før og efter gennemgang af ChatGPT-4o-outputs.
gennem hele studiet, i gennemsnit 6 måneder
Konsistensen af ChatGPT-4o-svar på tværs af uafhængige forsøg
Tidsramme: gennem studieafslutningen, i gennemsnit 6 måneder
Overensstemmelse mellem to uafhængige kørsler af ChatGPT-4o ved evaluering af de samme kliniske tilfælde.
gennem studieafslutningen, i gennemsnit 6 måneder

Samarbejdspartnere og efterforskere

Det er her, du vil finde personer og organisationer, der er involveret i denne undersøgelse.

Efterforskere

  • Ledende efterforsker: Pietro Emiliano Doneddu, MD, Neurologist, Humanitas Research Hospital IRCCS, Rozzano-Milan

Publikationer og nyttige links

Den person, der er ansvarlig for at indtaste oplysninger om undersøgelsen, leverer frivilligt disse publikationer. Disse kan handle om alt relateret til undersøgelsen.

Datoer for undersøgelser

Disse datoer sporer fremskridtene for indsendelser af undersøgelsesrekord og resumeresultater til ClinicalTrials.gov. Studieregistreringer og rapporterede resultater gennemgås af National Library of Medicine (NLM) for at sikre, at de opfylder specifikke kvalitetskontrolstandarder, før de offentliggøres på den offentlige hjemmeside.

Studer store datoer

Studiestart (Faktiske)

12. juni 2023

Primær færdiggørelse (Faktiske)

15. januar 2025

Studieafslutning (Faktiske)

1. marts 2025

Datoer for studieregistrering

Først indsendt

15. marts 2026

Først indsendt, der opfyldte QC-kriterier

20. marts 2026

Først opslået (Faktiske)

25. marts 2026

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

25. marts 2026

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

20. marts 2026

Sidst verificeret

1. marts 2026

Mere information

Begreber relateret til denne undersøgelse

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

JA

IPD-planbeskrivelse

Den fulde datasæt af Chat-GPT4o-output genereret og analyseret under studiet vil blive gjort tilgængelig ved offentliggørelsen. Datasættene af neurologers output genereret og analyseret under studiet vil blive gjort tilgængelig fra den tilsvarende forfatter på rimelig akademisk anmodning.

IPD-delingstidsramme

Fra marts 2026 og fremefter

IPD-delingsadgangskriterier

Rimelig akademisk anmodning

IPD-deling Understøttende informationstype

  • STUDY_PROTOCOL
  • SAP
  • ICF
  • ANALYTIC_CODE
  • CSR

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Ingen

Studerer et amerikansk FDA-reguleret enhedsprodukt

Ingen

Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .

Kliniske forsøg med ChatGPT-4o

Abonner