- ICH GCP
- US Clinical Trials Registry
- Klinisk forsøg NCT07493681
ChatGPT i diagnostik og behandling af komplekse polyneuropatier: Sammenlignende analyse med neurologer ved brug af virkelige tilfælde (REASON)
ChatGPTs rolle i den differentielle diagnose af polyneuropatier og sammenligning af dens præstation med perifere neuropati-specialister og ikke-specialister
BAGGGRUND OG FORMÅL Polyneuropatier er sygdomme, der påvirker de perifere nerver og forekommer hos cirka 1 % af den generelle befolkning, hvilket stiger til op til 13 % blandt ældre voksne. På trods af deres udbredelse er præcis diagnose ofte udfordrende og kræver specialiserede ekspertise, der ikke er ensartet tilgængelig. Patienter, der vurderes i primær sundhedspleje eller ikke-specialiserede indstillinger, oplever hyppigt diagnostiske forsinkelser eller fejldiagnoser, hvilket understreger behovet for innovative værktøjer til at støtte klinikere på kritiske punkter i den diagnostiske proces.
Kunstig intelligens (AI) store sprogmodeller (LLM'er), såsom ChatGPT, udforskes i stigende grad som potentielle hjælpemidler i klinisk diagnose. Disse værktøjer kan behandle kompleks klinisk information og generere diagnostiske forslag til lav pris og med bred tilgængelighed. Deres præstation i specialiserede neurologiske tilstande, især komplekse polyneuropatier, er dog endnu ikke blevet strengt evalueret i virkelige omgivelser.
STUDIE MÅL Dette studie har til formål at evaluere den diagnostiske præstation af ChatGPT-4o på virkelige polyneuropatitilfælde og sammenligne den med specialister i perifer nervesygdom og ikke-specialiserede neurologer. Et sekundært mål er at vurdere, om eksponering for ChatGPT-4o's output påvirker og potentielt forbedrer neurologers diagnostiske nøjagtighed.
STUDIEDESIGN Dette vil være en komparativ diagnostisk nøjagtighedsundersøgelse udført på to tertiære henvisningscentre for perifere neuropatier i Milano, Italien. Hundrede patienter med bekræftede polyneuropatidiagnoser vil blive tilfældigt udvalgt fra på hinanden følgende ambulante patienter. Hvert tilfælde vil blive opsummeret i et standardiseret format, der inkluderer demografi, symptomhistorie, neurologiske undersøgelsesfund, resultater fra nervekonduktionsundersøgelser og screeningslaboratoriedata. Kun tilfælde med en diagnose bekræftet efter mindst 12 måneders klinisk opfølgning vil blive inkluderet.
ChatGPT-4o vil blive præsenteret for hvert tilfælde ved hjælp af en struktureret prompt og vil blive bedt om at give: (1) en ledende diagnose, (2) to alternative differentialdiagnoser og (3) en enkelt anbefalet bekræftende diagnostisk test. Modellen vil blive kørt i to uafhængige forsøg for at vurdere svarkonsistens.
De samme 100 tilfælde vil også blive gennemgået af neurologer fra flere internationale centre. Deltagere vil blive klassificeret som enten specialister i perifer nervesygdom, neurologer, der rutinemæssigt praktiserer i tertiære polyneuropati-centre, eller ikke-specialister, herunder generelle neurologer eller dem, der er under-specialiserede inden for andre områder. Neurologer vil først give deres egne diagnostiske vurderinger uafhængigt, og vil efterfølgende blive vist ChatGPT-4o's output med mulighed for at revidere deres svar.
FORVENTET BETYDNING Dette studie vil give bevis for, om AI-baserede LLM'er kan tjene som pålidelige diagnostiske hjælpemidler i komplekse polyneuropatitilfælde.
Studieoversigt
Status
Betingelser
Intervention / Behandling
Detaljeret beskrivelse
Baggrund og Rationale Polyneuropatier repræsenterer en heterogen gruppe af lidelser, der påvirker det perifere nervesystem og udgør en af de mest almindelige neurologiske tilstande, man støder på i klinisk praksis.
Deres prævalens anslås til cirka 1 % i den generelle befolkning og stiger betydeligt med alderen, når næsten 4 % blandt middelaldrende individer og op til 13 % blandt ældre.
Perifere neuropatier udgør derfor en stor bidragsyder til neurologisk morbiditet og sundhedsudnyttelse på verdensplan.
Etablering af den etiologiske diagnose af polyneuropati forbliver klinisk udfordrende.
På trods af fremskridt inden for laboratorieundersøgelser og neurofysiologiske teknikker fortsætter den diagnostiske proces med at stole tungt på omhyggelig klinisk evaluering, herunder detaljeret patienthistorie og neurologisk undersøgelse, efterfulgt af målrettet brug af elektrofysiologiske og laboratorieundersøgelser.
I mange tilfælde kræver præcis diagnose specialiseret ekspertise inden for neuromuskulære lidelser.
Adgangen til sådan ekspertise er ujævnt fordelt på tværs af sundhedssystemer.
En betydelig andel af patienter med perifere neuropatier vurderes oprindeligt af ikke-specialistlæger, herunder almindelige neurologer eller klinikere i primær- eller sekundærpleje.
Diagnostiske forsinkelser og fejlklassificering af neuropati-subtyper er derfor relativt almindelige, især for sjældne eller atypiske ætiologier.
Disse udfordringer fremhæver behovet for værktøjer, der er i stand til at støtte klinikere under den diagnostiske proces.
Seneste fremskridt inden for kunstig intelligens (AI), især udviklingen af store sprogmodeller (LLM'er), har skabt stigende interesse for deres potentielle anvendelser i klinisk medicin.
ChatGPT, udviklet af OpenAI og baseret på Generative Pre-trained Transformer-arkitekturen, er et samtale-AI-system, der er i stand til at generere kontekstbevidst medicinsk ræsonnement og diagnostiske forslag.
Fremvoksende undersøgelser antyder, at LLM'er kan opnå diagnostisk præstation, der kan sammenlignes med medicinske praktikanter eller læger i visse kliniske ræsonnementsoppgaver.
Dog er streng evaluering af LLM-præstation i komplekse neurologiske tilstande stadig begrænset.
Især findes der ringe bevis for deres præstation i diagnostisk udfordrende polyneuropatitilfælde, der typisk påtræffes i tertiære henvisningscentre.
Evaluering af sådanne værktøjers evner og begrænsninger i denne sammenhæng er afgørende, før man overvejer deres potentielle rolle som kliniske beslutningsstøttesystemer.
Denne undersøgelse har til formål systematisk at evaluere den diagnostiske præstation af ChatGPT-4o, når den anvendes på virkelige polyneuropatitilfælde, og sammenligne dens præstation med specialister og ikke-specialistneurologer.
Studiemål Den primære mål for denne undersøgelse er at evaluere den diagnostiske nøjagtighed af ChatGPT-4o i at identificere den førende etiologiske diagnose i komplekse polyneuropatitilfælde.
Specifikt har undersøgelsen til formål at sammenligne den diagnostiske præstation af ChatGPT-4o med specialister i perifer nervesygdom og ikke-specialistneurologer.
Sekundære mål inkluderer vurdering af ChatGPT-4os evne til at generere passende differentialdiagnoser og anbefale passende bekræftende diagnostiske tests.
Undersøgelsen vil også evaluere, om eksponering for AI-genererede diagnostiske forslag påvirker neurologers diagnostiske beslutninger.
Derudover vil undersøgelsen vurdere konsistensen af ChatGPT-4o-svar på tværs af gentagne uafhængige evalueringer og karakterisere de fejltyper, der produceres af modellen, når forkerte diagnoser genereres.
Studiedesign Dette er en komparativ diagnostisk nøjagtighedsundersøgelse designet til at evaluere præstationen af en kunstig intelligens-baseret stor sprogmodel i forhold til menneskelige neurologer.
Undersøgelsen vil blive gennemført på tværs af to tertiære henvisningscentre for perifere neuropatier beliggende i Milano, Italien: Humanitas Research Hospital (IRCCS) og Fondazione IRCCS Istituto Neurologico Carlo Besta.
Disse institutioner giver specialiseret pleje til patienter med et bredt udvalg af polyneuropatier, herunder inflammatoriske, arvelige, metaboliske, toksiske og paraneoplastiske ætiologier.
Studieprotokollen er blevet godkendt af etisk komité ved Humanitas Research Hospital og vil blive gennemført i overensstemmelse med principperne i Helsinkideklarationen.
Studiepopulation og tilfældsvalg Kliniske tilfælde vil blive retrospektivt identificeret fra patienter evalueret i polyneuropatiambulatorierne ved de deltagende institutioner.
Berettigede tilfælde vil inkludere patienter med en bekræftet diagnose af polyneuropati, for hvem en stabil etiologisk diagnose er blevet etableret efter mindst 12 måneders klinisk opfølgning.
Klinisk information vil blive uddraget fra medicinske journaler og brugt til at forberede standardiserede tilfældessammendrag.
Data inkluderet i sammendragene vil afspejle den information, der typisk er tilgængelig under tidlig diagnostisk evaluering, herunder patientdemografi, klinisk historie, neurologiske undersøgelsesfund, resultater af nervekonduktionsundersøgelser og resultater af standard laboratorie screenings tests.
Fra puljen af berettigede tilfælde vil 100 tilfælde blive tilfældigt udvalgt ved hjælp af en computer-genereret udvælgelsesmetode.
Alle tilfælde vil blive anonymiseret før analyse.
Det endelige datasæt forventes at inkludere et bredt spektrum af polyneuropatiætiologier, der afspejler henvisningsmønstrene i tertiære neuromuskulære centre, herunder inflammatoriske neuropatier, arvelige neuropatier, metaboliske neuropatier, toksiske neuropatier og andre mindre almindelige tilstande.
Tilfældsevaluering af ChatGPT-4o Det kunstige intelligenssystem evalueret i denne undersøgelse er ChatGPT-4o Enterprise, udviklet af OpenAI.
Hvert kliniske tilfældessammendrag vil blive præsenteret for modellen ved hjælp af standardiserede prompts, der instruerer modellen til at analysere det kliniske scenario og give diagnostisk ræsonnement.
For hvert tilfælde vil modellen blive bedt om at generere:
- en førende etiologisk diagnose,
- to mindre sandsynlige alternative diagnoser,
- og en diagnostisk test i stand til at bekræfte den førende diagnose.
For at minimere kontekstuel bias vil hvert tilfælde blive evalueret i en uafhængig session uden tidligere samtalehistorie.
Hele datasættet vil blive evalueret to gange i to uafhængige kørsler for at vurdere reproducerbarheden og konsistensen af modellens svar.
Tilfældsevaluering af Neurologer Et panel af neurologer fra flere internationale centre vil deltage som menneskelige bedømmere i undersøgelsen.
Deltagere vil inkludere både specialister i perifer nervesygdom og neurologer uden specifik under-specialisering i neuromuskulære lidelser.
Neurologer vil gennemgå de samme standardiserede tilfældessammendrag ved hjælp af et webbaseret interface og vil blive bedt om at give en førende diagnose, to alternative differentialdiagnoser og en anbefalet bekræftende diagnostisk test for hvert tilfælde.
Evalueringen vil blive gennemført i to faser.
I den første fase vil neurologer uafhængigt gennemgå tilfældene og give deres diagnostiske vurderinger.
I den anden fase vil tilfældene blive præsenteret igen sammen med den diagnostiske output genereret af ChatGPT-4o, hvilket tillader neurologer at bekræfte eller ændre deres tidligere svar.
Dette design vil tillade vurdering af den potentielle indflydelse af AI-genererede forslag på lægers diagnostiske beslutninger.
Resultatvurdering Studiet primære resultat er diagnostisk nøjagtighed for den førende diagnose, defineret som andelen af tilfælde, hvor den foreslåede førende diagnose matcher den endelige bekræftede etiologiske diagnose.
Sekundære resultater inkluderer nøjagtigheden af differentialdiagnoser, egnemæssigheden af anbefalede bekræftende diagnostiske tests og ændringer i neurologers diagnostiske præstation efter gennemgang af AI-genererede output.
Alle svar vil blive evalueret mod den endelige bekræftede diagnose for hvert tilfælde.
Egnemæssigheden af differentialdiagnoser og diagnostiske testanbefalinger vil blive uafhængigt vurderet af ekspertneurologer med omfattende erfaring i polyneuropatidiagnose.
Klinisk Betydning Denne undersøgelse vil give empirisk bevis for den diagnostiske præstation af en stor sprogmodel i et komplekst neurologisk domæne.
Ved direkte at sammenligne AI-genereret diagnostisk ræsonnement med specialister og ikke-specialistneurologer har undersøgelsen til formål at klarlægge den potentielle rolle af store sprogmodeller som beslutningsstøtteværktøjer i neurologi.
Undersøgelsestype
Tilmelding (Faktiske)
Kontakter og lokationer
Studiesteder
-
-
MI
-
Milan, MI, Italien, 20089
- HUMANITAS Research Hospital
-
-
Deltagelseskriterier
Berettigelseskriterier
Aldre berettiget til at studere
- Barn
- Voksen
- Ældre voksen
Tager imod sunde frivillige
Prøveudtagningsmetode
Studiebefolkning
Beskrivelse
Inklusionskriterier
- Be kræftet diagnose af polyneuropati af enhver ætiologi
- Endelig ætiologisk diagnose bekræftet efter mindst 12 måneders klinisk opfølgning
- Tilgængelighed af tilstrækkelig klinisk, elektrofysiologisk og laboratorieinformation i journalen til at muliggøre udarbejdelse af en standardiseret casesammendrag
Eksklusionskriterier
- Fravær af en bekræftet ætiologisk diagnose (idiopatisk neuropati)
Studieplan
Hvordan er undersøgelsen tilrettelagt?
Design detaljer
Kohorter og interventioner
Gruppe / kohorte |
Intervention / Behandling |
|---|---|
|
Polyneuropati patienter
Patienter med en bekræftet etiologisk diagnose af polyneuropati evalueret på tertiære neuromuskulære henvisningscentre.
Kliniske data fra disse patienter vil blive brugt til at generere standardiserede anonymiserede casessammenfatninger, der vil blive evalueret af neurologer og af en kunstig intelligens-baseret stor sprogmodel (ChatGPT-4o) for diagnostisk nøjagtighed.
|
ChatGPT-4o Enterprise (OpenAI) evalueres som en kunstig intelligens-baseret stor sprogmodel til klinisk diagnostisk ræsonnering.
Standardiserede anonymiserede kliniske casesammenfattninger vil blive præsenteret for modellen, som vil generere en førende diagnose, to alternative differentialdiagnoser og én anbefalet bekræftende diagnostisk test for hver case.
Sagsoversigter vil
|
Hvad måler undersøgelsen?
Primære resultatmål
Resultatmål |
Foranstaltningsbeskrivelse |
Tidsramme |
|---|---|---|
|
Diagnostisk nøjagtighed af førende diagnose
Tidsramme: gennem studiefærdiggørelsen, i gennemsnit 6 måneder
|
Andelen af tilfælde, hvor den førende diagnose foreslået af ChatGPT-4o, specialiserede neurologer eller ikke-specialiserede neurologer matcher patientens endelige bekræftede etiologiske diagnose.
|
gennem studiefærdiggørelsen, i gennemsnit 6 måneder
|
Sekundære resultatmål
Resultatmål |
Foranstaltningsbeskrivelse |
Tidsramme |
|---|---|---|
|
Nøjagtighed af differentialdiagnoser
Tidsramme: gennem studiet, i gennemsnit 6 måneder
|
Andel af tilfælde, hvor den korrekte etiologiske diagnose er inkluderet blandt de tre foreslåede diagnoser (én ledende diagnose og to alternative differentialdiagnoser).
|
gennem studiet, i gennemsnit 6 måneder
|
|
Ændring i Neurologers Diagnostiske Nøjagtighed Efter AI-gennemgang
Tidsramme: gennem hele studiet, i gennemsnit 6 måneder
|
Ændring i neurologens diagnostiske nøjagtighed før og efter gennemgang af ChatGPT-4o-outputs.
|
gennem hele studiet, i gennemsnit 6 måneder
|
|
Konsistensen af ChatGPT-4o-svar på tværs af uafhængige forsøg
Tidsramme: gennem studieafslutningen, i gennemsnit 6 måneder
|
Overensstemmelse mellem to uafhængige kørsler af ChatGPT-4o ved evaluering af de samme kliniske tilfælde.
|
gennem studieafslutningen, i gennemsnit 6 måneder
|
Samarbejdspartnere og efterforskere
Sponsor
Samarbejdspartnere
Efterforskere
- Ledende efterforsker: Pietro Emiliano Doneddu, MD, Neurologist, Humanitas Research Hospital IRCCS, Rozzano-Milan
Publikationer og nyttige links
Generelle publikationer
- Fonseca A, Ferreira A, Ribeiro L, Moreira S, Duque C. Embracing the future-is artificial intelligence already better? A comparative study of artificial intelligence performance in diagnostic accuracy and decision-making. Eur J Neurol. 2024 Apr;31(4):e16195. doi: 10.1111/ene.16195. Epub 2024 Jan 18.
- Kanjee Z, Crowe B, Rodman A. Accuracy of a Generative Artificial Intelligence Model in a Complex Diagnostic Challenge. JAMA. 2023 Jul 3;330(1):78-80. doi: 10.1001/jama.2023.8288.
- Uwishema O, Boon P. Bridging the Gaps: Addressing Inequities in Neurological Care for Underserved Populations. Eur J Neurol. 2025 Feb;32(2):e70073. doi: 10.1111/ene.70073. No abstract available.
- Elafros MA, Kvalsund MP, Callaghan BC. The Global Burden of Polyneuropathy-In Need of an Accurate Assessment. JAMA Neurol. 2022 Jun 1;79(6):537-538. doi: 10.1001/jamaneurol.2022.0565. No abstract available.
Datoer for undersøgelser
Studer store datoer
Studiestart (Faktiske)
Primær færdiggørelse (Faktiske)
Studieafslutning (Faktiske)
Datoer for studieregistrering
Først indsendt
Først indsendt, der opfyldte QC-kriterier
Først opslået (Faktiske)
Opdateringer af undersøgelsesjournaler
Sidste opdatering sendt (Faktiske)
Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier
Sidst verificeret
Mere information
Begreber relateret til denne undersøgelse
Yderligere relevante MeSH-vilkår
Andre undersøgelses-id-numre
- 485/24
Plan for individuelle deltagerdata (IPD)
Planlægger du at dele individuelle deltagerdata (IPD)?
IPD-planbeskrivelse
IPD-delingstidsramme
IPD-delingsadgangskriterier
IPD-deling Understøttende informationstype
- STUDY_PROTOCOL
- SAP
- ICF
- ANALYTIC_CODE
- CSR
Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter
Studerer et amerikansk FDA-reguleret lægemiddelprodukt
Studerer et amerikansk FDA-reguleret enhedsprodukt
Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .
Kliniske forsøg med ChatGPT-4o
-
Lahore University of Management SciencesKing Edward Medical UniversityAfsluttet
-
Lahore University of Management SciencesAfsluttet
-
Maastricht UniversityAga Khan University; University of Indonesia, Jakarta, IndonesiaAfsluttetDiagnose | Vignetter af fiktive patienterHolland, Indonesien, Kenya
-
Charite University, Berlin, GermanyGerman Research Foundation; Max Planck Institute for Human DevelopmentIkke rekrutterer endnuAnbefalinger for screening af æggestokkræft fra gynækologerTyskland
-
Philipps University MarburgAfsluttet
-
North Sichuan Medical CollegePeking University; Peking University First Hospital; Monash University; Case... og andre samarbejdspartnereIkke rekrutterer endnuHjertesygdomme | Infektioner | Lungebetændelse | Sygdom | Kræft | ÅndedrætssvigtKina
-
Chang Gung University of Science and TechnologyNational Science and Technology Council, TaiwanIkke rekrutterer endnuSocial kommunikation | CHF - Kongestiv hjertesvigt | 65 år ældre
-
Boston Intelligent Medical Research Center, Shenzhen...Tsinghua UniversityIkke rekrutterer endnuPræoperativ pleje
-
National Taiwan University HospitalTilmelding efter invitationAutisme | JobinterviewpræstationTaiwan
-
Saglik Bilimleri UniversitesiAfsluttet