- ICH GCP
- Registr klinických studií v USA
- Klinická studie NCT07493681
ChatGPT v diagnostice a léčbě komplexních polyneuropatií: Srovnávací analýza s neurology využívající reálné případy (REASON)
Role ChatGPT v diferenciální diagnostice polyneuropatií a srovnání jeho výkonu s výkonem specialistů na periferní neuropatie a nespecialistů
POZADÍ A CÍL Polyneuropatie jsou onemocnění postihující periferní nervy, která se vyskytují přibližně u 1 % obecné populace, přičemž u starších dospělých toto číslo stoupá až na 13 %. Navzdory jejich rozšíření je přesná diagnóza často náročná a vyžaduje specializované odborné znalosti, které nejsou všeobecně dostupné. Pacienti vyšetřovaní v primární péči nebo v nespecializovaných zařízeních často zažívají diagnostická zpoždění nebo chybné diagnózy, což zdůrazňuje potřebu inovativních nástrojů na podporu kliniků v kritických bodech diagnostického procesu.
Umělá inteligence (AI) a velké jazykové modely (LLM), jako je ChatGPT, jsou stále více zkoumány jako potenciální pomůcky v klinické diagnostice. Tyto nástroje dokážou zpracovat komplexní klinické informace a generovat diagnostické návrhy s nízkými náklady a širokou dostupností. Jejich výkonnost u specializovaných neurologických stavů, zejména komplexních polyneuropatií, však dosud nebyla důkladně vyhodnocena v reálných podmínkách.
CÍLE STUDIE Tato studie si klade za cíl vyhodnotit diagnostickou výkonnost ChatGPT-4o na reálných případech polyneuropatie a porovnat ji s výkonností specialistů na onemocnění periferních nervů a nespecializovaných neurologů. Vedlejším cílem je posoudit, zda vystavení výstupům ChatGPT-4o ovlivňuje a potenciálně zlepšuje diagnostickou přesnost neurologů.
DESIGN STUDIE Půjde o srovnávací studii diagnostické přesnosti provedenou ve dvou terciárních referenčních centrech pro periferní neuropatie v Miláně v Itálii. Sto pacientů s potvrzenou diagnózou polyneuropatie bude náhodně vybráno z po sobě jdoucích ambulantních pacientů. Každý případ bude shrnut standardizovaným formátem zahrnujícím demografické údaje, anamnézu příznaků, nálezy neurologického vyšetření, výsledky vyšetření nervového vedení a screeningová laboratorní data. Budou zahrnuty pouze případy s diagnózou potvrzenou po nejméně 12 měsících klinického sledování.
ChatGPT-4o bude každý případ prezentován pomocí strukturovaného dotazu a bude požádán o poskytnutí: (1) hlavní diagnózy, (2) dvou alternativních diferenciálních diagnóz a (3) jediného doporučeného potvrzujícího diagnostického testu. Model bude spuštěn ve dvou nezávislých pokusech, aby byla posouzena konzistence odpovědí.
Stejných 100 případů bude také posouzeno neurology z více mezinárodních center. Účastníci budou klasifikováni buď jako specialisté na onemocnění periferních nervů, neurologové rutinně působící v terciárních centrech pro polyneuropatie, nebo jako nespecialisté, včetně obecných neurologů nebo těch, kteří se specializují na jiné obory. Neurologové nejprve nezávisle poskytnou vlastní diagnostická hodnocení a následně jim budou ukázány výstupy ChatGPT-4o s možností revidovat své odpovědi.
OČEKÁVANÝ VÝZNAM Tato studie poskytne důkazy o tom, zda mohou AI založené LLM sloužit jako spolehlivé diagnostické pomůcky u komplexních případů polyneuropatie.
Přehled studie
Detailní popis
Polyneuropatie představují heterogenní skupinu onemocnění postihujících periferní nervový systém a patří mezi nejčastější neurologické stavy, s nimiž se v klinické praxi setkáváme.
Jejich prevalence se odhaduje přibližně na 1 % v běžné populaci a s věkem výrazně stoupá, dosahuje téměř 4 % u osob středního věku a až 13 % u starších osob.
Periferní neuropatie tedy významně přispívají k neurologické morbiditě a využívání zdravotní péče na celém světě.
Stanovení etiologické diagnózy polyneuropatie zůstává klinicky náročné.
Přes pokroky v laboratorních testech a neurofyziologických technikách diagnostický proces stále z velké části závisí na pečlivém klinickém hodnocení, včetně podrobné anamnézy pacienta a neurologického vyšetření, po němž následuje cílené využití elektrofyziologických a laboratorních vyšetření.
V mnoha případech přesná diagnóza vyžaduje specializované znalosti v oblasti neuromuskulárních onemocnění.
Přístup k takovým znalostem je v systémech zdravotní péče nerovnoměrně rozložen.
Významný podíl pacientů s periferními neuropatiemi je zpočátku vyšetřován lékaři bez specializace, včetně všeobecných neurologů nebo kliniků v primární nebo sekundární péči.
Diagnostická zpoždění a chybné zařazení podtypů neuropatie jsou proto poměrně časté, zejména u vzácných nebo atypických etiologií.
Tyto výzvy zdůrazňují potřebu nástrojů, které by byly schopny podpořit kliniky během diagnostického procesu.
Nedávné pokroky v umělé inteligenci (AI), zejména vývoj velkých jazykových modelů (LLM), vzbudily rostoucí zájem o jejich potenciální využití v klinické medicíně.
ChatGPT, vyvinutý společností OpenAI a založený na architektuře Generative Pre-trained Transformer, je konverzační systém umělé inteligence schopný generovat kontextově uvědomělé lékařské uvažování a diagnostická doporučení.
Nové studie naznačují, že LLM mohou dosáhnout diagnostického výkonu srovnatelného s lékařskými stážisty nebo lékaři při určitých úlohách klinického uvažování.
Přísné hodnocení výkonu LLM u komplexních neurologických stavů však zůstává omezené.
Zejména existuje málo důkazů o jejich výkonu u diagnosticky náročných případů polyneuropatie, které jsou typicky k vidění v terciárních referenčních centrech.
Hodnocení schopností a omezení takových nástrojů v tomto prostředí je zásadní, než budeme uvažovat o jejich potenciální roli jako systémů podpory klinického rozhodování.
Tato studie si klade za cíl systematicky vyhodnotit diagnostický výkon ChatGPT-4o při aplikaci na reálné případy polyneuropatie a porovnat jeho výkon s výkonem specialistů a nespecialistických neurologů.
Studijní cíle Hlavním cílem této studie je vyhodnotit diagnostickou přesnost ChatGPT-4o při identifikaci hlavní etiologické diagnózy u komplexních případů polyneuropatie.
Konkrétně si studie klade za cíl porovnat diagnostický výkon ChatGPT-4o s výkonem specialistů na onemocnění periferních nervů a neurologů bez specializace.
Vedlejší cíle zahrnují posouzení schopnosti ChatGPT-4o generovat vhodné diferenciální diagnózy a doporučit vhodná potvrzující diagnostická vyšetření.
Studie také vyhodnotí, zda vystavení diagnostickým doporučením generovaným umělou inteligencí ovlivňuje diagnostická rozhodnutí neurologů.
Kromě toho studie posoudí konzistenci odpovědí ChatGPT-4o při opakovaných nezávislých hodnoceních a charakterizuje typy chyb, které model produkuje, když generuje nesprávné diagnózy.
Studijní design Jedná se o komparativní studii diagnostické přesnosti navrženou k vyhodnocení výkonu velkého jazykového modelu založeného na umělé inteligenci ve srovnání s lidskými neurology.
Studie bude provedena ve dvou terciárních referenčních centrech pro periferní neuropatie nacházejících se v Miláně v Itálii: Humanitas Research Hospital (IRCCS) a Fondazione IRCCS Istituto Neurologico Carlo Besta.
Tyto instituce poskytují specializovanou péči pacientům s širokou škálou polyneuropatií, včetně zánětlivých, dědičných, metabolických, toxických a paraneoplastických etiologií.
Studijní protokol byl schválen etickou komisí Humanitas Research Hospital a bude prováděn v souladu se zásadami Helsinské deklarace.
Studijní populace a výběr případů Klinické případy budou retrospektivně identifikovány z pacientů vyšetřených na ambulancích polyneuropatie zúčastněných institucí.
Způsobilé případy budou zahrnovat pacienty s potvrzenou diagnózou polyneuropatie, u kterých byla po nejméně 12 měsících klinického sledování stanovena stabilní etiologická diagnóza.
Klinické informace budou extrahovány z lékařských záznamů a použity k přípravě standardizovaných souhrnů případů.
Data zahrnutá v souhrnech budou odrážet informace typicky dostupné během raného diagnostického hodnocení, včetně demografických údajů pacienta, klinické anamnézy, nálezů neurologického vyšetření, výsledků vyšetření nervového vedení a výsledků standardních laboratorních screeningových testů.
Ze souboru způsobilých případů bude náhodně vybráno 100 případů pomocí počítačem generované metody vzorkování.
Všechny případy budou před analýzou anonymizovány.
Očekává se, že konečná datová sada bude zahrnovat široké spektrum etiologií polyneuropatie odrážejících referenční vzorce terciárních neuromuskulárních center, včetně zánětlivých neuropatií, dědičných neuropatií, metabolických neuropatií, toxických neuropatií a dalších méně častých stavů.
Hodnocení případů pomocí ChatGPT-4o Umělý inteligentní systém hodnocený v této studii je ChatGPT-4o Enterprise, vyvinutý společností OpenAI.
Každý souhrn klinického případu bude modelu předložen pomocí standardizovaných výzev, které modelu nařídí analyzovat klinický scénář a poskytnout diagnostické uvažování.
U každého případu bude model požádán, aby vygeneroval:
- jednu hlavní etiologickou diagnózu,
- dva méně pravděpodobné alternativní diagnózy,
- a jedno diagnostické vyšetření schopné potvrdit hlavní diagnózu.
Pro minimalizaci kontextové zaujatosti bude každý případ hodnocen v nezávislé relaci bez předchozí historie konverzace.
Celá datová sada bude hodnocena dvakrát ve dvou nezávislých bězích za účelem posouzení reprodukovatelnosti a konzistence odpovědí modelu.
Hodnocení případů neurology Panel neurologů z několika mezinárodních center se studie zúčastní jako lidské hodnotitelé.
Účastníci budou zahrnovat jak specialisty na onemocnění periferních nervů, tak neurology bez specifické subspecializace v neuromuskulárních poruchách.
Neurologové budou přezkoumávat stejné standardizované souhrny případů pomocí webového rozhraní a bude po nich požadováno, aby u každého případu poskytli hlavní diagnózu, dvě alternativní diferenciální diagnózy a doporučené potvrzující diagnostické vyšetření.
Hodnocení bude provedeno ve dvou fázích.
V první fázi budou neurologové nezávisle přezkoumávat případy a poskytovat svá diagnostická hodnocení.
Ve druhé fázi budou případy znovu prezentovány spolu s diagnostickým výstupem generovaným ChatGPT-4o, což neurologům umožní potvrdit nebo upravit své předchozí odpovědi.
Tento design umožní posoudit potenciální vliv doporučení generovaných umělou inteligencí na diagnostická rozhodnutí lékařů.
Hodnocení výsledků Primárním výsledkem studie je diagnostická přesnost pro hlavní diagnózu, definovaná jako podíl případů, ve kterých navržená hlavní diagnóza odpovídá konečné potvrzené etiologické diagnóze.
Sekundární výsledky zahrnují přesnost diferenciálních diagnóz, vhodnost doporučených potvrzujících diagnostických vyšetření a změny v diagnostickém výkonu neurologů po přezkoumání výstupů generovaných umělou inteligencí.
Všechny odpovědi budou hodnoceny ve vztahu ke konečné potvrzené diagnóze pro každý případ.
Vhodnost diferenciálních diagnóz a doporučení diagnostických vyšetření bude nezávisle posouzena odbornými neurology s rozsáhlými zkušenostmi v diagnostice polyneuropatie.
Klinický význam Tato studie poskytne empirické důkazy o diagnostickém výkonu velkého jazykového modelu v komplexní neurologické oblasti.
Přímým porovnáním diagnostického uvažování generovaného umělou inteligencí s uvažováním specialistů a nespecialistických neurologů si studie klade za cíl objasnit potenciální roli velkých jazykových modelů jako nástrojů podpory rozhodování v neurologii.
Typ studie
Zápis (Aktuální)
Kontakty a umístění
Studijní místa
-
-
MI
-
Milan, MI, Itálie, 20089
- Humanitas Research Hospital
-
-
Kritéria účasti
Kritéria způsobilosti
Věk způsobilý ke studiu
- Dítě
- Dospělý
- Starší dospělý
Přijímá zdravé dobrovolníky
Metoda odběru vzorků
Studijní populace
Popis
Inkluzní kritéria
- Potvrzená diagnóza polyneuropatie jakékoli etiologie
- Konečná etiologická diagnóza potvrzena po minimálně 12 měsících klinického sledování
- Dostupnost dostatečných klinických, elektrofyziologických a laboratorních informací v lékařské dokumentaci umožňujících přípravu standardizovaného shrnutí případu
Exkluzní kritéria
- Absence potvrzené etiologické diagnózy (idiopatická neuropatie)
Studijní plán
Jak je studie koncipována?
Detaily designu
Kohorty a intervence
Skupina / kohorta |
Intervence / Léčba |
|---|---|
|
Pacienti s polyneuropatií
Pacienti s potvrzenou etiologickou diagnózou polyneuropatie vyšetření na terciárních neuromuskulárních referenčních centrech.
Klinická data těchto pacientů budou použita k vytvoření standardizovaných anonymizovaných kazuistik, které budou vyhodnoceny neurology a umělou inteligencí založenou na velkém jazykovém modelu (ChatGPT-4o) pro diagnostickou přesnost.
|
ChatGPT-4o Enterprise (OpenAI) je hodnocen jako umělá inteligence založený velký jazykový model pro klinické diagnostické uvažování.
Standardizované anonymizované souhrny klinických případů budou předloženy modelu, který pro každý případ vygeneruje hlavní diagnózu, dvě alternativní diferenciální diagnózy a jeden doporučený potvrzovací diagnostický test.
Souhrny případů budou
|
Co je měření studie?
Primární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
|---|---|---|
|
Diagnostická přesnost hlavní diagnózy
Časové okno: po dobu trvání studie, v průměru 6 měsíců
|
Podíl případů, kdy vedoucí diagnóza navržená ChatGPT-4o, specialisty neurology nebo nespecialisty neurology odpovídá pacientově konečné potvrzené etiologické diagnóze.
|
po dobu trvání studie, v průměru 6 měsíců
|
Sekundární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
|---|---|---|
|
Přesnost diferenciálních diagnóz
Časové okno: po dobu trvání studie, v průměru 6 měsíců
|
Podíl případů, ve kterých je správná etiologická diagnóza zahrnuta mezi tři navržené diagnózy (jedna hlavní diagnóza a dvě alternativní diferenciální diagnózy).
|
po dobu trvání studie, v průměru 6 měsíců
|
|
Změna v diagnostické přesnosti neurologa po přezkoumání pomocí AI
Časové okno: po dobu trvání studie, v průměru 6 měsíců
|
Změna v diagnostické přesnosti neurologa před a po přezkoumání výstupů ChatGPT-4o.
|
po dobu trvání studie, v průměru 6 měsíců
|
|
Konzistence odpovědí ChatGPT-4o napříč nezávislými studiemi
Časové okno: až do ukončení studie, v průměru 6 měsíců
|
Dohoda mezi dvěma nezávislými běhy ChatGPT-4o při hodnocení stejných klinických případů.
|
až do ukončení studie, v průměru 6 měsíců
|
Spolupracovníci a vyšetřovatelé
Sponzor
Spolupracovníci
Vyšetřovatelé
- Vrchní vyšetřovatel: Pietro Emiliano Doneddu, MD, Neurologist, Humanitas Research Hospital IRCCS, Rozzano-Milan
Publikace a užitečné odkazy
Obecné publikace
- Fonseca A, Ferreira A, Ribeiro L, Moreira S, Duque C. Embracing the future-is artificial intelligence already better? A comparative study of artificial intelligence performance in diagnostic accuracy and decision-making. Eur J Neurol. 2024 Apr;31(4):e16195. doi: 10.1111/ene.16195. Epub 2024 Jan 18.
- Kanjee Z, Crowe B, Rodman A. Accuracy of a Generative Artificial Intelligence Model in a Complex Diagnostic Challenge. JAMA. 2023 Jul 3;330(1):78-80. doi: 10.1001/jama.2023.8288.
- Uwishema O, Boon P. Bridging the Gaps: Addressing Inequities in Neurological Care for Underserved Populations. Eur J Neurol. 2025 Feb;32(2):e70073. doi: 10.1111/ene.70073. No abstract available.
- Elafros MA, Kvalsund MP, Callaghan BC. The Global Burden of Polyneuropathy-In Need of an Accurate Assessment. JAMA Neurol. 2022 Jun 1;79(6):537-538. doi: 10.1001/jamaneurol.2022.0565. No abstract available.
Termíny studijních záznamů
Hlavní termíny studia
Začátek studia (Aktuální)
Primární dokončení (Aktuální)
Dokončení studie (Aktuální)
Termíny zápisu do studia
První předloženo
První předloženo, které splnilo kritéria kontroly kvality
První zveřejněno (Aktuální)
Aktualizace studijních záznamů
Poslední zveřejněná aktualizace (Aktuální)
Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality
Naposledy ověřeno
Více informací
Termíny související s touto studií
Klíčová slova
Další relevantní podmínky MeSH
Další identifikační čísla studie
- 485/24
Plán pro data jednotlivých účastníků (IPD)
Plánujete sdílet data jednotlivých účastníků (IPD)?
Popis plánu IPD
Časový rámec sdílení IPD
Kritéria přístupu pro sdílení IPD
Typ podpůrných informací pro sdílení IPD
- PROTOKOL STUDY
- MÍZA
- ICF
- ANALYTIC_CODE
- CSR
Informace o lécích a zařízeních, studijní dokumenty
Studuje lékový produkt regulovaný americkým FDA
Studuje produkt zařízení regulovaný americkým úřadem FDA
Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .
Klinické studie na ChatGPT-4o
-
Lahore University of Management SciencesKing Edward Medical UniversityDokončeno
-
Lahore University of Management SciencesDokončeno
-
Maastricht UniversityAga Khan University; University of Indonesia, Jakarta, IndonesiaDokončenoDiagnóza | Vignette fiktivních pacientůHolandsko, Indonésie, Keňa
-
Philipps University MarburgDokončenoRevmatická onemocněníNěmecko
-
North Sichuan Medical CollegePeking University; Peking University First Hospital; Monash University; Case Western... a další spolupracovníciZatím nenabírámeSrdeční choroba | Infekce | Zápal plic | Choroba | Rakovina | Respirační selháníČína
-
Chang Gung University of Science and TechnologyNational Science and Technology Council, TaiwanZatím nenabírámeSociální komunikace | CHF – městnavé srdeční selhání | 65 let starší
-
Boston Intelligent Medical Research Center, Shenzhen...Tsinghua UniversityZatím nenabírámePředoperační péče
-
Charite University, Berlin, GermanyGerman Research Foundation; Max Planck Institute for Human DevelopmentZatím nenabírámeDoporučení gynekologů pro screening rakoviny vaječníkůNěmecko
-
North Sichuan Medical CollegeAffiliated Hospital of North Sichuan Medical CollegeDokončeno
-
Hartford HospitalBoston Scientific CorporationAktivní, ne náborPříznaky dolních močových cest | Únik moči | Uterovaginální prolapsSpojené státy