Tato stránka byla automaticky přeložena a přesnost překladu není zaručena. Podívejte se prosím na anglická verze pro zdrojový text.

Obohacení uvažování pomocí zpětné vazby od AI v nefrologické studii (REFINe)

12. ledna 2026 aktualizováno: Aghiles.HAMROUN, University Hospital, Lille

Zlepšení diagnostického uvažování s využitím zpětné vazby od generativní AI v nefrologii (REFINe): Randomizované hodnocení podpory generativní AI v nefrologické diagnostice

Cílem této klinické studie je zjistit, jak může umělá inteligence (AI) pomáhat lékařům při stanovení diagnóz v nefrologii. Výzkumníci chtějí zjistit, zda nástroj AI zvaný velký jazykový model (LLM) může pomoci lékařům častěji volit správnou diagnózu a cítit se při svých odpovědích jistější.

Před zahájením studie výzkumný tým otestoval několik modelů AI a vybral jeden z nejlepších, model třídy GPT-5 nastavený na vysokou úroveň úsilí při uvažování.

Hlavní otázky, na které tato studie hledá odpověď, jsou:

  1. Stanovují lékaři správnější diagnózy, když mohou vidět návrhy AI?
  2. Mění pohled na návrhy AI to, jak jistí se lékaři cítí ohledně své diagnózy?

Výzkumníci budou porovnávat lékaře, kteří dostávají návrhy AI, s lékaři, kteří návrhy AI nedostávají, aby viděli, jak AI ovlivňuje přesnost, jistotu a rozhodování.

Účastníci dokončí až 10 online klinických případů. Pro každý případ budou:

  1. Přečíst si krátký lékařský scénář
  2. Navrhnout až tři možné diagnózy

(Pokud jsou ve skupině AI) Prozkoumat návrhy AI a rozhodnout se, zda změnit svou odpověď

Studie se také bude zabývat tím, jak dlouho účastníkům trvá odpovědět na každý případ, a jaký je výkon AI ve srovnání s lidskými odpověďmi.

Přehled studie

Detailní popis

Tato studie vyhodnocuje, zda poskytnutí klinickým lékařům diagnostických návrhů v reálném čase z modelu velkého jazykového modelu s vysokou schopností uvažování (GPT-5) zlepšuje diagnostickou přesnost, sebevědomí a efektivitu při řešení klinických vinět z nefrologie. Před výběrem modelu pro zkoušku výzkumný tým porovnal několik špičkových modelů na pilotní sadě nefrologických případů, včetně: GPT-5, GPT-5-mini, O3, GPT-4o, Llama-4 Maverick-17B, Gemini-2.5-Pro, Qwen-3 VL-235B Thinking, DeepSeek-V3.2-Exp, MedGEMMA-27B, Claude Sonnet-4.5 a Magistral-Medium-2509. GPT-5 (s vysokou schopností uvažování) prokázal nejvyšší diagnostickou výkonnost, stabilitu a interpretovatelnost a byl vybrán jako systém umělé inteligence používaný v intervenční skupině.

Účastníci zahrnují studenty medicíny, rezidenty, fellowy a praktikující lékaře. Po vytvoření účtu účastníci vyplní demografický dotazník (specializace, roky zkušeností, typ praxe, věková kategorie, obeznámenost s AI) a musí výslovně souhlasit s použitím těchto dat pro výzkumné účely před přístupem k vinětám. Nesbírají se žádné přímo identifikující informace.

Účastníci jsou randomizováni (se stratifikací podle profesního statusu) buď do skupiny s podporou AI, nebo do kontrolní skupiny. Každý účastník dostane přiděleno 10 nefrologických vinět ve francouzštině nebo angličtině a může je dokončit v několika sezeních. Jakmile je viněta odeslána, nelze se k ní vrátit ("žádné vracení"). Čas dokončení na jednu vinětu je automaticky zaznamenáván.

Kontrolní skupina

Účastníci si prohlédnou každou vinětu a poskytnou až tři diagnózy ("Top-3"), následované hodnocením sebevědomí (0-10).

Skupina s podporou AI

Účastníci nejprve zadají počáteční Top-3 diagnózu a hodnocení sebevědomí bez pomoci AI. Systém poté zobrazí diagnostické návrhy GPT-5, po kterých mohou účastníci jednou revidovat své diagnózy. Viněta je po odeslání uzamčena.

Studie sbírá:

  • počáteční a konečné diagnózy,
  • hodnocení sebevědomí před a (pokud je to možné) po návrzích AI,
  • časy dokončení,
  • demografické proměnné účastníků,
  • a vlastní diagnostické výstupy modelu AI.

Částečné dokončení je povoleno; všechny dokončené viněty přispívají k analýze.

Primární a sekundární výsledky zahrnují diagnostickou přesnost (Top-3 a Top-1), zlepšení přesnosti před vs. po AI, změny v diagnostickém sebevědomí, diagnostické chyby vyvolané AI, benchmarkování člověk versus AI, metriky efektivity času dokončení a podíl přiřazených vinět dokončených.

Primární analýza bude porovnávat diagnostickou přesnost mezi kontrolní skupinou (lékaři sami) a experimentální skupinou (lékaři asistovaní modelem AI). Přesnost je analyzována jako binární výsledek (správná vs nesprávná diagnóza). Protože každý účastník hodnotí více klinických vinět, přesnost bude modelována pomocí smíšené logistické regrese s fixním efektem pro studijní skupinu a náhodnými úrovněmi pro účastníka i vinětu. Tento přístup zohledňuje shlukování a různou obtížnost případů. Primární test hypotézy používá oboustranné α = 0,05. Velikosti efektů budou hlášeny jako poměry šancí s 95% intervaly spolehlivosti. Sekundární analýzy budou zkoumat, zda se přesnost liší podle demografických faktorů (např. úroveň zkušeností, specializace) pomocí interakčních členů.

Protože každý účastník hodnotí více vinět, tým také provedl analýzy síly založené na simulacích pomocí modelů smíšené logistické regrese s náhodnými úrovněmi pro účastníka i vinětu, za předpokladu intra-participantského ICC 0,10. Za těchto předpokladů celkový vzorek 100 účastníků (50 na skupinu) s 10 vinětami na účastníka poskytuje >99% sílu k detekci klinicky významného zlepšení diagnostické přesnosti. Zkoumatelé proto plánují zařadit přibližně 100 účastníků celkem.

Tato studie si klade za cíl kvantifikovat, zda rozšířené uvažování pomocí AI významně zlepšuje diagnostický výkon a rozhodování, když klinici hodnotí složité nefrologické případy.

Typ studie

Intervenční

Zápis (Odhadovaný)

100

Fáze

  • Nelze použít

Kontakty a umístění

Tato část poskytuje kontaktní údaje pro ty, kteří studii provádějí, a informace o tom, kde se tato studie provádí.

Studijní kontakt

Studijní místa

Kritéria účasti

Výzkumníci hledají lidi, kteří odpovídají určitému popisu, kterému se říká kritéria způsobilosti. Některé příklady těchto kritérií jsou celkový zdravotní stav osoby nebo předchozí léčba.

Kritéria způsobilosti

Věk způsobilý ke studiu

  • Dospělý
  • Starší dospělý

Přijímá zdravé dobrovolníky

Ano

Popis

Kriteria pro zařazení:

Dospělí ve věku 18 let nebo starší.

Schopnost číst a odpovídat na klinické případy v angličtině nebo francouzštině.

Přístup k počítači nebo smartphonu s připojením k internetu.

Poskytnutí informovaného souhlasu online.

Od účastníků se očekává alespoň základní lékařské vzdělání (např. studenti medicíny, lékaři v přípravě, odborní asistenti nebo praktikující lékaři), ačkoli formální ověření není vyžadováno.

Kriteria pro vyloučení:

Jednotlivci mladší 18 let.

Neschopnost dokončit online studijní postupy.

Předchozí zapojení do návrhu, vývoje nebo hodnocení systému umělé inteligence použitého v této studii.

Studijní plán

Tato část poskytuje podrobnosti o studijním plánu, včetně toho, jak je studie navržena a co studie měří.

Jak je studie koncipována?

Detaily designu

  • Primární účel: Diagnostický
  • Přidělení: Randomizované
  • Intervenční model: Paralelní přiřazení
  • Maskování: Žádné (otevřený štítek)

Zbraně a zásahy

Skupina účastníků / Arm
Intervence / Léčba
Experimentální: Skupina s návrhy AI
Účastníci v této větvi vyplní stejné klinické případové studie jako kontrolní skupina. Pro každý případ obdrží navrženou diagnózu generovanou velkým jazykovým modelem (GPT-5, konfigurace s vysokou úrovní uvažování), který byl vybrán po interním porovnání. Účastníci si mohou přečíst návrh AI před zadáním své vlastní konečné diagnostické odpovědi. Nebudou poskytnuty žádné další informace, podněty nebo vedení. Zásah spočívá pouze v zobrazení diagnostického návrhu generovaného AI během řešení případu.
Tento zásah spočívá v zobrazení AI-generovaného diagnostického návrhu během řešení klinického případu. Po přečtení každé viněty účastníci uvidí nejlepší diagnostický návrh vytvořený velkým jazykovým modelem (GPT-5, konfigurace s vysokým uvažováním), vybraný po interním benchmarkingu. Návrh AI se zobrazí jednou na vinětu a nelze jej znovu vyžádat ani upravit. Účastníci mohou po zhlédnutí návrhu revidovat svou diagnostickou odpověď, ale nemohou se k vinětě později vrátit. Neposkytují se žádné další pokyny, koučování ani interaktivní funkce.
Žádný zásah: Skupina bez návrhů AI
Účastníci v této větvi studie budou samostatně plnit klinické kasuistické vinyety bez jakýchkoliv AI-generovaných diagnostických návrhů. Budou číst každou vinyetu a poskytnou vlastní diagnostickou odpověď pouze na základě prezentovaných informací. Nebude poskytnuta žádná externí rozhodovací podpora ani další materiály.

Co je měření studie?

Primární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Konečná diagnostická přesnost (top-3) s podporou AI vs bez podpory AI
Časové okno: Od odpovědi na první vinětu do konce studie (až 12 měsíců).

Pro každého účastníka podíl vinět, kde je správná hlavní diagnóza zahrnuta do konečné top-3 diagnóz účastníka. Porovnejte konečnou přesnost top-3 mezi ramenem s AI (po návrzích AI) a kontrolním ramenem (bez AI).

Procento správně diagnostikovaných případů (top-3).

Od odpovědi na první vinětu do konce studie (až 12 měsíců).

Sekundární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Konečná diagnostická přesnost (top-1) s podporou AI vs bez podpory AI
Časové okno: Od zodpovězení první viněty až do konce studie (až 12 měsíců).
Pro každého účastníka podíl vinět, kde je správná hlavní diagnóza zahrnuta v konečném seznamu top-1 diagnóz účastníka.
Porovnejte konečnou přesnost top-1 mezi větví s AI (po návrzích AI) a kontrolní větví (bez AI).
Procento správně diagnostikovaných případů (top-1).
Od zodpovězení první viněty až do konce studie (až 12 měsíců).
Změna přesnosti nejlepších tří diagnostických úloh před a po návrzích AI (pouze skupina AI)
Časové okno: Od první zodpovězené viněty až do konce studie (až 12 měsíců).

V rameni podporovaném umělou inteligencí účastníci nejprve poskytnou počáteční odpověď (až tři diagnózy) bez návrhů AI, poté uvidí návrhy generované AI a mohou svou odpověď jednou revidovat; k tomuto případu se později již nemohou vrátit. U každého účastníka výzkumníci vypočítají rozdíl v přesnosti top-3 mezi počátečními a konečnými odpověďmi napříč všemi dokončenými případy.

Procentní změna v přesnosti diagnostiky Top-3

Od první zodpovězené viněty až do konce studie (až 12 měsíců).
Změna v přesnosti diagnostiky top-1 před a po návrzích umělé inteligence (pouze skupina s umělou inteligencí)
Časové okno: Od zodpovězení první viněty až do konce studie (až 12 měsíců).

V rameni podporovaném umělou inteligencí účastníci nejprve poskytnou počáteční odpověď (až tři diagnózy) bez návrhů AI, poté uvidí návrhy generované AI a mohou svou odpověď jednou revidovat; k tomuto případu se již nemohou vrátit. Pro každého účastníka výzkumníci vypočítají rozdíl v přesnosti top-1 mezi počáteční a konečnou odpovědí napříč všemi dokončenými případy.

Zvýšení/pokles v procentních bodech v diagnostické přesnosti Top-1

Od zodpovězení první viněty až do konce studie (až 12 měsíců).
Diagnostická jistota (0-10) před návrhy AI: Kontrolní skupina vs skupina s AI
Časové okno: Od odpovědi na první vinětu až do konce studie (až 12 měsíců).

Účastníci v obou ramenech studie ohodnotí svou jistotu (na stupnici 0–10) ohledně svých 3 nejpravděpodobnějších diagnostických návrhů ještě před jakýmikoli návrhy AI.

V rameni s AI se jedná o hodnocení „před AI“. V kontrolním rameni jde o jediné hodnocení jistoty (protože se AI nezobrazuje).

Výzkumníci porovnají jistotu před AI mezi oběma rameny, agregovanou napříč všemi dokončenými vinětami na účastníka.

Od odpovědi na první vinětu až do konce studie (až 12 měsíců).
Konečná diagnostická jistota (0-10) po návrzích AI: Kontrolní skupina vs. skupina s AI
Časové okno: Od první odpovědi na vinětu až do konce studie (až 12 měsíců).

Konečná diagnostická jistota (stupnice 0-10) v návrhu Top-3 diagnózy napříč všemi dokončenými vinětami, porovnáno mezi rameny.

V rameni AI se jedná o hodnocení jistoty po použití AI. V kontrolním rameni se jedná o stejné hodnocení jistoty (účastníci nedostávají návrhy od AI).

Od první odpovědi na vinětu až do konce studie (až 12 měsíců).
Změna v diagnostické jistotě (0–10) před návrhy umělé inteligence vs. po nich (pouze rameno s umělou inteligencí)
Časové okno: Od první vyplněné viněty do konce studie (až 12 měsíců).

Ve skupině s umělou inteligencí účastníci poskytují hodnocení jistoty (stupnice 0–10) pro své tři hlavní diagnózy před zobrazením návrhů AI i po něm.

U každého účastníka výzkumníci vypočítají změnu uvnitř účastníka (po AI minus před AI) napříč všemi dokončenými vinětami.

Změna ve skóre jistoty (stupnice 0–10)

Od první vyplněné viněty do konce studie (až 12 měsíců).
Chyba diagnostiky způsobená umělou inteligencí (pouze rameno s umělou inteligencí)
Časové okno: Od první vyřešené viněty až do konce studie (až 12 měsíců).
Mezi dokončenými vinětami, kde je počáteční diagnóza Top-1 účastníka správná, podíl těch, u kterých se konečná diagnóza Top-1 stane nesprávnou po návrzích AI.
Od první vyřešené viněty až do konce studie (až 12 měsíců).
Změna tří hlavních diagnóz po návrzích umělé inteligence (pouze skupina s umělou inteligencí)
Časové okno: Od zodpovězení prvního vignetu až do konce studie (až 12 měsíců).
Mezi dokončenými vinětami ve skupině s umělou inteligencí podíl případů, kdy se první tři diagnózy liší mezi odpověďmi před a po použití umělé inteligence.
Od zodpovězení prvního vignetu až do konce studie (až 12 měsíců).
Nejlepší 3 diagnostická přesnost: Všechny lidské odpovědi před umělou inteligencí vs. přesnost umělé inteligence
Časové okno: Od zodpovězení první viněty až do konce studie (až 12 měsíců).

Pro každou vinetu je porovnána přesnost diagnostiky Top-3 lidských účastníků před jakýmikoli návrhy AI (kombinace účastníků z obou větví studie v jejich fázi před AI) s přesností diagnostiky Top-3 modelu AI pro stejnou vinetu. Uvedený Výsledek je rozdíl v přesnosti, definovaný jako přesnost Top-3 AI minus přesnost Top-3 lidí před AI, vyjádřený v procentních bodech a vypočítaný na úrovni vinet napříč všemi dokončenými vinetami.

Rozdíl v procentních bodech v přesnosti diagnostiky Top-3

Od zodpovězení první viněty až do konce studie (až 12 měsíců).
Top-3 diagnostická přesnost: Konečné odpovědi lidí po AI vs přesnost AI (pouze větev AI)
Časové okno: Od zodpovězení první viněty do konce studie (až 12 měsíců).

Pro každý scénář dokončený v rameni s podporou umělé inteligence se porovnává přesnost Top-3 diagnostiky lidských účastníků po zobrazení návrhů AI s přesností Top-3 diagnostiky modelu AI.

(Přesnost Top-3 je jediným měřítkem) Hlášený výsledek je rozdíl v přesnosti, definovaný jako přesnost Top-3 AI minus přesnost Top-3 lidí po AI, vyjádřený v procentních bodech a vypočítaný na úrovni scénáře napříč všemi dokončenými scénáři v rameni AI.

Rozdíl v procentních bodech v přesnosti Top-3 diagnostiky mezi AI a lidmi

Od zodpovězení první viněty do konce studie (až 12 měsíců).
Doba dokončení každého vymezeného úkolu s podporou AI a bez ní
Časové okno: Od zodpovězení první viněty do konce studie (až 12 měsíců).

Pro každý vinět zaznamenává platforma čas od otevření viněty do odeslání odpovědi. V kontrolní větvi se zaznamenává jediný čas dokončení pro každou vinětu. V větvi s podporou umělé inteligence se čas dokončení zaznamenává před zobrazením návrhů AI a znovu po zobrazení návrhů AI. Výsledek uvádí rozdíl v čase dokončení mezi studijními větvemi, vyjádřený v sekundách a vypočítaný pro všechny dokončené viněty.

Sekundy (rozdíl v čase dokončení)

Od zodpovězení první viněty do konce studie (až 12 měsíců).
Proporce přiřazených vinět dokončených
Časové okno: Od zodpovězení první viněty až do konce studie (až 12 měsíců).
Pro každého účastníka byl porovnán podíl 10 vinět dokončených v průběhu studie mezi rameny.
Od zodpovězení první viněty až do konce studie (až 12 měsíců).

Spolupracovníci a vyšetřovatelé

Zde najdete lidi a organizace zapojené do této studie.

Termíny studijních záznamů

Tato data sledují průběh záznamů studie a předkládání souhrnných výsledků na ClinicalTrials.gov. Záznamy ze studií a hlášené výsledky jsou před zveřejněním na veřejné webové stránce přezkoumány Národní lékařskou knihovnou (NLM), aby se ujistily, že splňují specifické standardy kontroly kvality.

Hlavní termíny studia

Začátek studia (Aktuální)

20. listopadu 2025

Primární dokončení (Odhadovaný)

31. října 2026

Dokončení studie (Odhadovaný)

31. prosince 2026

Termíny zápisu do studia

První předloženo

19. listopadu 2025

První předloženo, které splnilo kritéria kontroly kvality

12. ledna 2026

První zveřejněno (Aktuální)

20. ledna 2026

Aktualizace studijních záznamů

Poslední zveřejněná aktualizace (Aktuální)

20. ledna 2026

Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality

12. ledna 2026

Naposledy ověřeno

1. ledna 2026

Více informací

Termíny související s touto studií

Informace o lécích a zařízeních, studijní dokumenty

Studuje lékový produkt regulovaný americkým FDA

Ne

Studuje produkt zařízení regulovaný americkým úřadem FDA

Ne

Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .

Klinické studie na AI návrh

Předplatit