- ICH GCP
- Registr klinických studií v USA
- Klinická studie NCT04991987
Multicentrická ověřovací studie nástroje umělé inteligence pro automatickou klasifikaci rentgenových snímků hrudníku
Přehled studie
Postavení
Detailní popis
Aktuálním problémem na radiologických odděleních je neustálý nárůst počtu prováděných studií. Tento neustále se zvyšující objem informací znamená prodloužení času, který musí lékařští specialisté věnovat vykazování těchto studií. Metodika prováděná pro hlášení se liší podle zobrazovací modality, která ve vysoce složitých centrech zahrnuje mimo jiné radiologii, počítačovou tomografii, magnetickou rezonanci a ultrazvuk. V současnosti největší objem studií připadá na prosté rentgeny. V Hospital Italiano de Buenos Aires (HIBA) bylo během roku 2019 provedeno více než 220 000 rentgenových snímků a v rámci této skupiny tvoří více než 50 % výkonů rentgenové snímky hrudníku, které se provádějí jako metoda počáteční detekce potenciálně závažných patologií. (plicní uzel, zápal plic, pneumotorax).
Tato zobrazovací modalita není atraktivní a není prozkoumána novými generacemi zobrazovacích specialistů, kteří preferují přechod k modernějším a složitějším metodám, jako je počítačová tomografie nebo magnetická rezonance. Problém narůstajícího objemu analyzovaných obyčejných rentgenových snímků je proto umocněn nedostatkem odborníků s nasazením a zkušenostmi s jejich interpretací.
V oblasti informatiky se objevila oblast studia nazvaná Artificial Intelligence (AI), která se skládá z počítačového systému, který se učí vykonávat specifické rutinní úkoly a může doplňovat nebo napodobovat lidskou práci. Vývojář musí systému umělé inteligence sdělit, jaká reakce je od daného podnětu požadována. Příkladem toho je kontrola pravopisu v textovém procesoru.
Oblast AI zahrnuje širokou škálu dílčích oblastí a specifických technik, jako je strojové učení (ML) nebo hluboké učení (DL). ML zahrnuje jakýkoli nástroj, ve kterém se používají počítačová data k přizpůsobení modelu, který z těchto vstupních dat vyvozuje závěry. Algoritmy jsou trénovány, aby se naučily dané úkoly na základě souboru dříve utajovaných informací. Patří sem také tradiční techniky pro vytváření prediktivních modelů nebo klasifikačních modelů. Filtrování e-mailového spamu je příkladem ML. Neuronové sítě jsou jedním z nástrojů obsažených v ML.
A konečně, DL je typ ML, který se začal objevovat v roce 2015, který spočívá v přidávání vrstev do tradiční neuronové sítě a vytváří tak nelineární model s vyšším stupněm složitosti, protože zvyšuje počet parametrů, které je třeba upravit. Tato síť je vystavena trénovací datové sadě, která se skládá z již označených informací, a „učí se“ označovat nové informace napodobováním kritérií označování datové sady. Toto učení je vlastně iterativní úprava parametrů modelu, které jsou iterativně upravovány podle chyby mezi původním značením a značením navrženým sítí. Jakmile je model natrénován, jeho parametry jsou pevně dané a lze jej použít k odvození označení nových informací, jejichž označení není známo. Bylo zjištěno, že DL metody fungují mnohem lépe v analýze dat než tradiční metody. DL již má aplikace v běžném životě, jako jsou hlasoví asistenti v chytrých telefonech nebo automatické rozpoznávání obličeje a označování na sociálních sítích.
DL aplikovaný na zpracování obrazu je založen na metodě zvané konvoluční neuronové sítě. Jeho aplikace byla zkoumána v oblasti lékařského zobrazování, při hledání zlepšení výkonu, od detekce objektů (anatomické nebo patologické struktury v radiologických snímcích) až po segmentační úkoly.
Od roku 2018 provozuje Hospital Italiano de Buenos Aires program TRx, který spočívá ve vývoji nástroje na bázi AI pro detekci patologických nálezů na rentgenových snímcích hrudníku. Projekt je součástí programu Artificial Intelligence in Healthcare Hospital Italiano de Buenos Aires a je realizován multidisciplinárním týmem profesionálů, včetně biomedicínských inženýrů, datových vědců, radiologů, klinických klinických informatiků, metodologů a softwarových inženýrů. TRx je DL model, vyvinutý a ověřený v HIBA, který detekuje čtyři typy radiologických nálezů na rentgenových snímcích hrudníku: plicní opacity (uzlíky, útvary, pneumonie, konsolidace, zabroušené sklo nebo atelektáza), pneumotorax, pleurální výpotky a žebra zlomeniny. Tato detekce se provádí prostřednictvím čtyř nezávislých modulů, které jsou integrovány do jednoho systému. Při zpracování rentgenového snímku TRx hlásí různé typy výsledků. Za prvé, jednotný systém TRx dichotomicky indikuje, zda je snímek podezřelý pro patologický nález, nebo jde případně o normální rentgen hrudníku. Za druhé, každý ze čtyř modulů zejména udává, zda byl detekován nález plicní opacity, pneumotoraxu, pleurálního výpotku nebo zlomeniny žeber. A konečně TRx umožňuje vizualizaci tepelné mapy nad obrazem indikující barevně oblast hrudníku, kde byl detekován podezřelý nález.
Účelem tohoto nástroje je pomoci nezobrazujícím lékařům při diagnostice rentgenových snímků hrudníku automatickou detekcí radiologických nálezů. TRx verze 1.0 (TRx v1) vyhodnocuje frontální rentgen hrudníku pacientů starších 14 let pro čtyři typy nálezů: plicní opacity, pleurální výpotek, zlomeniny a pneumotorax. Cílem tohoto nástroje je zlepšit diagnostický výkon nezobrazovacích lékařů poskytováním pomoci nebo „předběžné zprávy“.
Jedna skutečnost, která je v AI zdůrazněna, je, že modely musí být replikovatelné; model musí poskytovat stejné nebo lepší výsledky, pokud je zadán stejný vstup. I když se to zdá zřejmé, je to na rozdíl od lidí, kteří běžně vykazují variabilitu mezi pozorovateli i uvnitř pozorovatelů. Standard modelu umělé inteligence by měl alespoň odpovídat lidskému výkonu, kterému bude pomáhat. Replikovatelnost závisí na problému a míra variability závisí na konkrétním úkolu.
Existují autoři, kteří uvádějí, že model umělé inteligence může představovat potíže při poskytování přesných předpovědí, když je aplikován na nové situace nebo populace (tj. kterým nebyl vystaven během tréninku). Zatímco radiologové jsou schopni se úspěšně přizpůsobit rozdílům v obrazech (ať už kvůli tloušťce řezu, značení skeneru, síle pole, intenzitě gradientu nebo době kontrastu), aniž by to ovlivnilo jejich interpretaci snímků, AI tuto schopnost obecně postrádá. Pokud byl například agent AI trénován pouze s obrázky ze skeneru MRI 3 Tesla, nelze a priori zaručit, že bude mít stejné výsledky na skenech provedených na 1,5 Tesla. Jedním z řešení je vyvinout matematické procesy pro rozpoznání, normalizaci a transformaci dat, aby se minimalizoval posun. Dalším přístupem ke zmírnění tohoto jevu je provádět trénování a ověřování s „úplnými“ soubory dat, které představují každý typ získávání a rekonstrukce obrazových dat.
Aby bylo možné komplexně vyhodnotit diagnostický výkon nástroje AI a zajistit tak jeho zamýšlené použití, doporučuje se provést multicentrické studie, které umožňují měřit tento výkon u různých populací pacientů a různých protokolů pořizování snímků. Tato multicentrická studie se snaží externě ověřit výkon nástroje AI (TRx v.1) jako diagnostického asistenčního nástroje pro rentgeny hrudníku.
Typ studie
Zápis (Očekávaný)
Kontakty a umístění
Studijní místa
-
-
-
Buenos Aires, Argentina, 1199
- Hospital Italiano de Buenos Aires
-
-
Kritéria účasti
Kritéria způsobilosti
Věk způsobilý ke studiu
Přijímá zdravé dobrovolníky
Pohlaví způsobilá ke studiu
Metoda odběru vzorků
Studijní populace
Popis
Kritéria pro zařazení:
Budou zahrnuty rentgenové snímky, které splňují následující požadavky:
- Rentgen hrudníku
- Patří pacientům starším 18 let.
- Advokacie a digitální akvizice
- Studie prováděná ve výše uvedených institucích a uložená v jejich příslušném systému pro archivaci obrázků a komunikaci
Kritéria vyloučení:
Rentgenové snímky, které jsou vyloučeny:
- Špatná technika (nízký kontrast, zahalení, mimo střed)
- Přítomnost abnormální polohy pacienta během akvizice.
Studijní plán
Jak je studie koncipována?
Detaily designu
Co je měření studie?
Primární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
---|---|---|
Shoda mezi nástrojem AI a referenčním standardem
Časové okno: 5 měsíců
|
Bude analyzována shoda mezi kategorií přiřazenou profesionály a kategorií přiřazenou algoritmem.
Za tímto účelem bude vyhodnocen diagnostický test pro zjištění abnormality (tj. test je pozitivní, když je pozorován alespoň jeden ze čtyř typů nálezů).
S přihlédnutím k diagnóze specialistů jako k referenčnímu standardu bude vytvořena matice zmatků a budou vypočteny diagnostické metriky nástroje AI (senzitivita, specificita a prediktivní hodnoty).
95% intervaly spolehlivosti budou vypočteny pomocí přesné binomické distribuce.
|
5 měsíců
|
Sekundární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
---|---|---|
Křivky provozních charakteristik přijímače
Časové okno: 5 měsíců
|
Křivky provozních charakteristik přijímače budou sestrojeny pro celkovou kategorii abnormality a pro každý jednotlivý radiologický nález, přičemž v každém případě se vypočítá plocha pod křivkou (hodnota mezi 0 a 1).
Model, jehož předpovědi jsou 100% nesprávné, má plochu pod křivkou 0,0; jiný, jehož předpovědi jsou 100% správné, má plochu pod křivkou 1,0.
Za referenční standard bude považována kategorizace provedená odbornými radiology.
Bude hodnoceno, zda existuje významný rozdíl mezi plochou pod křivkou nástroje AI a referenční hodnotou odhadnutou pro nezobrazující lékaře (tj.
lékaři na pohotovosti nebo obyvatelé).
Použije se De Longův test s hladinou významnosti 0,01.
|
5 měsíců
|
Kvalitativní analýza
Časové okno: 5 měsíců
|
Snímky s chybnou diagnózou (falešně negativní a falešně pozitivní) a odpovídající tepelné mapy generované algoritmem budou studovány individuálně.
|
5 měsíců
|
Index shody mezi pozorovateli
Časové okno: 5 měsíců
|
Bude analyzována shoda mezi pozorovateli mezi zúčastněnými specialisty.
V případech, kdy je dotyčný obraz každým z pozorovatelů kategorizován odlišně, budou požádáni, aby si snímky společně prohlédli a definovali kategorii.
|
5 měsíců
|
Analýza podle instituce
Časové okno: 5 měsíců
|
Proměnné položek 1. a 2. budou vypočítány samostatně pro snímky každé zúčastněné instituce.
Zda existuje významný rozdíl v různých hodnotách oblasti pod křivkou napříč institucemi, vyhodnotíme pomocí De Longova testu.
Použije se hladina významnosti 0,01.
|
5 měsíců
|
Spolupracovníci a vyšetřovatelé
Vyšetřovatelé
- Vrchní vyšetřovatel: Sonia E Benitez, MD, MSc, Hospital Italiano de Buenos Aires
Publikace a užitečné odkazy
Obecné publikace
- Calvert JS, Price DA, Chettipally UK, Barton CW, Feldman MD, Hoffman JL, Jay M, Das R. A computational approach to early sepsis detection. Comput Biol Med. 2016 Jul 1;74:69-73. doi: 10.1016/j.compbiomed.2016.05.003. Epub 2016 May 12.
- Kesselman A, Soroosh G, Mollura DJ; RAD-AID Conference Writing Group. 2015 RAD-AID Conference on International Radiology for Developing Countries: The Evolving Global Radiology Landscape. J Am Coll Radiol. 2016 Sep;13(9):1139-1144. doi: 10.1016/j.jacr.2016.03.028. Epub 2016 May 25.
- Chartrand G, Cheng PM, Vorontsov E, Drozdzal M, Turcotte S, Pal CJ, Kadoury S, Tang A. Deep Learning: A Primer for Radiologists. Radiographics. 2017 Nov-Dec;37(7):2113-2131. doi: 10.1148/rg.2017170077.
- Erickson BJ, Korfiatis P, Akkus Z, Kline TL. Machine Learning for Medical Imaging. Radiographics. 2017 Mar-Apr;37(2):505-515. doi: 10.1148/rg.2017160130. Epub 2017 Feb 17.
- Balthazar P, Harri P, Prater A, Safdar NM. Protecting Your Patients' Interests in the Era of Big Data, Artificial Intelligence, and Predictive Analytics. J Am Coll Radiol. 2018 Mar;15(3 Pt B):580-586. doi: 10.1016/j.jacr.2017.11.035. Epub 2018 Feb 6.
- Mosquera C, Diaz FN, Binder F, Rabellino JM, Benitez SE, Beresnak AD, Seehaus A, Ducrey G, Ocantos JA, Luna DR. Chest x-ray automated triage: A semiologic approach designed for clinical implementation, exploiting different types of labels through a combination of four Deep Learning architectures. Comput Methods Programs Biomed. 2021 Jul;206:106130. doi: 10.1016/j.cmpb.2021.106130. Epub 2021 May 2.
Užitečné odkazy
- Weakly Supervised Learning of Deep Convolutional Neural Networks [Internet]. 2016 Institute of Electrical and Electronics Engineers, Conference on Computer Vision and Pattern Recognition. 2016.
- Guest Editorial Deep Learning in Medical Imaging: Overview and Future Promise of an Exciting New Technique [Internet]. Vol. 35, Institute of Electrical and Electronics Engineers, Transactions on Medical Imaging. 2016. p. 1153-9.
- Dataset shift in machine learning. Neural Information Processing. 2008.
Termíny studijních záznamů
Hlavní termíny studia
Začátek studia (Aktuální)
Primární dokončení (Očekávaný)
Dokončení studie (Očekávaný)
Termíny zápisu do studia
První předloženo
První předloženo, které splnilo kritéria kontroly kvality
První zveřejněno (Aktuální)
Aktualizace studijních záznamů
Poslední zveřejněná aktualizace (Aktuální)
Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality
Naposledy ověřeno
Více informací
Termíny související s touto studií
Klíčová slova
Další relevantní podmínky MeSH
Další identifikační čísla studie
- 6025
Informace o lécích a zařízeních, studijní dokumenty
Studuje lékový produkt regulovaný americkým FDA
Studuje produkt zařízení regulovaný americkým úřadem FDA
Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .