Tato stránka byla automaticky přeložena a přesnost překladu není zaručena. Podívejte se prosím na anglická verze pro zdrojový text.

Multicentrická ověřovací studie nástroje umělé inteligence pro automatickou klasifikaci rentgenových snímků hrudníku

28. července 2021 aktualizováno: Hospital Italiano de Buenos Aires
Aktuálním problémem na radiologických odděleních je neustálý nárůst počtu prováděných studií. V současnosti největší objem studií připadá na prosté rentgeny. Tento problém je umocněn nedostatkem odborníků s nasazením a zkušenostmi v jejich interpretaci. V oblasti informatiky se objevila oblast studia nazvaná Artificial Intelligence (AI), která se skládá z počítačového systému, který se učí vykonávat specifické rutinní úkoly a může doplňovat nebo napodobovat lidskou práci. Od roku 2018 provozuje Hospital Italiano de Buenos Aires program TRx, který spočívá ve vývoji nástroje na bázi AI pro detekci patologických nálezů na rentgenových snímcích hrudníku. Účelem tohoto nástroje je pomoci nezobrazujícím lékařům při diagnostice rentgenových snímků hrudníku automatickou detekcí radiologických nálezů. Tato multicentrická studie se snaží externě ověřit výkon nástroje AI (TRx v1) jako diagnostického asistenčního nástroje pro rentgeny hrudníku.

Přehled studie

Detailní popis

Aktuálním problémem na radiologických odděleních je neustálý nárůst počtu prováděných studií. Tento neustále se zvyšující objem informací znamená prodloužení času, který musí lékařští specialisté věnovat vykazování těchto studií. Metodika prováděná pro hlášení se liší podle zobrazovací modality, která ve vysoce složitých centrech zahrnuje mimo jiné radiologii, počítačovou tomografii, magnetickou rezonanci a ultrazvuk. V současnosti největší objem studií připadá na prosté rentgeny. V Hospital Italiano de Buenos Aires (HIBA) bylo během roku 2019 provedeno více než 220 000 rentgenových snímků a v rámci této skupiny tvoří více než 50 % výkonů rentgenové snímky hrudníku, které se provádějí jako metoda počáteční detekce potenciálně závažných patologií. (plicní uzel, zápal plic, pneumotorax).

Tato zobrazovací modalita není atraktivní a není prozkoumána novými generacemi zobrazovacích specialistů, kteří preferují přechod k modernějším a složitějším metodám, jako je počítačová tomografie nebo magnetická rezonance. Problém narůstajícího objemu analyzovaných obyčejných rentgenových snímků je proto umocněn nedostatkem odborníků s nasazením a zkušenostmi s jejich interpretací.

V oblasti informatiky se objevila oblast studia nazvaná Artificial Intelligence (AI), která se skládá z počítačového systému, který se učí vykonávat specifické rutinní úkoly a může doplňovat nebo napodobovat lidskou práci. Vývojář musí systému umělé inteligence sdělit, jaká reakce je od daného podnětu požadována. Příkladem toho je kontrola pravopisu v textovém procesoru.

Oblast AI zahrnuje širokou škálu dílčích oblastí a specifických technik, jako je strojové učení (ML) nebo hluboké učení (DL). ML zahrnuje jakýkoli nástroj, ve kterém se používají počítačová data k přizpůsobení modelu, který z těchto vstupních dat vyvozuje závěry. Algoritmy jsou trénovány, aby se naučily dané úkoly na základě souboru dříve utajovaných informací. Patří sem také tradiční techniky pro vytváření prediktivních modelů nebo klasifikačních modelů. Filtrování e-mailového spamu je příkladem ML. Neuronové sítě jsou jedním z nástrojů obsažených v ML.

A konečně, DL je typ ML, který se začal objevovat v roce 2015, který spočívá v přidávání vrstev do tradiční neuronové sítě a vytváří tak nelineární model s vyšším stupněm složitosti, protože zvyšuje počet parametrů, které je třeba upravit. Tato síť je vystavena trénovací datové sadě, která se skládá z již označených informací, a „učí se“ označovat nové informace napodobováním kritérií označování datové sady. Toto učení je vlastně iterativní úprava parametrů modelu, které jsou iterativně upravovány podle chyby mezi původním značením a značením navrženým sítí. Jakmile je model natrénován, jeho parametry jsou pevně dané a lze jej použít k odvození označení nových informací, jejichž označení není známo. Bylo zjištěno, že DL metody fungují mnohem lépe v analýze dat než tradiční metody. DL již má aplikace v běžném životě, jako jsou hlasoví asistenti v chytrých telefonech nebo automatické rozpoznávání obličeje a označování na sociálních sítích.

DL aplikovaný na zpracování obrazu je založen na metodě zvané konvoluční neuronové sítě. Jeho aplikace byla zkoumána v oblasti lékařského zobrazování, při hledání zlepšení výkonu, od detekce objektů (anatomické nebo patologické struktury v radiologických snímcích) až po segmentační úkoly.

Od roku 2018 provozuje Hospital Italiano de Buenos Aires program TRx, který spočívá ve vývoji nástroje na bázi AI pro detekci patologických nálezů na rentgenových snímcích hrudníku. Projekt je součástí programu Artificial Intelligence in Healthcare Hospital Italiano de Buenos Aires a je realizován multidisciplinárním týmem profesionálů, včetně biomedicínských inženýrů, datových vědců, radiologů, klinických klinických informatiků, metodologů a softwarových inženýrů. TRx je DL model, vyvinutý a ověřený v HIBA, který detekuje čtyři typy radiologických nálezů na rentgenových snímcích hrudníku: plicní opacity (uzlíky, útvary, pneumonie, konsolidace, zabroušené sklo nebo atelektáza), pneumotorax, pleurální výpotky a žebra zlomeniny. Tato detekce se provádí prostřednictvím čtyř nezávislých modulů, které jsou integrovány do jednoho systému. Při zpracování rentgenového snímku TRx hlásí různé typy výsledků. Za prvé, jednotný systém TRx dichotomicky indikuje, zda je snímek podezřelý pro patologický nález, nebo jde případně o normální rentgen hrudníku. Za druhé, každý ze čtyř modulů zejména udává, zda byl detekován nález plicní opacity, pneumotoraxu, pleurálního výpotku nebo zlomeniny žeber. A konečně TRx umožňuje vizualizaci tepelné mapy nad obrazem indikující barevně oblast hrudníku, kde byl detekován podezřelý nález.

Účelem tohoto nástroje je pomoci nezobrazujícím lékařům při diagnostice rentgenových snímků hrudníku automatickou detekcí radiologických nálezů. TRx verze 1.0 (TRx v1) vyhodnocuje frontální rentgen hrudníku pacientů starších 14 let pro čtyři typy nálezů: plicní opacity, pleurální výpotek, zlomeniny a pneumotorax. Cílem tohoto nástroje je zlepšit diagnostický výkon nezobrazovacích lékařů poskytováním pomoci nebo „předběžné zprávy“.

Jedna skutečnost, která je v AI zdůrazněna, je, že modely musí být replikovatelné; model musí poskytovat stejné nebo lepší výsledky, pokud je zadán stejný vstup. I když se to zdá zřejmé, je to na rozdíl od lidí, kteří běžně vykazují variabilitu mezi pozorovateli i uvnitř pozorovatelů. Standard modelu umělé inteligence by měl alespoň odpovídat lidskému výkonu, kterému bude pomáhat. Replikovatelnost závisí na problému a míra variability závisí na konkrétním úkolu.

Existují autoři, kteří uvádějí, že model umělé inteligence může představovat potíže při poskytování přesných předpovědí, když je aplikován na nové situace nebo populace (tj. kterým nebyl vystaven během tréninku). Zatímco radiologové jsou schopni se úspěšně přizpůsobit rozdílům v obrazech (ať už kvůli tloušťce řezu, značení skeneru, síle pole, intenzitě gradientu nebo době kontrastu), aniž by to ovlivnilo jejich interpretaci snímků, AI tuto schopnost obecně postrádá. Pokud byl například agent AI trénován pouze s obrázky ze skeneru MRI 3 Tesla, nelze a priori zaručit, že bude mít stejné výsledky na skenech provedených na 1,5 Tesla. Jedním z řešení je vyvinout matematické procesy pro rozpoznání, normalizaci a transformaci dat, aby se minimalizoval posun. Dalším přístupem ke zmírnění tohoto jevu je provádět trénování a ověřování s „úplnými“ soubory dat, které představují každý typ získávání a rekonstrukce obrazových dat.

Aby bylo možné komplexně vyhodnotit diagnostický výkon nástroje AI a zajistit tak jeho zamýšlené použití, doporučuje se provést multicentrické studie, které umožňují měřit tento výkon u různých populací pacientů a různých protokolů pořizování snímků. Tato multicentrická studie se snaží externě ověřit výkon nástroje AI (TRx v.1) jako diagnostického asistenčního nástroje pro rentgeny hrudníku.

Typ studie

Pozorovací

Zápis (Očekávaný)

385

Kontakty a umístění

Tato část poskytuje kontaktní údaje pro ty, kteří studii provádějí, a informace o tom, kde se tato studie provádí.

Studijní místa

      • Buenos Aires, Argentina, 1199
        • Hospital Italiano de Buenos Aires

Kritéria účasti

Výzkumníci hledají lidi, kteří odpovídají určitému popisu, kterému se říká kritéria způsobilosti. Některé příklady těchto kritérií jsou celkový zdravotní stav osoby nebo předchozí léčba.

Kritéria způsobilosti

Věk způsobilý ke studiu

18 let a starší (Dospělý, Starší dospělý)

Přijímá zdravé dobrovolníky

N/A

Pohlaví způsobilá ke studiu

Všechno

Metoda odběru vzorků

Ukázka pravděpodobnosti

Studijní populace

Studijní jednotkou budou RTG hrudníku poskytované zúčastněnými centry se zachováním mlčenlivosti daného pacienta (bez jakýchkoli citlivých údajů jako je jméno, příjmení, číslo občanského průkazu nebo datum narození). Snímky budou získány zpětně z jejich příslušných institucionálních databází.

Popis

Kritéria pro zařazení:

Budou zahrnuty rentgenové snímky, které splňují následující požadavky:

  • Rentgen hrudníku
  • Patří pacientům starším 18 let.
  • Advokacie a digitální akvizice
  • Studie prováděná ve výše uvedených institucích a uložená v jejich příslušném systému pro archivaci obrázků a komunikaci

Kritéria vyloučení:

Rentgenové snímky, které jsou vyloučeny:

  • Špatná technika (nízký kontrast, zahalení, mimo střed)
  • Přítomnost abnormální polohy pacienta během akvizice.

Studijní plán

Tato část poskytuje podrobnosti o studijním plánu, včetně toho, jak je studie navržena a co studie měří.

Jak je studie koncipována?

Detaily designu

Co je měření studie?

Primární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Shoda mezi nástrojem AI a referenčním standardem
Časové okno: 5 měsíců
Bude analyzována shoda mezi kategorií přiřazenou profesionály a kategorií přiřazenou algoritmem. Za tímto účelem bude vyhodnocen diagnostický test pro zjištění abnormality (tj. test je pozitivní, když je pozorován alespoň jeden ze čtyř typů nálezů). S přihlédnutím k diagnóze specialistů jako k referenčnímu standardu bude vytvořena matice zmatků a budou vypočteny diagnostické metriky nástroje AI (senzitivita, specificita a prediktivní hodnoty). 95% intervaly spolehlivosti budou vypočteny pomocí přesné binomické distribuce.
5 měsíců

Sekundární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Křivky provozních charakteristik přijímače
Časové okno: 5 měsíců
Křivky provozních charakteristik přijímače budou sestrojeny pro celkovou kategorii abnormality a pro každý jednotlivý radiologický nález, přičemž v každém případě se vypočítá plocha pod křivkou (hodnota mezi 0 a 1). Model, jehož předpovědi jsou 100% nesprávné, má plochu pod křivkou 0,0; jiný, jehož předpovědi jsou 100% správné, má plochu pod křivkou 1,0. Za referenční standard bude považována kategorizace provedená odbornými radiology. Bude hodnoceno, zda existuje významný rozdíl mezi plochou pod křivkou nástroje AI a referenční hodnotou odhadnutou pro nezobrazující lékaře (tj. lékaři na pohotovosti nebo obyvatelé). Použije se De Longův test s hladinou významnosti 0,01.
5 měsíců
Kvalitativní analýza
Časové okno: 5 měsíců
Snímky s chybnou diagnózou (falešně negativní a falešně pozitivní) a odpovídající tepelné mapy generované algoritmem budou studovány individuálně.
5 měsíců
Index shody mezi pozorovateli
Časové okno: 5 měsíců
Bude analyzována shoda mezi pozorovateli mezi zúčastněnými specialisty. V případech, kdy je dotyčný obraz každým z pozorovatelů kategorizován odlišně, budou požádáni, aby si snímky společně prohlédli a definovali kategorii.
5 měsíců
Analýza podle instituce
Časové okno: 5 měsíců
Proměnné položek 1. a 2. budou vypočítány samostatně pro snímky každé zúčastněné instituce. Zda existuje významný rozdíl v různých hodnotách oblasti pod křivkou napříč institucemi, vyhodnotíme pomocí De Longova testu. Použije se hladina významnosti 0,01.
5 měsíců

Spolupracovníci a vyšetřovatelé

Zde najdete lidi a organizace zapojené do této studie.

Vyšetřovatelé

  • Vrchní vyšetřovatel: Sonia E Benitez, MD, MSc, Hospital Italiano de Buenos Aires

Publikace a užitečné odkazy

Osoba odpovědná za zadávání informací o studiu tyto publikace poskytuje dobrovolně. Mohou se týkat čehokoli, co souvisí se studiem.

Obecné publikace

Termíny studijních záznamů

Tato data sledují průběh záznamů studie a předkládání souhrnných výsledků na ClinicalTrials.gov. Záznamy ze studií a hlášené výsledky jsou před zveřejněním na veřejné webové stránce přezkoumány Národní lékařskou knihovnou (NLM), aby se ujistily, že splňují specifické standardy kontroly kvality.

Hlavní termíny studia

Začátek studia (Aktuální)

1. července 2021

Primární dokončení (Očekávaný)

28. února 2022

Dokončení studie (Očekávaný)

31. července 2022

Termíny zápisu do studia

První předloženo

28. července 2021

První předloženo, které splnilo kritéria kontroly kvality

28. července 2021

První zveřejněno (Aktuální)

5. srpna 2021

Aktualizace studijních záznamů

Poslední zveřejněná aktualizace (Aktuální)

5. srpna 2021

Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality

28. července 2021

Naposledy ověřeno

1. července 2021

Více informací

Termíny související s touto studií

Informace o lécích a zařízeních, studijní dokumenty

Studuje lékový produkt regulovaný americkým FDA

Ne

Studuje produkt zařízení regulovaný americkým úřadem FDA

Ne

Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .

3
Předplatit