- ICH GCP
- Registr klinických studií v USA
- Klinická studie NCT05272189
Projekt 3 Příklad: Human-AI Collaboration Tester (HAICT) Exp. 7
Přehled studie
Postavení
Intervence / Léčba
Detailní popis
Tento text je textem předběžné registrace pro experiment HAICT 7, jak je popsán v rámci Open Science Framework. https://osf.io/hngu4/
POZNÁMKA: Tato studie je reprezentativní pro studie provedené v rámci projektu 3 tohoto grantu. Ve svazku experimentů reprezentovaném Projektem 3 je několik experimentů, ale není možné zaregistrovat svazek studií na CT.gov.
POZNÁMKA: Vzhledem k tomu, že komentář se zájmenem je poradní, necháme ho prozatím.
Human-AI Collaboration Tester (HAICT) Exp. 7 (lehce upraveno z OSF)
Sběr dat. Byla již pro tuto studii shromážděna nějaká data? (Ano ne)
Ano
- Hypotéza. Jaká je hlavní otázka nebo hypotéza, která je v této studii testována?
Pozadí: V různých vyhledávacích experimentech, základních i klinických, byla data v souladu se situací, kdy je variabilita signálu (nebo cíle) větší než variabilita šumu (distraktory). Klasickým znakem toho je funkce zROC se sklonem < 1 - typicky kolem 0,6. Směrnice 1,0 je ukazatelem úlohy 2AFC se stejnou variací. U úlohy HAICT, kterou jsme testovali, bychom očekávali stejnou variabilitu, ale myslíme si, že by stálo za to ji zkontrolovat, takže budeme systematicky měnit prevalenci, což posune kritérium. To vynese ROC křivku, kterou můžeme prozkoumat.
Budeme také testovat faux-AI druhého čtenáře, abychom zjistili, zda nízká prevalence druhého čtenáře zhoršuje.
- (H1): Očekáváme, že zopakujeme zjištění, že lidská kritéria se s klesající prevalencí stávají konzervativnějšími.
- (H2): Předpovídáme, že sklon výsledného zROC bude 1,0.
(H3): Předpokládáme, že nízká prevalence způsobí, že AI druhého čtenáře bude méně efektivní, protože pozitivní prediktivní hodnota jejích komentářů bude nízká.
Závislá proměnná. Popište klíčové závislé proměnné a specifikujte, jak budou měřeny.
Hlavními závislými proměnnými, které nás zajímají, jsou přesnost (a derivace přesnosti detekce signálu, d' ac), reakční doba a subjektivní hodnocení v průzkumu po každém bloku.
- Podmínky. Kolik a za jakých podmínek bude účastníkům přiděleno?
Tato série experimentů zkoumá, jak může změna vstupu ze simulované umělé inteligence ovlivnit rozhodnutí učiněná lidskými pozorovateli ve dvou alternativních úkolech nucené volby (jako je rozhodnutí odvolat ženu k dalšímu vyšetření v mamografii). Vyvinuli jsme paradigma zvané Human-AI Collaboration Tester (HAICT), které umožňuje efektivní testování interakcí mezi člověkem a simulovanou AI.
Úkolem pozorovatelů za všech podmínek je rozhodnout 2AFC o tom, zda je podnět „špatný“ nebo „není špatný“. Abychom použili jazyk zhruba napodobující lékařskou diagnózu, každý podnět se nazývá „případ“. Pozorovatelé jsou požádáni, aby učinili rozhodnutí 2AFC o polích barevných tvarů. Rozhodnutí se provádí na základě převládající barvy pouzdra. Počet prvků každé barvy se získá z jednoho ze dvou normálních rozdělení, jedno pro pozitivní (špatné) podněty a druhé pro negativní (ne špatné) podněty.
Výsledky předchozích experimentů HAICT (3 a 4) ukázaly, že lidská výkonnost ve stavu druhého čtenáře významně klesá při nízké prevalenci. Výkon ve stavu druhého čtenáře byl lepší než základní stav, kdy prevalence špatných případů byla 50 %, ale byl výrazně horší než výchozí stav, kdy prevalence byla pouze 10 %. V tomto experimentu manipulujeme s prevalencí „špatných“ případů v podmínkách druhého čtenáře a základního stavu. Budou testovány čtyři různé míry prevalence – 10 %, 33 %, 67 % a 90 %. Pozorovatelé dokončí 8 bloků (2 pravidla AI x 4 míry prevalence) a pořadí bloků je náhodné.
Pravidla AI k testování:
- Základní linie – Žádný vstup AI. Observer klasifikuje každý případ jako „špatný“ nebo „ne“ špatný sám o sobě.
Druhý čtenář – pozorovatel činí prvotní rozhodnutí o každém případu. AI tiše klasifikuje podněty pomocí konzervativního kritéria (c = 0,5). Logika konzervativního kritéria spočívá v tom, že druhý čtenář se používá k omezení falešně pozitivních odpovědí, a proto je zamýšlen ke zpochybňování pozitivních lidských odpovědí, které mohou být okrajové. Pokud se pozorovatel a AI neshodnou, pak AI informuje lidského pozorovatele. Pozorovatel pak dostane šanci buď změnit svou odpověď, nebo se řídit svým prvním názorem.
Stejně jako v experimentech 1-5 je AI d-prime pevně nastaveno na 2,2. Je známo, že zpětná vazba zvyšuje efekt prevalence, takže zpětná vazba bude poskytnuta jak v praxi, tak v testech. Pozorovatelé absolvují 20 cvičných zkoušek a 200 zkušebních zkoušek v každém bloku. Ihned po dokončení každého bloku se pozorovatelům zobrazí souhrn jejich výkonu. Po blocích druhého čtenáře budou také požádáni, aby odpověděli na tři subjektivní otázky o užitečnosti AI (další podrobnosti viz „Soubory“).
Analýzy. Uveďte přesně, které analýzy budete provádět, abyste prozkoumali hlavní otázku/hypotézu.
Nejprve shrneme počet shod, skutečných záporů, chyb a falešných poplachů v každém bloku. Z toho můžeme vypočítat přesnost, pozitivní prediktivní hodnotu, citlivost (d-prime) a kritérium pro každého pozorovatele za každé z různých podmínek. Vzhledem k měření výkonnosti na 4 úrovních prevalence můžeme odhadnout křivku ROC (pHit x pFA) a funkci zROC (zHit x zFA). Budeme testovat hypotézu, že směrnice zROC je rovna 1 (důsledek úlohy 2AFC se stejnou variací).
Více analýz. Nějaké sekundární analýzy?
Podíváme se, zda subjektivní názory pozorovatelů na AI korelují s proměnnými, jako je empirický d-prime nebo pozitivní prediktivní hodnota.
Velikost vzorku. Kolik pozorování bude shromážděno nebo co určí velikost vzorku? Rozhodnutí není třeba zdůvodňovat, ale upřesněte, jak přesně bude číslo určeno.
Vyzkoušíme 12 pozorovatelů. To je v souladu s velikostí vzorků z předchozích experimentů.
- Jiný. Je ještě něco, co byste chtěli předběžně zaregistrovat? (např. vyloučení dat, proměnné shromážděné pro účely průzkumu, plánované neobvyklé analýzy?)
N/A
Typ studie
Zápis (Aktuální)
Fáze
- Nelze použít
Kontakty a umístění
Studijní místa
-
-
Massachusetts
-
Boston, Massachusetts, Spojené státy, 02215
- Visual Attention Lab / Brigham and Women's Hospital
-
-
Kritéria účasti
Kritéria způsobilosti
Věk způsobilý ke studiu
Přijímá zdravé dobrovolníky
Popis
Kritéria pro zařazení:
- - Všichni jsou vítáni k online registraci
Kritéria vyloučení:
- Musí projít testem barevného vidění Ishihara
- 20/25 vidění (s korekcí)
Studijní plán
Jak je studie koncipována?
Detaily designu
- Primární účel: Základní věda
- Přidělení: N/A
- Intervenční model: Přiřazení jedné skupiny
- Maskování: Žádné (otevřený štítek)
Zbraně a zásahy
Skupina účastníků / Arm |
Intervence / Léčba |
|---|---|
|
Experimentální: Experiment
Všichni účastníci jsou testováni ve všech podmínkách tohoto experimentu.
|
V tomto experimentu se za určitých podmínek účastník rozhoduje za přítomnosti informací o simulovaném rozhodnutí umělé inteligence.
Frekvence, s jakou jsou cíle prezentovány, se pohybuje od 10 % do 90 %
Ostatní jména:
|
Co je měření studie?
Primární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
|---|---|---|
|
D'
Časové okno: Data jsou shromažďována během sezení trvajícího přibližně hodinu.
|
D' (d-prime) je míra teorie detekce signálu, která vyjadřuje úroveň výkonu při úloze.
Vypočítá se výpočtem podílu pravdivě pozitivních odpovědí = (pravdivě pozitivní pokusy) / (pravdivě pozitivní + falešně negativní pokusy) = p(TP) a výpočtem podílu falešně pozitivních odpovědí = (falešně pozitivní pokusy) / (falešně pozitivní + pravdivě negativní pokusy) = p(FP).
Tyto hodnoty se transformují na 'z-skóre' (například pomocí funkce NORMSINV v Excelu pro výpočet inverze standardního normálního rozdělení).
D' je definováno jako Z(TP)-Z(FP).
Jeho rozsah je od 0 pro případy, kdy nelze signál odlišit od šumu, až přibližně do 4,0.
Horní hranice není definována, ale hodnota 4 by znamenala, že pozorovatel je v podstatě dokonalý v rozlišování signálu od šumu.
|
Data jsou shromažďována během sezení trvajícího přibližně hodinu.
|
|
Kritérium
Časové okno: Data se shromažďují během sezení trvajícího přibližně hodinu.
|
Kritérium, podobně jako D' (viz výše), se počítá z z(TP) a z(FP).
Kritérium ( c ) = (z(TP)+z(FP))/-2.
Hodnota nula znamená, že pozorovatel je stejně pravděpodobný, že udělá pozitivní (např.
'cíl přítomen') odpověď jako negativní (nepřítomen) odpověď.
Pozitivní hodnoty znamenají, že pozorovatel je pravděpodobnější, že řekne "nepřítomen" ("konzervativní" kritérium).
Negativní hodnoty znamenají, že pozorovatel je pravděpodobnější, že řekne "přítomen" ("liberální" kritérium).
Liberální a konzervativní v tomto případě nemají politické konotace.
Hodnoty kritéria téměř vždy spadají mezi -2 a 2.
|
Data se shromažďují během sezení trvajícího přibližně hodinu.
|
Sekundární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
|---|---|---|
|
Reakční Doba
Časové okno: Data jsou shromažďována během sezení trvajícího přibližně hodinu.
|
Toto je míra toho, jak dlouho trvá vytvoření odpovědi.
|
Data jsou shromažďována během sezení trvajícího přibližně hodinu.
|
Spolupracovníci a vyšetřovatelé
Sponzor
Spolupracovníci
Vyšetřovatelé
- Vrchní vyšetřovatel: Jeremy M Wolfe, PhD, Brigham and Women's Hospital
Termíny studijních záznamů
Hlavní termíny studia
Začátek studia (Aktuální)
Primární dokončení (Aktuální)
Dokončení studie (Aktuální)
Termíny zápisu do studia
První předloženo
První předloženo, které splnilo kritéria kontroly kvality
První zveřejněno (Aktuální)
Aktualizace studijních záznamů
Poslední zveřejněná aktualizace (Aktuální)
Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality
Naposledy ověřeno
Více informací
Termíny související s touto studií
Klíčová slova
Další relevantní podmínky MeSH
Další identifikační čísla studie
- 2007P000646-B
- R01CA207490 (Grant/smlouva NIH USA)
Plán pro data jednotlivých účastníků (IPD)
Plánujete sdílet data jednotlivých účastníků (IPD)?
Popis plánu IPD
Časový rámec sdílení IPD
Kritéria přístupu pro sdílení IPD
Typ podpůrných informací pro sdílení IPD
- PROTOKOL STUDY
- MÍZA
- ICF
Informace o lécích a zařízeních, studijní dokumenty
Studuje lékový produkt regulovaný americkým FDA
Studuje produkt zařízení regulovaný americkým úřadem FDA
Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .