- ICH GCP
- Registr klinických studií v USA
- Klinická studie NCT06801925
Vyhodnocení účinnosti a přijatelnosti hlasového chatbota na bázi GPT-4O a Rag pro screening deprese pomocí PHQ-9 (GPT4-RAG-PHQ)
Cílem této studie je posoudit proveditelnost a přijatelnost hlasového chatbotu, poháněného GPT-4O a vyhledáváním generace (RAG), pro provádění deprese screeningu pomocí dotazníku pro zdraví pacienta-9 (PHQ-9). PHQ-9 je validovaný nástroj pro vlastní hlášení, který se široce používá k screeningu, diagnostice a sledování závažnosti deprese. Skládá se z devíti otázek, které odpovídají diagnostickému a statistickému manuálu duševních poruch (DSM-5) pro velkou depresivní poruchu. Respondenti hodnotí frekvenci příznaků za poslední dva týdny na stupnici od 0 („vůbec ne“) do 3 („téměř každý den“). Celkové skóre (v rozmezí od 0 do 27) naznačuje závažnost depresivních symptomů, kategorizovaných do minimálních, mírných, středních, středně závažných nebo závažných deprese. PHQ-9 se také používá k posouzení funkčního poškození a rozhodnutí o léčbě v klinickém a výzkumném prostředí.
Hlasový chatbot integruje GPT-4o s RAG, aby zlepšil jeho schopnost poskytovat informované a kontextové odpovědi během interakcí. GPT-4o slouží jako konverzační motor, který je schopen generovat lidské, empatické a kontextově vhodný dialog. Rag naproti tomu umožňuje Chatbot načíst a začlenit externí, aktuální znalosti z kurátorské databáze nebo úložiště znalostí, což zajišťuje přesnost a spolehlivost jeho odpovědí.
Přehled studie
Postavení
Intervence / Léčba
Detailní popis
Deprese je převládající výzvou duševního zdraví s významnými osobními, sociálními a ekonomickými náklady. Tradiční zdroje duševního zdraví čelí překážkám, jako je stigma, omezená dostupnost a dlouhé čekací doby. Technologie, zejména nástroje poháněné AI, poskytuje příležitost překlenout tyto mezery. Tato studie využívá GPT-4o a Rag k vytvoření hlasového interaktivního chatbota schopného konverzačního zapojení, podávání dotazníku PHQ-9 a poskytování personalizované zpětné vazby.
Účastníci vyplní PHQ-9 pro samoobsluhu před interakcí s chatbotem (výsledky nebudou zveřejněny veřejnosti a budou použity pouze pro srovnání přesnosti) a výsledky jejich samoobslužných testů budou porovnány s výsledky dané chatbotem z hlediska přesnosti.
Interakce Chatbot zahrnuje tři fáze:
Zahřívací rozhovory pro budování vztahů a obecné podpory.
- Chatbot iniciuje příležitostné empatické dialogy, aby se stavěl vztah s uživateli, což jim pomáhá cítit se pohodlně a v pohodě před přechodem na screening PHQ-9.
- Uživatelé mohou klást obecné otázky týkající se duševního zdraví a Chatbot poskytuje informované a podpůrné reakce.
Správa dotazníku PHQ-9 pro screening deprese.
- Chatbot představuje dotazník PHQ-9, vysvětluje svůj účel a jak výsledky pomohou posoudit duševní zdraví uživatele.
- Prostřednictvím hlasové interakce uživatelé reagují na devět otázek PHQ-9 a Chatbot zaznamenává své odpovědi. Chatbot může objasnit otázky nebo poskytnout další kontext, pokud mají uživatelé potíže s porozuměním konkrétním položkám.
Analýza výsledků a dodání doporučení na míru.
- Poté, co uživatel dokončí PHQ-9, chatbot analyzuje odpovědi, vypočítá celkové skóre a kategorizuje výsledky na úroveň závažnosti (např. Mírný, střední).
- Na základě skóre poskytuje chatbot personalizovaná doporučení, jako jsou svépomocné strategie pro mírné příznaky nebo navrhování profesionálních služeb duševního zdraví pro závažnější případy.
Účastníci budou komunikovat s chatbotem a poté se účastní 1hodinového polostrukturovaného rozhovoru, aby poskytli zpětnou vazbu o jejich zkušenostech. Studie se zaměřuje na vyhodnocení přijatelnosti a proveditelnosti použití takových chatbotů založených na LLM při screeningu duševního zdraví a identifikaci potenciálních zlepšení a rizik.
Cíle studia Primární cíle
Zhodnotit přijatelnost, proveditelnost a přesnost hlasového chatbota na bázi GPT-4O a RAG na depresivní screening pomocí PHQ-9.
Hypotéza: Účastníci prokázali vysoké přijetí Hopebot (vyšší než 65%) a vysokou ochotu používat takový LLM Chatbot pro screening duševního zdraví v budoucnu (vyšší než 65%), což naznačuje uznání důvěryhodnosti LLM jako podpůrného nástroje v Screening duševního zdraví (vyšší než 65%). Účastníci používají Hopebot pro screening deprese jejich výsledky PHQ-9 s vlastním testem o 100%
- Analyzovat účinnost chatbota při identifikaci depresivních příznaků a poskytování akčních doporučení.
Hypotéza: Hopebot může uživatelům pomoci provést test PHQ-9 přátelským způsobem, pomoci uživatelům přesně kategorizovat odpovědi a poskytnout přesné výsledky testu, rada, kterou poskytují, je založena na oficiálních pokynech PHQ-9 a více než 70% z Uživatelé tvrdí, že jejich odpovědi jsou velmi efektivní a užitečné.
Sekundární cíle
Posoudit proveditelnost a výkon integrace RAG s LLM při vytváření hlasového interaktivního chatbota pro duševní zdraví.
Hypotéza: Více než 65% účastníků uznalo, že odpovědi používající RAG byly užitečnější a účinnější.
- Chcete -li prozkoumat silné stránky, omezení a rizika nasazení LLM v doméně duševního zdraví.
Hypotéza: Více než 65% uživatelů tvrdí, že Hopebot je velmi pohodlný, přístupnější a bezplatnější, aby poskytoval nesoudní rady. 50% však stále vyjádřilo obavy ohledně jejího soukromí a zabezpečení dat.
Typ studie
Zápis (Odhadovaný)
Kontakty a umístění
Studijní místa
-
-
-
London, Spojené království, NW1 2DA
- UCL Institute of Health Informatics
-
-
Kritéria účasti
Kritéria způsobilosti
Věk způsobilý ke studiu
- Dospělý
- Starší dospělý
Přijímá zdravé dobrovolníky
Metoda odběru vzorků
Studijní populace
Populace studie se skládá ze zdravých jedinců ve věku 18 až 65 let, kteří nemají závažné duševní onemocnění. Vítáme účastníky, kteří mají zájem o technologie umělé inteligence. Nábor bude prováděn online i offline.
Účastníci se zapojí do sofistikovaného AI chatbota určeného k simulaci konzultace s odborníkem na duševní zdraví. Tato interakce jim umožňuje dokončit psychometrické hodnocení, jako je test PHQ-9, strukturovaným, ale konverzačním způsobem. Na rozdíl od konvenčních online verzí testu PHQ-9 nabízí Chatbot zvýšenou interaktivitu. Pro jednotlivce, kteří mohou mít potíže s artikulací nebo shrnutí jejich odpovědí, poskytuje chatbot objasnění a pomoc pomocí komplexního jazykového modelu.
Po posouzení dostanou účastníci interpretaci svých výsledků testů spolu s radami na míru, doručené v souladu se zavedenými pokyny pro duševní zdraví.
Popis
Kritéria pro zařazení:
- Dospělí ve věku 18–65 let.
- Plynně v angličtině.
- Přístup k zařízení schopnému interakce hlasu a stabilní připojení k internetu.
- Ochota se účastnit interakce chatbot a následného rozhovoru.
Kritéria pro vyloučení:
- Současné těžké psychiatrické diagnózy (např. Psychóza, bipolární porucha).
- Účastníci podstupují aktivní léčbu deprese s psychiatrem.
- Nepohodlí s hlasovou technologií nebo neschopností poskytnout informovaný souhlas.
Studijní plán
Jak je studie koncipována?
Detaily designu
Co je měření studie?
Primární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
|---|---|---|
|
Proveditelnost a přijatelnost GPT-4O a Rag Voice Chatbot
Časové okno: Rozhovory se provádějí bezprostředně po interakci Chatbot.
|
Vnímání proveditelnosti, přijatelnosti a účinnosti účastníků se hodnotí prostřednictvím polostrukturovaných rozhovorů prováděných po interakční relaci.
Tyto rozhovory zkoumají témata, jako je empatie chatbot, použitelnost a celkový uživatelský zážitek.
|
Rozhovory se provádějí bezprostředně po interakci Chatbot.
|
Sekundární výstupní opatření
Měření výsledku |
Popis opatření |
Časové okno |
|---|---|---|
|
Přesnost skóre PHQ-9 Chatbotem
Časové okno: Měřeno ihned po interakční relaci, jakmile Chatbot vygeneroval skóre PHQ-9
|
Přesnost skóre PHQ-9 generovaných chatbotem se měří porovnáním výsledků chatbota s vlastními skóre PHQ-9 účastníků shromážděných před interakcí.
Smlouva bude posouzena pomocí statistických metod, jako je Cohenův kappa nebo korelační koeficient intraclass (ICC).
|
Měřeno ihned po interakční relaci, jakmile Chatbot vygeneroval skóre PHQ-9
|
Spolupracovníci a vyšetřovatelé
Sponzor
Vyšetřovatelé
- Ředitel studie: Kezhi Li, University College, London
Termíny studijních záznamů
Hlavní termíny studia
Začátek studia (Odhadovaný)
Primární dokončení (Odhadovaný)
Dokončení studie (Odhadovaný)
Termíny zápisu do studia
První předloženo
První předloženo, které splnilo kritéria kontroly kvality
První zveřejněno (Aktuální)
Aktualizace studijních záznamů
Poslední zveřejněná aktualizace (Aktuální)
Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality
Naposledy ověřeno
Více informací
Termíny související s touto studií
Další relevantní podmínky MeSH
Další identifikační čísla studie
- 26133.001 (Jiný identifikátor: UCL Research Ethics Committee)
Plán pro data jednotlivých účastníků (IPD)
Plánujete sdílet data jednotlivých účastníků (IPD)?
Popis plánu IPD
Informace o lécích a zařízeních, studijní dokumenty
Studuje lékový produkt regulovaný americkým FDA
Studuje produkt zařízení regulovaný americkým úřadem FDA
Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .