Tato stránka byla automaticky přeložena a přesnost překladu není zaručena. Podívejte se prosím na anglická verze pro zdrojový text.

Vyhodnocení účinnosti a přijatelnosti hlasového chatbota na bázi GPT-4O a Rag pro screening deprese pomocí PHQ-9 (GPT4-RAG-PHQ)

24. ledna 2025 aktualizováno: University College, London

Cílem této studie je posoudit proveditelnost a přijatelnost hlasového chatbotu, poháněného GPT-4O a vyhledáváním generace (RAG), pro provádění deprese screeningu pomocí dotazníku pro zdraví pacienta-9 (PHQ-9). PHQ-9 je validovaný nástroj pro vlastní hlášení, který se široce používá k screeningu, diagnostice a sledování závažnosti deprese. Skládá se z devíti otázek, které odpovídají diagnostickému a statistickému manuálu duševních poruch (DSM-5) pro velkou depresivní poruchu. Respondenti hodnotí frekvenci příznaků za poslední dva týdny na stupnici od 0 („vůbec ne“) do 3 („téměř každý den“). Celkové skóre (v rozmezí od 0 do 27) naznačuje závažnost depresivních symptomů, kategorizovaných do minimálních, mírných, středních, středně závažných nebo závažných deprese. PHQ-9 se také používá k posouzení funkčního poškození a rozhodnutí o léčbě v klinickém a výzkumném prostředí.

Hlasový chatbot integruje GPT-4o s RAG, aby zlepšil jeho schopnost poskytovat informované a kontextové odpovědi během interakcí. GPT-4o slouží jako konverzační motor, který je schopen generovat lidské, empatické a kontextově vhodný dialog. Rag naproti tomu umožňuje Chatbot načíst a začlenit externí, aktuální znalosti z kurátorské databáze nebo úložiště znalostí, což zajišťuje přesnost a spolehlivost jeho odpovědí.

Přehled studie

Detailní popis

Deprese je převládající výzvou duševního zdraví s významnými osobními, sociálními a ekonomickými náklady. Tradiční zdroje duševního zdraví čelí překážkám, jako je stigma, omezená dostupnost a dlouhé čekací doby. Technologie, zejména nástroje poháněné AI, poskytuje příležitost překlenout tyto mezery. Tato studie využívá GPT-4o a Rag k vytvoření hlasového interaktivního chatbota schopného konverzačního zapojení, podávání dotazníku PHQ-9 a poskytování personalizované zpětné vazby.

Účastníci vyplní PHQ-9 pro samoobsluhu před interakcí s chatbotem (výsledky nebudou zveřejněny veřejnosti a budou použity pouze pro srovnání přesnosti) a výsledky jejich samoobslužných testů budou porovnány s výsledky dané chatbotem z hlediska přesnosti.

Interakce Chatbot zahrnuje tři fáze:

  1. Zahřívací rozhovory pro budování vztahů a obecné podpory.

    • Chatbot iniciuje příležitostné empatické dialogy, aby se stavěl vztah s uživateli, což jim pomáhá cítit se pohodlně a v pohodě před přechodem na screening PHQ-9.
    • Uživatelé mohou klást obecné otázky týkající se duševního zdraví a Chatbot poskytuje informované a podpůrné reakce.
  2. Správa dotazníku PHQ-9 pro screening deprese.

    • Chatbot představuje dotazník PHQ-9, vysvětluje svůj účel a jak výsledky pomohou posoudit duševní zdraví uživatele.
    • Prostřednictvím hlasové interakce uživatelé reagují na devět otázek PHQ-9 a Chatbot zaznamenává své odpovědi. Chatbot může objasnit otázky nebo poskytnout další kontext, pokud mají uživatelé potíže s porozuměním konkrétním položkám.
  3. Analýza výsledků a dodání doporučení na míru.

    • Poté, co uživatel dokončí PHQ-9, chatbot analyzuje odpovědi, vypočítá celkové skóre a kategorizuje výsledky na úroveň závažnosti (např. Mírný, střední).
    • Na základě skóre poskytuje chatbot personalizovaná doporučení, jako jsou svépomocné strategie pro mírné příznaky nebo navrhování profesionálních služeb duševního zdraví pro závažnější případy.

Účastníci budou komunikovat s chatbotem a poté se účastní 1hodinového polostrukturovaného rozhovoru, aby poskytli zpětnou vazbu o jejich zkušenostech. Studie se zaměřuje na vyhodnocení přijatelnosti a proveditelnosti použití takových chatbotů založených na LLM při screeningu duševního zdraví a identifikaci potenciálních zlepšení a rizik.

Cíle studia Primární cíle

  1. Zhodnotit přijatelnost, proveditelnost a přesnost hlasového chatbota na bázi GPT-4O a RAG na depresivní screening pomocí PHQ-9.

    Hypotéza: Účastníci prokázali vysoké přijetí Hopebot (vyšší než 65%) a vysokou ochotu používat takový LLM Chatbot pro screening duševního zdraví v budoucnu (vyšší než 65%), což naznačuje uznání důvěryhodnosti LLM jako podpůrného nástroje v Screening duševního zdraví (vyšší než 65%). Účastníci používají Hopebot pro screening deprese jejich výsledky PHQ-9 s vlastním testem o 100%

  2. Analyzovat účinnost chatbota při identifikaci depresivních příznaků a poskytování akčních doporučení.

Hypotéza: Hopebot může uživatelům pomoci provést test PHQ-9 přátelským způsobem, pomoci uživatelům přesně kategorizovat odpovědi a poskytnout přesné výsledky testu, rada, kterou poskytují, je založena na oficiálních pokynech PHQ-9 a více než 70% z Uživatelé tvrdí, že jejich odpovědi jsou velmi efektivní a užitečné.

Sekundární cíle

  1. Posoudit proveditelnost a výkon integrace RAG s LLM při vytváření hlasového interaktivního chatbota pro duševní zdraví.

    Hypotéza: Více než 65% účastníků uznalo, že odpovědi používající RAG byly užitečnější a účinnější.

  2. Chcete -li prozkoumat silné stránky, omezení a rizika nasazení LLM v doméně duševního zdraví.

Hypotéza: Více než 65% uživatelů tvrdí, že Hopebot je velmi pohodlný, přístupnější a bezplatnější, aby poskytoval nesoudní rady. 50% však stále vyjádřilo obavy ohledně jejího soukromí a zabezpečení dat.

Typ studie

Pozorovací

Zápis (Odhadovaný)

100

Kontakty a umístění

Tato část poskytuje kontaktní údaje pro ty, kteří studii provádějí, a informace o tom, kde se tato studie provádí.

Studijní místa

Kritéria účasti

Výzkumníci hledají lidi, kteří odpovídají určitému popisu, kterému se říká kritéria způsobilosti. Některé příklady těchto kritérií jsou celkový zdravotní stav osoby nebo předchozí léčba.

Kritéria způsobilosti

Věk způsobilý ke studiu

  • Dospělý
  • Starší dospělý

Přijímá zdravé dobrovolníky

Ano

Metoda odběru vzorků

Vzorek nepravděpodobnosti

Studijní populace

Populace studie se skládá ze zdravých jedinců ve věku 18 až 65 let, kteří nemají závažné duševní onemocnění. Vítáme účastníky, kteří mají zájem o technologie umělé inteligence. Nábor bude prováděn online i offline.

Účastníci se zapojí do sofistikovaného AI chatbota určeného k simulaci konzultace s odborníkem na duševní zdraví. Tato interakce jim umožňuje dokončit psychometrické hodnocení, jako je test PHQ-9, strukturovaným, ale konverzačním způsobem. Na rozdíl od konvenčních online verzí testu PHQ-9 nabízí Chatbot zvýšenou interaktivitu. Pro jednotlivce, kteří mohou mít potíže s artikulací nebo shrnutí jejich odpovědí, poskytuje chatbot objasnění a pomoc pomocí komplexního jazykového modelu.

Po posouzení dostanou účastníci interpretaci svých výsledků testů spolu s radami na míru, doručené v souladu se zavedenými pokyny pro duševní zdraví.

Popis

Kritéria pro zařazení:

  • Dospělí ve věku 18–65 let.
  • Plynně v angličtině.
  • Přístup k zařízení schopnému interakce hlasu a stabilní připojení k internetu.
  • Ochota se účastnit interakce chatbot a následného rozhovoru.

Kritéria pro vyloučení:

  • Současné těžké psychiatrické diagnózy (např. Psychóza, bipolární porucha).
  • Účastníci podstupují aktivní léčbu deprese s psychiatrem.
  • Nepohodlí s hlasovou technologií nebo neschopností poskytnout informovaný souhlas.

Studijní plán

Tato část poskytuje podrobnosti o studijním plánu, včetně toho, jak je studie navržena a co studie měří.

Jak je studie koncipována?

Detaily designu

Co je měření studie?

Primární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Proveditelnost a přijatelnost GPT-4O a Rag Voice Chatbot
Časové okno: Rozhovory se provádějí bezprostředně po interakci Chatbot.
Vnímání proveditelnosti, přijatelnosti a účinnosti účastníků se hodnotí prostřednictvím polostrukturovaných rozhovorů prováděných po interakční relaci. Tyto rozhovory zkoumají témata, jako je empatie chatbot, použitelnost a celkový uživatelský zážitek.
Rozhovory se provádějí bezprostředně po interakci Chatbot.

Sekundární výstupní opatření

Měření výsledku
Popis opatření
Časové okno
Přesnost skóre PHQ-9 Chatbotem
Časové okno: Měřeno ihned po interakční relaci, jakmile Chatbot vygeneroval skóre PHQ-9
Přesnost skóre PHQ-9 generovaných chatbotem se měří porovnáním výsledků chatbota s vlastními skóre PHQ-9 účastníků shromážděných před interakcí. Smlouva bude posouzena pomocí statistických metod, jako je Cohenův kappa nebo korelační koeficient intraclass (ICC).
Měřeno ihned po interakční relaci, jakmile Chatbot vygeneroval skóre PHQ-9

Spolupracovníci a vyšetřovatelé

Zde najdete lidi a organizace zapojené do této studie.

Vyšetřovatelé

  • Ředitel studie: Kezhi Li, University College, London

Termíny studijních záznamů

Tato data sledují průběh záznamů studie a předkládání souhrnných výsledků na ClinicalTrials.gov. Záznamy ze studií a hlášené výsledky jsou před zveřejněním na veřejné webové stránce přezkoumány Národní lékařskou knihovnou (NLM), aby se ujistily, že splňují specifické standardy kontroly kvality.

Hlavní termíny studia

Začátek studia (Odhadovaný)

1. února 2025

Primární dokončení (Odhadovaný)

31. března 2025

Dokončení studie (Odhadovaný)

31. května 2025

Termíny zápisu do studia

První předloženo

24. ledna 2025

První předloženo, které splnilo kritéria kontroly kvality

24. ledna 2025

První zveřejněno (Aktuální)

25. března 2025

Aktualizace studijních záznamů

Poslední zveřejněná aktualizace (Aktuální)

25. března 2025

Odeslaná poslední aktualizace, která splnila kritéria kontroly kvality

24. ledna 2025

Naposledy ověřeno

1. ledna 2025

Více informací

Termíny související s touto studií

Další identifikační čísla studie

  • 26133.001 (Jiný identifikátor: UCL Research Ethics Committee)

Plán pro data jednotlivých účastníků (IPD)

Plánujete sdílet data jednotlivých účastníků (IPD)?

NE

Popis plánu IPD

IPD nebude sdílena, aby zajistila důvěrnost účastníka a dodržovala etické pokyny týkající se výzkumu duševního zdraví. Účastníci navíc neposkytli výslovný souhlas pro sdílení dat s externími vědci.

Informace o lécích a zařízeních, studijní dokumenty

Studuje lékový produkt regulovaný americkým FDA

Ne

Studuje produkt zařízení regulovaný americkým úřadem FDA

Ne

Tyto informace byly beze změn načteny přímo z webu clinicaltrials.gov. Máte-li jakékoli požadavky na změnu, odstranění nebo aktualizaci podrobností studie, kontaktujte prosím register@clinicaltrials.gov. Jakmile bude změna implementována na clinicaltrials.gov, bude automaticky aktualizována i na našem webu .

Předplatit