Denne side blev automatisk oversat, og nøjagtigheden af ​​oversættelsen er ikke garanteret. Der henvises til engelsk version for en kildetekst.

Evaluering af effektiviteten og acceptabiliteten af ​​en GPT-4O og ragbaseret stemme chatbot til depression screening ved hjælp af PHQ-9 (GPT4-RAG-PHQ)

24. januar 2025 opdateret af: University College, London

Denne undersøgelse sigter mod at vurdere gennemførligheden og acceptabiliteten af ​​en stemmebaseret chatbot, drevet af GPT-4O og hentning-augmenteret generation (RAG), til udførelse af depression screening ved hjælp af patientens sundhedsspørgeskema-9 (PHQ-9). PHQ-9 er et valideret selvrapportinstrument, der i vid udstrækning bruges til at screene, diagnosticere og overvåge sværhedsgraden af ​​depression. Det består af ni spørgsmål, der svarer til den diagnostiske og statistiske manual for psykiske lidelser (DSM-5) kriterier for større depressiv lidelse. Respondenterne vurderer hyppigheden af ​​symptomer, der opleves i løbet af de sidste to uger på en skala fra 0 ("slet ikke") til 3 ("næsten hver dag"). Den samlede score (fra 0 til 27) indikerer sværhedsgraden af ​​depressive symptomer, kategoriseret i minimal, mild, moderat, moderat svær eller svær depression. PHQ-9 bruges også til at vurdere funktionsnedsættelse og vejlede behandlingsbeslutninger i kliniske og forskningsindstillinger.

Den stemmebaserede chatbot integrerer GPT-4O med RAG for at forbedre sin evne til at give informerede og kontekstualiserede svar under interaktioner. GPT-4O fungerer som samtalemotoren, der er i stand til at generere menneskelignende, empatisk og kontekst passende dialog. Rag på den anden side gør det muligt for Chatbot at hente og inkorporere ekstern, ajourført viden fra en kurateret database eller videnopbevaring, hvilket sikrer nøjagtigheden og pålideligheden af ​​dens svar.

Studieoversigt

Detaljeret beskrivelse

Depression er en udbredt mental sundhedsudfordring med betydelige personlige, sociale og økonomiske omkostninger. Traditionelle mentale sundhedsressourcer står over for barrierer såsom stigma, begrænset tilgængelighed og lange ventetider. Teknologi, især AI-drevne værktøjer, giver en mulighed for at bygge bro over disse huller. Denne undersøgelse bruger GPT-4O og RAG til at skabe en stemme-interaktiv chatbot, der er i stand til samtaleengagement, administration af PHQ-9-spørgeskemaet og levering af personlig feedback.

Deltagerne udfylder PHQ-9 til selvtestning, før de interagerer med chatboten (resultaterne vil ikke blive videregivet til offentligheden og vil kun blive brugt til nøjagtighedssammenligninger), og resultaterne af deres selvtest vil blive sammenlignet med Resultater givet af chatboten med hensyn til nøjagtighed.

Chatbot -interaktionen omfatter tre faser:

  1. Opvarmningssamtaler til rapportopbygning og generel støtte.

    • Chatboten indleder afslappede, empatiske dialoger til at opbygge rapport med brugere, hjælpe dem med at føle sig godt tilpas og let, før de overgår til PHQ-9-screeningen.
    • Brugere kan stille generelle spørgsmål relateret til mental sundhed, og Chatbot giver informerede og støttende svar.
  2. Administration af PHQ-9-spørgeskemaet til screening af depression.

    • Chatbot introducerer PHQ-9-spørgeskemaet, der forklarer dets formål, og hvordan resultaterne vil hjælpe med at vurdere brugerens mentale sundhed.
    • Gennem stemmeinteraktion svarer brugerne på de ni PHQ-9-spørgsmål, og Chatbot registrerer deres svar. Chatboten kan afklare spørgsmål eller give yderligere kontekst, hvis brugerne har svært ved at forstå specifikke genstande.
  3. Analyse af resultater og levering af skræddersyede anbefalinger.

    • Når brugeren er afsluttet PHQ-9, analyserer chatbotene svarene, beregner den samlede score og kategoriserer resultaterne i sværhedsgraden (f.eks. Mild, moderat).
    • Baseret på scoringen giver Chatbot personlige anbefalinger, såsom selvhjælpsstrategier for milde symptomer eller foreslår professionelle mentale sundhedsydelser til mere alvorlige tilfælde.

Deltagerne vil interagere med Chatbot og derefter deltage i et 1-timers semistruktureret interview for at give feedback om deres oplevelse. Undersøgelsen fokuserer på at evaluere acceptabiliteten og gennemførligheden af ​​at bruge sådanne LLM-baserede chatbots i screening af mental sundhed og identificere potentielle forbedringer og risici.

Undersøgelsesmål Primære mål

  1. For at evaluere acceptabiliteten, gennemførligheden og nøjagtigheden af ​​en GPT-4O og RAG-baseret stemme Chatbot (HOPEBOT) til depressionsscreening ved hjælp af PHQ-9.

    Hypotese: Deltagerne viste stor accept af HopeBot (højere end 65%) og høj vilje til at bruge en sådan LLM-baseret chatbot til mental sundhedsscreening i fremtiden (højere end 65%), hvilket indikerer anerkendelse af troværdigheden af ​​LLM som et understøttende værktøj i værktøjet i Screening af mental sundhed (højere end 65%). Deltagerne Brug af hopebot til depressionsscreening matchede deres selvtest PHQ-9-resultater med 100%

  2. At analysere chatbotens effektivitet til at identificere depressive symptomer og levere handlingsmæssige anbefalinger.

Hypotese: HopeBot kan hjælpe brugerne med at tage PHQ-9-testen på en venlig måde, hjælpe brugerne med at kategorisere svarene nøjagtigt og give nøjagtige testresultater, det råd, de giver, er baseret på de officielle PHQ-9-retningslinjer og mere end 70% af Brugere siger, at deres svar er meget effektive og hjælpsomme.

Sekundære mål

  1. At vurdere muligheden og ydeevnen ved at integrere RAG med LLM i at skabe en stemme-interaktiv chatbot for mental sundhed.

    Hypotese: Over 65% af deltagerne anerkendte, at svarene ved hjælp af RAG var mere nyttige og effektive.

  2. At udforske styrker, begrænsninger og risici ved at implementere LLM'er inden for det mentale sundhedsdomæne.

Hypotese: Mere end 65% af brugerne siger, at HopeBot er meget praktisk, mere tilgængelig og omkostningsfri til at give ikke-dømmende rådgivning. 50% udtrykte dog stadig bekymring for dets privatliv og datasikkerhed.

Undersøgelsestype

Observationel

Tilmelding (Anslået)

100

Kontakter og lokationer

Dette afsnit indeholder kontaktoplysninger for dem, der udfører undersøgelsen, og oplysninger om, hvor denne undersøgelse udføres.

Studiesteder

Deltagelseskriterier

Forskere leder efter personer, der passer til en bestemt beskrivelse, kaldet berettigelseskriterier. Nogle eksempler på disse kriterier er en persons generelle helbredstilstand eller tidligere behandlinger.

Berettigelseskriterier

Aldre berettiget til at studere

  • Voksen
  • Ældre voksen

Tager imod sunde frivillige

Ja

Prøveudtagningsmetode

Ikke-sandsynlighedsprøve

Studiebefolkning

Undersøgelsespopulationen består af raske individer i alderen 18 til 65 år, der ikke har alvorlige psykiske sygdomme. Vi byder deltagere velkommen, der har interesse i kunstige intelligensteknologier. Rekruttering gennemføres både online og offline.

Deltagerne vil engagere sig i en sofistikeret AI -chatbot designet til at simulere en konsultation med en mental sundhedsperson. Denne interaktion gør det muligt for dem at gennemføre en psykometrisk evaluering, såsom PHQ-9-testen, på en struktureret, men alligevel samtale. I modsætning til konventionelle online versioner af PHQ-9-testen tilbyder chatboten forbedret interaktivitet. For personer, der kan opleve vanskeligheder med at formulere eller opsummere deres svar, giver Chatbot afklaringer og hjælp ved hjælp af en omfattende sprogmodel.

Efter vurderingen vil deltagerne modtage en fortolkning af deres testresultater sammen med skræddersyet rådgivning, leveret i overensstemmelse med etablerede retningslinjer for mental sundhed.

Beskrivelse

Inkluderingskriterier:

  • Voksne i alderen 18-65 år.
  • Flydende på engelsk.
  • Adgang til en enhed, der er i stand til stemmeinteraktion og stabil internetforbindelse.
  • Villig til at deltage i Chatbot-interaktion og en opfølgende samtale.

Ekskluderingskriterier:

  • Aktuelle alvorlige psykiatriske diagnoser (f.eks. Psykose, bipolar lidelse).
  • Deltagere, der gennemgår aktiv behandling af depression med en psykiater.
  • Ubehag med stemmebaseret teknologi eller manglende evne til at give informeret samtykke.

Studieplan

Dette afsnit indeholder detaljer om studieplanen, herunder hvordan undersøgelsen er designet, og hvad undersøgelsen måler.

Hvordan er undersøgelsen tilrettelagt?

Design detaljer

Hvad måler undersøgelsen?

Primære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Feasibility and Acceptability of the GPT-4O og Rag Voice Chatbot
Tidsramme: Interviews gennemføres umiddelbart efter chatbot -interaktionen.
Deltagernes opfattelse af chatbotens gennemførlighed, acceptabilitet og effektivitet vurderes gennem semistrukturerede interviews, der blev gennemført efter interaktionssessionen. Disse interviews udforsker temaer som Chatbots empati, brugervenlighed og den samlede brugeroplevelse.
Interviews gennemføres umiddelbart efter chatbot -interaktionen.

Sekundære resultatmål

Resultatmål
Foranstaltningsbeskrivelse
Tidsramme
Nøjagtighed af PHQ-9-scoringer af Chatbot
Tidsramme: Målt umiddelbart efter interaktionssessionen, når Chatbot har genereret PHQ-9-scoringer
Nøjagtigheden af ​​PHQ-9-scoringer genereret af Chatbot måles ved at sammenligne Chatbots resultater med deltagernes selvrapporterede PHQ-9-scoringer indsamlet før interaktionen. Aftalen vil blive vurderet ved hjælp af statistiske metoder såsom Cohens kappa eller intraklas korrelationskoefficient (ICC).
Målt umiddelbart efter interaktionssessionen, når Chatbot har genereret PHQ-9-scoringer

Samarbejdspartnere og efterforskere

Det er her, du vil finde personer og organisationer, der er involveret i denne undersøgelse.

Efterforskere

  • Studieleder: Kezhi Li, University College, London

Datoer for undersøgelser

Disse datoer sporer fremskridtene for indsendelser af undersøgelsesrekord og resumeresultater til ClinicalTrials.gov. Studieregistreringer og rapporterede resultater gennemgås af National Library of Medicine (NLM) for at sikre, at de opfylder specifikke kvalitetskontrolstandarder, før de offentliggøres på den offentlige hjemmeside.

Studer store datoer

Studiestart (Anslået)

1. februar 2025

Primær færdiggørelse (Anslået)

31. marts 2025

Studieafslutning (Anslået)

31. maj 2025

Datoer for studieregistrering

Først indsendt

24. januar 2025

Først indsendt, der opfyldte QC-kriterier

24. januar 2025

Først opslået (Faktiske)

25. marts 2025

Opdateringer af undersøgelsesjournaler

Sidste opdatering sendt (Faktiske)

25. marts 2025

Sidste opdatering indsendt, der opfyldte kvalitetskontrolkriterier

24. januar 2025

Sidst verificeret

1. januar 2025

Mere information

Begreber relateret til denne undersøgelse

Andre undersøgelses-id-numre

  • 26133.001 (Anden identifikator: UCL Research Ethics Committee)

Plan for individuelle deltagerdata (IPD)

Planlægger du at dele individuelle deltagerdata (IPD)?

INGEN

IPD-planbeskrivelse

IPD deles ikke for at sikre deltagerens fortrolighed og overholde etiske retningslinjer relateret til mental sundhedsforskning. Derudover gav deltagerne ikke eksplicit samtykke til datadeling med eksterne forskere.

Lægemiddel- og udstyrsoplysninger, undersøgelsesdokumenter

Studerer et amerikansk FDA-reguleret lægemiddelprodukt

Ingen

Studerer et amerikansk FDA-reguleret enhedsprodukt

Ingen

Disse oplysninger blev hentet direkte fra webstedet clinicaltrials.gov uden ændringer. Hvis du har nogen anmodninger om at ændre, fjerne eller opdatere dine undersøgelsesoplysninger, bedes du kontakte register@clinicaltrials.gov. Så snart en ændring er implementeret på clinicaltrials.gov, vil denne også blive opdateret automatisk på vores hjemmeside .

Kliniske forsøg med Depression Angstlidelse

Abonner