이 페이지는 자동 번역되었으며 번역의 정확성을 보장하지 않습니다. 참조하십시오 영문판 원본 텍스트의 경우.

신경과 응급 환자 분류를 위한 인공 지능 기반 가상 도우미 (AIDEN)

2024년 3월 21일 업데이트: Mauricio F. Farez, Fundación para la Lucha contra las Enfermedades Neurológicas de la Infancia

신경학 응급 분류를 위한 인공 지능 기반 가상 보조 구현의 1단계 시험

이 연구는 특히 의료 자원이 제한된 장소에서 신경학적 응급 상황을 신속하게 식별하고 처리하기 위해 AI 기반 가상 비서를 사용하는 방법을 조사합니다. 연구의 목표는 이 AI 도구가 고급 테스트 단계로 넘어갈 만큼 안전하고 정확한지 확인하는 것이었습니다. 최초의 시험에서 가상 비서는 긴급한 신경학적 문제가 있는 환자를 대상으로 테스트되었습니다. 신경과 전문의는 먼저 임상 기록을 사용하여 AI의 권장 사항을 검토한 다음 환자와 직접 성능을 평가했습니다. 연구 결과는 다음과 같습니다. 신경과 의사들은 거의 항상 AI의 결정에 동의했으며 AI는 테스트된 모든 측면에서 이전 버전의 Chat GPT보다 성능이 뛰어났습니다. 환자와 의사는 AI가 매우 효과적이라는 것을 확인했으며 대부분의 경우 AI를 우수 또는 매우 좋음으로 평가했습니다. 이는 AI가 신경학적 응급 상황을 얼마나 빠르고 정확하게 처리하는지를 크게 향상시킬 수 있음을 시사하지만, 널리 사용되기 전에는 추가 시험이 필요합니다.

연구 개요

상세 설명

배경 및 목적: 신경학적 응급 상황은 특히 자원이 제한된 국가에서 의료에 심각한 문제를 야기합니다. 인공지능(AI), 특히 건강 챗봇은 유망한 솔루션을 제공합니다. 그러나 안전성과 정확성을 보장하려면 엄격한 검증이 필요합니다. 우리 작업의 목적은 응급 신경병리학 분류를 위해 설계된 AI 기반 가상 비서의 진단 정확성과 해결 효과를 평가하여 연속적인 검증 테스트를 진행할 수 있는 최소 안전 표준을 보장하는 것입니다.

방법: 이 1단계 시험에서는 응급 신경학적 분류를 위한 AI 기반 가상 보조자의 성능을 평가합니다. 긴급한 신경학적 병리가 있는 18세 이상의 환자 10명을 선정하였다. 첫 번째 단계에서는 9명의 신경과 전문의가 임상 기록을 바탕으로 가상 비서의 안전성을 평가했습니다. 두 번째 부분에서는 환자가 보조자를 사용할 때 보조자의 정확성을 평가했습니다. 마지막으로 Chat GPT 3.5 및 4와 성능을 비교했습니다.

연구 유형

중재적

등록 (실제)

10

단계

  • 초기 1단계

연락처 및 위치

이 섹션에서는 연구를 수행하는 사람들의 연락처 정보와 이 연구가 수행되는 장소에 대한 정보를 제공합니다.

연구 장소

참여기준

연구원은 적격성 기준이라는 특정 설명에 맞는 사람을 찾습니다. 이러한 기준의 몇 가지 예는 개인의 일반적인 건강 상태 또는 이전 치료입니다.

자격 기준

공부할 수 있는 나이

  • 성인
  • 고령자

건강한 자원 봉사자를 받아들입니다

아니

설명

포함 기준:

  • 신경학적 응급 상황으로 인해 응급실에서 상담 중인 18세 이상의 환자

제외 기준:

  • 임신

공부 계획

이 섹션에서는 연구 설계 방법과 연구가 측정하는 내용을 포함하여 연구 계획에 대한 세부 정보를 제공합니다.

연구는 어떻게 설계됩니까?

디자인 세부사항

  • 주 목적: 특수 증상
  • 할당: 무작위화되지 않음
  • 중재 모델: 단일 그룹 할당
  • 마스킹: 없음(오픈 라벨)

무기와 개입

참가자 그룹 / 팔
개입 / 치료
실험적: 가상 비서
환자는 최근 응급실 방문에 대해 가상 비서와 함께 질문에 답합니다.
1단계에서는 안전에 중점을 두고 임상 기록의 의료 정보만을 가상 보조원에게 활용했습니다. 정확성을 평가한 2단계에서 참가자들은 의료 후 안정화 가상 보조자와 상호 작용했습니다. 또한 참가자들은 Chat-GPT 입력에 대한 초기 증상 세부 정보도 제공했습니다. 이번 연구에는 응급상황을 전문으로 하는 신경과 전문의 9명이 참여했다. 1단계에서는 임상 이력 정보를 활용하여 가상 비서의 성능을 평가했습니다. 2단계에서는 참가자와 보조자의 상호 작용 결과를 분석하고 Chat-GPT의 비교 평가를 수행했습니다. 가상 비서는 스페인어를 사용하고 고급 알고리즘, 의사 결정 트리 및 상호 작용을 위한 대규모 언어 모델을 통합하여 WhatsApp 및 Telegram에서 챗봇으로 작동했습니다. 비교를 위해 Chat-GPT 버전 3.5와 4를 활용하여 자연스러운 스페인어로 두 가지 프롬프트 유형을 사용했습니다. 하나는 임상 기록 데이터를 통합하고 다른 하나는 참가자 내러티브를 기반으로 합니다.
활성 비교기: 채팅GPT 3.5
환자는 최근 응급실 방문에 대한 질문에 ChatGPT로 답변합니다.
1단계에서는 안전에 중점을 두고 임상 기록의 의료 정보만을 가상 보조원에게 활용했습니다. 정확성을 평가한 2단계에서 참가자들은 의료 후 안정화 가상 보조자와 상호 작용했습니다. 또한 참가자들은 Chat-GPT 입력에 대한 초기 증상 세부 정보도 제공했습니다. 이번 연구에는 응급상황을 전문으로 하는 신경과 전문의 9명이 참여했다. 1단계에서는 임상 이력 정보를 활용하여 가상 비서의 성능을 평가했습니다. 2단계에서는 참가자와 보조자의 상호 작용 결과를 분석하고 Chat-GPT의 비교 평가를 수행했습니다. 가상 비서는 스페인어를 사용하고 고급 알고리즘, 의사 결정 트리 및 상호 작용을 위한 대규모 언어 모델을 통합하여 WhatsApp 및 Telegram에서 챗봇으로 작동했습니다. 비교를 위해 Chat-GPT 버전 3.5와 4를 활용하여 자연스러운 스페인어로 두 가지 프롬프트 유형을 사용했습니다. 하나는 임상 기록 데이터를 통합하고 다른 하나는 참가자 내러티브를 기반으로 합니다.
활성 비교기: 채팅GPT 4
환자는 최근 응급실 방문에 대한 질문에 ChatGPT로 답변합니다.
1단계에서는 안전에 중점을 두고 임상 기록의 의료 정보만을 가상 보조원에게 활용했습니다. 정확성을 평가한 2단계에서 참가자들은 의료 후 안정화 가상 보조자와 상호 작용했습니다. 또한 참가자들은 Chat-GPT 입력에 대한 초기 증상 세부 정보도 제공했습니다. 이번 연구에는 응급상황을 전문으로 하는 신경과 전문의 9명이 참여했다. 1단계에서는 임상 이력 정보를 활용하여 가상 비서의 성능을 평가했습니다. 2단계에서는 참가자와 보조자의 상호 작용 결과를 분석하고 Chat-GPT의 비교 평가를 수행했습니다. 가상 비서는 스페인어를 사용하고 고급 알고리즘, 의사 결정 트리 및 상호 작용을 위한 대규모 언어 모델을 통합하여 WhatsApp 및 Telegram에서 챗봇으로 작동했습니다. 비교를 위해 Chat-GPT 버전 3.5와 4를 활용하여 자연스러운 스페인어로 두 가지 프롬프트 유형을 사용했습니다. 하나는 임상 기록 데이터를 통합하고 다른 하나는 참가자 내러티브를 기반으로 합니다.

연구는 무엇을 측정합니까?

주요 결과 측정

결과 측정
측정값 설명
기간
진단 성능
기간: 참가자와 가상 비서 간의 첫 번째 상호 작용은 이벤트 후 1년도 채 되지 않아 발생했습니다. 결과 측정은 환자와 가상 비서 간의 상호 작용 직후 평가되었습니다.

환자의 질병이나 상태를 정확하게 식별하는 데 있어 의료 검사 또는 진단 도구의 정확성과 효율성을 나타냅니다.

증후군 진단 합의: AI 도구가 특정 질병을 식별하는 것이 아니라 일반적으로 공존하는 일련의 징후와 증상을 기반으로 상태를 식별할 수 있을 때 신경과 의사를 평가하는 것은 증후군 진단이 정확한 것으로 간주됩니다. 이 방법은 증상을 일으키는 정확한 질병을 즉시 식별할 수 없는 경우에 적용되므로 의료인이 환자의 증상을 효과적으로 모니터링하고 치료할 수 있습니다.

감별진단 동의: 각 AI 도구에서 제공한 감별 결과가 참가자가 제시한 감별 결과와 일치할 때 감별 진단이 정확한 것으로 간주됩니다.

진단에 대한 최적 기준은 응급실에서 주어진 기준으로 1개월 동안 변경되지 않은 것으로 간주되었습니다.

참가자와 가상 비서 간의 첫 번째 상호 작용은 이벤트 후 1년도 채 되지 않아 발생했습니다. 결과 측정은 환자와 가상 비서 간의 상호 작용 직후 평가되었습니다.

2차 결과 측정

결과 측정
측정값 설명
기간
적절한 의료행위 또는 권고
기간: 참가자와 가상 비서 간의 첫 번째 상호 작용은 이벤트 후 1년도 채 되지 않아 발생했습니다. 결과 측정은 환자와 가상 비서 간의 상호 작용 직후 평가되었습니다.

사례 해결은 적절한 의학적 행위 또는 권장사항에 따라 평가되었으며, 1) 긴급함은 즉시, 2) 단기(48시간 이내), 3) 긴급함 또는 비긴급함으로 분류되었습니다.

각 AI 도구가 제공하는 권장 사항은 임상 기록에서 수집된 정보와 참가자의 의견을 기반으로 평가되었습니다.

적절한 의학적 행위 또는 권장 사항에 대한 최적 기준은 응급실에서 제공되는 기준으로 간주되었으며, 한 달 동안 변경되지 않았습니다.

참가자와 가상 비서 간의 첫 번째 상호 작용은 이벤트 후 1년도 채 되지 않아 발생했습니다. 결과 측정은 환자와 가상 비서 간의 상호 작용 직후 평가되었습니다.
사용성 및 만족도 평가
기간: 참가자와 가상 비서 간의 첫 번째 상호 작용은 이벤트 후 1년도 채 되지 않아 발생했습니다. 결과 측정은 환자와 가상 비서 간의 상호 작용 직후 평가되었습니다.

유용성은 신경과 의사와 참가자 모두 최종 진단 및 해결에 필요한 시간과 질문 수로 측정되었습니다. Chat GPT의 경우 상담 이유 초안을 작성하는 데 걸린 시간을 평가했습니다.

1에서 5까지의 만족도 척도가 구현되었으며, 1은 부정적인 경험("나쁨", 환자에게 잠재적으로 위험함)을 나타내고 5는 매우 긍정적인("우수", 잠재적으로 비전문 인간 분류를 능가함)을 나타냅니다. 보조자의 질문에 대한 이해도, 긴급성에 따른 의뢰의 적절성, 보조자가 비전문 분류를 대체하거나 응급 도착 시간을 단축할 수 있다고 생각하는지 여부를 묻는 간단한 예/아니요 설문조사도 참가자에게 적용되었습니다.

참가자와 가상 비서 간의 첫 번째 상호 작용은 이벤트 후 1년도 채 되지 않아 발생했습니다. 결과 측정은 환자와 가상 비서 간의 상호 작용 직후 평가되었습니다.

공동 작업자 및 조사자

여기에서 이 연구와 관련된 사람과 조직을 찾을 수 있습니다.

협력자

수사관

  • 수석 연구원: Mauricio F Farez, MD MPH, Fundación para la lucha contra las enfermedades neurológicas de la infancia

간행물 및 유용한 링크

연구에 대한 정보 입력을 담당하는 사람이 자발적으로 이러한 간행물을 제공합니다. 이것은 연구와 관련된 모든 것에 관한 것일 수 있습니다.

연구 기록 날짜

이 날짜는 ClinicalTrials.gov에 대한 연구 기록 및 요약 결과 제출의 진행 상황을 추적합니다. 연구 기록 및 보고된 결과는 공개 웹사이트에 게시되기 전에 특정 품질 관리 기준을 충족하는지 확인하기 위해 국립 의학 도서관(NLM)에서 검토합니다.

연구 주요 날짜

연구 시작 (실제)

2023년 10월 1일

기본 완료 (실제)

2024년 1월 1일

연구 완료 (실제)

2024년 1월 1일

연구 등록 날짜

최초 제출

2024년 3월 6일

QC 기준을 충족하는 최초 제출

2024년 3월 21일

처음 게시됨 (실제)

2024년 3월 28일

연구 기록 업데이트

마지막 업데이트 게시됨 (실제)

2024년 3월 28일

QC 기준을 충족하는 마지막 업데이트 제출

2024년 3월 21일

마지막으로 확인됨

2024년 3월 1일

추가 정보

이 정보는 변경 없이 clinicaltrials.gov 웹사이트에서 직접 가져온 것입니다. 귀하의 연구 세부 정보를 변경, 제거 또는 업데이트하도록 요청하는 경우 register@clinicaltrials.gov. 문의하십시오. 변경 사항이 clinicaltrials.gov에 구현되는 즉시 저희 웹사이트에도 자동으로 업데이트됩니다. .

뇌졸중에 대한 임상 시험

가상 비서에 대한 임상 시험

구독하다