이 페이지는 자동 번역되었으며 번역의 정확성을 보장하지 않습니다. 참조하십시오 영문판 원본 텍스트의 경우.

코로나바이러스(COVID-19) 조사를 위한 자유 텍스트 노트의 자연어 처리(NLP) 분석

2021년 7월 22일 업데이트: Dr Sapna Trivedi, Cambridge University Hospitals NHS Foundation Trust

COVID-19 환자의 결과와 표현형 연관성을 조사하기 위한 자유 텍스트 임상 기록 및 구조화된 데이터의 데이터베이스 및 분석 연구

전자 건강 기록(EHR)의 구조화된 데이터와 함께 자연어 처리를 사용하여 결과와 관련된 기능을 식별하기 위한 분석용 데이터베이스를 생성하는 임상 노트를 조사하는 후향적 코호트 연구입니다.

연구 개요

상세 설명

COVID-19로 케임브리지 대학 병원(CUH)에 입원한 환자는 일상적인 임상 기록과 COVID-19에 대한 특정 조사 및 검사를 받았습니다. 이러한 환자를 위한 경로는 병실에서의 지지 조치부터 집중 치료실(ITU) 입원 및 환기 지원이 필요한 악화까지 다양합니다. 환자는 또한 급성 신장 손상 및 혈전색전증과 같은 합병증이 발생할 위험이 있습니다. 이러한 결과에 대한 위험 요소와 환기 요구 사항과 같은 다른 결과를 식별하는 것은 여전히 ​​어려운 과제이며 이러한 환자에 대한 임상 데이터를 검토하는 것은 환자 특성과 결과 사이의 관계를 이해하는 데 중요합니다.

EHR의 구조화된 필드에서 사용할 수 있는 데이터가 있지만 때때로 불완전하고 부정확합니다. 자유 텍스트 임상 노트의 평가는 격차를 메울 수 있는 기회를 제공하고 평가를 위한 훨씬 더 풍부한 데이터 세트를 제공합니다. 우리는 자연어 처리(NLP)(컴퓨터가 인간의 언어를 분석할 수 있는 기계 학습 분야)를 사용하여 COVID-19로 병원에 입원한 환자의 퇴원 요약을 검토하고 무료 텍스트 데이터를 구조화된 데이터로 변환하여 분석할 계획입니다.

Dr Collier 팀이 개발한 NLP 기술에는 자유 텍스트를 SNOMED CT 및 기타 생물의학 온톨로지로 코딩하는 방법이 포함됩니다. 사람이 주석을 단 텍스트의 통계적 기계 학습을 기반으로 하는 이러한 방법은 과학 텍스트 및 소셜 미디어에 대해 벤치마킹되었습니다. 이 프로젝트에서 우리는 이러한 기술을 환자 기록에 적용하려고 합니다. 이 기술을 적용하려면 주석이 달린 여러 환자 기록이 필요합니다. NLP 출력은 EHR의 구조화된 데이터와 결합되고 통계 분석을 거쳐 COVID-19 환자의 합병증 비율과 이와 관련된 위험 요소를 식별합니다. 이는 이러한 환자의 불량한 결과를 방지하기 위해 조기 개입을 통해 관리 결정을 안내하는 데 도움이 될 수 있습니다.

연구 유형

관찰

등록 (실제)

200

연락처 및 위치

이 섹션에서는 연구를 수행하는 사람들의 연락처 정보와 이 연구가 수행되는 장소에 대한 정보를 제공합니다.

연구 장소

      • Cambridge, 영국
        • Cambridge University NHS Foundation Trust

참여기준

연구원은 적격성 기준이라는 특정 설명에 맞는 사람을 찾습니다. 이러한 기준의 몇 가지 예는 개인의 일반적인 건강 상태 또는 이전 치료입니다.

자격 기준

공부할 수 있는 나이

18년 (성인, 고령자)

건강한 자원 봉사자를 받아들입니다

해당 없음

연구 대상 성별

모두

샘플링 방법

비확률 샘플

연구 인구

COVID-19 확진으로 Cambridge University Hospitals NHS Foundation Trust에 입원한 환자

설명

포함 기준:

  • 남성과 여성
  • 연령대: 18~100세
  • 실험실 검사에서 COVID-19 확진 판정을 받고 케임브리지 대학 병원에 입원한 환자

제외 기준:

COVID 검사 결과가 음성인 어린이 및 환자.

공부 계획

이 섹션에서는 연구 설계 방법과 연구가 측정하는 내용을 포함하여 연구 계획에 대한 세부 정보를 제공합니다.

연구는 어떻게 설계됩니까?

디자인 세부사항

연구는 무엇을 측정합니까?

주요 결과 측정

결과 측정
측정값 설명
기간
개체명 인식을 위한 NLP 도구를 사용하여 처리된 COVID-19 환자의 EHR 기록 연구 데이터베이스 및 관심 변수 식별을 위해 CUH EMR 데이터에 적응된 연결
기간: 일년
우리의 가장 중요한 가설은 자유 텍스트 퇴원 요약에서 NLP로 추출한 데이터를 EMR의 구조화된 데이터와 결합하여 합병증 발생에 대한 통찰력을 얻을 수 있다는 것입니다. ITU 입원이 필요한 중증 질환 및 입원 병동에서 관리되는 중증이 아닌 환자가 포함됩니다. 관심 변수에는 입원 기간 및 기준선 조사(예: 혈액 검사) 및 받은 개입을 포함하여 환자 특성 및 특정 만남 관련 정보가 포함됩니다.
일년

2차 결과 측정

결과 측정
기간
EHR의 하위 집합에 대해 인간 전문가(골드) 레이블이 지정된 데이터를 생성하기 위한 일련의 주석 지침
기간: 6 개월
6 개월
구조화된 문제 목록에서 누락된 용어를 식별하기 위해 NLP 출력을 구조화된 문제 목록의 용어와 비교
기간: 일년
일년

공동 작업자 및 조사자

여기에서 이 연구와 관련된 사람과 조직을 찾을 수 있습니다.

연구 기록 날짜

이 날짜는 ClinicalTrials.gov에 대한 연구 기록 및 요약 결과 제출의 진행 상황을 추적합니다. 연구 기록 및 보고된 결과는 공개 웹사이트에 게시되기 전에 특정 품질 관리 기준을 충족하는지 확인하기 위해 국립 의학 도서관(NLM)에서 검토합니다.

연구 주요 날짜

연구 시작 (실제)

2020년 7월 1일

기본 완료 (실제)

2021년 7월 1일

연구 완료 (실제)

2021년 7월 1일

연구 등록 날짜

최초 제출

2020년 6월 15일

QC 기준을 충족하는 최초 제출

2020년 6월 15일

처음 게시됨 (실제)

2020년 6월 16일

연구 기록 업데이트

마지막 업데이트 게시됨 (실제)

2021년 7월 28일

QC 기준을 충족하는 마지막 업데이트 제출

2021년 7월 22일

마지막으로 확인됨

2021년 7월 1일

추가 정보

이 연구와 관련된 용어

약물 및 장치 정보, 연구 문서

미국 FDA 규제 의약품 연구

아니

미국 FDA 규제 기기 제품 연구

아니

이 정보는 변경 없이 clinicaltrials.gov 웹사이트에서 직접 가져온 것입니다. 귀하의 연구 세부 정보를 변경, 제거 또는 업데이트하도록 요청하는 경우 register@clinicaltrials.gov. 문의하십시오. 변경 사항이 clinicaltrials.gov에 구현되는 즉시 저희 웹사이트에도 자동으로 업데이트됩니다. .

코로나바이러스감염증-19 : 코로나19에 대한 임상 시험

3
구독하다