此页面是自动翻译的，不保证翻译的准确性。请参阅英文版对于源文本。

开发自然语言处理工具以支持急诊医学临床研究 (NLP-DeVal)

2024年4月3日更新者：Mario Negri Institute for Pharmacological Research

自然语言处理工具的开发和验证，以实现急诊和急症护理医学的临床研究：回顾性队列研究

这项回顾性队列研究的目标是开发和验证一种语言模型，该模型可以解释急诊科电子病历的内容并提取三年内到达参与急诊科的所有成年患者的相关信息用于研究目的。

它要回答的主要问题是：语言模型是否能够解释急诊科电子病历的内容并从中提取所需的信息，以便进行准确的分析和预测？

该研究是回顾性的，数据将从医疗健康记录中自动提取。

研究概览

地位

尚未招聘

条件

急救医学

干预/治疗

其他：没有干预

详细说明

研究的背景和理由

开展急诊医学临床和护理质量评估研究既困难又重要。这很困难，因为需要治疗的患者数量巨大，而工作人员长期短缺，使得临时数据收集变得不切实际。这很重要，因为最终，研究使急诊医生和护士能够将他们的实践建立在他们自己独特的环境中获得的证据的基础上，而不是像今天常见的情况那样，在遥远的背景下获得的证据。

弥合研究需求与可靠数据可用性之间差距的唯一方法是直接从急诊科的电子健康记录 (EHR) 中提取数据，从而避免专门且耗时的数据收集。然而，这是一项艰巨的任务，因为最有用的信息是自由文本格式的（例如，体征和症状的存在、疑似和确诊的诊断、病史）。这种情况和需求需要可靠的自然语言处理 (NLP) 工具来从自由文本中获取高度一致的数据。

如今，大规模语言模型可以准确解释自然语言。然而，这些模型是根据主要来自互联网的大量常识进行训练的，因此它们在更专业的领域（例如医学领域）的性能可能不是最佳的。

本研究是一个名为 eCREAM（促进急诊和急症护理医学临床研究）的大型项目的一部分，旨在开发和验证六种语言的语言模型（称为 eCREAM_LM），该模型可以解释急诊科 EHR 的内容和提取相关信息用于研究目的。

方法

该研究是一项为期 24 个月的观察性、多中心、回顾性研究。 30 个中心将参与这项研究：13 个来自意大利，4 个来自波兰，3 个来自希腊、斯洛伐克、斯洛文尼亚和英国，1 个来自瑞士。这些中心不会获得任何补偿，但其费用将由项目资金支付。

eCREAM_LM 模型的开发和验证。

eCREAM_LM 将通过对开源模型中最佳整体模型的训练和微调来开发，并将以部分并行的阶段进行。候选模型将接触到来自科学文献或其他公共来源的大量（数十亿）医学文本。同时，模型还将接触到从参与医院使用的医疗记录中获得的大量（数百万）免费文本注释。然后，我们将继续进行微调，将再次使用从参与中心的医疗记录中获得的大量（数千）临床记录。这些注释将由经验丰富的医生进行注释，其中包括从注释中提取信息以填写虚拟数据收集表格 (vCRF) 中列出的数据项。 vCRF 是为相关研究创建的，包含一组可用于预测呼吸困难或短暂意识丧失患者住院治疗的变量，这是相关研究的目标。在当前的研究中，vCRF 将作为验证语言模型的工具。

eCREAM_LM 的验证将使用一组 1,000 个临床记录进行，如上所述进行注释，但不在开发阶段使用。这些注释将提交给 eCREAM_LM 模型，并执行编译 vCRF 的任务。专家医师和 eCREAM_LM 填写 vCRF 的一致性将作为 eCREAM_LM 最终验证的衡量标准。

数据收集和匿名化

每家参与的医院将提供 2021 年至 2023 年间接受治疗的 150-300,000 名成年患者的病历中包含的免费文本注释。涉及同一患者不同方面的注释（例如病史、客观检查、测试结果）将彼此分开，因此无法重建患者的完整档案。此外，注释中将删除对患者的任何提及（例如名字、姓氏、出生日期）和背景信息（例如医院、到达中心的日期和时间）。这一过程最大限度地减少了重新识别患者的可能性，并最大限度地保护了他们的权利。在数据库中重新识别患者的可能性取决于他或她的特征与数据库中其他个体的独特程度。拥有独特且可识别的患者的可能性随着数据库中可用信息量的增加而增加，并随着数据库大小的增加而减少。通过从临床记录中删除所有个人和上下文信息并将每个记录与其他记录分开，每个记录将仅报告患者的一些特征。此外，从同一国家的医院收集的数据将被合并，以便每种语言都有一个大型数据库。这有效地消除了从笔记中可以唯一识别个人的可能性。

最后，为了排除笔记中包含第三方信息的可能性，例如患者亲属的姓名和电话号码，每家医院都将安装经过认证的匿名软件，专门用于从自由文本中删除个人数据。

一旦匿名化，数据将集中进行分析，同时也会上传到科学界主要的欧洲语言资源共享平台。

统计分析

在 eCREAM_LM 验证中，我们将评估专家急诊医师与 eCREAM_LM 本身在填写 vCRF 时的一致性。该数据将涉及每种学习语言的 1,000 个笔记样本。将使用 Cohen 的 κ 作为一致性度量来评估 vCRF 每个变量的一致性。如果 Cohen 的 κ 大于 0.75，则 eCREAM_LM 将被视为有效。

样本量

假设 eCREAM_LM 和经验丰富的急诊医生在完成 vCRF 时达成了良好的协议 (κ=0.80)，则需要至少 735 个注释的样本才能达到足够的精度以保证良好的协议（95% 置信区间的置信下限） Cohen 的 κ 大于 0.75）。这个数字是在不同场景下获得的最大样本量，涉及每个变量的不同类别数（2到5个）以及样本中类别的不同边际分布，包括平衡分布（例如，5个类别占样本的20%）每个类别中都有）并且结果非常不平衡（例如，5 个类别分别占样本的 1.8%、7.3%、16.4%、29.1% 和 45.5%）。由于部分笔记中可能缺少感兴趣的信息，因此我们将对 1,000 个笔记进行数据验证评估。

研究类型

观察性的

注册 (估计的)

300000

联系人和位置

本节提供了进行研究的人员的详细联系信息，以及有关进行该研究的地点的信息。

学习联系方式

姓名：Chiara Pandolfini
电话号码：0039 02 39014 253
邮箱：chiara.pandolfini@marionegri.it

研究联系人备份

姓名：Giulia Ghilardi
电话号码：0039 035 4535 313
邮箱：giulia.ghilardi@marionegri.it

学习地点

意大利
- - Milan、意大利、20156
    - Istituto di Ricerche Farmacologiche Mario Negri IRCCS

参与标准

研究人员寻找符合特定描述的人，称为资格标准。这些标准的一些例子是一个人的一般健康状况或先前的治疗。

资格标准

适合学习的年龄

成人
年长者

接受健康志愿者

是的

取样方法

概率样本

研究人群

2021年1月1日至2023年12月31日期间抵达参与急诊科的所有成年患者

描述

纳入标准：

成人
2021年1月1日至2023年12月31日期间到达急诊室

排除标准：

没有任何

学习计划

本节提供研究计划的详细信息，包括研究的设计方式和研究的衡量标准。

研究是如何设计的？

设计细节

团体/队列数

队列和干预

团体/队列	干预/治疗
到急诊科就诊的成年人	其他：没有干预没有干预

研究衡量的是什么？

主要结果指标

结果测量	措施说明	大体时间
填写虚拟病例报告表的一致性大体时间：1个月	专家医师填写虚拟病例报告表与 eCREAM_LM 语言模型的一致性程度	1个月

合作者和调查者

在这里您可以找到参与这项研究的人员和组织。

赞助

Mario Negri Institute for Pharmacological Research

合作者

Fondazione Bruno Kessler

Astir S.r.l.

Orobix Life S.r.l.

调查人员

首席研究员：Guido Bertolini、Istituto di Ricerche Farmacologiche Mario Negri IRCCS

研究记录日期

这些日期跟踪向 ClinicalTrials.gov 提交研究记录和摘要结果的进度。研究记录和报告的结果由国家医学图书馆 (NLM) 审查，以确保它们在发布到公共网站之前符合特定的质量控制标准。

研究主要日期

学习开始 (估计的)

2024年6月1日

初级完成 (估计的)

2025年3月1日

研究完成 (估计的)

2025年5月1日

研究注册日期

首次提交

2024年1月26日

首先提交符合 QC 标准的

2024年1月26日

首次发布 (实际的)

2024年2月5日

研究记录更新

最后更新发布 (实际的)

2024年4月4日

上次提交的符合 QC 标准的更新

2024年4月3日

最后验证

2024年1月1日

没有干预的临床试验

Shiraz University of Medical Sciences

完全的

MIND 饮食干预和认知表现 (MIND)

肥胖

伊朗伊斯兰共和国
University of Illinois at Chicago
Shirley Ryan AbilityLab; Oakland University; Access Living

主动，不招人

我们的同行 - 授权和导航支持 (OP-ENS)

残疾人士

美国
University of Wisconsin, Madison
National Cancer Institute (NCI); Northwestern University

主动，不招人

促进乳腺癌和子宫内膜癌幸存者的身体活动

体力活动 | 乳腺癌幸存者 | 子宫内膜癌幸存者

美国
Otsuka Pharmaceutical Factory, Inc.
Celerion

完全的

评估 NO-13065 在健康和肥胖成人受试者中的安全性、耐受性、药代动力学和食物效应的研究

肥胖

美国
Eunah Cho, MD

完全的

妇科手术术前口服碳水化合物负荷

术后恢复

大韩民国
Tianjin Medical University Cancer Institute and...

招聘中

局部晚期胃癌No.12a淋巴结清扫的可能范围

胃癌 | No.12a 淋巴结清扫术

中国
Assistance Publique - Hôpitaux de Paris

完全的

镰状细胞病患儿肺毛细血管血容量的评估 (VOLCADREP)

镰状细胞性贫血症

法国
Ajou University School of Medicine

尚未招聘

高流量鼻氧合对儿童胃充气的影响

全身麻醉的诱导
Anabio R&D
Hanoi Medical University

招聘中

益生菌（LiveSpo Navax）预防儿童呼吸道疾病的功效

呼吸系统疾病 | 儿童呼吸道感染

越南
Northwestern University

完全的

设定目标：参与 Go/No-Go 主动学习

沮丧 | 焦虑

美国

开发自然语言处理工具以支持急诊医学临床研究 (NLP-DeVal)

自然语言处理工具的开发和验证，以实现急诊和急症护理医学的临床研究：回顾性队列研究

研究概览

地位

条件

干预/治疗

详细说明

研究类型

注册 (估计的)

联系人和位置

学习联系方式

研究联系人备份

学习地点

参与标准

资格标准

适合学习的年龄

接受健康志愿者

取样方法

研究人群

描述

学习计划

研究是如何设计的？

设计细节

团体/队列数

队列和干预

团体/队列

干预/治疗

研究衡量的是什么？

主要结果指标

结果测量

措施说明

大体时间

合作者和调查者

赞助

合作者

调查人员

研究记录日期

研究主要日期

学习开始 (估计的)

初级完成 (估计的)

研究完成 (估计的)

研究注册日期

首次提交

首先提交符合 QC 标准的

首次发布 (实际的)

研究记录更新

最后更新发布 (实际的)

上次提交的符合 QC 标准的更新

最后验证

更多信息

与本研究相关的术语

其他相关的 MeSH 术语

其他研究编号

计划个人参与者数据 (IPD)

计划共享个人参与者数据 (IPD)？

IPD 计划说明

IPD 共享时间框架

IPD 共享支持信息类型

药物和器械信息、研究文件

研究美国 FDA 监管的药品

研究美国 FDA 监管的设备产品

没有干预的临床试验

搜索类似试验

赞助者和合作者

医疗条件

药物干预

CROs by country

CROs in Slovenia

条件

罕见疾病

药物干预

膳食补充剂

赞助者/合作者

地点