此页面是自动翻译的,不保证翻译的准确性。请参阅 英文版 对于源文本。

急性胰腺炎严重程度的人工智能预测

2021年4月30日 更新者:Ali Tüzün İnce、Bezmialem Vakif University

人工智能在急性胰腺炎疾病严重程度预测中的应用

如今,急性胰腺炎(AP)的发病率正在增加。 AP 的诊断是根据亚特兰大标准定义的,存在以下 3 项发现中的两项; a) 特征性腹痛 b) 淀粉酶和脂肪酶值≥3 倍 c) AP 超声诊断 (USG)、磁共振成像 (MRI) 或计算机断层扫描 (CT) 成像。 虽然 80% 的疾病病程较轻,但 20% 的病程较重,需要重症监护治疗。 严重(严重)AP 的死亡率在 10-25% 之间变化,而轻度 AP 的死亡率为 1-3%。

具有临床、实验室和放射学发现的评分系统用于评估疾病的严重程度。 高龄(>70 岁)、肥胖(体重指数(BMI,kg/m2)、吸烟和饮酒、血尿素氮 (BUN) ≥20 mg/dl、肌酐升高、C 反应蛋白水平 (CRP) > 120mg/dl,Hct 水平降低或升高,腹部 CT ≥ 8 Balthazar 评分提示严重 AP。 根据修订后的亚特兰大标准,AP 存在三种严重程度。 轻度(无器官衰竭和无局部并发症)、中度(局部并发症如假性囊肿、脓肿、坏死、血管血栓形成)和/或短暂的全身并发症(小于48h)和重度(持久的全身并发症(>48h));器官功能不全,如肺、心脏、胃肠道和肾脏)。 虽然亚特兰大评分在今天被认为是非常流行的,但由于在感染性坏死、非胰腺感染和非胰腺坏死以及器官衰竭的动态性质等方面的一些不足,它似乎仍然需要修正。 尽管存在 30 个严重程度评分系统(其中最被接受的是 APACHE 2 评分),但目前还没有发现任何一个系统可以明确预测哪些患者将患有非常严重的疾病,哪些患者将患有轻度病程。

今天,人工智能(机器学习)应用程序被用于医学的许多学科(如诊断、手术、药物开发、个性化治疗、基因编辑技能)。 关于机器学习确定 AP 暴力的研究已经开始出现在文献中。 本研究的目的是调查人工智能 (AI) 应用程序是否在确定 AP 的疾病严重程度方面发挥作用。

研究概览

地位

完全的

详细说明

以回顾性方式,筛选了 2010 年 10 月至 2020 年 2 月期间在 Bezmialem 基金会大学胃肠病诊所接受随访并根据亚特兰大标准诊断为 AP 的 1550 名患者。 剔除 216 名缺失数据的患者后,1334 名患者被纳入研究进行评估。

  1. 患者人口统计信息; [年龄(yo),性别(男/女),香烟/酒精使用情况(是或否)],临床信息; [身高(厘米)、体重(千克)、BMI(以 kg/m2 为单位)、是否存在糖尿病和高血压(是或否)]、AP 的病因,如胆结石、酒精等,以及实验室检查入院后的前 24 小时; [CRP 水平(mg/dl,通常:0-5),BUN 水平(mg/dl,通常;9,8 - 20,1),肌酐水平(mg/dl,通常;0,57 - 1,11) 、白细胞数量(通常为 4.5 至 11.0 ×109/L)和血细胞比容水平(%,通常为 35.5-48%),以及 Balthazar 断层扫描评分 [0:正常,1:胰腺体积增加, 2:胰腺组织及胰周脂肪组织炎性改变,3:边界不规则,单一积液,4:边界不规则,2处或2处以上积液,5~10处不同程度的坏死)],记录在excel文件中。
  2. 修订后的亚特兰大评分也将在入院一周内记录为轻度、中度和重度分数。 急性胰腺炎病程中发生的感染性胰腺坏死和脓毒症,由于Atlanta评分的某些问题存在不足,将被认定为重症急性胰腺炎。 疾病的严重程度将根据亚特兰大评分进行评估。 而人工智能研究的结果会根据亚特兰大的得分结果进行匹配。
  3. 并发症分类为0;无,2;局部并发症:假性囊肿、脓肿、坏死、血栓、肠系膜脂膜炎3例;全身并发症:肺、肾、胃肠道和心血管并发症4例;混合严重并发症/共病情况,5:感染和化脓性并发症。
  4. 此外,侵入性手术要求,如超声内镜 (EUS)、逆行胰胆管造影 (ERCP)(是或否)、住院时间(少于 10 天或多于 11 天)、重症监护室要求(存在或不存在) )、未来 AP 发作的次数(入院一个月后的持续时间,一次发作或不止一次发作)和存活率(死亡、存活)也将被记录。

使用的机器学习算法:Gradient Boosted Ensemble Trees Trees。 (“贪心函数逼近:梯度提升机”,作者 Jerome H. Friedman (1999))。 数据集已按 90%-10% 的比例进行分区。 10% 用于验证,90% 用于人工智能机器学习。 90% 的机器学习部分也分为两部分,70% 用于 AI 学习,30% 用于测试学习。 为此,使用了 5 倍分层抽样

研究的人工智能方法

用于 AI 机器学习的功能:

  1. 性别:男/女
  2. 年龄:连续值
  3. 身高(cm):连续值
  4. 重量(Kg):连续值
  5. BMI 组:第 1 组:≤ 25 kg/m2;第 2 组; 25-30 公斤/平方米;第 3 组:>30.1 kg/m2
  6. 香烟:0;不,1;是的
  7. 酒精:0;不,1;是的
  8. 糖尿病:0;不,1;是的
  9. 高血压:0;不,1;是的
  10. 病因:1;胆道,2;酒精,3;高甘油三酯血症,4;高钙血症,5;药物,6;先天性,7;隐源性,8;内窥镜逆行胆管造影 (ERCP),9;奇怪的括约肌功能障碍 (OSD),10;恶性,11;乳头状粘液瘤 (IPMN),12:原发性硬化性胆管造影术 (PSC) 13:自身免疫性,14:多病因
  11. 白细胞数(WBC):N; 4,5-11x100
  12. 血细胞比容 (Hct):N; %35,5-48
  13. C 反应蛋白 (CRP):N:0-5 mg/dl
  14. 血尿素氮 (BUN):N:9.8-20.1 mg/dl
  15. 肌酐 (KREA):N:0,57-1,11 mg/dl
  16. 巴尔塔扎得分 (BLTZR):0;正常 P, 1;胰腺体积增加,2;胰腺组织和胰周脂肪组织的炎症变化,3;边界不规则,单个积液,4个,边界不规则的2个或更多积液,有不同程度的坏死(5到10之间)

在人工智能中,决策树模型被广泛用于有监督的机器学习。 它们可能取决于基尼指数、增益比/熵、卡方、回归等。 在 AI 中,它们是首选,因为它们为人类生成可理解的规则,这与其他机器学习算法(如人工神经网络和支持向量机)不同。 另一方面,他们被认为是弱学习者。 这意味着它们受到数据集中存在的噪声和异常值的高度影响。 为了克服这个障碍,已经开发了随机森林、集成树、梯度提升等模型。

随机森林和集成树通过对数据集的垂直和水平部分应用某种决策树算法来生成规则。 这种技术极大地减少了学习中发生的错误。 学习过程完成后,他们将弱决策树组合成一个强大的更大的决策树模型。 集成学习模型通过 F ̂(x) 近似最小化训练集损失函数的平均值来实现更好的学习。 这个想法是以贪婪的方式对最小化问题应用最速下降步骤。

在这项研究中,弗里德曼提出的梯度提升树模型已被用于机器学习。 该模型为树的每个部分选择一个单独的最优值,而不是为整棵树选择一个最优值。 这种方法可用于最小化任何可区分的损失 L(y, F) 并结合转发阶段加法建模。 据报道,梯度提升树模型在许多情况下优于随机森林和常规集成树。

该算法的目标是找到一个近似 F_m (x_i) 来最小化预期的 L(y,F(x)) 损失函数。

该算法可以总结如下:

输入:

训练数据集:{(x_i,y_i )} i=1 到 n,n 维,类变量 可微损失函数:L(y,F(x)) 迭代次数:M。

输出:

F_m (x_i)

算法:

使用常量值初始化模型:

F_0 (x)=arg min⁡∑_(i=1)^n▒〖L(y_i,γ)〗

对于 m = 1 到 M:

计算伪残差 rim r_im=-[(∂L(y_(i,) F(x_i )))/(∂F(x_i))]

使用训练集将基础学习器训练为伪残差:

{(x_i,y_i )} i=1 to n 计算乘数 γ γ=arg min⁡∑_(i=1)^n▒〖L(y_i,F_(m-1) (x_i )+γh_m (x_i )) 】

更新模型:

〖F_m(x_i)=F〗_(m-1)(x_i)+γ_m h_m(x_i)输出F_m(x_i)

在分析中,为了避免类变量不平衡的缺点,使用了合成少数过采样技术(SMOTE)[5]。 SMOTE 是一种用于增加数据的数据增强技术。 在某些情况下,类变量可能不会在所有情况下都具有相同数量的值。 例如,幸存的患者可能比失去生命的患者多得多。 在这种情况下,数据会增加。 本研究的数据集中的类别变量存在不平衡。 因此,SMOTE 被应用于增加少数类进行训练。

数据集已按 90%-10% 的比例进行分区。 10% 用于验证,90% 用于人工智能机器学习。 90% 的机器学习部分也分为两部分,70% 用于 AI 学习,30% 用于测试学习。 为此,使用了 5 倍分层抽样。 KNIME 分析平台已用于 AI 机器学习。

研究类型

观察性的

注册 (实际的)

1334

联系人和位置

本节提供了进行研究的人员的详细联系信息,以及有关进行该研究的地点的信息。

学习地点

      • Istanbul、火鸡、34093
        • Bezmialem Vakif University, Gastroenterology Clinic

参与标准

研究人员寻找符合特定描述的人,称为资格标准。这些标准的一些例子是一个人的一般健康状况或先前的治疗。

资格标准

适合学习的年龄

18年 至 100年 (成人、年长者)

接受健康志愿者

有资格学习的性别

全部

取样方法

非概率样本

研究人群

根据亚特兰大标准诊断为急性胰腺炎的患者

描述

纳入标准:

- 诊断为急性胰腺炎且在腹痛开始后 24 小时内入院的患者

排除标准:

  • 入院后立即签署治疗拒绝书并出院的患者
  • 数据不完整的患者
  • 精神病患者
  • 一般情况极差的患者

学习计划

本节提供研究计划的详细信息,包括研究的设计方式和研究的衡量标准。

研究是如何设计的?

设计细节

  • 观测模型:队列
  • 时间观点:追溯

队列和干预

团体/队列
人工智能 (AI) 机器学习组

90% 的机器学习部分也分为 2 部分,70% 用于人工智能学习,30% 用于测试学习。

70%的急性胰腺炎患者(约840名患者)将组成本研究的模型训练组。 30%的急性胰腺炎患者(约360名患者)将组成该研究的测试组。

由于这里也会对模型应用交叉验证,因此数据本身也会发生变化,也会优化分布以提高预测能力。

验证组

10% 的急性胰腺炎患者(约 134 名)将构成研究的验证组。

由于这里也会对模型应用交叉验证,因此数据本身也会发生变化,也会优化分布以提高预测能力。

研究衡量的是什么?

主要结果指标

结果测量
措施说明
大体时间
通过机器学习方法准确预估疾病的严重程度
大体时间:一周之内。
根据修订的亚特兰大标准,严重程度被描述为轻度、中度和重度急性胰腺炎。
一周之内。

次要结果测量

结果测量
措施说明
大体时间
侵入性程序要求
大体时间:一周之内
住院期间需要进行 EUS 或 ERCP 以评估远端胆总管因结石、假性囊肿或坏死发展等原因而阻塞(是或否)
一周之内
重症监护病房要求
大体时间:一周之内
如果患者出现呼吸困难(如果呼吸频率超过 25 次/分钟)、低血压(低于 90/60 mmHg)、如果患者有胃肠道出血(超过 2 lt. 在一天内),如果患者的 BUN 水平高于 20 毫克并且逐渐增加(是或否)
一周之内
生存状况
大体时间:一周之内
死亡:如果患者还活着(是) 如果死了(否)
一周之内
住院时间
大体时间:一个月内
住院时间为一天(少于 10 天或多于 10 天)
一个月内
AP攻击次数
大体时间:一次发作或多次发作入院一个月后
因 AP 发作再次入院。
一次发作或多次发作入院一个月后

合作者和调查者

在这里您可以找到参与这项研究的人员和组织。

合作者

调查人员

  • 首席研究员:Gökhan Silahtaroğlu, Prof.、Medipol University

出版物和有用的链接

负责输入研究信息的人员自愿提供这些出版物。这些可能与研究有关。

一般刊物

研究记录日期

这些日期跟踪向 ClinicalTrials.gov 提交研究记录和摘要结果的进度。研究记录和报告的结果由国家医学图书馆 (NLM) 审查,以确保它们在发布到公共网站之前符合特定的质量控制标准。

研究主要日期

学习开始 (实际的)

2020年9月3日

初级完成 (实际的)

2020年9月23日

研究完成 (实际的)

2020年9月30日

研究注册日期

首次提交

2020年9月30日

首先提交符合 QC 标准的

2021年1月30日

首次发布 (实际的)

2021年2月2日

研究记录更新

最后更新发布 (实际的)

2021年5月5日

上次提交的符合 QC 标准的更新

2021年4月30日

最后验证

2021年4月1日

更多信息

与本研究相关的术语

其他相关的 MeSH 术语

其他研究编号

  • MLKkrm986%

计划个人参与者数据 (IPD)

计划共享个人参与者数据 (IPD)?

药物和器械信息、研究文件

研究美国 FDA 监管的药品

研究美国 FDA 监管的设备产品

此信息直接从 clinicaltrials.gov 网站检索,没有任何更改。如果您有任何更改、删除或更新研究详细信息的请求,请联系 register@clinicaltrials.gov. clinicaltrials.gov 上实施更改,我们的网站上也会自动更新.

3
订阅