此页面是自动翻译的,不保证翻译的准确性。请参阅 英文版 对于源文本。

智能导师诱导暂停对学习模拟手术技能的影响

2024年2月1日 更新者:Rolando Del Maestro、McGill University

智能导师诱导暂停对医学生学习模拟手术技能的影响:随机对照试验

传统的外科技术技能培训依赖于经验丰富的外科医生的指导,他们不断评估和改变学员的表现,通过提供口头指示来防止错误和潜在的患者伤害。 这些教育工作者还可以暂停该程序,解释与受训者的行为相关的风险,并可以亲自向学生展示适当的技术。 研究在提供医疗保健的同时暂停一下,概述了这些方法可以促进学习。

人工智能 (AI) 辅导系统,即智能连续专业监控系统 (ICEMS),可在识别错误​​时向学员提供口头指示,从而改善外科模拟手术中的学习。 然而,在人工智能教学中加入暂停的效果尚未被研究。 因此,ICEMS 错误后识别方法已被更改,包括智能导师语音指令的暂停。

本研究的目的是确定暂停对医学预科生和医学生手术技能获取和转移的影响。 这将通过比较它们在重复模拟肿瘤切除任务中的表现来完成。

研究概览

详细说明

背景:手术技能评估正在从基于时间的定量方法转向对受训者能力的定性评估。 在手术过程中,讲师不断监控学员的表现,并利用各种教学方法,重点提高手术技能的掌握。 其中一种方法包括暂停操作,以概述与受训者表现相关的风险或亲自演示最佳实践技术。 事实证明,在这种情况下暂停可以让学习者重新评估最佳实践,中断负面动力并进行学习。 具体来说,错误后暂停可以防止引入新信息,这些新信息可能会影响一个人反思错误的能力,并在继续之前减轻压力。

理由:ICEMS是我们团队开发的人工智能辅导系统,使用长短期记忆深度学习算法来评估手术表现并提供指导。 然后将其与 NeuroVR 模拟平台集成。 使用该人工智能系统,提供有关错误识别的口头反馈,证明了智能辅导在之前两项随机对照试验(RCT)中改善学习的潜力。 然而,这些随机对照试验并未纳入错误识别后的暂停方法。 为了进一步模仿经验丰富的外科医生在临床环境中的指导,ICEMS 平台经过修改,可以在发现学习者错误时启动暂停,并提供展示专家表现的视频。

研究目的:比较在智能导师指导后加入暂停与单独智能导师指导对医学生和医学预科学生外科技能习得和技能转移的影响。

假设:

  1. 视频组的暂停将显着提高练习场景的第一次和第六次重复之间的综合分数。
  2. 在第六次重复练习场景中,视频暂停组的综合得分在统计上高于对照组。
  3. 在练习场景的第六次重复中,有视频暂停组的综合得分在统计上不低于​​无视频暂停组。
  4. 在现实场景中,视频暂停组的总体 OSATS 分数在统计上高于对照组。
  5. 在实际场景中,有视频暂停组的全局 OSATS 分数在统计上不低于​​无视频暂停组。
  6. 与对照组相比,视频组的暂停不会造成情绪压力或认知负荷的差异。

具体的目标:

  1. 评估人工智能介导的实时定制反馈与暂停方法相结合的功效在提高医学生在两项虚拟现实手术任务中的手术技能方面是否优于单独使用人工智能介导的实时定制反馈。
  2. 确定与仅听到人工智能介导的反馈相比,暂停方法是否会引发不同的情绪和认知负荷。

设计:采用暂停方法的人工智能反馈的三臂单盲随机对照试验以及专家演示视频与仅采用暂停方法的人工智能反馈与单独的人工智能反馈的比较。

地点:神经外科模拟和人工智能学习中心。

参与者:在魁北克医学院预科、一年级和二年级就读的学生。

任务:使用 CAE Healthcare 的 NeuroVR 手术模拟器,切除模拟练习肿瘤六次,并使用超声波吸引器和双极钳切除一次复杂的模拟现实脑肿瘤,同时最大限度地减少出血并保留周围的模拟健康大脑结构。

干预:为期 90 分钟的培训课程,参与者将进行七次模拟软膜下肿瘤切除尝试(六次重复简单的练习场景和一次尝试复杂的现实场景)。 所有参与者都会收到来自 ICEMS 的听觉反馈,但会有以下不同:

  1. 连续执行该程序(即无暂停)(第 1 组);
  2. 暂停后进行反思(第 2 组);
  3. 暂停,然后是专家级演示视频和反思期(第 3 组)。

听觉反馈将基于 4 个指标:

  1. 仪器尖端分离距离;
  2. 低双极力;
  3. 高吸气力;
  4. 高双极力。 最初,仅根据第一个指标(仪器尖端分离)给出反馈,但一旦完成重复但未收到反馈,后续重复将评估上面列表中的下一个指标,依此类推。

主要成果和措施:

两个共同主要结果是:

  1. 手术表现的改善,由先前经过验证的 ICEMS 评估模块计算的综合评分决定。 表现改进是通过 6 次重复练习场景中每次的综合分数差异来衡量的。 学习迁移将通过参与者在复杂的现实场景中的综合得分来衡量。
  2. 参与者在复杂现实场景中的表现得分,由两名盲法专家使用客观结构化技术技能评估 (OSATS) 全球评级量表进行评估。

次要结果是使用达菲医学情绪量表(MES)在练习场景之前、实际场景之前以及完成所有尝试之后测量的引发的情绪强度的差异。 在完成所有任务后,还将使用 Leppink 的认知负荷指数 (CLI) 来测量认知负荷。 这两种结果都是通过自我报告来衡量的。

统计分析计划:参与者数据将被匿名化并存储。 ICEMS 将评估参与者的手术表现,并在每次重复模拟手术任务时以 0.2 秒的间隔提供表现评分。 然后将计算每次重复的平均综合分数。 使用ANCOVA,将通过比较第一次练习场景重复(基线)的综合得分和第六次重复(总结)的综合得分来评估绩效和参与者学习的改进。 同时,复杂现实场景的综合得分将用于使用单向方差分析来评估学习迁移。 效应量为 0.25,显着性为 0.05,总样本量为 129,可提供 80% 的功效来检测显着的相互作用。

参与者在复杂现实场景中表现的视频将由两名盲法专家评估员使用 OSATS 全球评级量表进行评估。 将使用单向方差分析对各组之间的 OSATS 分数进行分析,以比较学习效率和技能保留率。

模拟场景中学习前、学习中和学习后的情绪变化将使用双向混合方差分析进行评估,而单向方差分析将用于评估学习后的认知负荷。

研究类型

介入性

注册 (估计的)

129

阶段

  • 不适用

联系人和位置

本节提供了进行研究的人员的详细联系信息,以及有关进行该研究的地点的信息。

学习联系方式

研究联系人备份

学习地点

参与标准

研究人员寻找符合特定描述的人,称为资格标准。这些标准的一些例子是一个人的一般健康状况或先前的治疗。

资格标准

适合学习的年龄

  • 成人
  • 年长者

接受健康志愿者

是的

描述

纳入标准:

  • 积极就读任何魁北克院校但不符合排除标准的一年级和二年级医学生。
  • 不符合排除标准的学生在任何魁北克机构的预科阶段积极入读医学院。

排除标准:

  • 参与之前涉及 NeuroVR (CAE Healthcare) 模拟器的试验

学习计划

本节提供研究计划的详细信息,包括研究的设计方式和研究的衡量标准。

研究是如何设计的?

设计细节

  • 主要用途:卫生服务研究
  • 分配:随机化
  • 介入模型:并行分配
  • 屏蔽:双倍的

武器和干预

参与者组/臂
干预/治疗
无干预:控制组 智能连续专业监测系统 (ICEMS) 仅口头反馈组

43 名参与者。 个人收到标准信息。 他们进行 6 次每次 5 分钟的练习场景切除,每次之间有 5 分钟的休息时间。 第 7 次尝试是 13 分钟的现实场景。

参与者在第一次重复期间不会收到任何反馈。 然后,他们将收到 4 个指标的反馈,一次一个指标:器械尖端分离、低双极力、高吸引器力、高双极力。 一旦尝试完成但未收到反馈,下一次重复将评估上面列表中的下一个指标。 在尝试完成但未收到反馈的 5 分钟休息期间,参与者可以观看与下一个指标相对应的可选专家级演示视频。 参与者在第六次重复期间没有收到任何反馈。 他们在第七次重复(现实场景)中不会得到任何反馈。

实验性的:实验组 ICEMS 口头反馈与暂停组

43 名参与者。 个人收到标准信息。 他们进行 6 次每次 5 分钟的练习场景切除,每次之间有 5 分钟的休息时间。 第 7 次尝试是 13 分钟的现实场景。

参与者在第一次重复期间不会收到任何反馈。 然后,他们将收到 4 个指标的反馈,一次一个指标:器械尖端分离、低双极力、高吸引器力、高双极力。 一旦尝试完成但未收到反馈,下一次重复将评估上面列表中的下一个指标。 在尝试完成但未收到反馈的 5 分钟休息期间,参与者可以观看与下一个指标相对应的可选专家级演示视频。 参与者在第六次重复期间没有收到任何反馈。 他们在第七次重复(即现实场景)中不会得到任何反馈。

在执行模拟程序时,如果参与者收到基于智能系统错误检测的实时口头反馈,他们将被指示暂停任务,放下仪器并反思 22 秒。 当反思期还剩 7 秒时,将会发出警告,以便个人可以立即准备继续执行任务。
实验性的:实验组 ICEMS 口头反馈(带暂停)和专家级视频演示

43 名参与者。 个人收到标准信息。 他们进行 6 次每次 5 分钟的练习场景切除,每次之间有 5 分钟的休息时间。 第 7 次尝试是 13 分钟的现实场景。

参与者在第一次重复期间不会收到任何反馈。 然后,他们将收到 4 个指标的反馈,一次一个指标:器械尖端分离、低双极力、高吸引器力、高双极力。 一旦尝试完成但未收到反馈,下一次重复将评估上面列表中的下一个指标。 在尝试完成但未收到反馈的 5 分钟休息期间,参与者可以观看与下一个指标相对应的可选专家级演示视频。 参与者在第六次重复期间没有收到任何反馈。 他们在第七次重复(现实场景)中不会得到任何反馈。

在执行模拟过程时,如果参与者收到基于智能系统错误检测的实时口头反馈,他们将被指示暂停任务,放下仪器,将注意力转向9秒的专家级演示视频,并反思13秒。 当反思期还剩 7 秒时,将会发出警告,以便个人可以立即准备继续执行任务。

研究衡量的是什么?

主要结果指标

结果测量
措施说明
大体时间
性能变化
大体时间:学习1天
通过比较 ICEMS 计算的每个练习场景的平均综合分数来进行评估。 分数范围从专家/熟练级别(分数为 1.00)到新手/不太熟练级别(分数为-1.00)。
学习1天
学习迁移
大体时间:学习1天
通过比较 ICEMS 计算的每个练习场景的平均综合分数来进行评估。 分数范围从专家/熟练级别(分数为 1.00)到新手/不太熟练级别(分数为-1.00)。
学习1天
客观结构化技术技能评估 (OSATS) 全球评级量表
大体时间:学习1天
参与者在复杂的现实场景中的表现得分,由两位盲法专家使用客观结构化技术技能评估 (OSATS) 全球评级量表按 7 点李克特量表(1= 新手到 7= 专家)进行评估。 将使用暂停方法和专家级演示视频与仅使用暂停方法和不使用暂停方法的学习效果进行比较。
学习1天

次要结果测量

结果测量
措施说明
大体时间
引发的情绪强度差异
大体时间:学习1天
在学习之前、期间和之后通过达菲医学情绪量表 (MES) 进行测量。 参与者将按照 5 点李克特量表自我报告每种情绪的强度(1 = 完全没有,5 = 非常强烈)。
学习1天
认知负荷差异
大体时间:学习1天
干预后使用 Leppink 认知负荷指数 (CLI) 进行测量。 参与者将按照 5 点李克特量表自我报告他们对每项陈述的同意程度(1 = 强烈不同意,5 = 强烈同意)。
学习1天

合作者和调查者

在这里您可以找到参与这项研究的人员和组织。

调查人员

  • 首席研究员:Rolando F Del Maestro, MD, PhD、McGill University

出版物和有用的链接

负责输入研究信息的人员自愿提供这些出版物。这些可能与研究有关。

研究记录日期

这些日期跟踪向 ClinicalTrials.gov 提交研究记录和摘要结果的进度。研究记录和报告的结果由国家医学图书馆 (NLM) 审查,以确保它们在发布到公共网站之前符合特定的质量控制标准。

研究主要日期

学习开始 (实际的)

2024年1月30日

初级完成 (估计的)

2024年9月1日

研究完成 (估计的)

2024年9月1日

研究注册日期

首次提交

2024年1月23日

首先提交符合 QC 标准的

2024年1月23日

首次发布 (实际的)

2024年2月1日

研究记录更新

最后更新发布 (估计的)

2024年2月5日

上次提交的符合 QC 标准的更新

2024年2月1日

最后验证

2024年2月1日

更多信息

与本研究相关的术语

其他研究编号

  • 2010-270, NEU-09-042-Trial 4

计划个人参与者数据 (IPD)

计划共享个人参与者数据 (IPD)?

是的

IPD 计划说明

如果其他研究人员对这些数据感兴趣,则可以共享从主要和次要结果获得的数据。

IPD 共享时间框架

试验完成后 5 年内数据将可用。

IPD 共享访问标准

想要获取数据的研究人员需要联系该试验的主要研究者。 罗兰多·德尔·马埃斯特罗博士

IPD 共享支持信息类型

  • 研究方案
  • 树液
  • 国际碳纤维联合会
  • 分析代码
  • 企业社会责任

药物和器械信息、研究文件

研究美国 FDA 监管的药品

研究美国 FDA 监管的设备产品

此信息直接从 clinicaltrials.gov 网站检索,没有任何更改。如果您有任何更改、删除或更新研究详细信息的请求,请联系 register@clinicaltrials.gov. clinicaltrials.gov 上实施更改,我们的网站上也会自动更新.

3
订阅