项目1:通过2D全视野数字乳腺X线摄影或合成图像进行自我分类
项目 1:通过 2D 全视野数字乳腺 X 线摄影或合成图像进行自我分类注:注意,这是研究 ID 386408 项目 1 下的一项研究:放射科医生研究
乳腺癌筛查的一种方法是放射科医生读取数字断层合成 (DBT) 图像。 DBT 由穿过乳房的 X 射线“切片”的 3D 堆栈组成。 检查附有 2D 图像,如标准乳房 X 光检查、单次乳房 X 光检查。 在筛查环境中,大多数病例都是正常的。 有时,快速查看 2D 图像就可以明显看出病例是正常的。 如果读者能够仅根据 2D 图像而不查看 DBT 图像而排除明显正常的情况,那么将加快筛选过程。 显然,如果研究人员几乎完全确定不会遗漏任何癌症,那么研究人员只会以这种方式“分类”病例。 在这项研究中,研究人员考察了放射科医生对病例进行分类的意愿及其答案的准确性。 此外,调查人员还询问了人工智能 (AI) 意见的影响。 是否有可能仅根据人工智能意见对图像进行分类?
放射科医生将观察每个病例长达五秒钟,并就他们对病例是否正常的确定程度提供意见(按 1-10 分制)。 接下来,他们将看到人工智能的意见。 最后,他们会(使用 1-10)表示,他们是否愿意让人工智能在没有人工干预的情况下对这种情况进行分类。
这项研究是了解放射科医生在什么条件下愿意在很少或根本没有进行人体检查的情况下宣布病例“正常”的开始。
研究概览
详细说明
注意:此注册与 ASSIST 中的人类受试者注册相关联。 这又是 NCI 拨款 CA207490 的一部分。 该资助描述了许多拟议的实验,并指出许多其他实验可能会作为后续研究进行。 根据 NIH 的建议,研究人员将这些研究分为三项“研究”,每项都涵盖多项实验。 这里描述的实验是“研究 ID 386408 项目 1:放射科医生研究”的一部分。 对于已开始收集参与者的项目,无法通过 PRS 系统在 CT.gov 中注册一组实验,并且无法在没有 NCT 编号的情况下提交年度拨款报告 (RPPR)。 因此,研究人员在此描述了一项实验,该实验将成为“项目 1”研究包的一部分。
项目 1 的核心思想是,Os 有可能在简单查看 2D 图像后,或者可能在人工智能系统简单查看图像后,可靠地消除筛查乳房 X 光检查中的一组病例。 也就是说,临床医生和/或人工智能会查看图像并“肯定”知道那里什么都没有,并且愿意根据这种简短的查看来驳回或“分类”病例。 如果读者不能完全确定,该案件将会受到更多审查。
作为研究这个问题的开始,研究人员希望估计临床医生对病例进行分类的意愿如何,以及他们将如何与被要求对病例进行分类的人工智能进行交互。 任何分类实施的一个挑战将是让临床医生(更不用说律师等人)接受不查看图像/病例或短暂查看(例如,2D 图像)并且愿意不查看的想法。查看 3D 数字断层合成 (DBT) 图像。 研究人员在此报告的实验旨在成为研究这个问题的开始。 存在从“明显正常”到“明显异常”的连续情况。 调查人员希望估计该连续体上的一个点,低于该点的案件非常正常,以至于读者愿意让计算机对案件进行分类和/或愿意自己对案件进行分类。 也有可能有些病例非常异常,以至于可以仅通过计算机召回患者进行进一步检查,尽管研究人员并未研究这种病例的分类形式。 研究人员假设这些分类点将与计算机的正常评级和读者的评级相关。
方法:呈现 5 秒钟的双侧 2D 乳房 X 光照片。 时间限制的目的是限制放射科医生对病例的正常审查。 调查人员希望根据案件的“要点”做出决定。 为了模拟筛查性乳房 X 光检查中疾病的低患病率,150 例病例中只有 4 例呈阳性。 读者被告知这些病例模拟了筛查环境,因此他们知道阳性病例很少见,但他们不知道实际的患病率。
研究人员要求放射科医生针对最多 150 个单图像“病例”中的每一个回答两个问题。 (“最多 150 个”是因为放射科医生可以而且确实在未完成所有病例的情况下退出。 使用评级量表方法,研究人员询问:
参与者如何确定这些图像来自正常病例?
接下来,研究人员告诉读者“计算机将这些图像评为 X(满分 10 分)(10:存在癌症的可能性最高)”。 该 AI 值是由 Transpara 1.7.0 版本生成的真实异常评级,它返回检查的恶性肿瘤概率评分。 该评级由 Radboud U 的 Sarah Verboom 获得。
然后调查人员询问读者是否认为计算机在没有进一步人工检查的情况下对案件进行分类是合理的。
- 参与者是否愿意让计算机在不让参与者查看的情况下单独对这个案例做出决定?
Os 使用滑动条作为评分量表进行回答。 所选的评级显示在滑动条的顶部。
参加者:
这项研究的第一批观察者在欧洲放射学会议(ECR,维也纳,2023 年 3 月)组织的“流行实验室”进行了测试。 研究人员一直在组织这些实验室,为来自许多实验室的研究人员提供参加 ECR 等大型会议的机会,在那里他们可能能够对比在家里更多的放射科医生进行测试。 好处是能够吸引读者。 缺点是调查人员通常只能占用读者 15-30 分钟的时间。 因此,这个实验的读者是一群方便的人。 调查人员测试了 15 名读者。 这些人的经验差异很大。 调查人员询问他们估计每年阅读多少个筛查案例。 该数字从 0(已了解乳房 X 光检查但未实践的学生)到 8000 不等。 在时间/耐心耗尽之前,读者愿意为我们阅读的案例数量也各不相同。 范围为 19 至 148(平均 83 例)。 在现阶段,研究人员没有足够的能力确定这些变量是否对结果产生重要影响。 对于放射科医生等检测专家来说,这是一个长期存在的问题。 收集尽可能多的数据是极其困难的。 尽管如此,这些数据可以为我们提供有关决定图像分类成功或失败的因素的信息。
研究类型
注册 (估计的)
阶段
- 不适用
联系人和位置
学习联系方式
- 姓名:Jeremy M Wolfe, PhD
- 电话号码:617-851-1166
- 邮箱:jwolfe@bwh.harvard.edu
研究联系人备份
- 姓名:Ava A Mitra, BA
- 电话号码:617-525-3681
- 邮箱:amitra@bwh.harvard.edu
学习地点
-
-
Massachusetts
-
Boston、Massachusetts、美国、02215
- 招聘中
- Visual Attention Lab / Brigham and Women's Hospital
-
接触:
- Jeremy M Wolfe, PhD
- 电话号码:617-851-1166
- 邮箱:jwolfe@bwh.harvard.edu
-
接触:
- Ava A Mitra, BA
- 电话号码:617-525-3681
- 邮箱:amitra@bwh.harvard.edu
-
-
参与标准
资格标准
适合学习的年龄
- 成人
- 年长者
接受健康志愿者
描述
纳入标准:
- 必须是放射科医生或放射学实习生
- 一些阅读乳房X光检查的经验。
排除标准:
- 矫正后敏锐度低于 20/25
学习计划
研究是如何设计的?
设计细节
- 主要用途:诊断
- 分配:不适用
- 介入模型:单组作业
- 屏蔽:单身的
研究衡量的是什么?
主要结果指标
结果测量 |
措施说明 |
大体时间 |
---|---|---|
异常评级准确度
大体时间:通过学习完成,平均1年
|
读者对每幅图像的异常情况进行评分。
结果衡量标准是与该案例的黄金标准事实的一致性。
|
通过学习完成,平均1年
|
人工智能接受度
大体时间:通过学习完成,平均1年
|
读者表示他们是否接受人工智能评级作为最终结果。
相关衡量标准是接受率作为人工智能评级和人类异常评级的函数。
|
通过学习完成,平均1年
|
合作者和调查者
研究记录日期
研究主要日期
学习开始 (实际的)
初级完成 (估计的)
研究完成 (估计的)
研究注册日期
首次提交
首先提交符合 QC 标准的
首次发布 (实际的)
研究记录更新
最后更新发布 (实际的)
上次提交的符合 QC 标准的更新
最后验证
更多信息
此信息直接从 clinicaltrials.gov 网站检索,没有任何更改。如果您有任何更改、删除或更新研究详细信息的请求,请联系 register@clinicaltrials.gov. clinicaltrials.gov 上实施更改,我们的网站上也会自动更新.
人工智能意见的临床试验
-
Erasmus Medical CenterHospices Civils de Lyon; Maastro Clinic, The Netherlands招聘中
-
Case Western Reserve University招聘中
-
Acusphere完全的