このページは自動翻訳されたものであり、翻訳の正確性は保証されていません。を参照してください。 英語版 ソーステキスト用。

内視鏡検査におけるインフォームドコンセントトレーニングのためのAIロールプレイとピアロールプレイの比較:無作為化対照試験

2025年7月15日 更新者:Catharine Walsh、The Hospital for Sick Children

このランダム化比較試験の目標は、AIベースのロールプレイが、内視鏡処置のために患者からインフォームドコンセントを取得する方法を医療研修生に教えるのに効果的であるかどうかを調べることです。

主な質問は次のとおりです。

•生成的AIベースのロールプレイは、内視鏡手順のインフォームドコンセントを提供するために、医療研修生のトレーニングにおける従来のピアロールプレイと比較してどのように比較されますか?

研究者は、AIベースのロールプレイとピアロールプレイを比較して、このスキルを教えるためにより効果的である方法を確認します。

参加者が何をするか:

  • インフォームドコンセントを取得する方法に関する講義に出席します。
  • ピアロールプレイまたはAIベースのロールプレイのいずれかを使用して、シミュレーションベースのトレーニングに参加してください。
  • シミュレートされた臨床的遭遇に参加して、インフォームドコンセントを得る能力を評価します。

調査の概要

詳細な説明

バックグラウンドと根拠生成人工知能(AI)、特に大規模な言語モデル(LLM)は最近、ヘルスケアコミュニケーションにおける体験学習をサポートするインタラクティブでカスタマイズ可能な仮想患者シミュレーションの開発を可能にしました。 これらのAI駆動型プラットフォームは、さまざまな人口統計、感情状態、臨床的複雑さを組み込んで、現実的な患者の出会いをシミュレートできます。 また、個別のフィードバックと繰り返しの実践へのスケーラブルなアクセスを提供し、従来のピアまたは俳優ベースのシミュレーションの物流上の制限を回避します。 予備研究は、研修生がこれらのツールをリアリズムと教育的価値が高いと認識していることを示唆しています。ただし、生成的AIベースのシミュレーションの教育的有効性を確立された教育的アプローチと直接比較する経験的証拠は残っています。 これは、胃腸内視鏡検査のインフォームドコンセントを取得するなど、複雑なコミュニケーションタスクを教えるために特に関連しています。これは、明確さ、共感、手続き上のリスク、利点、および代替案の詳細な説明を必要とする相互作用です。

研究の目的この研究の主な目的は、内視鏡手順のインフォームドコンセントを得るために、医療研修生のトレーニングにおける生成的AIベースのロールプレイと従来のピアロールプレイの有効性を比較することです。 具体的には、この研究では、ランダム化比較試験(RCT)設計を使用したシミュレーションベースのトレーニング後のインフォームドコンセントと自己報告された自信(自己効力感)を得る際の情報に基づいたコミュニケーションスキルを得る訓練能力の違いの違いを評価します。

方法研究デザインこれは、単一盲検、平行グループのランダム化対照試験です。 合計40人の医療研修生が募集されます。 参加者は、介入グループ(生成AIベースのロールプレイ)またはコントロールグループ(従来のピアロールプレイ)に対して1:1の比率でランダム化されます。 ランダム化は、コンピューターで生成されたシーケンスを使用して行われ、独立した研究チームメンバーによって分散された密閉封筒にグループ割り当てが配置されます。 介入の性質により、参加者の盲検化は実行不可能です。ただし、結果評価者はグループ割り当てに盲目にされます。

参加者の参加者には、トロント大学医療訓練プログラムに登録されている医療研修生が含まれます。 除外基準には、臨床またはシミュレートされた設定のいずれかで、内視鏡検査のインフォームドコンセントを25回以上取得する以前の経験が含まれます。

ベースライン評価すべての参加者は、人口統計データを収集するベースラインアンケート、インフォームドコンセントの取得における自己効力感、およびヘルスケア教育におけるAIに対する態度を完了します。

教育介入の参加者は、胃腸内視鏡検査におけるインフォームドコンセントの原則とコンポーネントに関する標準化された20分間の教訓的な講義に最初に出席します。 このセッションでは、上部および下部内視鏡検査の目的とリスク、代替診断オプション、患者の懸念への対処、倫理的法的考慮事項などの重要なトピックをカバーします。 この講義は、シミュレーションベースの練習セッションの前に統一された知識ベースを確保するように設計されています。

シミュレーションベースのトレーニング

参加者は、割り当てられたモダリティを使用して、30分間のシミュレーションベースのプラクティスに従事します。

  • コントロールグループ - ピアロールプレイ:参加者は、仲間の研修生とペアになり、医師と患者の役割を交互に行います。 標準化されたケースプロンプトを使用して、研修生はインフォームドコンセントの議論を行います。 各対話の後、患者の役割の参加者は、提供されたチェックリストに基づいてピアフィードバックを提供します。
  • 介入グループ - 生成AIロールプレイ:参加者は、AI駆動型仮想患者インターフェイスと個別に対話します。 このシミュレーションは、AI患者がリアルタイムで研修生の入力に応答する動的なインフォームドコンセントの会話を導きます。 このプラットフォームは、現実的な患者のペルソナをエミュレートするようにプログラムされており、各シナリオの後に自動化された個別化されたフィードバックを提供し、コンテンツの完全性、トーン、共感、明確さに焦点を当てています。

両方のグループで使用されるロールプレイシナリオは、臨床コンテキスト(つまり、上部内視鏡検査と大腸内視鏡検査の組み合わせのインフォームドコンセント)、関連する患者の歴史、および同じ必要なコミュニケーションタスクを含む内容と一致します。 この設計は、結果の違いが、複雑さの違いではなく、配信モードに起因することを保証することを目的としています。

介入後評価シミュレーションセッション後、すべての参加者は、シミュレートされた患者の遭遇を含む標準化されたポストテストを完了します。 この評価では、研修生は、一貫したスクリプト化された患者のペルソナに続いて、標準化された患者(SP、つまり俳優)から上部内視鏡検査と大腸内視鏡検査の組み合わせのインフォームドコンセントを取得する必要があります。 SPは、参加者全体で一貫した応答を提供するように訓練されます。

すべての相互作用は、評価のためにビデオ録音され、匿名性を維持するために顔の特徴を特定することがキャプチャされないようにします。 評価者はグループの割り当てに盲目にされます。

テスト後の直後のフォローアップ調査では、参加者はインフォームドコンセントを取得する際に自己効力感を再評価するフォローアップ調査を完了します。 介入グループは、AIベースのプラットフォームの使いやすさ、知覚された教育的価値、および受け入れを評価するフィードバックアンケートも完了します。

結果

  • 主要な結果:

    • 構造化されたチェックリストを使用して評価されたSPポストテスト中にインフォームドコンセントを取得する能力(グループ割り当てを盲目にした評価者)
    • 構造化されたグローバル評価尺度を使用して評価されたSPポストテスト中のコミュニケーションパフォーマンス(グループ割り当てを盲目にした評価者)
  • 二次的な結果:

    oインフォームドコンセントを取得する際の自己効力感の変化(介入後の調査スコア)。

  • その他の結果(介入グループのみ); oリアリズム、使いやすさ、満足度など、AIベースのシミュレーション(介入グループのみ)に対する研修生の認識。

統計分析の定量的データは、標準統計的方法を使用して分析されます。 インフォームドコンセントのパフォーマンススコアと通信スコアのグループ間の違いは、データの分布に応じて、独立したサンプルT検定またはMann-Whitney Uテストを使用して評価されます。 混合設計(反復測定)ANOVAを使用して、自己効力感の事前ポストの変化を評価し、時間とグループ間の相互作用効果をテストします(AI対ピアロールプレイ)。 自由回答形式の調査回答からの定性的データは、帰納的コーディングアプローチに従ってテーマ分析を使用して分析されます。

研究の種類

介入

入学 (推定)

40

段階

  • 適用できない

連絡先と場所

このセクションには、調査を実施する担当者の連絡先の詳細と、この調査が実施されている場所に関する情報が記載されています。

研究場所

    • Ontario
      • Toronto、Ontario、カナダ、M5G 0A4
        • 募集
        • Scarborough Health Network, University of Toronto
        • コンタクト:
          • Samir Grover, MD, MEd, FRCPC
          • 電話番号:416284-8131
          • メールsgrover@shn.ca

参加基準

研究者は、適格基準と呼ばれる特定の説明に適合する人を探します。これらの基準のいくつかの例は、人の一般的な健康状態または以前の治療です。

適格基準

就学可能な年齢

  • 大人
  • 高齢者

健康ボランティアの受け入れ

はい

説明

包含基準:

1)トロント大学に在籍する医師の研修生。

除外基準:

1)実際の臨床またはシミュレートされた設定のいずれかで、内視鏡処置のインフォームドコンセントを25回以上、以前にインフォームドコンセントを取得しています。

研究計画

このセクションでは、研究がどのように設計され、研究が何を測定しているかなど、研究計画の詳細を提供します。

研究はどのように設計されていますか?

デザインの詳細

  • 主な目的:他の
  • 割り当て:ランダム化
  • 介入モデル:並列代入
  • マスキング:独身

武器と介入

参加者グループ / アーム
介入・治療
実験的:AIロールプレイ
参加者は、内視鏡手順の現実的な同意議論を模倣するように設計された生成的AI駆動型の患者シミュレーションと対話します。 AIは、研修生の入力に動的に応答し、同意プロセスの重要な要素を促します。 各ケースの後、生成AIプラットフォームは、研修生に個別のフィードバックを提供します。 トレーニングは30分間続きます。 同じ患者の症例が両方のグループで使用されます。
参加者は、内視鏡手順の現実的な同意議論を模倣するように設計された生成的なAI主導の患者シミュレーションを使用して、インフォームドコンセントシナリオをロールプレイします。
アクティブコンパレータ:ピアロールプレイ
参加者は、このグループの別の研修生(つまり、ピア)とペアになり、標準化されたプロンプトとガイドラインを使用して、医師と患者の役割を交互に行うロールプレイエクササイズを実施します。 各ケースの後、患者を描いた研修生は、参加者を描写する個々の人にフィードバックを提供するように求められます。 トレーニングは30分間続きます。 同じ患者の症例が両方のグループで使用されます。
参加者は、ピアとのロールプレイインフォームドコンセントディスカッション(つまり、このグループに無作為化された別の参加者)と

この研究は何を測定していますか?

主要な結果の測定

結果測定
メジャーの説明
時間枠
インフォームドコンセントチェックリスト
時間枠:1日目(トレーニング後すぐ)
3ポイントスケール(Yes(2)、Partial(2)、No(0))および10ポイントグローバル評価尺度で評価されたインフォームドコンセントプロセスの19の重要なステップの概要を概説する20項目チェックリスト。 最大合計スコアはチェックリストで28、グローバル評価尺度で10(全体で38)で、スコアが高いほどパフォーマンスが向上します。 トレーニング(1日目)直後に実施されたSP後のテスト中の研修生のパフォーマンスは、このスケールを使用して評価されます。
1日目(トレーニング後すぐ)
コミュニケーションスキル
時間枠:1日目(トレーニング後すぐ)
コミュニケーションスキルグローバル評価フォームHodges B、McIlroy JHが発行。 分析的なグローバルOSCE評価は、トレーニングのレベルに敏感です。 Med Educ 2003; 37:1012-6。 スケールは、全体的なコミュニケーション、共感、一貫性、口頭および非言語的コミュニケーションを1〜5ポイントスケールで評価します。 最大スコアは25で、スコアが高いほどパフォーマンスが向上します。 トレーニング(1日目)直後に実施されたSP後のテスト中の研修生のパフォーマンスは、このスケールを使用して評価されます。
1日目(トレーニング後すぐ)

二次結果の測定

結果測定
メジャーの説明
時間枠
自己効力感
時間枠:ベースラインと1日目
インフォームドコンセントを実行するための自己効力感の変化は、Banduraのフレームワークに基づいて開発された自己効力感スケールを使用して吐き出されます。 自己効力感スケールには、0〜100スケールで評価された9つのアイテムが含まれています(0 =まったくできません; 50 =モデラルに確実にできる; 100 =非常に確実にできる)。 高いスコアは、より高い自己効力感を示します。 研修生は、ベースラインおよび1日目(SP後のテスト後)でインフォームドコンセントを実行するために自己効力感を評価します。
ベースラインと1日目

その他の成果指標

結果測定
メジャーの説明
時間枠
AIプラットフォームの認識(AIロールプレイグループのみ)
時間枠:1日目
全体的な経験、リアリズム、有用性、受容性、エンゲージメント、フィードバックの品質を含むAIプラットフォームの参加者の評価は、それぞれ1〜5スケールで評価されます(アンカー:非常に貧弱、貧弱、公正、良い、優れた)。 合計スコア30。 研修生は、AIプラットフォームを1日目(SP後のテスト後)に評価します。
1日目
AIシステムユーザビリティ(AIロールプレイグループのみ)
時間枠:1日目
5ポイントスケールで10のドメインを評価するシステムユーザビリティ(SUS)スケールを使用して評価されたAIプラットフォームの教育技術のユーザビリティ評価。 合計スコアは50で、スコアが高いほど使いやすくなります。 研修生は、1日目(SP後のテスト後)にSUSスケールを完了します。
1日目

協力者と研究者

ここでは、この調査に関係する人々や組織を見つけることができます。

出版物と役立つリンク

研究に関する情報を入力する責任者は、自発的にこれらの出版物を提供します。これらは、研究に関連するあらゆるものに関するものである可能性があります。

研究記録日

これらの日付は、ClinicalTrials.gov への研究記録と要約結果の提出の進捗状況を追跡します。研究記録と報告された結果は、国立医学図書館 (NLM) によって審査され、公開 Web サイトに掲載される前に、特定の品質管理基準を満たしていることが確認されます。

主要日程の研究

研究開始 (実際)

2025年7月2日

一次修了 (推定)

2025年9月1日

研究の完了 (推定)

2026年12月31日

試験登録日

最初に提出

2025年6月30日

QC基準を満たした最初の提出物

2025年7月15日

最初の投稿 (実際)

2025年7月16日

学習記録の更新

投稿された最後の更新 (実際)

2025年7月16日

QC基準を満たした最後の更新が送信されました

2025年7月15日

最終確認日

2025年7月1日

詳しくは

本研究に関する用語

個々の参加者データ (IPD) の計画

個々の参加者データ (IPD) を共有する予定はありますか?

未定

医薬品およびデバイス情報、研究文書

米国FDA規制医薬品の研究

いいえ

米国FDA規制機器製品の研究

いいえ

この情報は、Web サイト clinicaltrials.gov から変更なしで直接取得したものです。研究の詳細を変更、削除、または更新するリクエストがある場合は、register@clinicaltrials.gov。 までご連絡ください。 clinicaltrials.gov に変更が加えられるとすぐに、ウェブサイトでも自動的に更新されます。

購読する