このページは自動翻訳されたものであり、翻訳の正確性は保証されていません。を参照してください。 英語版 ソーステキスト用。

神経内科における緊急トリアージのための人工知能を活用した仮想アシスタント (AIDEN)

神経内科における緊急トリアージのための人工知能を活用した仮想アシスタントの実装に関するフェーズ 1 トライアル

この研究では、特に医療リソースが限られている場所で、神経学的緊急事態を迅速に特定して対処するための AI を活用した仮想アシスタントの使用を検討します。 この研究の目的は、この AI ツールがより高度なテスト段階に進むのに十分な安全性と精度があるかどうかを確認することです。 この種のものとしては初めての試験で、仮想アシスタントは緊急の神経学的問題を抱えた患者を対象にテストされました。 神経科医はまず臨床記録を使用して AI の推奨事項を検討し、次に患者を対象に AI のパフォーマンスを直接評価しました。 結果は次のとおりです。神経科医はほぼ常に AI の決定に同意し、AI はテストされたすべての側面で以前のバージョンの Chat GPT を上回りました。 患者と医師は AI が非常に効果的であると認識しており、ほとんどの場合において「優れている」または「非常に優れている」と評価されました。 これは、AI が神経学的緊急事態への迅速かつ正確な対処方法を大幅に強化できる可能性があることを示唆していますが、広く使用されるまでにはさらなる試験が必要です。

調査の概要

詳細な説明

背景と目的: 神経系の緊急事態は、特に資源が限られた国において、医療に重大な課題をもたらします。 人工知能 (AI)、特に健康チャットボットは、有望なソリューションを提供します。 ただし、安全性と正確性を確保するには厳密な検証が必要です。 私たちの研究の目的は、緊急の神経学的病状のトリアージ用に設計された AI を活用した仮想アシスタントの診断精度と解決効果を評価し、後続の検証テストに進むことができる最低限の安全基準を確保することです。

方法: このフェーズ 1 試験では、緊急神経学的トリアージのための AI を活用した仮想アシスタントのパフォーマンスを評価します。 緊急の神経学的病状を有する18歳以上の患者10人が選択された。 第 1 段階では、9 人の神経内科医が臨床記録を使用して仮想アシスタントの安全性を評価しました。 2 番目のパートでは、患者が使用した際のアシスタントの正確性が評価されました。 最後に、そのパフォーマンスを Chat GPT 3.5 および 4 と比較しました。

研究の種類

介入

入学 (実際)

10

段階

  • 初期フェーズ 1

連絡先と場所

このセクションには、調査を実施する担当者の連絡先の詳細と、この調査が実施されている場所に関する情報が記載されています。

研究場所

参加基準

研究者は、適格基準と呼ばれる特定の説明に適合する人を探します。これらの基準のいくつかの例は、人の一般的な健康状態または以前の治療です。

適格基準

就学可能な年齢

  • 大人
  • 高齢者

健康ボランティアの受け入れ

いいえ

説明

包含基準:

  • 神経学的緊急事態のためERを受診している18歳以上の患者

除外基準:

  • 妊娠

研究計画

このセクションでは、研究がどのように設計され、研究が何を測定しているかなど、研究計画の詳細を提供します。

研究はどのように設計されていますか?

デザインの詳細

  • 主な目的:診断
  • 割り当て:非ランダム化
  • 介入モデル:単一グループの割り当て
  • マスキング:なし(オープンラベル)

武器と介入

参加者グループ / アーム
介入・治療
実験的:仮想アシスタント
患者は仮想アシスタントを使用して、最近の ER 訪問についての質問に答えます。
ステージ 1 では安全性に重点を置き、仮想アシスタントの臨床記録からの医療情報のみを使用しました。 精度を評価するステージ 2 では、参加者は医療安定化後の仮想アシスタントと対話しました。 さらに、参加者は、Chat-GPT 入力の初期症状の詳細も提供しました。 救急を専門とする9人の神経内科医が研究に参加した。 ステージ 1 では、臨床病歴情報を使用して仮想アシスタントのパフォーマンスを評価しました。 ステージ 2 では、参加者とアシスタントの対話の結果を分析し、Chat-GPT の比較評価を実行しました。 仮想アシスタントは、スペイン語を使用し、対話用の高度なアルゴリズム、デシジョン ツリー、および大規模な言語モデルを組み込んで、WhatsApp および Telegram 上のチャットボットとして機能しました。 比較のために、Chat-GPT バージョン 3.5 および 4 を利用し、自然なスペイン語の 2 つのプロンプト タイプを使用しました。1 つは臨床記録データを組み込んだもので、もう 1 つは参加者の説明に基づいたものです。
アクティブコンパレータ:チャットGPT 3.5
患者は最近の ER 訪問について ChatGPT を使用して質問に答えます。
ステージ 1 では安全性に重点を置き、仮想アシスタントの臨床記録からの医療情報のみを使用しました。 精度を評価するステージ 2 では、参加者は医療安定化後の仮想アシスタントと対話しました。 さらに、参加者は、Chat-GPT 入力の初期症状の詳細も提供しました。 救急を専門とする9人の神経内科医が研究に参加した。 ステージ 1 では、臨床病歴情報を使用して仮想アシスタントのパフォーマンスを評価しました。 ステージ 2 では、参加者とアシスタントの対話の結果を分析し、Chat-GPT の比較評価を実行しました。 仮想アシスタントは、スペイン語を使用し、対話用の高度なアルゴリズム、デシジョン ツリー、および大規模な言語モデルを組み込んで、WhatsApp および Telegram 上のチャットボットとして機能しました。 比較のために、Chat-GPT バージョン 3.5 および 4 を利用し、自然なスペイン語の 2 つのプロンプト タイプを使用しました。1 つは臨床記録データを組み込んだもので、もう 1 つは参加者の説明に基づいたものです。
アクティブコンパレータ:チャットGPT 4
患者は最近の ER 訪問について ChatGPT を使用して質問に答えます。
ステージ 1 では安全性に重点を置き、仮想アシスタントの臨床記録からの医療情報のみを使用しました。 精度を評価するステージ 2 では、参加者は医療安定化後の仮想アシスタントと対話しました。 さらに、参加者は、Chat-GPT 入力の初期症状の詳細も提供しました。 救急を専門とする9人の神経内科医が研究に参加した。 ステージ 1 では、臨床病歴情報を使用して仮想アシスタントのパフォーマンスを評価しました。 ステージ 2 では、参加者とアシスタントの対話の結果を分析し、Chat-GPT の比較評価を実行しました。 仮想アシスタントは、スペイン語を使用し、対話用の高度なアルゴリズム、デシジョン ツリー、および大規模な言語モデルを組み込んで、WhatsApp および Telegram 上のチャットボットとして機能しました。 比較のために、Chat-GPT バージョン 3.5 および 4 を利用し、自然なスペイン語の 2 つのプロンプト タイプを使用しました。1 つは臨床記録データを組み込んだもので、もう 1 つは参加者の説明に基づいたものです。

この研究は何を測定していますか?

主要な結果の測定

結果測定
メジャーの説明
時間枠
診断性能
時間枠:参加者と仮想アシスタントの間の最初の対話は、イベントから 1 年も経たないうちに行われました。結果の尺度は、患者と仮想アシスタントの間の対話の直後に評価されました。

患者の病気や状態を正確に特定する際の医療検査や診断ツールの精度と有効性を指します。

症候群診断の合意: 評価する神経科医は、AI ツールが特定の疾患を特定するのではなく、一般的に共存する一連の兆候や症状に基づいて状態を特定できる場合に、症候群診断が正確であるとみなしました。 この方法は、症状の原因となっている正確な病気がすぐには特定できない場合に適用され、医療提供者が患者の症状を効果的に監視して治療できるようになります。

鑑別診断の一致: 各 AI ツールによって提供された差異が参加者によって提示された差異と一致する場合、鑑別診断は正確であると見なされます。

診断のゴールドスタンダードは、救急外来で与えられた診断が 1 か月間変化しないものであると考えられていました。

参加者と仮想アシスタントの間の最初の対話は、イベントから 1 年も経たないうちに行われました。結果の尺度は、患者と仮想アシスタントの間の対話の直後に評価されました。

二次結果の測定

結果測定
メジャーの説明
時間枠
適切な医療行為または推奨事項
時間枠:参加者と仮想アシスタントの間の最初の対話は、イベントから 1 年も経たないうちに行われました。結果の尺度は、患者と仮想アシスタントの間の対話の直後に評価されました。

症例解決は、適切な医療行為または推奨事項に基づいて評価され、1) 緊急性は即時、2) 短期 (48 時間以内)、3) または非緊急に分類されました。

各 AI ツールによって提供される推奨事項は、病歴から収集した情報と参加者からの入力に基づいて評価されました。

適切な医療行為または推奨のゴールドスタンダードは、救急部門で行われ、1 か月間変化がなかったものであると考えられていました。

参加者と仮想アシスタントの間の最初の対話は、イベントから 1 年も経たないうちに行われました。結果の尺度は、患者と仮想アシスタントの間の対話の直後に評価されました。
使いやすさと満足度の評価
時間枠:参加者と仮想アシスタントの間の最初の対話は、イベントから 1 年も経たないうちに行われました。結果の尺度は、患者と仮想アシスタントの間の対話の直後に評価されました。

使いやすさは、神経内科医と参加者の両方による、最終的な診断と解決に必要な時間と質問の数によって測定されました。 チャット GPT については、相談理由の作成にかかる時間を評価しました。

1 ~ 5 の満足度スケールが実装され、1 は否定的な経験 (「悪い」、患者にとって潜在的に危険) を示し、5 は非常に肯定的な経験 (「優れた」、非専門的な人間のトリアージを超える可能性がある) を示します。 簡単な「はい/いいえ」アンケートも参加者に適用され、アシスタントの質問のわかりやすさ、緊急度に応じた紹介の適切性、およびアシスタントが専門外のトリアージの代わりになるか、または緊急到着時間を短縮できると考えるかについて尋ねました。

参加者と仮想アシスタントの間の最初の対話は、イベントから 1 年も経たないうちに行われました。結果の尺度は、患者と仮想アシスタントの間の対話の直後に評価されました。

協力者と研究者

ここでは、この調査に関係する人々や組織を見つけることができます。

協力者

捜査官

  • 主任研究者:Mauricio F Farez, MD MPH、Fundación para la Lucha contra las Enfermedades Neurológicas de la Infancia

出版物と役立つリンク

研究に関する情報を入力する責任者は、自発的にこれらの出版物を提供します。これらは、研究に関連するあらゆるものに関するものである可能性があります。

研究記録日

これらの日付は、ClinicalTrials.gov への研究記録と要約結果の提出の進捗状況を追跡します。研究記録と報告された結果は、国立医学図書館 (NLM) によって審査され、公開 Web サイトに掲載される前に、特定の品質管理基準を満たしていることが確認されます。

主要日程の研究

研究開始 (実際)

2023年10月1日

一次修了 (実際)

2024年1月1日

研究の完了 (実際)

2024年1月1日

試験登録日

最初に提出

2024年3月6日

QC基準を満たした最初の提出物

2024年3月21日

最初の投稿 (実際)

2024年3月28日

学習記録の更新

投稿された最後の更新 (実際)

2024年3月28日

QC基準を満たした最後の更新が送信されました

2024年3月21日

最終確認日

2024年3月1日

詳しくは

本研究に関する用語

個々の参加者データ (IPD) の計画

個々の参加者データ (IPD) を共有する予定はありますか?

いいえ

IPD プランの説明

IPDは共有しません

医薬品およびデバイス情報、研究文書

米国FDA規制医薬品の研究

いいえ

米国FDA規制機器製品の研究

いいえ

この情報は、Web サイト clinicaltrials.gov から変更なしで直接取得したものです。研究の詳細を変更、削除、または更新するリクエストがある場合は、register@clinicaltrials.gov。 までご連絡ください。 clinicaltrials.gov に変更が加えられるとすぐに、ウェブサイトでも自動的に更新されます。

仮想アシスタントの臨床試験

3
購読する