이 페이지는 자동 번역되었으며 번역의 정확성을 보장하지 않습니다. 참조하십시오 영문판 원본 텍스트의 경우.

실제 사례에서의 진단 및 치료를 위한 AI 대형 모델 평가: 다기관 후향적 연구

2026년 1월 26일 업데이트: First Affiliated Hospital of Fujian Medical University

실제 임상 사례에서 AI 대형 모델의 진단 및 치료 평가: 다기관 후향적 연구

본 다기관 후향적 연구는 4개 3차 병원의 비뇨기과에서 수집된 800개의 입원 환자 의무기록을 활용하여 ChatGPT, Gemini, Deepseek 등 세 가지 대규모 언어 모델의 진단 및 치료 성능을 평가하는 것을 목표로 합니다. 이 연구는 실제 임상 환경에서의 의사 결정 지원에 있어 이러한 모델의 잠재적 가치와 한계를 탐구하기 위해, 질병 인식, 예비 진단 및 치료 권장 사항 생성에서의 정확성과 적용 가능성에 중점을 둘 것입니다.

연구 개요

상태

모병

정황

비뇨기과 질환

개입 / 치료

다른: 대형 언어 모델 평가 (ChatGPT, Gemini, DeepSeek)

연구 유형

관찰

등록 (추정된)

800

연락처 및 위치

이 섹션에서는 연구를 수행하는 사람들의 연락처 정보와 이 연구가 수행되는 장소에 대한 정보를 제공합니다.

연구 연락처

이름: Ning Xu
전화번호: +86-13235907575
이메일: drxun@fjmu.edu.cn

연구 장소

중국
- - Fuzhou, 중국
    - 모병
    - The First Affiliated Hospital of Fujian Medical University

참여기준

연구원은 적격성 기준이라는 특정 설명에 맞는 사람을 찾습니다. 이러한 기준의 몇 가지 예는 개인의 일반적인 건강 상태 또는 이전 치료입니다.

자격 기준

공부할 수 있는 나이

성인
고령자

건강한 자원 봉사자를 받아들입니다

아니

샘플링 방법

비확률 샘플

연구 인구

연구 대상군은 다음과 같은 기관에서 선정되었습니다: 복건의과대학 제1부속병원, 복건의과대학 제2부속병원, 석사시인민병원 및 소무시인민병원

설명

포함 기준:

사례 데이터는 연구에 참여한 네 병원에서 수집되었으며, 완전하고 진정한 진단 및 치료 기록을 보유합니다.
환자는 18세 이상이어야 하며, 성별 제한이 없습니다.
환자의 기본 정보, 현재 병력, 과거 병력, 신체 검사, 보조 검사(실험실 및 영상 검사 포함) 등 핵심 정보를 포함한 완전한 의무 기록이 필요합니다.
명확한 퇴원 진단 및 치료 계획(치료 조치 및 추적 관찰 계획 포함)이 있어야 합니다.
의무 기록은 보관되었으며, 객관적이고 정확한 정보로 변경되지 않았습니다.
환자 또는 법정 대리인이 동의서를 작성하여 익명화된 의료 데이터를 연구 분석에 사용하는 데 동의했습니다.

제외 기준:

핵심 임상 세부 정보(현재 병력, 진단 또는 치료 기록 등)와 같이 중요한 정보가 누락된 의무 기록.
진단 또는 치료 계획이 불명확하거나, 초기 진단에 대한 치료가 완전히 완료되지 않은 사례.
주요 진단이 비뇨기과적이지 않은 사례.
추가 평가에 영향을 줄 수 있는 주요 오류나 불일치가 기록에 있는 사례.
특수 형식이나 읽을 수 없는 이미지(예: 손글씨, 비표준 문서)로 된 의무 기록.
동의서에 서명하지 않았거나 의료 데이터를 연구에 사용하는 것을 거부한 환자.

공부 계획

이 섹션에서는 연구 설계 방법과 연구가 측정하는 내용을 포함하여 연구 계획에 대한 세부 정보를 제공합니다.

연구는 어떻게 설계됩니까?

디자인 세부사항

연구는 무엇을 측정합니까?

주요 결과 측정

결과 측정	측정값 설명	기간
진단 정확도: Top-1 정확도로 평가됨 기간: 연구 완료까지, 평균 3개월	Top-1: 모델의 첫 번째 진단이 실제 주요 진단과 일치하는 경우의 비율.	연구 완료까지, 평균 3개월
진단 정확도: Top-3 정확도로 평가 기간: 연구 완료 시까지, 평균 3개월	Top-3: 참 진단이 모델의 상위 3개에 포함되는 경우의 비율.	연구 완료 시까지, 평균 3개월
진단 완전성 기간: 연구 완료 시까지, 평균 3개월	모델의 진단 중 사례의 모든 진단(1차 및 2차)과 중복되는 비율.	연구 완료 시까지, 평균 3개월
차별 진단 품질 기간: 연구 완료까지 평균 3개월	전문가들이 리커트 5점 척도를 사용하여 평가하였으며, 일반적인 질병 범위, 논리적 명확성 및 특이성과 같은 요소를 고려함	연구 완료까지 평균 3개월
치료 계획 품질 기간: 연구 완료 시까지, 평균 3개월	모델의 치료 제안이 임상 지침과 일치하는지 평가하며, 전문가가 완전성, 적절성 및 안전성에 대해 점수를 매깁니다.	연구 완료 시까지, 평균 3개월
분석 시간 기간: 연구 완료까지, 평균 3개월	5. AI 모델이 진단 및 치료 제안을 제공하는 데 걸린 시간(초 단위), 실시간 능력을 반영합니다.	연구 완료까지, 평균 3개월

공동 작업자 및 조사자

여기에서 이 연구와 관련된 사람과 조직을 찾을 수 있습니다.

스폰서

First Affiliated Hospital of Fujian Medical University

연구 기록 날짜

이 날짜는 ClinicalTrials.gov에 대한 연구 기록 및 요약 결과 제출의 진행 상황을 추적합니다. 연구 기록 및 보고된 결과는 공개 웹사이트에 게시되기 전에 특정 품질 관리 기준을 충족하는지 확인하기 위해 국립 의학 도서관(NLM)에서 검토합니다.

연구 주요 날짜

연구 시작 (추정된)

2026년 1월 1일

기본 완료 (추정된)

2026년 4월 1일

연구 완료 (추정된)

2026년 6월 1일

연구 등록 날짜

최초 제출

2025년 12월 9일

QC 기준을 충족하는 최초 제출

2026년 1월 26일

처음 게시됨 (실제)

2026년 1월 30일

연구 기록 업데이트

마지막 업데이트 게시됨 (실제)

2026년 1월 30일

QC 기준을 충족하는 마지막 업데이트 제출

2026년 1월 26일

마지막으로 확인됨

2026년 1월 1일

추가 정보

이 연구와 관련된 용어

키워드

추가 관련 MeSH 약관

기타 연구 ID 번호

MRCTA,ECFAH of FMU[2025]902

개별 참가자 데이터(IPD) 계획

개별 참가자 데이터(IPD)를 공유할 계획입니까?

아니요

약물 및 장치 정보, 연구 문서

미국 FDA 규제 의약품 연구

아니

미국 FDA 규제 기기 제품 연구

아니

이 정보는 변경 없이 clinicaltrials.gov 웹사이트에서 직접 가져온 것입니다. 귀하의 연구 세부 정보를 변경, 제거 또는 업데이트하도록 요청하는 경우 register@clinicaltrials.gov. 문의하십시오. 변경 사항이 clinicaltrials.gov에 구현되는 즉시 저희 웹사이트에도 자동으로 업데이트됩니다. .

비뇨기과 질환에 대한 임상 시험

University of Pennsylvania

완전한

심근경색 환자의 약물 순응도를 개선하기 위한 자동화된 호버링(Heartstrong) (Heartstrong)

Intrntl Classification of Diseases, 9th Revision, (ICD-9-CM) 410의 주진단 또는 이차진단 코드가 있는 환자(5번째 숫자가 2인 경우 제외)

미국

대형 언어 모델 평가 (ChatGPT, Gemini, DeepSeek)에 대한 임상 시험

The Hong Kong Polytechnic University

완전한

대형 언어 모델 기반 근시 보조 시스템 개발 및 검증

근시 | 대규모 언어 모델

중국
Bursa City Hospital

모집하지 않고 적극적으로

수술 전 마취 평가에서 인공지능 모델을 사용한 비심장 수술 예정 환자의 심장내과 상담 필요성 예측 가능성

마취에서 인공 지능의 활용 | 수술 전 심장학 상담 요구사항

터키 (Türkiye)
Kirsehir Ahi Evran Universitesi

완전한

LLM 기반 퇴행성 무릎 질환 재활 (LLM-RehabKnee)

퇴행성 무릎 질환

터키 (Türkiye)