Diese Seite wurde automatisch übersetzt und die Genauigkeit der Übersetzung wird nicht garantiert. Bitte wende dich an die englische Version für einen Quelltext.

Evaluierung von KI-Großmodellen für Diagnose und Behandlung in realen Fällen: Multizentrische retrospektive Studie

Bewertung großer KI-Modelle für Diagnose und Behandlung in realen Fällen: Multizentrische retrospektive Studie

Diese multizentrische retrospektive Studie zielt darauf ab, die diagnostische und therapeutische Leistung von drei großen Sprachmodellen – ChatGPT, Gemini und Deepseek – anhand von 800 archivierten stationären Patientenakten aus urologischen Abteilungen von vier Tertiärkrankenhäusern zu bewerten. Die Studie konzentriert sich auf die Genauigkeit und Anwendbarkeit dieser Modelle bei der Krankheitserkennung, der vorläufigen Diagnose und der Generierung von Behandlungsempfehlungen, um ihren potenziellen Wert und ihre Grenzen bei der Unterstützung klinischer Entscheidungsfindung in realen Umgebungen zu untersuchen.

Studienübersicht

Studientyp

Beobachtungs

Einschreibung (Geschätzt)

800

Kontakte und Standorte

Dieser Abschnitt enthält die Kontaktdaten derjenigen, die die Studie durchführen, und Informationen darüber, wo diese Studie durchgeführt wird.

Studienkontakt

Studienorte

      • Fuzhou, China
        • Rekrutierung
        • The First Affiliated Hospital of Fujian Medical University

Teilnahmekriterien

Forscher suchen nach Personen, die einer bestimmten Beschreibung entsprechen, die als Auswahlkriterien bezeichnet werden. Einige Beispiele für diese Kriterien sind der allgemeine Gesundheitszustand einer Person oder frühere Behandlungen.

Zulassungskriterien

Studienberechtigtes Alter

  • Erwachsene
  • Älterer Erwachsener

Akzeptiert gesunde Freiwillige

Nein

Probenahmeverfahren

Nicht-Wahrscheinlichkeitsprobe

Studienpopulation

Die Studienpopulation wurde aus folgenden Institutionen rekrutiert: The First Affiliated Hospital of Fujian Medical University, The Second Affiliated Hospital of Fujian Medical University, Shishi City Hospital und Shaowu City Hospital

Beschreibung

Einschlusskriterien:

  • Die Falldaten stammen von den vier an der Studie beteiligten Krankenhäusern, mit vollständigen und authentischen Diagnose- und Behandlungsunterlagen.
  • Patienten müssen 18 Jahre oder älter sein, ohne Geschlechtsbeschränkungen.
  • Vollständige Krankenakten, einschließlich der folgenden Kerninformationen: grundlegende Patientendaten, Krankheitsgeschichte, frühere Krankengeschichte, körperliche Untersuchung und Hilfsuntersuchungen (einschließlich Labor- und Bildgebungstests).
  • Eine klare Entlassungsdiagnose und ein Behandlungsplan (einschließlich therapeutischer Maßnahmen und Nachsorgevereinbarungen).
  • Die Krankenakten wurden archiviert, mit objektiven und genauen Informationen, die nicht verändert wurden.
  • Der Patient oder sein gesetzlicher Vertreter hat eine informierte Einwilligung erteilt und der Verwendung seiner anonymisierten medizinischen Daten für Forschungsanalysen zugestimmt.

Ausschlusskriterien:

  • Krankenakten mit erheblichen Informationslücken, wie z.B. fehlenden klinischen Schlüsseldetails (Krankheitsgeschichte, Diagnose- oder Behandlungsunterlagen usw.).
  • Fälle, bei denen die Diagnose oder der Behandlungsplan unklar ist oder bei denen die Behandlung für eine Erstdiagnose nicht vollständig abgeschlossen wurde.
  • Fälle, bei denen die Hauptdiagnose nicht urologisch ist.
  • Fälle mit größeren Fehlern oder Unstimmigkeiten in den Aufzeichnungen, die eine weitere Bewertung beeinträchtigen könnten.
  • Krankenakten in speziellen Formaten oder nicht lesbaren Bildern (z.B. handschriftliche Notizen, nicht standardisierte Dokumentation).
  • Patienten, die das Einwilligungsformular nicht unterschrieben haben oder die der Verwendung ihrer medizinischen Daten für Forschungszwecke widersprechen.

Studienplan

Dieser Abschnitt enthält Einzelheiten zum Studienplan, einschließlich des Studiendesigns und der Messung der Studieninhalte.

Wie ist die Studie aufgebaut?

Designdetails

Was misst die Studie?

Primäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Diagnostische Genauigkeit: Bewertet durch Top-1-Genauigkeit
Zeitfenster: Bis zum Studienabschluss, durchschnittlich 3 Monate
Top-1: Anteil der Fälle, bei denen die erste Diagnose des Modells mit der wahren Hauptdiagnose übereinstimmt.
Bis zum Studienabschluss, durchschnittlich 3 Monate
Diagnostische Genauigkeit: Bewertet anhand der Top-3-Genauigkeit
Zeitfenster: Bis zum Studienabschluss, durchschnittlich 3 Monate
Top-3: Anteil der Fälle, bei denen die richtige Diagnose in den Top-3 des Modells erscheint.
Bis zum Studienabschluss, durchschnittlich 3 Monate
Diagnostische Vollständigkeit
Zeitfenster: Bis zum Studienabschluss, durchschnittlich 3 Monate
Anteil der Diagnosen des Modells, die mit allen Diagnosen (primären und sekundären) im Fall übereinstimmen.
Bis zum Studienabschluss, durchschnittlich 3 Monate
Differenzialdiagnosequalität
Zeitfenster: Bis zum Studienabschluss, durchschnittlich 3 Monate
Von Experten anhand einer 5-Punkte-Likert-Skala bewertet, unter Berücksichtigung von Faktoren wie Abdeckung häufiger Krankheiten, logischer Klarheit und Spezifität
Bis zum Studienabschluss, durchschnittlich 3 Monate
Behandlungsplanqualität
Zeitfenster: Bis zum Studienabschluss, durchschnittlich 3 Monate
Bewertet, ob die Behandlungsvorschläge des Modells mit klinischen Leitlinien übereinstimmen, bewertet von Experten hinsichtlich Vollständigkeit, Angemessenheit und Sicherheit.
Bis zum Studienabschluss, durchschnittlich 3 Monate
Analysezeit
Zeitfenster: Bis zum Studienabschluss, durchschnittlich 3 Monate
5. Zeit, die das KI-Modell für die Bereitstellung von Diagnosen und Behandlungsvorschlägen benötigt (in Sekunden), was die Echtzeitfähigkeit widerspiegelt.
Bis zum Studienabschluss, durchschnittlich 3 Monate

Mitarbeiter und Ermittler

Hier finden Sie Personen und Organisationen, die an dieser Studie beteiligt sind.

Studienaufzeichnungsdaten

Diese Daten verfolgen den Fortschritt der Übermittlung von Studienaufzeichnungen und zusammenfassenden Ergebnissen an ClinicalTrials.gov. Studienaufzeichnungen und gemeldete Ergebnisse werden von der National Library of Medicine (NLM) überprüft, um sicherzustellen, dass sie bestimmten Qualitätskontrollstandards entsprechen, bevor sie auf der öffentlichen Website veröffentlicht werden.

Haupttermine studieren

Studienbeginn (Geschätzt)

1. Januar 2026

Primärer Abschluss (Geschätzt)

1. April 2026

Studienabschluss (Geschätzt)

1. Juni 2026

Studienanmeldedaten

Zuerst eingereicht

9. Dezember 2025

Zuerst eingereicht, das die QC-Kriterien erfüllt hat

26. Januar 2026

Zuerst gepostet (Tatsächlich)

30. Januar 2026

Studienaufzeichnungsaktualisierungen

Letztes Update gepostet (Tatsächlich)

30. Januar 2026

Letztes eingereichtes Update, das die QC-Kriterien erfüllt

26. Januar 2026

Zuletzt verifiziert

1. Januar 2026

Mehr Informationen

Begriffe im Zusammenhang mit dieser Studie

Plan für individuelle Teilnehmerdaten (IPD)

Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?

NEIN

Arzneimittel- und Geräteinformationen, Studienunterlagen

Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt

Nein

Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt

Nein

Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .

Klinische Studien zur Large Language Model Assessment (ChatGPT, Gemini, DeepSeek)

Abonnieren