Diese Seite wurde automatisch übersetzt und die Genauigkeit der Übersetzung wird nicht garantiert. Bitte wende dich an die englische Version für einen Quelltext.

KI-unterstützte Stadieneinteilung und Behandlungsentscheidung für das hepatozelluläre Karzinom

13. April 2026 aktualisiert von: Jiahong Dong,MD, Beijing Tsinghua Chang Gung Hospital

Eine prospektive, randomisierte, kontrollierte Crossover-Studie zur künstlichen Intelligenz-gestützten mehrdimensionalen Stadieneinteilung und Behandlungsentscheidung beim hepatozellulären Karzinom

Die präzise Behandlung des primären hepatozellulären Karzinoms (HCC) hängt stark von einer genauen Stadieneinteilung der Erkrankung (CNLC, TNM, BCLC) und einer wissenschaftlichen Therapieentscheidung ab, was die Integration sowohl von bildgebenden als auch von klinischen Basiswerten erfordert. Diese Studie rekrutiert prospektiv HCC-Patienten und klinische Ärzte aus verschiedenen Krankenhausstufen, um den klinischen Wert eines selbstentwickelten künstlichen Intelligenz (KI)-Modells bei der Unterstützung der mehrdimensionalen umfassenden Bewertung und Therapieentscheidung zu evaluieren. Unter Verwendung eines Multi-Rater Multi-Case (MRMC)-Crossover-Balanced-Designs vergleicht die Studie die Genauigkeit der klinischen Bewertungen, die von Ärzten unter "ohne Unterstützung (ohne KI)" versus "KI-unterstützt" durchgeführt werden. Ein Hauptaugenmerk liegt darauf zu untersuchen, ob KI die umfassenden Bewertungsfähigkeiten von Ärzten in Primär-/Sekundärversorgungskrankenhäusern signifikant verbessern kann, um so prospektiv die diagnostische und therapeutische Heterogenität über verschiedene institutionelle Ebenen hinweg zu reduzieren.

Studienübersicht

Detaillierte Beschreibung

  1. Studienbeschreibung

    Kurzzusammenfassung: Die präzise Behandlung des primären hepatozellulären Karzinoms (HCC) hängt stark von einer genauen Krankheitsstadienerfassung (CNLC, TNM, BCLC) und einer wissenschaftlichen Therapieentscheidung ab, was die Integration sowohl von Bildgebungs- als auch von klinischen Basisdaten erfordert. Diese Studie rekrutiert prospektiv HCC-Patienten und klinische Ärzte verschiedener Krankenhausstufen, um den klinischen Nutzen eines selbstentwickelten künstlichen Intelligenz (KI)-Modells bei der Unterstützung einer mehrdimensionalen Gesamtbeurteilung und Therapieentscheidung zu bewerten. Unter Verwendung eines Multi-Rater Multi-Case (MRMC)-Crossover-ausgeglichenen Designs vergleicht die Studie die Genauigkeit der klinischen Bewertungen, die von Ärzten unter „nicht unterstützten (ohne KI)“ versus „KI-unterstützten“ Bedingungen durchgeführt werden. Ein besonderer Fokus liegt darauf, zu untersuchen, ob KI die umfassenden Beurteilungsfähigkeiten von Ärzten in Primär-/Sekundärversorgungskrankenhäusern signifikant verbessern kann, wodurch prospektiv die diagnostische und therapeutische Heterogenität über verschiedene institutionelle Ebenen hinweg verringert werden könnte.

    Goldstandard (Referenzstandard): Der Referenzstandard (Ground Truth) für alle prospektiv eingeschlossenen Fälle wird von einem unabhängigen Expertengremium bestehend aus 3 autoritativen Experten festgelegt. Das Gremium bestimmt die endgültigen Standardantworten für die vier Klassifizierungsaufgaben durch verblindete unabhängige Bewertung und gemeinsame Diskussion (Abstimmungssystem) unter Einbeziehung vollständiger prospektiver Bildgebungsdaten, klinischer Basisdaten, des Konsenses eines multidisziplinären Teams (MDT) sowie endgültiger pathologischer oder klinischer Nachuntersuchungsergebnisse.

  2. Eignungskriterien

2.1 Bewertereignung:

  1. Oberärzte in Krankenhäusern der Maximalversorgung (Tertiärversorgung): Angestellt in der Abteilung für hepato-pankreato-biliäre Chirurgie, Onkologie oder verwandten Abteilungen in Krankenhäusern der Klasse III Grad A (Tertiärversorgung), mit dem Berufstitel eines Facharztes oder höher.
  2. Assistenzärzte in Krankenhäusern der Maximalversorgung (Tertiärversorgung): Angestellt in verwandten Abteilungen in Krankenhäusern der Klasse III Grad A (Tertiärversorgung), mit dem Berufstitel eines Assistenzarztes.
  3. Ärzte in Primär-/Sekundärversorgungskrankenhäusern: Klinische Ärzte, angestellt in Kreiskrankenhäusern oder Allgemeinkrankenhäusern der Klasse II.
  4. Einwilligung nach Aufklärung: Muss freiwillig der Teilnahme an der Bewertung zustimmen und das Einwilligungsformular nach Aufklärung unterzeichnen.

2.2 Patienten-/Falleignung:

Einschlusskriterien:

  1. Alter > 18 Jahre.
  2. Patienten, die prospektiv mit Verdacht auf oder neu diagnostiziertem primärem hepatozellulärem Karzinom (HCC) vorstellig werden, das später durch Pathologie bestätigt wird oder den China Leberkrebs (CNLC)-Richtlinien entspricht.
  3. Vollständige klinische Basisdaten, die während der prospektiven Einschlussphase erhoben wurden, einschließlich vollständiger Anamnese der aktuellen/vergangenen Erkrankung, ECOG PS-Score, umfassender Labortests (Leberfunktion, Gerinnung, Tumormarker wie AFP etc.) und Basis-Abdomen-Kontrastmittel-CT.
  4. Patienten (oder ihre gesetzlichen Vertreter) müssen eine schriftliche Einwilligungserklärung für die Verwendung ihrer klinischen Daten in dieser Studie erteilen.

Ausschlusskriterien:

  1. Patienten mit sekundärem (metastatischem) Leberkrebs oder gleichzeitig schweren Malignomen anderer Systeme.
  2. Patienten, die die erforderlichen Basis-Bildgebungs- oder Labortests nicht abschließen, was eine genaue Stadienberechnung verhindert (z.B. fehlende Daten für den Child-Pugh-Score).
  3. Patienten, die vor Einschluss bereits antitumorale Therapien gegen Leberkrebs erhalten haben.

3. Studiendesign

Interventionsmodell: Crossover-Zuteilung Verblindung: Einfachblind. Die teilnehmenden Bewerter sind gegenüber den Goldstandard-Antworten der Fälle und den Bewertungsergebnissen anderer teilnehmender Ärzte verblindet.

Arme und Interventionen:

Fallset-Aufteilung: 108 prospektiv und konsekutiv eingeschlossene geeignete HCC-Fälle werden gebündelt und zufällig in Datenset A (54 Fälle) und Datenset B (54 Fälle) aufgeteilt. Es wird sichergestellt, dass zwischen den beiden Sets keine statistisch signifikanten Unterschiede hinsichtlich Tumorlast, Leberfunktionseinstufung und Stadienverteilung bestehen.

Bewertergruppierung: Insgesamt werden 12 prospektiv rekrutierte klinische Ärzte eingeschlossen, bestehend aus 4 in der Gruppe der Oberärzte der Maximalversorgung, 4 in der Gruppe der Assistenzärzte der Maximalversorgung und 4 in der Gruppe der Primär-/Sekundärversorgung. Sie werden basierend auf stratifizierter Randomisierung in zwei Bewertungsgruppen eingeteilt:

Gruppe A (6 Bewerter): 2 Oberärzte der Maximalversorgung, 2 Assistenzärzte der Maximalversorgung, 2 Primär-/Sekundärversorgung.

Gruppe B (6 Bewerter): 2 Oberärzte der Maximalversorgung, 2 Assistenzärzte der Maximalversorgung, 2 Primär-/Sekundärversorgung.

Arm 1 - Gruppe A Bewerter:

Phase 1 Intervention (Kontrolle): Unabhängige Bewertung von Set A (54 Fälle) unter Kombination klinischer Texte und Bildgebungsdaten, Aufzeichnung der 4 Klassifizierungsergebnisse, ohne KI-Unterstützung.

Phase 2 Intervention (Experimentell): Bewertung von Set B (54 Fälle). Das System präsentiert die 4 Vorhersageergebnisse des KI-Modells und verwandte Evidenz; Ärzte treffen das endgültige Urteil nach umfassender Berücksichtigung.

Arm 2 - Gruppe B Bewerter:

Phase 1 Intervention (Kontrolle): Unabhängige Bewertung von Set B (54 Fälle) unter Kombination klinischer Texte und Bildgebungsdaten, Aufzeichnung der 4 Klassifizierungsergebnisse, ohne KI-Unterstützung.

Phase 2 Intervention (Experimentell): Bewertung von Set A (54 Fälle). Ärzte treffen das endgültige Urteil nach Berücksichtigung der Ergebnisse des KI-Modells.

4. Endpunkte

Primärer Endpunkt:

Verbesserung der Gesamtgenauigkeit: Die Differenz in der durchschnittlichen Genauigkeit über die 4 Klassifizierungsaufgaben hinweg zwischen KI-unterstützter Bewertung (Experimentalgruppe) und unabhängiger Bewertung (Kontrollgruppe).

Sekundäre Endpunkte:

Homogenisierungseffekt: Bewertung, ob die Differenz in der klinischen Bewertungsgenauigkeit zwischen Ärzten der Primär-/Sekundärversorgungsgruppe und den Gruppen der Maximalversorgung unter KI-Unterstützung signifikant reduziert wird.

Bewertungseffizienz: Vergleich der durchschnittlichen Bewertungszeit pro Fall zwischen Ärzten mit und ohne KI-Unterstützung.

Inter-Rater-Übereinstimmung: Vergleich der Konsistenz der Bewertungsergebnisse unter Ärzten (z.B. unter Verwendung von Kappa-Statistiken), mit und ohne KI-Unterstützung.

5. Statistikplan & Stichprobengröße

Begründung der Stichprobengröße:

Die Stichprobenberechnung für diese Studie basiert auf der erwarteten Veränderung der Gesamtdurchschnittsgenauigkeit über alle Ebenen der prospektiv rekrutierten Ärzte hinweg. Es wird geschätzt, dass die Gesamtdurchschnittsgenauigkeit ohne KI-Unterstützung 0,60 beträgt und mit KI-Unterstützung 0,70.

Setzt man das Signifikanzniveau für einen zweiseitigen Test auf 0,05 (entsprechend einem Z-Wert von etwa 1,96) und die statistische Power auf 0,80 (entsprechend einem Z-Wert von etwa 0,84), wurde die Stichprobengröße unter Verwendung der Standardstatistikmethode zum Vergleich zweier unabhängiger Proportionen bestimmt. Unter der Annahme, dass kein Clustering-Effekt durch mehrfache Fallbewertungen desselben Arztes resultiert, zeigt diese Berechnung, dass jede Interventionsgruppe mindestens 353 unabhängige Bewertungen benötigt.

Power-Verifikation:

In der tatsächlichen Konfiguration dieser Studie gibt es insgesamt 12 Ärzte.

Gesamtzahl unabhängiger Bewertungen für die Kontrollgruppe (ohne KI) = Gruppe A (6 Bewerter) x Set A (54 Fälle) + Gruppe B (6 Bewerter) x Set B (54 Fälle) = 648 unabhängige Bewertungen.

Gesamtzahl unabhängiger Bewertungen für die Experimentalgruppe (mit KI) ebenfalls = 648 unabhängige Bewertungen.

Da 648 Bewertungen größer sind als die erforderliche Basis von 353 Bewertungen, besitzt die aktuelle Konfiguration von Fällen und Ärzten bereits ausreichende statistische Power. Diese Stichprobengröße bietet einen konservativen Spielraum (etwa das 1,8-fache der Basisvoraussetzung), um angemessen für etwaige Clustering-Effekte (Intra-Klassen-Korrelation) zu berücksichtigen, die durch mehrfache Fallbewertungen desselben Arztes in diesem MRMC-Design resultieren könnten.

Studientyp

Beobachtungs

Einschreibung (Geschätzt)

108

Kontakte und Standorte

Dieser Abschnitt enthält die Kontaktdaten derjenigen, die die Studie durchführen, und Informationen darüber, wo diese Studie durchgeführt wird.

Studienkontakt

Studienorte

    • Changping
      • Beijing, Changping, China, 102218
        • Rekrutierung
        • Beijing Tsinghua Changgung Hospital
        • Kontakt:

Teilnahmekriterien

Forscher suchen nach Personen, die einer bestimmten Beschreibung entsprechen, die als Auswahlkriterien bezeichnet werden. Einige Beispiele für diese Kriterien sind der allgemeine Gesundheitszustand einer Person oder frühere Behandlungen.

Zulassungskriterien

Studienberechtigtes Alter

  • Erwachsene
  • Älterer Erwachsener

Akzeptiert gesunde Freiwillige

Nein

Probenahmeverfahren

Nicht-Wahrscheinlichkeitsprobe

Studienpopulation

Die Studienpopulation umfasst 108 prospektiv und konsekutiv aufgenommene erwachsene Patienten mit neu diagnostiziertem primären hepatozellulären Karzinom (HCC). Nach Aufnahme und Bestätigung vollständiger klinischer Basis- und Bildgebungsdaten werden diese 108 Patienten-Fälle zufällig in zwei gleiche Datensätze aufgeteilt: Satz A (54 Fälle) und Satz B (54 Fälle). Die Randomisierung ist stratifiziert, um sicherzustellen, dass es keine statistisch signifikanten Unterschiede zwischen den beiden Sätzen in Bezug auf Basismerkmale wie Tumorlast, Leberfunktionsgrad und Stadienverteilung gibt.

Im Rahmen dieses Multi-Rater-Multi-Case (MRMC) Cross-Over-Designs werden diese Patienten-Fälle verschiedenen Bewertungsbedingungen zugeordnet. Die Fälle aus Satz A werden der ersten Gruppe der begutachtenden Ärzte ohne KI-Unterstützung (Kontrollbedingung) und der zweiten Gruppe der Ärzte mit KI-Unterstützung (Versuchs-/Experimentalbedingung) zur Bewertung zugewiesen. Umgekehrt werden die Fälle aus Satz B von der zweiten Gruppe der Ärzte ohne KI

Beschreibung

Einschlusskriterien:

  • Alter ≥ 18 Jahre.
  • Patienten, bei denen prospektiv ein Verdacht auf oder eine neu diagnostizierte primäre hepatozelluläre Karzinom (HCC) vorliegt, die später durch Pathologie bestätigt oder gemäß den China Liver Cancer (CNLC)-Richtlinien erfüllt wird.
  • Vollständige klinische Basisuntersuchungen, die während der prospektiven Einschlussphase erhoben wurden, einschließlich vollständiger Anamnese der aktuellen/vorherigen Erkrankung, ECOG-PS-Score, umfassender Labortests (Leberfunktion, Gerinnung, Tumormarker wie AFP usw.) und Basis-Abdomen-Kontrastmittel-CT.
  • Patienten (oder ihre gesetzlichen Vertreter) müssen eine schriftliche Einwilligungserklärung für die Verwendung ihrer klinischen Daten in dieser Studie abgeben.

Ausschlusskriterien:

  • Patienten mit sekundärem (metastasiertem) Leberkrebs oder gleichzeitigen schweren Malignomen anderer Systeme.
  • Patienten, die die erforderlichen Basis-Bildgebungs- oder Labortests nicht abschließen, wodurch eine genaue Stadienberechnung verhindert wird (z.B. fehlende Daten für den Child-Pugh-Score).
  • Patienten, die vor der Einschreibung bereits anti-tumorale Therapien gegen Leberkrebs erhalten haben.

Studienplan

Dieser Abschnitt enthält Einzelheiten zum Studienplan, einschließlich des Studiendesigns und der Messung der Studieninhalte.

Wie ist die Studie aufgebaut?

Designdetails

Kohorten und Interventionen

Gruppe / Kohorte
Intervention / Behandlung
Gruppe-A-Bewerter
Eine prospektiv rekrutierte Gruppe von 6 Ärzten (2 tertiäre Senioren, 2 tertiäre Junioren und 2 Primär-/Sekundärkrankenhausärzte). In Phase 1 (Kontrolle) bewerten sie unabhängig voneinander HCC-Fallset A ohne KI-Unterstützung. In Phase 2 (experimentell) bewerten sie Fallset B mit Unterstützung des KI-Modells.
Die Ärzte bewerten die HCC-Fälle unabhängig und treffen Stadieneinteilungs- und Behandlungsentscheidungen ausschließlich auf Basis vollständiger klinischer Ausgangsdaten und Bildgebungsdaten, ohne jegliche Unterstützung durch das KI-Modell.
Die Ärzte bewerten die HCC-Fälle und treffen abschließende Entscheidungen zur Stadieneinteilung und Behandlung, nachdem sie die anfänglichen Vorhersagen und die damit verbundenen Beweise, die vom selbstentwickelten künstlichen Intelligenz (KI)-Modell generiert wurden, zusammen mit den klinischen Basis- und Bildgebungsdaten überprüft haben.
Gruppe-B-Bewerter
Eine prospektiv rekrutierte Gruppe von 6 Ärzten (2 tertiäre Senioren, 2 tertiäre Junioren und 2 Primär-/Sekundärkrankenhausärzte). In Phase 1 (Kontrolle) bewerten sie unabhängig voneinander den HCC-Fallset B ohne KI-Unterstützung. In Phase 2 (Experimentell) bewerten sie den Fallset A mit Unterstützung des KI-Modells.
Die Ärzte bewerten die HCC-Fälle unabhängig und treffen Stadieneinteilungs- und Behandlungsentscheidungen ausschließlich auf Basis vollständiger klinischer Ausgangsdaten und Bildgebungsdaten, ohne jegliche Unterstützung durch das KI-Modell.
Die Ärzte bewerten die HCC-Fälle und treffen abschließende Entscheidungen zur Stadieneinteilung und Behandlung, nachdem sie die anfänglichen Vorhersagen und die damit verbundenen Beweise, die vom selbstentwickelten künstlichen Intelligenz (KI)-Modell generiert wurden, zusammen mit den klinischen Basis- und Bildgebungsdaten überprüft haben.

Was misst die Studie?

Primäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Verbesserung der Gesamtgenauigkeit
Zeitfenster: Bis zu 1 Woche (Bewertung nach Abschluss aller Fallauswertungen)
Der Unterschied in der durchschnittlichen Genauigkeit über die 4 Klassifizierungsaufgaben hinweg zwischen der KI-unterstützten Auswertung (experimentell) und der unabhängigen Auswertung (Kontrolle). Die Genauigkeit wird durch den Vergleich der Vorhersagen der Ärzte mit dem Referenzstandard (Ground Truth) bestimmt, der vom unabhängigen Expertengremium festgelegt wurde.
Bis zu 1 Woche (Bewertung nach Abschluss aller Fallauswertungen)

Sekundäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Homogenisierungseffekt auf die Bewertungsgenauigkeit
Zeitfenster: Bis zu 1 Woche (Beurteilt nach Abschluss aller Fallbewertungen)
Bewertung, ob der Unterschied in der klinischen Beurteilungsgenauigkeit zwischen Ärzten in der Primär-/Sekundärkrankenhausgruppe und den Tertiärkrankenhausgruppen unter KI-Unterstützung im Vergleich zur ununterstützten unabhängigen Beurteilung signifikant reduziert wird.
Bis zu 1 Woche (Beurteilt nach Abschluss aller Fallbewertungen)
Evaluierungseffizienz (durchschnittliche Zeit pro Fall)
Zeitfenster: Bis zu 1 Woche (Bewertung nach Abschluss aller Fallauswertungen)
Vergleich der durchschnittlichen Bewertungszeit (z. B. in Minuten gemessen) pro Fall, die von teilnehmenden Ärzten benötigt wird, wenn KI-Unterstützung genutzt wird, im Vergleich zur Durchführung einer unabhängigen Bewertung ohne Unterstützung.
Bis zu 1 Woche (Bewertung nach Abschluss aller Fallauswertungen)
Inter-Rater-Übereinstimmung
Zeitfenster: Bis zu 1 Woche (Bewertet nach Abschluss aller Fallbewertungen)
Vergleich der Übereinstimmung der Bewertungsergebnisse (Stadieneinteilung und Behandlungsentscheidungen) unter allen teilnehmenden Ärzten, bewertet mit geeigneten statistischen Maßnahmen (z. B. Kappa-Statistik), unter KI-unterstützten versus ununterstützten Bedingungen.
Bis zu 1 Woche (Bewertet nach Abschluss aller Fallbewertungen)

Mitarbeiter und Ermittler

Hier finden Sie Personen und Organisationen, die an dieser Studie beteiligt sind.

Studienaufzeichnungsdaten

Diese Daten verfolgen den Fortschritt der Übermittlung von Studienaufzeichnungen und zusammenfassenden Ergebnissen an ClinicalTrials.gov. Studienaufzeichnungen und gemeldete Ergebnisse werden von der National Library of Medicine (NLM) überprüft, um sicherzustellen, dass sie bestimmten Qualitätskontrollstandards entsprechen, bevor sie auf der öffentlichen Website veröffentlicht werden.

Haupttermine studieren

Studienbeginn (Geschätzt)

13. April 2026

Primärer Abschluss (Geschätzt)

13. Mai 2026

Studienabschluss (Geschätzt)

20. Mai 2026

Studienanmeldedaten

Zuerst eingereicht

13. April 2026

Zuerst eingereicht, das die QC-Kriterien erfüllt hat

13. April 2026

Zuerst gepostet (Tatsächlich)

20. April 2026

Studienaufzeichnungsaktualisierungen

Letztes Update gepostet (Tatsächlich)

20. April 2026

Letztes eingereichtes Update, das die QC-Kriterien erfüllt

13. April 2026

Zuletzt verifiziert

1. April 2026

Mehr Informationen

Begriffe im Zusammenhang mit dieser Studie

Plan für individuelle Teilnehmerdaten (IPD)

Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?

UNENTSCHIEDEN

Beschreibung des IPD-Plans

Die Weitergabe von individuellen Teilnehmerdaten, insbesondere hochauflösender medizinischer Bildgebung (CT-Scans) und klinischer Baseline-Daten, unterliegt strengen institutionellen Datensicherheitsrichtlinien und nationalen Vorschriften zum Schutz der Privatsphäre von Patienten. Daher ist ein endgültiger Plan für die öffentliche Datenweitergabe derzeit noch nicht entschieden. Allerdings können vollständig anonymisierte klinische Daten und KI-Modellbewertungsergebnisse auf angemessene Anfrage hin Forschern zur Verfügung gestellt werden, die einen methodisch fundierten Vorschlag vorlegen. Jede solche Weitergabe unterliegt streng der Genehmigung durch die Ethikkommission (IRB) des Beijing Tsinghua Changgung Hospital und der Unterzeichnung einer formellen Datenweitergabevereinbarung.

Arzneimittel- und Geräteinformationen, Studienunterlagen

Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt

Nein

Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt

Nein

Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .

Klinische Studien zur Hepatozelluläres Karzinom (HCC)

Klinische Studien zur Unterstützungsfreie unabhängige Bewertung

Abonnieren