Cette page a été traduite automatiquement et l'exactitude de la traduction n'est pas garantie. Veuillez vous référer au version anglaise pour un texte source.

Raisonnement des médecins sur des cas de diagnostic avec de grands modèles de langage

15 février 2024 mis à jour par: Jonathan Chen, Stanford University

Raisonnement diagnostique avec des chatbots à grand modèle de langage

Cette étude évaluera l'effet de l'accès à GPT-4, un grand modèle de langage, par rapport aux outils traditionnels d'aide à la décision de diagnostic sur les performances des tâches de raisonnement diagnostique basées sur des cas.

Aperçu de l'étude

Statut

Complété

Les conditions

Diagnostic

Intervention / Traitement

Autre: GPT-4

Description détaillée

Les technologies d'intelligence artificielle (IA), en particulier les grands modèles de langage avancés comme ChatGPT d'OpenAI, ont le potentiel d'améliorer la prise de décision médicale. Bien que ChatGPT-4 n'ait pas été développé pour être utilisé dans des applications médicales spécifiques, il s'est révélé prometteur dans divers contextes de soins de santé, notamment la rédaction de notes médicales, le traitement des demandes des patients et la facilitation des consultations médicales. Cependant, on sait peu de choses sur la manière dont ChatGPT augmente les capacités de raisonnement clinique des cliniciens.

Le raisonnement clinique est un processus complexe impliquant la reconnaissance de formes, l’application des connaissances et le raisonnement probabiliste. L'intégration d'outils d'IA tels que ChatGPT-4 dans les flux de travail des médecins pourrait potentiellement contribuer à réduire la charge de travail des cliniciens et à diminuer le risque de diagnostics manqués. Cependant, ChatGPT-4 n’a pas été développé à des fins de raisonnement clinique et n’a pas non plus été validé à cette fin. En outre, il peut faire l’objet de désinformation, notamment de confabulations convaincantes susceptibles d’induire les cliniciens en erreur. Si les cliniciens abusent de cet outil, il risque de ne pas améliorer le raisonnement diagnostique et pourrait même causer des dommages. Par conséquent, il est important d’étudier comment les cliniciens utilisent de grands modèles de langage pour augmenter le raisonnement clinique avant leur intégration systématique dans les soins aux patients.

Dans cette étude, nous randomiserons les participants pour répondre aux cas de diagnostic avec ou sans accès à ChatGPT-4. Les participants seront invités à donner trois diagnostics différentiels pour chaque cas, avec des résultats complémentaires et opposés pour chaque diagnostic. De plus, il leur sera demandé de fournir leur principal diagnostic ainsi que les prochaines étapes de diagnostic. Les réponses seront notées par des évaluateurs indépendants ignorant l'attribution du traitement.

Type d'étude

Interventionnel

Inscription (Réel)

Phase

N'est pas applicable

Contacts et emplacements

Cette section fournit les coordonnées de ceux qui mènent l'étude et des informations sur le lieu où cette étude est menée.

Coordonnées de l'étude

Nom: Robert J Gallo, MD
Numéro de téléphone: (650) 723-4000
E-mail: rjgallo@stanford.edu

Sauvegarde des contacts de l'étude

Nom: Jonathan H Chen, MD, PhD
Numéro de téléphone: (650) 723-4000
E-mail: jonc101@stanford.edu

Lieux d'étude

États-Unis
- California
  - Palo Alto, California, États-Unis, 94304
    - Stanford University

Critères de participation

Les chercheurs recherchent des personnes qui correspondent à une certaine description, appelée critères d'éligibilité. Certains exemples de ces critères sont l'état de santé général d'une personne ou des traitements antérieurs.

Critère d'éligibilité

Âges éligibles pour étudier

Enfant
Adulte
Adulte plus âgé

Accepte les volontaires sains

Oui

La description

Critère d'intégration:

Les participants doivent être des médecins agréés et avoir terminé au moins la deuxième année postuniversitaire (PGY2) de formation médicale.
Formation en médecine interne, médecine familiale ou médecine d'urgence.

Critère d'exclusion:

Ne pratique pas actuellement en clinique.

Plan d'étude

Cette section fournit des détails sur le plan d'étude, y compris la façon dont l'étude est conçue et ce que l'étude mesure.

Comment l'étude est-elle conçue ?

Détails de conception

Objectif principal: Diagnostique
Répartition: Randomisé
Modèle interventionnel: Affectation parallèle
Masquage: Seul

Nombre de bras

Armes et Interventions

Groupe de participants / Bras	Intervention / Traitement
Comparateur actif: GPT-4 Le groupe aura accès à GPT-4.	Autre: GPT-4 Grand modèle de langage GPT-4 d'OpenAI avec interface de discussion.
Aucune intervention: Ressources habituelles Le groupe n'aura pas accès à GPT-4 mais sera encouragé à utiliser toutes les ressources de son choix en plus des grands modèles linguistiques (UpToDate, Dynamed, Google, etc.).

Que mesure l'étude ?

Principaux critères de jugement

Mesure des résultats	Description de la mesure	Délai
Raisonnement diagnostique Délai: Pendant l'évaluation	Le résultat principal sera le pourcentage correct (plage : 0 à 100) pour chaque cas. Pour chaque cas, il sera demandé aux participants trois principaux diagnostics et conclusions du cas qui soutiennent ce diagnostic et s'y opposent. Les participants recevront 1 point pour chaque diagnostic plausible. Les résultats appuyant le diagnostic et les résultats s'opposant au diagnostic seront également notés en fonction de leur exactitude, avec 1 point pour les réponses partiellement correctes et 2 points pour les réponses complètement correctes. Les participants seront ensuite invités à nommer leur principal diagnostic, gagnant un point pour une réponse raisonnable et deux points pour la réponse la plus correcte. Enfin, les participants seront invités à nommer jusqu'à 3 étapes suivantes pour évaluer plus en détail le patient avec un point attribué pour une réponse partiellement correcte et deux points pour une réponse complètement correcte. Le résultat principal sera comparé au niveau du cas par les groupes randomisés.	Pendant l'évaluation

Mesures de résultats secondaires

Mesure des résultats	Description de la mesure	Délai
Temps consacré au diagnostic Délai: Pendant l'évaluation	Nous comparerons le temps (en minutes) que les participants passent par cas entre les deux bras d'étude.	Pendant l'évaluation

Collaborateurs et enquêteurs

C'est ici que vous trouverez les personnes et les organisations impliquées dans cette étude.

Parrainer

Stanford University

Collaborateurs

Beth Israel Deaconess Medical Center

University of Minnesota

Les enquêteurs

Chercheur principal: Jonathan H Chen, MD, PhD, Stanford University
Chercheur principal: Adam Rodman, MD, Beth Israel Deaconess Medical Center
Chercheur principal: Andrew Olson, MD, University of Minnesota

Dates d'enregistrement des études

Ces dates suivent la progression des dossiers d'étude et des soumissions de résultats sommaires à ClinicalTrials.gov. Les dossiers d'étude et les résultats rapportés sont examinés par la Bibliothèque nationale de médecine (NLM) pour s'assurer qu'ils répondent à des normes de contrôle de qualité spécifiques avant d'être publiés sur le site Web public.

Dates principales de l'étude

Début de l'étude (Réel)

29 novembre 2023

Achèvement primaire (Réel)

30 décembre 2023

Achèvement de l'étude (Réel)

30 décembre 2023

Dates d'inscription aux études

Première soumission

27 novembre 2023

Première soumission répondant aux critères de contrôle qualité

27 novembre 2023

Première publication (Réel)

6 décembre 2023

Mises à jour des dossiers d'étude

Dernière mise à jour publiée (Réel)

20 février 2024

Dernière mise à jour soumise répondant aux critères de contrôle qualité

15 février 2024

Dernière vérification

1 février 2024

Plus d'information

Termes liés à cette étude

Mots clés

Termes MeSH pertinents supplémentaires

Autres numéros d'identification d'étude

71319

Plan pour les données individuelles des participants (IPD)

Prévoyez-vous de partager les données individuelles des participants (DPI) ?

NON

Informations sur les médicaments et les dispositifs, documents d'étude

Étudie un produit pharmaceutique réglementé par la FDA américaine

Non

Étudie un produit d'appareil réglementé par la FDA américaine

Non

Ces informations ont été extraites directement du site Web clinicaltrials.gov sans aucune modification. Si vous avez des demandes de modification, de suppression ou de mise à jour des détails de votre étude, veuillez contacter register@clinicaltrials.gov. Dès qu'un changement est mis en œuvre sur clinicaltrials.gov, il sera également mis à jour automatiquement sur notre site Web .

Essais cliniques sur GPT-4

Stanford University
Beth Israel Deaconess Medical Center; University of Minnesota

Recrutement

Raisonnement des médecins sur des cas de gestion avec de grands modèles de langage

Prise de décision clinique

États-Unis
Wang Shalong
Central South University

Actif, ne recrute pas

ChatGPT contribue à faire progresser la formation des étudiants en médecine : une étude sur l'amélioration de l'apprentissage autodirigé (CHAT-MS)

Éducation médicale | Intelligence artificielle | Apprentissage autonome

Chine
Hoffmann-La Roche

Recrutement

Une étude visant à évaluer l'innocuité, la pharmacocinétique et l'activité antitumorale préliminaire du RO7227166 en association avec l'obinutuzumab et en association avec le glofitamab après une dose de prétraitement d'obinutuzumab administrée à des participants atteints d'un lymphome non hodgkinien à cellules B récidivant/réfractaire

Lymphome non hodgkinien

États-Unis, Belgique, Australie, Danemark, Italie, Espagne, France, Royaume-Uni
Taipei Veterans General Hospital, Taiwan

Recrutement

Évaluation du rôle de ChatGPT dans l'éducation des patients atteints d'un carcinome hépatocellulaire à un stade précoce

Carcinome hépatocellulaire

Taïwan
Janssen Research & Development, LLC

Complété

Une étude chez des adultes en bonne santé pour évaluer l'innocuité et l'immunogénicité de différentes doses de JNJ-63871860

En bonne santé

États-Unis
Pharma Holdings AS
CTC Clinical Trial Consultants AB

Complété

Étude pour évaluer l'efficacité, l'innocuité et la tolérabilité du LTX-109 à 3 % pour la décolonisation nasale de Staphylococcus aureus

Décolonisation nasale de Staphylococcus aureus

Suède
Maisonneuve-Rosemont Hospital

Complété

L'assistance inspiratoire améliore la préoxygénation chez les sujets sains

En bonne santé

Canada
University of Utah
Novartis

Retiré

BKM120 dans les cancers de l'endomètre avancés, métastatiques ou récurrents (BKM120)

Cancer de l'endomètre

États-Unis
Jeffrey A. Cohen, MD
Jacobus Pharmaceutical

Résilié

Essai contrôlé de 3,4-diaminopyridine (3-4DAP) dans le syndrome myasthénique de Lambert-Eaton (LEMS) (3-4DAP)

Faiblesse musculaire

États-Unis
Norwegian University of Science and Technology
St. Olavs Hospital

Complété

Entraînement par intervalles et métabolisme au repos (NEAT)

Sujets sains

Norvège

Raisonnement des médecins sur des cas de diagnostic avec de grands modèles de langage

Raisonnement diagnostique avec des chatbots à grand modèle de langage

Aperçu de l'étude

Statut

Les conditions

Intervention / Traitement

Description détaillée

Type d'étude

Inscription (Réel)

Phase

Contacts et emplacements

Coordonnées de l'étude

Sauvegarde des contacts de l'étude

Lieux d'étude

Critères de participation

Critère d'éligibilité

Âges éligibles pour étudier

Accepte les volontaires sains

La description

Plan d'étude

Comment l'étude est-elle conçue ?

Détails de conception

Nombre de bras

Armes et Interventions

Groupe de participants / Bras

Intervention / Traitement

Que mesure l'étude ?

Principaux critères de jugement

Mesure des résultats

Description de la mesure

Délai

Mesures de résultats secondaires

Mesure des résultats

Description de la mesure

Délai

Collaborateurs et enquêteurs

Parrainer

Collaborateurs

Les enquêteurs

Dates d'enregistrement des études

Dates principales de l'étude

Début de l'étude (Réel)

Achèvement primaire (Réel)

Achèvement de l'étude (Réel)

Dates d'inscription aux études

Première soumission

Première soumission répondant aux critères de contrôle qualité

Première publication (Réel)

Mises à jour des dossiers d'étude

Dernière mise à jour publiée (Réel)

Dernière mise à jour soumise répondant aux critères de contrôle qualité

Dernière vérification

Plus d'information

Termes liés à cette étude

Mots clés

Termes MeSH pertinents supplémentaires

Autres numéros d'identification d'étude

Plan pour les données individuelles des participants (IPD)

Prévoyez-vous de partager les données individuelles des participants (DPI) ?

Informations sur les médicaments et les dispositifs, documents d'étude

Étudie un produit pharmaceutique réglementé par la FDA américaine

Étudie un produit d'appareil réglementé par la FDA américaine

Essais cliniques sur GPT-4

Rechercher des essais similaires

Sponsors et collaborateurs

Les conditions médicales

Interventions en matière de drogue

CROs by country

CROs in Nigeria

Conditions

Maladies rares

Interventions en matière de drogue

Compléments alimentaires

Commanditaire / collaborateurs

Emplacements