- ICH GCP
- Registre américain des essais cliniques
- Essai clinique NCT06157944
Raisonnement des médecins sur des cas de diagnostic avec de grands modèles de langage
Raisonnement diagnostique avec des chatbots à grand modèle de langage
Aperçu de l'étude
Description détaillée
Les technologies d'intelligence artificielle (IA), en particulier les grands modèles de langage avancés comme ChatGPT d'OpenAI, ont le potentiel d'améliorer la prise de décision médicale. Bien que ChatGPT-4 n'ait pas été développé pour être utilisé dans des applications médicales spécifiques, il s'est révélé prometteur dans divers contextes de soins de santé, notamment la rédaction de notes médicales, le traitement des demandes des patients et la facilitation des consultations médicales. Cependant, on sait peu de choses sur la manière dont ChatGPT augmente les capacités de raisonnement clinique des cliniciens.
Le raisonnement clinique est un processus complexe impliquant la reconnaissance de formes, l’application des connaissances et le raisonnement probabiliste. L'intégration d'outils d'IA tels que ChatGPT-4 dans les flux de travail des médecins pourrait potentiellement contribuer à réduire la charge de travail des cliniciens et à diminuer le risque de diagnostics manqués. Cependant, ChatGPT-4 n’a pas été développé à des fins de raisonnement clinique et n’a pas non plus été validé à cette fin. En outre, il peut faire l’objet de désinformation, notamment de confabulations convaincantes susceptibles d’induire les cliniciens en erreur. Si les cliniciens abusent de cet outil, il risque de ne pas améliorer le raisonnement diagnostique et pourrait même causer des dommages. Par conséquent, il est important d’étudier comment les cliniciens utilisent de grands modèles de langage pour augmenter le raisonnement clinique avant leur intégration systématique dans les soins aux patients.
Dans cette étude, nous randomiserons les participants pour répondre aux cas de diagnostic avec ou sans accès à ChatGPT-4. Les participants seront invités à donner trois diagnostics différentiels pour chaque cas, avec des résultats complémentaires et opposés pour chaque diagnostic. De plus, il leur sera demandé de fournir leur principal diagnostic ainsi que les prochaines étapes de diagnostic. Les réponses seront notées par des évaluateurs indépendants ignorant l'attribution du traitement.
Type d'étude
Inscription (Réel)
Phase
- N'est pas applicable
Contacts et emplacements
Coordonnées de l'étude
- Nom: Robert J Gallo, MD
- Numéro de téléphone: (650) 723-4000
- E-mail: rjgallo@stanford.edu
Sauvegarde des contacts de l'étude
- Nom: Jonathan H Chen, MD, PhD
- Numéro de téléphone: (650) 723-4000
- E-mail: jonc101@stanford.edu
Lieux d'étude
-
-
California
-
Palo Alto, California, États-Unis, 94304
- Stanford University
-
-
Critères de participation
Critère d'éligibilité
Âges éligibles pour étudier
- Enfant
- Adulte
- Adulte plus âgé
Accepte les volontaires sains
La description
Critère d'intégration:
- Les participants doivent être des médecins agréés et avoir terminé au moins la deuxième année postuniversitaire (PGY2) de formation médicale.
- Formation en médecine interne, médecine familiale ou médecine d'urgence.
Critère d'exclusion:
- Ne pratique pas actuellement en clinique.
Plan d'étude
Comment l'étude est-elle conçue ?
Détails de conception
- Objectif principal: Diagnostique
- Répartition: Randomisé
- Modèle interventionnel: Affectation parallèle
- Masquage: Seul
Armes et Interventions
Groupe de participants / Bras |
Intervention / Traitement |
---|---|
Comparateur actif: GPT-4
Le groupe aura accès à GPT-4.
|
Grand modèle de langage GPT-4 d'OpenAI avec interface de discussion.
|
Aucune intervention: Ressources habituelles
Le groupe n'aura pas accès à GPT-4 mais sera encouragé à utiliser toutes les ressources de son choix en plus des grands modèles linguistiques (UpToDate, Dynamed, Google, etc.).
|
Que mesure l'étude ?
Principaux critères de jugement
Mesure des résultats |
Description de la mesure |
Délai |
---|---|---|
Raisonnement diagnostique
Délai: Pendant l'évaluation
|
Le résultat principal sera le pourcentage correct (plage : 0 à 100) pour chaque cas.
Pour chaque cas, il sera demandé aux participants trois principaux diagnostics et conclusions du cas qui soutiennent ce diagnostic et s'y opposent.
Les participants recevront 1 point pour chaque diagnostic plausible.
Les résultats appuyant le diagnostic et les résultats s'opposant au diagnostic seront également notés en fonction de leur exactitude, avec 1 point pour les réponses partiellement correctes et 2 points pour les réponses complètement correctes.
Les participants seront ensuite invités à nommer leur principal diagnostic, gagnant un point pour une réponse raisonnable et deux points pour la réponse la plus correcte.
Enfin, les participants seront invités à nommer jusqu'à 3 étapes suivantes pour évaluer plus en détail le patient avec un point attribué pour une réponse partiellement correcte et deux points pour une réponse complètement correcte.
Le résultat principal sera comparé au niveau du cas par les groupes randomisés.
|
Pendant l'évaluation
|
Mesures de résultats secondaires
Mesure des résultats |
Description de la mesure |
Délai |
---|---|---|
Temps consacré au diagnostic
Délai: Pendant l'évaluation
|
Nous comparerons le temps (en minutes) que les participants passent par cas entre les deux bras d'étude.
|
Pendant l'évaluation
|
Collaborateurs et enquêteurs
Parrainer
Les enquêteurs
- Chercheur principal: Jonathan H Chen, MD, PhD, Stanford University
- Chercheur principal: Adam Rodman, MD, Beth Israel Deaconess Medical Center
- Chercheur principal: Andrew Olson, MD, University of Minnesota
Dates d'enregistrement des études
Dates principales de l'étude
Début de l'étude (Réel)
Achèvement primaire (Réel)
Achèvement de l'étude (Réel)
Dates d'inscription aux études
Première soumission
Première soumission répondant aux critères de contrôle qualité
Première publication (Réel)
Mises à jour des dossiers d'étude
Dernière mise à jour publiée (Réel)
Dernière mise à jour soumise répondant aux critères de contrôle qualité
Dernière vérification
Plus d'information
Termes liés à cette étude
Termes MeSH pertinents supplémentaires
Autres numéros d'identification d'étude
- 71319
Plan pour les données individuelles des participants (IPD)
Prévoyez-vous de partager les données individuelles des participants (DPI) ?
Informations sur les médicaments et les dispositifs, documents d'étude
Étudie un produit pharmaceutique réglementé par la FDA américaine
Étudie un produit d'appareil réglementé par la FDA américaine
Ces informations ont été extraites directement du site Web clinicaltrials.gov sans aucune modification. Si vous avez des demandes de modification, de suppression ou de mise à jour des détails de votre étude, veuillez contacter register@clinicaltrials.gov. Dès qu'un changement est mis en œuvre sur clinicaltrials.gov, il sera également mis à jour automatiquement sur notre site Web .
Essais cliniques sur GPT-4
-
Stanford UniversityBeth Israel Deaconess Medical Center; University of MinnesotaRecrutementPrise de décision cliniqueÉtats-Unis
-
Wang ShalongCentral South UniversityActif, ne recrute pasÉducation médicale | Intelligence artificielle | Apprentissage autonomeChine
-
Hoffmann-La RocheRecrutementLymphome non hodgkinienÉtats-Unis, Belgique, Australie, Danemark, Italie, Espagne, France, Royaume-Uni
-
Taipei Veterans General Hospital, TaiwanRecrutementCarcinome hépatocellulaireTaïwan
-
Janssen Research & Development, LLCComplété
-
Pharma Holdings ASCTC Clinical Trial Consultants ABComplétéDécolonisation nasale de Staphylococcus aureusSuède
-
Maisonneuve-Rosemont HospitalComplété
-
University of UtahNovartisRetiréCancer de l'endomètreÉtats-Unis
-
Jeffrey A. Cohen, MDJacobus PharmaceuticalRésiliéFaiblesse musculaireÉtats-Unis
-
Norwegian University of Science and TechnologySt. Olavs HospitalComplété