- ICH GCP
- Registro de ensayos clínicos de EE. UU.
- Ensayo clínico NCT05272189
Ejemplo de proyecto 3: Probador de colaboración humano-IA (HAICT) Exp. 7
Descripción general del estudio
Estado
Intervención / Tratamiento
Descripción detallada
Este texto es el texto de la preinscripción para el experimento HAICT 7 como se describe en Open Science Framework. https://osf.io/hngu4/
NOTA: Este estudio es representativo de los estudios realizados en el Proyecto 3 de esta subvención. Hay varios experimentos en el paquete de experimentos representado por el Proyecto 3, pero no es posible registrar un paquete de estudios en CT.gov.
NOTA: Dado que el comentario del pronombre es un consejo, lo dejaremos por ahora.
Probador de colaboración humano-IA (HAICT) Exp. 7 (ligeramente editado de OSF)
Recopilación de datos. ¿Ya se han recopilado datos para este estudio? (Sí No)
Sí
- Hipótesis. ¿Cuál es la pregunta principal que se hace o la hipótesis que se prueba en este estudio?
Antecedentes: en una variedad de experimentos de búsqueda, tanto básicos como clínicos, los datos han sido consistentes con una situación en la que la variabilidad de la señal (u objetivo) es mayor que la variabilidad del ruido (distractores). El signo clásico de esto es una función zROC con una pendiente < 1, normalmente alrededor de 0,6. Una pendiente de 1,0 es indicativa de una tarea 2AFC de igual varianza. Para la tarea HAICT que hemos estado probando, esperaríamos una varianza igual, pero creemos que valdría la pena comprobarlo, por lo que variaremos sistemáticamente la prevalencia, lo que cambiará el criterio. Eso barrerá una curva ROC que podemos examinar.
También probaremos la IA falsa de Second Reader para determinar si la baja prevalencia empeora a Second Reader.
- (H1): Esperamos replicar el hallazgo de que los criterios humanos se vuelven más conservadores a medida que disminuye la prevalencia.
- (H2): Predecimos que la pendiente del zROC resultante será 1.0.
(H3): Tenemos la hipótesis de que una prevalencia baja hará que la IA de Second Reader sea menos efectiva porque el valor predictivo positivo de sus comentarios será bajo.
Variable dependiente. Describa la(s) variable(s) dependiente(s) clave especificando cómo se medirán.
Las principales variables dependientes de interés son la precisión (y las derivadas de detección de la señal de la precisión, d' y c), el tiempo de reacción y las calificaciones subjetivas en la encuesta que sigue a cada bloque.
- Condiciones. ¿A cuántos y en qué condiciones se asignarán los participantes?
Esta serie de experimentos investiga cómo cambiar la entrada de una IA simulada puede afectar las decisiones tomadas por los observadores humanos en una tarea de elección forzada de dos alternativas (como la decisión de llamar a una mujer para un examen más detallado en una mamografía). Hemos desarrollado un paradigma llamado Human-AI Collaboration Tester (HAICT) que permite probar de manera eficiente las interacciones entre un ser humano y una IA simulada.
La tarea de los observadores en todas las condiciones es dar una decisión 2AFC sobre si un estímulo es "malo" o "no malo". Para usar un lenguaje que imita aproximadamente un diagnóstico médico, cada estímulo se denomina "caso". Se pide a los observadores que tomen una decisión 2AFC sobre conjuntos de formas de colores. La decisión se toma en base al color predominante del caso. El número de elementos de cada color se extrae de una de las dos distribuciones normales, una para estímulos positivos (malos) y otra para estímulos negativos (no malos).
Los resultados de los experimentos anteriores de HAICT (3 y 4) mostraron que el rendimiento humano en la condición de Segundo Lector cae significativamente a baja prevalencia. El desempeño en la condición de segundo lector fue mejor que en la línea base cuando la prevalencia de casos graves fue del 50 %, pero fue significativamente peor que en la línea base cuando la prevalencia fue solo del 10 %. En este experimento, manipulamos la prevalencia de casos "malos" en las condiciones del segundo lector y de la línea de base. Se evaluarán cuatro tasas de prevalencia diferentes: 10 %, 33 %, 67 % y 90 %. Los observadores completarán 8 bloques (2 reglas de IA x 4 tasas de prevalencia) y el orden de los bloques es aleatorio.
Reglas de IA a probar:
- Línea de base: sin entrada de IA. Observer clasifica cada caso como "malo" o "no" malo por sí solo.
Segundo lector: el observador toma una decisión inicial sobre cada caso. La IA clasifica silenciosamente los estímulos utilizando un criterio conservador (c = 0,5). La lógica del criterio conservador es que el segundo lector se utiliza para reducir las respuestas positivas falsas y, por lo tanto, pretende cuestionar las respuestas humanas positivas que podrían ser marginales. Si el observador y la IA no están de acuerdo, la IA informa al observador humano. Luego, el observador tiene la oportunidad de cambiar su respuesta o elegir su primera opinión.
Como en los Experimentos 1-5, el AI d-prime se fija en 2.2. Se sabe que la retroalimentación aumenta el efecto de prevalencia, por lo que se brindará retroalimentación tanto en la práctica como en los ensayos de prueba. Los observadores completarán 20 ensayos de práctica y 200 ensayos de prueba en cada bloque. Inmediatamente después de completar cada bloque, a los observadores se les mostrará un resumen de su desempeño. Después de los bloques del segundo lector, también se les pedirá que respondan tres preguntas subjetivas sobre la utilidad de la IA (consulte "Archivos" para obtener más detalles).
Análisis. Especifique exactamente qué análisis llevará a cabo para examinar la pregunta/hipótesis principal.
Primero, resumimos el número de aciertos, verdaderos negativos, fallas y falsas alarmas en cada bloque. A partir de esto, podemos calcular la precisión, el valor predictivo positivo, la sensibilidad (d-prima) y el criterio para cada observador en cada una de las diferentes condiciones. Dadas las medidas de desempeño en 4 niveles de prevalencia, podemos estimar la curva ROC (pHit x pFA) y la función zROC (zHit x zFA). Probaremos la hipótesis de que la pendiente de la zROC es igual a 1 (la consecuencia de una tarea 2AFC de igual varianza).
Más análisis. ¿Algún análisis secundario?
Veremos si las opiniones subjetivas de los observadores sobre la IA están correlacionadas con variables como el d-primo empírico o el valor predictivo positivo.
Tamaño de la muestra. ¿Cuántas observaciones se recopilarán o qué determinará el tamaño de la muestra? No es necesario justificar la decisión, pero sea preciso acerca de cómo se determinará exactamente el número.
Pondremos a prueba a 12 observadores. Esto es consistente con los tamaños de muestra de experimentos anteriores.
- Otro. ¿Hay algo más que le gustaría pre-registrarse? (por ejemplo, ¿exclusiones de datos, variables recopiladas con fines exploratorios, análisis inusuales planificados?)
N / A
Tipo de estudio
Inscripción (Estimado)
Fase
- No aplica
Contactos y Ubicaciones
Estudio Contacto
- Nombre: Jeremy M Wolfe, PhD
- Número de teléfono: 6178511166
- Correo electrónico: jwolfe@bwh.harvard.edu
Ubicaciones de estudio
-
-
Massachusetts
-
Boston, Massachusetts, Estados Unidos, 02215
- Reclutamiento
- Visual Attention Lab / Brigham and Women's Hospital
-
Contacto:
- Jeremy M Wolfe
- Número de teléfono: 617-851-1166
- Correo electrónico: jwolfe@bwh.harvard.edu
-
-
Criterios de participación
Criterio de elegibilidad
Edades elegibles para estudiar
Acepta Voluntarios Saludables
Descripción
Criterios de inclusión:
- - Todos bienvenidos a inscribirse en línea
Criterio de exclusión:
- Debe pasar la prueba de detección de la visión del color de Ishihara
- Visión 20/25 (con corrección)
Plan de estudios
¿Cómo está diseñado el estudio?
Detalles de diseño
- Propósito principal: Ciencia básica
- Asignación: N / A
- Modelo Intervencionista: Asignación de un solo grupo
- Enmascaramiento: Ninguno (etiqueta abierta)
Armas e Intervenciones
Grupo de participantes/brazo |
Intervención / Tratamiento |
---|---|
Experimental: Experimento
Todos los participantes son probados en todas las condiciones de este experimento.
|
En este experimento, en algunas condiciones, el participante toma su decisión en presencia de información sobre una decisión de inteligencia artificial simulada.
La frecuencia con la que se presentan los objetivos varía del 10% al 90%
Otros nombres:
|
¿Qué mide el estudio?
Medidas de resultado primarias
Medida de resultado |
Medida Descripción |
Periodo de tiempo |
---|---|---|
D'
Periodo de tiempo: Hasta una semana
|
D' (d-prime) es la medida de la teoría de detección de señales del nivel de rendimiento en una tarea.
|
Hasta una semana
|
Criterio
Periodo de tiempo: Hasta una semana
|
El criterio es la medida de la teoría de detección de señales del sesgo ("liberal" o "conservador") de las decisiones de los observadores.
|
Hasta una semana
|
Medidas de resultado secundarias
Medida de resultado |
Medida Descripción |
Periodo de tiempo |
---|---|---|
Tiempo de reacción
Periodo de tiempo: Hasta una semana
|
Esta es la medida de cuánto tiempo lleva dar una respuesta.
|
Hasta una semana
|
Colaboradores e Investigadores
Patrocinador
Investigadores
- Investigador principal: Jeremy M Wolfe, PhD, Brigham and Women's Hospital
Fechas de registro del estudio
Fechas importantes del estudio
Inicio del estudio (Actual)
Finalización primaria (Estimado)
Finalización del estudio (Estimado)
Fechas de registro del estudio
Enviado por primera vez
Primero enviado que cumplió con los criterios de control de calidad
Publicado por primera vez (Actual)
Actualizaciones de registros de estudio
Última actualización publicada (Actual)
Última actualización enviada que cumplió con los criterios de control de calidad
Última verificación
Más información
Términos relacionados con este estudio
Palabras clave
Términos MeSH relevantes adicionales
Otros números de identificación del estudio
- 2007P000646-B
Plan de datos de participantes individuales (IPD)
¿Planea compartir datos de participantes individuales (IPD)?
Descripción del plan IPD
Marco de tiempo para compartir IPD
Criterios de acceso compartido de IPD
Tipo de información de apoyo para compartir IPD
- PROTOCOLO DE ESTUDIO
- SAVIA
- CIF
Información sobre medicamentos y dispositivos, documentos del estudio
Estudia un producto farmacéutico regulado por la FDA de EE. UU.
Estudia un producto de dispositivo regulado por la FDA de EE. UU.
Esta información se obtuvo directamente del sitio web clinicaltrials.gov sin cambios. Si tiene alguna solicitud para cambiar, eliminar o actualizar los detalles de su estudio, comuníquese con register@clinicaltrials.gov. Tan pronto como se implemente un cambio en clinicaltrials.gov, también se actualizará automáticamente en nuestro sitio web. .