SPIKES es un protocolo reconocido internacionalmente para comunicar malas noticias médicas, empero, no se cuenta con instrumentos que evalúen su práctica en los profesionales de la salud. En consecuencia, el objetivo de este estudio fue construir y validar un instrumento para la valoración de la aplicación del protocolo SPIKES (IVAP-SPIKES).
Material y métodosestudio transversal en una muestra propositiva de n = 200 estudiantes de Medicina del Centro Universitario de Tonalá de la Universidad de Guadalajara durante el año 2024. Se diseñó una lista de cotejo basada en el protocolo SPIKES, que se modificó según su fiabilidad. Se determinaron las consistencias interna y externa, la validez de constructo y la variabilidad intra- e interobservador con un 95% de confianza (p ≤ 0,05), usando IBM SPSS Statistics 26.
Resultadosse desarrollaron 4 versiones de la lista de cotejo, la cuarta constó de 18 ítems divididos en 6 dimensiones, para aplicarse en un máximo de 15 minutos. Su coeficiente de fiabilidad fue α = 0,778; la correlación entre las 2 mitades fue ρ = 0,703; su coeficiente K-S fue Z = 0,144 y la correlación test–retest fue ρ = 0,292. La mediana de los expertos fue mayor que la de los legos, U = 46,5. No hubo diferencias inter- e intraobservador. Estadísticas significativas (p ≤ 0,05).
Conclusionesel IVAP-SPIKES permite medir objetivamente la habilidad de comunicar malas noticias médicas en profesionales de la salud. Se exhorta a su uso para evaluar capacitaciones. Se sugiere su aplicación en diferentes contextos para determinar potenciales necesidades de adaptaciones.
SPIKES is an internationally recognized protocol for communicating bad medical news. However, there are no existing instruments to evaluate its practical application by health professionals. Consequently, the objective of this study was to develop and validate an Instrument for Assessing the Application of the SPIKES Protocol (IVAP-SPIKES, its Spanish acronym).
Material and methodsThis was a cross-sectional study conducted on a purposive sample of n = 200 medical students from the University Center of Tonala, University of Guadalajara during 2024. A checklist based on the SPIKES protocol was designed and modified based on its reliability. Internal and external consistency, construct validity, and intra- and inter-observer variability were determined with 95% confidence (p ≤ 0.05) using IBM SPSS Statistics 26.
ResultsFour versions of the checklist were developed. The fourth version consisted of 18 items divided into six dimensions, designed to be administered in a maximum of 15 min. Its reliability coefficient was α = 0.778, the correlation between the two halves was ρ = 0.703, its K-S coefficient was Z = 0.144, and the test–retest correlation was ρ = 0.292. The median score of experts was higher than that of laypersons, U = 46.5. There were no inter- or intra-observer differences. All statistics were significant (p ≤ 0,05).
ConclusionsThe IVAP-SPIKES instrument objectively measures the ability of health professionals to communicate bad medical news. Its use is encouraged for evaluating training programs. Its application in different contexts is suggested to determine potential adaptation needs.
La muerte y la enfermedad son eventos que requieren intervenciones tanatológicas para informar y confortar al paciente y a su familia1, empero, en la práctica médica se reduce a la transición entre las acciones hospitalarias y administrativas2; en este sentido, el análisis de conocimientos, las actitudes y las habilidades en la comunicación médico-paciente son significativas.
Estudios en México reportan bajos niveles de conocimiento sobre la voluntad anticipada, los cuidados tanatológicos y la experiencia y actitudes hacia la muerte en el personal médico y de enfermería3–10; en Brasil, los médicos informan sin gestionar la toma de decisiones11. Con relación a las actitudes, el grado de empatía del médico es clave para el éxito de la comunicación de diagnósticos y decesos4,12,13, mientras que las habilidades sociales juegan un papel principal; la literatura reporta que, cuando las posibilidades de recuperación del paciente son bajas, los médicos mexicanos tienden a evadir a la familia5,14, en contraste, en Brasil los médicos con mayor antigüedad recomiendan más la muerte en el hogar15. En áreas como pediatría y cuidados intensivos, los médicos requieren confrontar el fracaso de los esfuerzos clínicos para transmitir esperanza en el fin del sufrimiento6,7, acentuando la necesidad de formación y competencias personales, prácticas y cognoscitivas para hablar de la muerte y la enfermedad16–18. En este sentido, existen protocolos para la comunicación de malas noticias en salud con el objetivo de contrarrestar estas problemáticas.
SPIKES19,20, ABCDE21 y PEWTER22 son guías para la comunicación médico-paciente-familia, siendo el primero más específico que el segundo y más amplio que el tercero; en suma, SPIKES es el más referenciado y con aceptación global en la educación médica, incluso para guiar interacciones telefónicas23. Con atención al cambio de objetivos terapéuticos, educación en salud y atención emocional, se compone de 6 pasos: setting up (preparar el ambiente), perception (averiguar lo que el paciente sabe), invitation (indagar cuánto desea saber el paciente), knowledge (compartir la noticia), empathy (validar las emociones del paciente) y strategy o summary (establecer un plan de acción)19,20.
Actualmente, se cuenta con instrumentos para conocer la competencia tanatológica (capacidad para brindar apoyo emocional y logístico frente a la muerte)17,18, pero no para evaluar la competencia de comunicar malas noticias médicas según una herramienta estructurada y reconocida como SPIKES. Este trabajo es un paso inicial en la acumulación de evidencia sobre cómo los estudiantes interpretan y ejecutan (práctica) los pasos del protocolo SPIKES (argumento de validación delimitado) al tener como objetivo la construcción y validación de un instrumento para la valoración de la aplicación del protocolo SPIKES (IVAP-SPIKES) para comunicar malas noticias médicas, siendo las fuentes de evidencia exploradas la revisión del SPIKES original (evidencia basada en el contenido) y los análisis psicométricos (evidencia basada en la estructura)24,25.
Material y métodosSe realizó un estudio transversal en una muestra propositiva de n = 200 estudiantes de Medicina del Centro Universitario de Tonalá de la Universidad de Guadalajara (CUT-UDG), en Tonalá, Jalisco, México, durante el año 2024. El escenario y la temporalidad, así como el número de sujetos de estudio se definieron en función de su accesibilidad para los investigadores.
El tamaño de la muestra se determinó con las reglas de Nunnally y Bernstein26 y el criterio de casos por ítem para instrumentos adaptados, que sugiere un mínimo de 5–10 participantes por ítem o un mínimo absoluto de 100–200 casos. Con una muestra final de 200 participantes en este estudio se aseguró una base consistente para el análisis comparativo entre subgrupos.
Para evaluar la implementación correcta y completa del protocolo SPIKES, en la versión inicial del IVAP-SPIKES se obtuvieron 20 ítems para cada etapa (considerada posteriormente como dominio): 1) S: setting (escenario, 3 ítems), 2) P: perception or perspective (percepción o perspectiva, 3 ítems), 3) I: invitation (invitación, un ítem), 4) K: knowledge (conocimiento, 4 ítems), 5) E: empathy or emotion (empatía o emoción, 2 ítems) y 6) S: summary or strategy (sumario o estrategia, 3 ítems), más 2 ítems adicionales que abordaron la interacción médico-paciente. El instrumento se utilizó como una lista de cotejo, la naturaleza de los anclajes fue «0» = no cumple el criterio, y «1» = cumple con el criterio, donde todos los ítems tuvieron el mismo peso.
Para la validación de contenido, los ítems guardaron correspondencia con el protocolo SPIKES original, aceptado internacionalmente, con un elevado nivel de desempeño en quienes reciben entrenamiento y es usado en población angloparlante como método de evaluación clínica objetivamente estructurada (OSDE, por sus siglas en inglés)20. Se contrató a un traductor bilingüe e independiente con experiencia en terminología médica para la traducción directa-inversa; asimismo, las versiones fueron comparadas cualitativamente por un comité de 3 expertos clínicos con experiencia en comunicación médica para identificar y resolver discrepancias semánticas, idiomáticas o culturales. Solo aquellos ítems que demostraron equivalencia conceptual entre el original y la traducción inversa fueron retenidos, garantizando la claridad y fidelidad conceptual.
Se evaluaron las consistencias interna y externa del instrumento mediante su aplicación a una muestra de 100 estudiantes del programa de Médico Cirujano y Partero del CUT-UDG, que no habían recibido formación en tanatología ni sobre el protocolo SPIKES, ni tenían experiencia clínica.
La consistencia interna o fiabilidad se determinó mediante la prueba de 2 mitades de Guttman, mientras que la consistencia externa se determinó mediante la obtención de la prueba de correlación test–retest, tras 3 semanas de la primera aplicación del instrumento26, con lo que se obtuvo el coeficiente de correlación de Spearman; ambas pruebas con 95% de confianza (p ≤ 0,05).
La validez de constructo se determinó comparando los resultados del IVAP-SPIKES entre estudiantes del programa de Médico Cirujano y Partero con («expertos», n = 100) y sin («legos», n = 100) formación en tanatología y aplicación del protocolo SPIKES, así como experiencia clínica, bajo el supuesto de que, quienes recibieron formación y tenían experiencia clínica presentaban el constructo «aplicación del protocolo SPIKES» en un nivel elevado, en comparación con quienes no. El grupo de «expertos» estaba conformado por estudiantes de cuarto año de Medicina que aprobaron la asignatura de tanatología, con experiencia clínica de 6 meses; el grupo de «legos» por estudiantes de segundo año sin formación en tanatología, ni experiencia clínica. En ambos grupos se excluyeron aquellos con nacionalidad extranjera.
Asumiendo en principio que la aplicación del protocolo SPIKES no sigue una distribución normal, se usó estadística no paramétrica para realizar la comparación; de modo que se aplicaron las pruebas U de Mann–Whitney (U) y de Wilcoxon (W) con 95% de confianza (p ≤ 0,05) para comparar entre sí las medianas y rangos de los grupos relacionados y no relacionados27.
El análisis se realizó con el software IBM SPSS© (Statistical Package for the Social Sciences) Statistics versión 26 para el sistema operativo Microsoft Windows©, licenciado para su uso particular a uno de los investigadores.
Con base en el artículo 17, fracción II del Reglamento de la Ley General de Salud en Materia de Investigación para la Salud de México, esta investigación se consideró sin riesgo para la integridad de los participantes, debido a que no se intervinieron ni modificaron variables psicológicas, ni se trataron aspectos sensibles de la conducta28. Asimismo, el instrumento aplicado evaluó una competencia objetivo educativo intrínseco del programa de estudios de los participantes. No se recabaron datos sensibles según la legislación mexicana vigente al momento del estudio29; no obstante, se obtuvo el consentimiento informado verbal de todos los estudiantes antes de iniciar la actividad y se garantizó la voluntariedad, confidencialidad y anonimato. El estudio se realizó conforme a los principios del Código de Núremberg30 y la Declaración de Helsinki31.
ResultadosSe estudió una muestra de n = 200 estudiantes de Medicina, 100 sin formación en tanatología ni comunicación de malas noticias médicas y sin experiencia clínica, y 100 con formación en tanatología y comunicación de malas noticias médicas y con experiencia clínica. El 71% (n = 142) fueron mujeres y 29% (n = 58) hombres.
En la tabla 1 se presentan los parámetros de fiabilidad de la lista de cotejo en sus distintas versiones hasta llegar a su versión final, a intervalos de 3 semanas, considerándose este el tiempo prudente para que los sujetos olviden detalles específicos de la aplicación anterior del instrumento de medición y así evitar el efecto de la práctica o recuerdo directo en la siguiente aplicación25.
Parámetros de fiabilidad del IVAP-SPIKES en sus diferentes versiones
| Parámetro | Versión del instrumento | |||
|---|---|---|---|---|
| 1 | 2 | 3 | 4⁎ | |
| Número de ítems | 20 | 18 | 18 | 18 |
| Método de división | DMC | DMC | PYN | PYN |
| Mediana | 9 | 10 | 10 | 11 |
| Moda | 8 | 10 | 10 | 10 |
| Mínimo | 2 | 2 | 2 | 3 |
| Media | 8 | 10 | 10 | 10 |
| Máximo | 16 | 16 | 16 | 16 |
| Percentil 25 | 8 | 9 | 9 | 9 |
| Percentil 50 | 9 | 10 | 10 | 11 |
| Percentil 75 | 10 | 11 | 11 | 12 |
| Coeficiente de asimetría | 0,366 | 0,207 | 0,207 | 0,701 |
| Correlación: total⁎ mitad 1 (ρ) | 0,754 | 0,878 | 0,775 | 0,883 |
| Correlación: total⁎ mitad 2 (ρ) | 0,872 | 0,697 | 0,855 | 0,954 |
| Correlación: mitad 1⁎ mitad 2 (ρ) | 0,377 | 0,324 | 0,386 | 0,703 |
| Coeficiente de fiabilidad (α) | 0,598 | 0,541 | 0,623 | 0,778 |
| Ítems sin correlación | 1 y 18 | 17 | 17 | – |
DMC: 2 mitades consecutivas; PYN: Pares y nones. Fuente: Elaboración propia.
La versión inicial constó de 20 ítems sin límite de tiempo, se dividió en 2 mitades consecutivas y, al obtener un bajo coeficiente de fiabilidad y 2 ítems sin correlación, estos se integraron como parte de los otros 2, ya que no se podían eliminar del todo por ser parte constitutiva del protocolo SPIKES. La segunda versión constó de 18 ítems como resultado de la eliminación de los ítems sin correlación de la versión uno, también sin límite de tiempo, en la cual los ítems nuevamente se dividieron en 2 mitades consecutivas, de la que al obtener un coeficiente de fiabilidad más bajo que el de la primera y un ítem sin correlación, se decidió establecer un límite de tiempo para la aplicación del protocolo SPIKES y su evaluación, el cual fue de 15 minutos, dado que es el tiempo máximo de consulta médica en atención primaria en instituciones públicas mexicanas y constituye el contexto de aplicación32. Así, la tercera versión constó de 18 ítems con el ítem sin correlación de la versión 2 reformulado sin alterar su contenido, ante la necesidad de mantener un número par de ítems, con un tiempo límite de 15 minutos, cuyos ítems se dividieron en pares y nones, ya que este método de división de ítems incrementa la probabilidad de asemejar las 2 mitades por contenido y efectos potenciales de aspectos como el cansancio del evaluador o el orden de las preguntas25, de modo que se obtuvo un coeficiente de fiabilidad más elevado que el de las primeras 2 versiones, aunque persistía un ítem sin correlación. Finalmente, la cuarta versión constó de la tercera versión de 18 ítems del instrumento con el ítem sin correlación reformulado y el límite de tiempo establecido, en la cual, nuevamente los ítems se dividieron en pares y nones, con lo que se obtuvo un coeficiente de fiabilidad de α = 0,778 sin ítems sin correlación y, además, un coeficiente de correlación de Spearman de ρ = 0,703 entre las puntuaciones de las 2 mitades, ρ = 0,883 entre la puntuación total y la de la mitad 1, y ρ = 0,954 entre la puntuación total y la de la mitad 2, y un coeficiente de asimetría de SK = 0,701 (p ≤ 0,05), por lo que esta versión (ver anexo) se eligió para continuar con el proceso de validación del IVAP-SPIKES.
En la tabla 2 se muestran las estadísticas descriptivas, comparativas y de correlación test–retest del IVAP-SPIKES, donde se observa que no se encontraron diferencias estadísticamente significativas (p > 0,05), y que se halló un coeficiente de correlación estadísticamente significativo (p ≤ 0,05) entre ambas puntuaciones.
En la tabla 3 se exponen las estadísticas descriptivas y comparativas del IVAP-SPIKES en estudiantes con y sin formación en tanatología y comunicación de malas noticias médicas, así como experiencia clínica, donde se observa que se encontró una diferencia estadísticamente significativa (p < 0,05) a favor del grupo de estudiantes con formación y experiencia, en quienes el constructo «aplicación del protocolo SPIKES» se presuponía elevado frente al grupo sin formación. La distribución de las puntuaciones en legos y expertos se muestra en la figura 1, donde se observa que los expertos obtuvieron calificaciones mayores.
Finalmente, la correlación test–retest intraobservador fue ρ = 1,00 y la diferencia entre medianas de W = 1,00; ambas estadísticas fueron significativas (p ≤ 0,05). Mientras que la correlación interobservador fue ρ = 0,292 y la diferencia entre medianas interobservador fue de W = 0,653; ambas estadísticas resultaron significativas (p ≤ 0,05).
DiscusiónEste es el primer estudio conocido por los autores que propone la construcción y validación de un instrumento para evaluar la puesta en práctica del protocolo SPIKES para comunicar malas noticias médicas en hispanoparlantes. Los resultados obtenidos durante el desarrollo del IVAP-SPIKES demuestran que la versión final obtenida posee elevadas consistencias interna y externa y validez del constructo, así como escasa a nula variabilidad intra- e interobservador.
Al momento de realizar el presente reporte, fue imposible determinar si el IVAP-SPIKES posee validez de criterio, en tanto que no se cuenta con un instrumento que se considere el estándar de oro para evaluar esta habilidad25 contra el que se puedan comparar los resultados del instrumento propuesto, lo que constituye la principal área de oportunidad de esta investigación. Asimismo, debe considerarse que es un instrumento formativo y de evaluación de competencias iniciales dentro del currículo médico, pues proporciona evidencias psicométricas de partida para población en formación, lo que también puede explicar el bajo coeficiente de correlación de Spearman (p = 0,292) común en estudios de evaluación de competencia con fines formativos.
Este estudio aporta una evidencia sólida pero limitada por varios aspectos. Primero, al ser unicéntrico, su aplicabilidad se limita a entornos símiles; segundo, a pesar de los resultados positivos, las variaciones regionales del idioma español posibilitan diferencias culturales que podrían influir en la comunicación de las malas noticias médicas; tercero, la competencia clínica comunicativa requiere de evidencia basada en el proceso de respuesta, por lo que el empleo de simuladores o actores estandarizados y la relacion de los resultados con otras variables resulta importante para la acumulación de evidencia; cuarto, el estudio se centró en la validez basada en el contenido y la fiabilidad; quinto, se emplearon coeficientes clásicos para obtener la evidencia inicial. En este sentido, futuras líneas de trabajo deberán concentrarse en la replicación multicéntrica y en población no estudiantil para aumentar la capacidad de generalización, adaptaciones locales o regionales, trabajar sobre la evaluación de la competencia completa del SPIKES y la aplicación de análisis factorial exploratorio/confirmatorio para asegurar la estructura interna o la dimensionalidad del constructo, así como emplear la teoría de la generalizabilidad33 para optimizar la confiabilidad del instrumento en distintos contextos de aplicación.
El IVAP-SPIKES es una herramienta de mejora de la calidad de los servicios de salud, ya que una comunicación médico-paciente eficiente predice una actitud favorecedora en la toma de decisiones ante situaciones adversas y mejora la transición médico-paciente, de modo que representa un avance en la materia, puesto que permite evaluar más allá del conocimiento, y permitirá a las instituciones educativas y sanitarias medir objetivamente en estudiantes y profesionistas la habilidad de comunicar malas noticias médicas, para identificar sus áreas de oportunidad y diseñar intervenciones para su mejora u optimización.
Responsabilidades éticasLos autores declaran que según el Reglamento de la Ley General de Salud para la Investigación en Salud de México, la investigación de la que deriva este trabajo de investigación se considera sin riesgo para la integridad de física, psicológica y social de los participantes, en virtud de que se emplearon métodos de investigación documental y no se recabó información considerada sensible de los participantes, por lo que no se requirió de consentimiento informado ni la emisión de aviso de privacidad.
FinanciaciónLos autores declaran que este proyecto fue financiado con fondos del Programa de Apoyo a la Mejora en las Condiciones de Producción de los Miembros del SNI y SNCA-PROSNI 2023, asignados dentro del programa a la Dra. María de los Ángeles Covarrubias Bermúdez.
AutoríaMarco Antonio Zavala-González: conceptualización, metodología, análisis formal, revisión, edición y supervisión. María de los Ángeles Covarrubias-Bermúdez: conceptualización, metodología, análisis formal, recursos, curación de datos, escritura de borrador original, visualización, administración del proyecto y adquisición de fondos. Leonardo Rafael Jiménez-García: conceptualización, metodología, investigación y escritura de borrador original. Jaramar Martínez-Armas: conceptualización, metodología, investigación y escritura de borrador original. José Carlos Ramírez-Cruz: conceptualización, metodología, investigación y escritura de borrador original.
Conflicto de interesesLos autores declaran no tener ningún conflicto de intereses.
Declaración de inteligencia artificial y tecnologías asistidas por inteligencia artificial en el proceso de escrituraLos autores declaran que no se usó IA en ningún proceso de construcción de la investigación ni del manuscrito.









