Este artículo explora la aplicación de la prueba de Chi cuadrado de homogeneidad en el contexto de estudios clínicos, utilizando como ejemplo un estudio previo sobre la eficacia de 2 analgésicos en el tratamiento de la cefalea. La muestra incluyó 215 pacientes, cuyas respuestas al tratamiento fueron evaluadas y registradas en 4 categorías de intensidad de dolor. La prueba permitió identificar diferencias significativas entre los tratamientos evaluados, demostrando ser una herramienta estadística valiosa para la comparación de grupos en investigaciones clínicas. Este enfoque proporciona claridad y precisión en la interpretación de datos categóricos, esencial para la toma de decisiones informadas en la práctica médica.
This article explores the application of the chi-squared test of homogeneity in the context of clinical studies, using a previous study on the efficacy of two analgesics for treating headache as an example. The sample included 215 patients, whose responses to treatment were assessed and recorded across four pain intensity categories. The test allowed for the identification of significant differences between the treatments evaluated, proving to be a valuable statistical tool for comparing groups in clinical research. This approach provides clarity and precision in the interpretation of categorical data, essential for informed decision-making in medical practice.
La prueba de «Chi cuadrado (X2)» o «Ji al cuadrado», como también se le denomina, fue desarrollada por Karl Pearson en 1900 como una forma de valorar la bondad del ajuste de unos datos a una distribución de probabilidad conocida. El empleo de esta prueba no paramétrica permite verificar si existen diferencias significativas entre las frecuencias de los valores de una variable observada en una muestra, con unas frecuencias esperadas que se postulan como válidas para toda la población a través de una hipótesis. Se considera dentro de la estadística descriptiva aplicada al estudio de 2 variables con énfasis en extraer información sobre la muestra, convirtiéndose en una herramienta de gran utilidad en diversos campos de estudio, incluyendo la salud, donde se trabaja frecuentemente con variables de tipo cualitativo y que requieren de una mejor interpretación de los resultados1.
Con relación a esto último, la prueba de Chi cuadrado ha permitido analizar la asociación entre variables categóricas y realizar comparaciones de distribuciones de frecuencia en estudios observacionales o experimentales2, en investigaciones de tipo epidemiológico3, ensayos clínicos4, genética médica5, supervivencia6, enfermedades infecciosas7, comparación de prevalencia8 y factores de riesgo9, entre otros, convirtiéndola en una herramienta estadística con gran versatilidad y facilidad de uso en la investigación científica. Ejemplo de ello son los estudios realizados por Gálvez et al.10, quienes aplicaron la prueba de Chi cuadrado para comparar 2 variables cualitativas (tipo de derivaciones vs. prioridad de las derivaciones), Álvarez et al.11 la utilizaron para comparar las variables categóricas entre los grupos y Herrero et al.12 analizaron la posible relación entre las características de la migraña y las variables sociodemográficas mediante el uso de esta prueba.
Características de la prueba de Chi cuadradoAhora bien, la aplicación de esta herramienta requiere comprender sus limitaciones y tener en consideración algunas condiciones bajo las cuales es pertinente su uso. En este sentido, la prueba de Chi cuadrado no establece restricciones sobre el número de modalidades por variable, y el número de filas y columnas de la tabla no tienen que ser necesariamente iguales, pues la distribución es positivamente asimétrica. Debe aplicarse en aquellos estudios donde las muestras son independientes y donde todos los valores esperados son superiores a 5 y, por último, si los grados de libertad resultan ser mayores a 30 se estaría en presencia de una Chi cuadrado normal13.
Prueba de Chi cuadrado de homogeneidadDentro de los diferentes tipos de pruebas de Chi cuadrado está la prueba de homogeneidad que, a fines prácticos, se utiliza para determinar si existen diferencias significativas entre las distribuciones de frecuencia de 2 o más grupos14, resultando conveniente su aplicabilidad en determinados casos clínicos15. De ahí que resulta apropiado profundizar en el procedimiento y aplicabilidad de esta herramienta para así lograr una mejor comprensión y claridad en el momento de analizar los datos. Para fines prácticos, este artículo se basará en datos provenientes de un estudio realizado por Chanques et al.16, quienes evaluaron el efecto de 2 analgésicos para la reducción del dolor en pacientes con cefalea. La investigación abarcó una muestra de 215 pacientes divididos en 2 grupos, el primero compuesto por 107 pacientes a los cuales de se les suministró T1 (analgésico 1) y el segundo conformado por 108 pacientes tratados con T2 (analgésico 2). La intensidad del dolor manifestada por las personas una vez sometidas a los analgésicos evaluados fue registrada a través de 4 escalas: ausente, suave, moderado e intenso.
Se evaluaron 2 características cualitativas: la primera el tipo de tratamiento aplicado (analgésico) y la segunda la intensidad del dolor medida en 4 niveles. Por lo tanto, el uso de la prueba de Chi cuadrado de homogeneidad resulta conveniente para probar si la proporción de pacientes que experimentaron alivio al dolor fue la misma para ambos tratamientos. En función de esto se plantean las siguientes hipótesis a probar para este caso específico:
Hipótesis nula: la proporción de pacientes que experimentan alivio al dolor resulta ser la misma para ambos tratamientos (analgésicos) y en los 4 niveles de dolor.
Hipótesis alternativa: existen diferencias significativas en la cantidad de pacientes que experimentan un alivio del dolor entre los 2 analgésicos evaluados.
Una vez planteadas las hipótesis se verifica cuál de ellas se ajusta a la realidad, mediante cálculos obtenidos con el programa SPSS versión 25. Primero, se crea una base de datos utilizando el programa de Excel, con la cual se obtienen las frecuencias de ocurrencia de cada una de las variables. Posteriormente, se despliegan 3 columnas. En la primera columna se agrega el factor analgésico, donde «1» indica el primer analgésico y «2» representa el segundo analgésico. En la segunda columna se registran los diferentes niveles de dolor medidos (ausente, suave, moderado e intenso). En la tercera columna se registra la frecuencia de ocurrencia de cada combinación entre las 2 características estudiadas. Luego, se carga la matriz de datos en el programa SPSS y se realizan diversos pasos para calcular el estadístico Chi cuadrado. La ruta sugerida a seguir en el programa es la siguiente: a) datos; b) ponderar casos; y c) variable de frecuencia.
Seguidamente, se selecciona la variable con la cual se desea realizar la ponderación, que en este caso es la variable frecuencia. Una vez realizada la selección se procede a aceptar para obtener las frecuencias ponderadas. Es importante señalar que este paso se realiza exclusivamente cuando se tiene contabilizada la frecuencia de cada combinación. Por el contrario, si se dispone de valores individuales para cada combinación de filas y columnas, este paso no sería necesario.
Se solicita la creación de una tabla de doble entrada y el cálculo del estadístico de prueba siguiendo la siguiente ruta: a) analizar; b) estadísticos descriptivos; y c) tablas cruzadas. En el menú se selecciona la opción «filas» para incorporar la cualidad analgésica y la opción «columnas» para la cualidad de dolor, determinando así la disposición de cada cualidad.
Después se elige la opción «casillas» y se marca los recuentos «esperados», así como los porcentajes de «filas» y «columnas», como se muestra en la figura 1. A continuación se procede a clicar en «continuar» en el mismo menú y se selecciona la opción «estadísticos», optando por la alternativa «Chi cuadrado». De esta manera, se obtiene la tabla cruzada con los valores observados y esperados, así como los porcentajes respectivos de cada celda y, finalmente, el estadístico de prueba con su valor de probabilidad (fig. 2).
En la figura 2 se presentan varios aspectos importantes a considerar en el momento de analizar los resultados. En primer lugar, se muestra una tabla titulada «Resumen de procesamiento de casos», donde se puede observar que se utilizaron 215 datos para este caso clínico, lo que indica que no hay datos perdidos y que se está analizando el 100% de la información disponible.
Por otro lado, se presenta una tabla identificada como «Tabla cruzada analgésico», que contiene una gran cantidad de información. En esta tabla se registra inicialmente la cantidad de personas que experimentaron diferentes niveles de intensidad de dolor después de recibir el analgésico. Por ejemplo, el primer valor de la tabla indica el «recuento», que señala que solo 10 personas reportaron ausencia de dolor después de recibir el analgésico uno (tratamiento 1). Asimismo, se proporciona el «recuento esperado» de 23,9, el porcentaje que estas 10 personas representan dentro del total de pacientes que recibieron el analgésico (9,3%) y el porcentaje que representan dentro del total de casos de dolor (20,8%). Por lo tanto, para cada analgésico se proporciona información sobre el valor observado (recuento), el valor esperado (recuento esperado) y los porcentajes que representan en relación con el total de pacientes que recibieron el analgésico y la intensidad de dolor.
Antes de proseguir con el análisis de las combinaciones entre analgésico e intensidad de dolor, es crucial verificar si existe un efecto significativo del factor analgésico. Esto se logra al observar la tabla identificada como «Pruebas de Chi cuadrado» mostrada en la figura 2, donde se encuentra la celda designada como Chi cuadrado de Pearson, con un valor numérico de 44,010 y un valor de p de 0,0001. Al comparar estos datos con el nivel de significación establecido para este estudio (0,05) se rechaza la hipótesis nula (0,0001<0,05). Por consiguiente, se concluye que existen diferencias significativas en cuanto a la eficacia de los analgésicos para aliviar el dolor experimentado por los pacientes. Esto implica que uno de los analgésicos evaluados presenta una acción superior en el alivio del dolor.
Dada la importancia de la prueba de Chi cuadrado es crucial identificar la combinación más adecuada que ofrezca la mejor respuesta según el objetivo de la investigación. Por lo tanto, se procede a calcular los residuos estandarizados corregidos utilizando el programa SPSS, siguiendo la siguiente ruta: a) analizar; b) estadísticos descriptivos; y c) tablas cruzadas. Una vez en el menú de tablas cruzadas se selecciona la opción «casillas» y luego se eligen los «residuos», específicamente los estandarizados corregidos.
La información generada se presenta en la figura 3, donde se exhiben los residuos estandarizados corregidos para cada una de las combinaciones de la tabla. Estos residuos se incorporan en la base de datos como una nueva variable denominada «Z». Posteriormente, son transformados en valores de Chi cuadrado utilizando el programa SPSS: a) transformar y b) calcular variable. En este menú se incluye la siguiente fórmula: Chi cuadrado: Z*Z. Luego se determina la probabilidad asociada a estos valores para identificar las combinaciones significativas. Esta probabilidad se determina con el programa SPSS través del siguiente procedimiento: a) transformar; b) calcula variable; c) grupos de funciones; d) significación; e) funciones y variables especiales; seleccionando Sig.Chisq., de ahí que se genere una probabilidad llamada Sig.Chisq. (Chicuadrado, 1).
Debido a las diferencias significativas observadas entre los analgésicos estudiados y al análisis de los valores de probabilidad, es evidente que el analgésico 2 demostró un rendimiento superior. Esto se refleja en el hecho de que un porcentaje considerablemente mayor de personas no experimentaron cefaleas con este analgésico en comparación con el otro (38% vs. 1%). Por el contrario, el analgésico 1 mostró el menor efecto, ya que un porcentaje significativamente mayor de personas informaron sentir un dolor intenso en comparación con el analgésico 2 (42% vs. 6%). Es importante señalar que estas combinaciones específicas entre analgésicos e intensidades de dolor fueron las que resultaron significativas en la tabla, ya que los valores de probabilidad fueron inferiores al nivel de significación establecido, que en este caso fue del 5%. En cuanto al resto de las combinaciones entre analgésicos e intensidades de dolor, al presentar valores de probabilidad superiores al 5% no se pueden establecer diferencias significativas. Por lo tanto, ambos analgésicos reflejan un comportamiento similar en las escalas de dolor leve y moderado.
Aquí se ha demostrado cómo la prueba de Chi cuadrado de homogeneidad es una herramienta estadística eficaz para evaluar diferencias entre grupos tratados con distintas intervenciones en estudios clínicos. El uso de residuos estandarizados corregidos ayudó a profundizar en el análisis, permitiendo una interpretación más precisa de los datos. Este método puede ser particularmente útil en el campo de la investigación clínica y otros estudios epidemiológicos, donde entender la efectividad de diferentes tratamientos es crucial para la toma de decisiones clínicas y la mejora de las intervenciones de salud.






