INTRODUCCION
El objetivo básico de la artroplastia de cadera es reducir la incapacidad funcional derivada del dolor y de la limitación articular, mejorando la calidad de vida de los afectados. Desde las sociedades científicas se ha subrayado la importancia de la valoración de estos componentes 1. Una adecuada valoración de los resultados de la artroplastia requiere el uso de instrumentos genéricos de medición de la calidad de vida, capaces de valorar las diversas dimensiones del bienestar relacionadas con la salud, y de instrumentos específicos que sean lo suficientemente sensibles para detectar los cambios clínicos de interés en el estado de los pacientes 2. Probablemente, el instrumento genérico más difundido actualmente es el Medical Outcomes Study-Short Form 36 (MOS SF-36) 3. Este instrumento se ha utilizado ampliamente en las enfermedades de cadera 4 y sus propiedades clinimétricas (fiabilidad, validez, sensibilidad a los cambios) han sido bien estudiadas en los problemas de esta articulación dado su frecuente uso como patrón oro para la validación de otros instrumentos 2,5-16. Respecto a los instrumentos específicos, el Western Ontario and McMaster University (WOMAC) Osteoarthritis Index 17 es un instrumento muy extendido para evaluar la patología de cadera y, posiblemente, uno de los que cuenta con más estudios de validación 2,18, incluyendo la versión española 19,20. Sin embargo, el instrumento más utilizado, con gran diferencia, para evaluar los resultados tras la artroplastia de cadera es la escala de cadera de Harris (Harris Hip Score, HHS) 21, a pesar de la escasez de trabajos sobre sus propiedades clinimétricas 2,13,18.
La HHS fue introducida en 1969 para valorar la patología traumática de cadera a partir de cuatro dimensiones dolor, función, deformidad y amplitud del movimiento que reciben diferentes ponderaciones en función del juicio clínico de sus autores. Pese a su larga disponibilidad y amplio uso, contaba con muy pocos, y parciales, estudios de validación 2,22,23 y sólo muy recientemente se ha revisado de forma más completa su fiabilidad y validez 13 y sensibilidad a los cambios 16. Excepto uno en artrosis bajo tratamiento rehabilitador todos estos estudios se han realizado desde la perspectiva de la cirugía ortopédica, valorando la situación del paciente previa a la intervención y tras períodos variables de seguimiento. Esta perspectiva, la de mayor interés desde el punto de vista del paciente, integra los resultados de todos los tratamientos (quirúrgicos, médicos, rehabilitadores) que el paciente ha recibido en el período de seguimiento. Sin embargo, desde la perspectiva de la rehabilitación, interesa también conocer los resultados una vez que el paciente ha sido intervenido y accede a esta modalidad de tratamiento, porque permite valorar las aportaciones y posibles mejoras del tratamiento rehabilitador 24,25. El objetivo de este trabajo es analizar determinadas propiedades clinimétricas de la HHS (validez de contenido, de constructo, de criterio y sensibilidad a los cambios) en pacientes que acceden a tratamiento rehabilitador tras ser intervenidos de artroplastia total de cadera.
MATERIAL Y MÉTODO
Diseño
Cohorte prospectiva de 89 pacientes que iniciaron tratamiento rehabilitador tras ser intervenidos de prótesis total de cadera, en los que se evaluó la capacidad funcional (HHS) y la calidad de vida (MOS SF-36) en la primera visita y a los 3 meses de seguimiento. Los resultados de calidad vida, objetivo central de la investigación, han sido previamente publicados 26 y en este trabajo se muestran sólo los resultados de la validación de la HHS.
Entorno
El estudio se realizó en el servicio de rehabilitación de un área de salud fundamentalmente urbana de Valencia. El servicio, dependiente de la red asistencial de la Generalitat Valenciana, cuenta con un centro de rehabilitación hospitalario y, en el momento del estudio, 6 unidades básicas de rehabilitación extrahospitalarias.
Pacientes
Se incluyeron los 89 pacientes que, entre enero de 1997 y diciembre de 1998, fueron atendidos en primera visita, tras 10-20 días desde la intervención de prótesis total de cadera. Los datos sociodemográficos y clínicos de los pacientes evaluados se han descrito previamente 26. Resumidamente, el 64 % fueron mujeres, la edad media fue de 68,7 años, con el 44 % entre 65-74 años y un 18 % de 75 o más años. La coxartrosis (71,6 %) y la fractura (19,7 %) fueron los diagnósticos más frecuentes, repartiéndose el 8,6 % restante entre necrosis, artritis reumatoide, enfermedad de Perthes y no etiquetados. La comorbilidad más frecuente fue la presencia de otras artroplastias (16 %), seguida de la enfermedad vascular periférica (13,5 %) y la afectación sensorial moderada (11 %). En el 49,4 % de los casos se intervino la cadera derecha y en el resto, la izquierda.
Instrumentos
La HHS es un instrumento específico utilizado para evaluar por una persona externa, no autoaplicado, los problemas de la cadera y los resultados de su tratamiento 21. La HHS incluye cuatro dimensiones (dolor, función, amplitud de movimiento y ausencia de deformidad) y utiliza un rango de puntuación entre 0 (peor capacidad funcional posible) y 100 (mejor capacidad funcional posible). La puntuación global se obtiene por agregación simple de las puntuaciones de cada una de las cuatro dimensiones, siendo el dolor (hasta 44 puntos) y la función (hasta 47 puntos, divididos en funciones de marcha, hasta 33 puntos, y actividades diarias, hasta 14 puntos) las que reciben un mayor peso. A la deformidad le corresponden 4 puntos y a la amplitud de movimiento 5 puntos. Sus autores propusieron un criterio de interpretación cualitativa de los resultados (excelentes: entre 90 y 100; buenos: 80-89; aceptables: 70-79; y pobres: < 70) que, a pesar de haber recibido algunas críticas es utilizado con carácter general 10. La versión utilizada en este estudio corresponde a una traducción española de la versión original 21 publicada en 1994 27.
El MOS SF-36 es un instrumento genérico y autoaplicado 3, ampliamente utilizado para medir el impacto de la enfermedad o los tratamientos en la calidad de vida, y del que existe una versión española previamente validada 28, así como valores poblacionales de referencia 29. Incluye ocho dimensiones: salud general, función física, rol funcional, rol emocional, rol social, dolor, vitalidad y salud mental. Cada dimensión puede tomar valores entre 0 y 100 siendo esta última la mejor puntuación. El MOS SF-36 no permite agrupar las puntuaciones de las diferentes dimensiones en una puntuación global de calidad de vida y para la valoración cualitativa de sus resultados suele emplearse la comparación con los patrones poblacionales de puntuación según grupos de edad y sexo.
Aspectos éticos, confidencialidad y autorizaciones
Todos los pacientes formalizaron el consentimiento informado previamente a su incorporación al estudio que, de otro lado, no implicaba la realización o exclusión de tratamientos, pruebas u otras intervenciones más allá de las mediciones de la HHS y del MOS SF-36. Aunque el estudio requería la identificación de los pacientes, el equipo investigador adoptó las medidas oportunas para evitar el acceso de terceros a esta información. Para la utilización del MOS SF-36 se dispuso de la correspondiente autorización del Health Institute (New England Medical Hospitals).
Análisis
La validez de contenido se valoró comparando directamente el porcentaje de casos que tomaron los valores mínimo (efecto suelo) y máximo (efecto techo) de la HHS y sus subescalas (dolor, función, deformidad y movimiento), y de las dimensiones función física y dolor del MOS SF-36. Aunque no existe un criterio de evaluación cuantitativo, se espera que los instrumentos con buena validez de contenido tengan un bajo porcentaje de casos en los valores de puntuación máximo y mínimo. La validez de constructo se valoró analizando si determinados factores del paciente (mayor edad, comorbilidad, diagnóstico) se asociaban a peores puntuaciones en la HHS. Los aspectos de validez convergente y divergente, se evaluaron analizando la correlación entre la HHS (y sus subescalas) y las diversas dimensiones del MOS SF-36 para contrastar la hipótesis que los dominios similares (dolor y función) de ambos instrumentos deberían correlacionar estrechamente entre sí, mientras que estas correlaciones deberían ser menores entre dominios no relacionados. La validez de criterio se valoró analizando la correlación entre la puntuación global de la HHS y las dimensiones función física y dolor del MOS SF-36, adoptadas "como patrón oro" (el MOS SF-36 es uno de los instrumentos más y mejor validados en una amplia gama de situaciones, incluyendo las validaciones previas de la HHS) 13,16, para contrastar la hipótesis de que estas correlaciones serían significativas (p < 0,05) y superiores al valor preestablecido de 0,40. Dada la no normalidad de varias distribuciones se utilizó el coeficiente de correlación de Spearman.
Finalmente, para analizar la sensibilidad a los cambios de la HHS se evaluó la presencia de diferencias significativas para cada una de las respectivas dimensiones entre las valoraciones basal y a los 3 meses de seguimiento (dada la no normalidad de las distribuciones se utilizó la pruebas no paramétrica de Wilcoxon), y se estimaron el tamaño del efecto tipificado (diferencia entre las puntuaciones de las valoraciones en ambos momentos del tiempo, dividida por la desviación estándar [DE] de la valoración basal) 30-32 y la respuesta media tipificada (diferencia entre las puntuaciones de las valoraciones en ambas momentos del tiempo, dividida por la DE de la distribución de estas diferencias) 31,33. Para la interpretación de estos estadísticos se siguieron los criterios propuestos por Cohen 30 para interpretar el tamaño del efecto tipificado (valores < 0,20 representarían un cambio de aproximadamente la quinta parte de la DE basal y se considera pequeño; un valor de 0,50 representa un cambio de al menos la mitad de la DE basal y se considera moderado, y un valor superior a 0,80 supone un cambio de al menos cuatro veces la DE basal y se considera elevado). La aplicación de estos criterios a la respuesta media tipificada es discutible 35, pero viene siendo utilizada por la mayor parte de autores y se ha mantenido en este trabajo. Los análisis estadísticos se realizaron con el programa estadístico STATA® (College Station, Texas).
RESULTADOS
El porcentaje de casos que obtuvieron la puntuación mínima (efecto suelo) fue prácticamente nulo para la HHS y sus subescalas, tanto en la valoración basal como a los 3 meses de seguimiento (tabla 1). Las dimensiones del MOS SF-36 analizadas mostraron un comportamiento similar, con excepción de la función física en la valoración basal (18 % de casos con la puntuación mínima). Un importante porcentaje de casos puntuaron en los valores máximos (efecto techo) en varias subescalas de la HHS (sobre todo en la de amplitud de movimiento) y en la dimensión dolor del MOS SF-36. Sin embargo, las dimensiones de función de ambos instrumentos y la puntuación global de la HHS prácticamente no mostraron valores techo. En conjunto, la HHS no mostró efectos techo o suelo de importancia, mientras que en el MOS SF-36 la función física mostró un cierto efecto suelo y el dolor un efecto techo.
En el análisis bivariable para identificar factores asociados con la puntuación de la HHS al final del seguimiento, sólo el sexo se asoció a diferencias significativas en la puntuación, aunque de escasa magnitud (mediana de 88 en hombres, por 85 en mujeres). No se hallaron diferencias significativas en función de diversas características del paciente (edad, comorbilidad, nivel de estudios, estado civil, disponer de ayuda social, situación laboral, vivir solo, diagnóstico) o del tratamiento, como la lateralidad de la prótesis, el lugar de tratamiento (hospital o unidad básica de rehabilitación extrahospitalaria) o el haber recibido tratamiento fisioterápico frente a programa domiciliario. Respecto al MOS SF-36, no se hallaron diferencias significativas en la dimensión función física para ninguna de las variables estudiadas; en la dimensión dolor las fracturas mostraron peor puntuación que las artrosis, pero tampoco existieron diferencias en el resto de variables. Otras variables del MOS SF-36 sí se asociaron a determinadas características de los pacientes (los hombres obtuvieron mejores resultados en las dimensiones salud general, vitalidad y salud mental; los jubilados por edad y las personas sin comorbilidad tenían mejores puntuaciones en salud general; los viudos mostraban peores resultados en vitalidad y rol social; los que vivían en su propio domicilio mostraron peores resultados en vitalidad), pero no a las de tratamiento.
En la evaluación al inicio del tratamiento (tabla 2) las dimensiones dolor y función de la HHS correlacionaron fuertemente con las respectivas dimensiones del MOS SF-36 (r = 0,70 y 0,55, respectivamente), siendo más débiles estas correlaciones con el resto de dimensiones (sólo la correlación entre la HHS-dolor y MOS SF-36-salud mental alcanzó el valor preestablecido de 0,40). En la evaluación a los 3 meses del seguimiento (tabla 3), las escalas de dolor y función de la HHS se correlacionaron también con otras dimensiones del MOS SF-36, pero las asociaciones más fuertes se mantuvieron entre las dimensiones análogas de ambos instrumentos. Las dimensiones de amplitud de movimiento y ausencia de deformidad de la HHS no mostraron correlaciones significativas, o fueron muy débiles, con la puntuación global de la HHS o con las dimensiones del MOS SF-36 en ninguna de las evaluaciones. La puntuación global de la HHS mostró una correlación significativa y superior a 0,40 con las dimensiones de función física y dolor del MOS SF-36 en ambas evaluaciones; en la evaluación a los 3 meses también correlacionó fuertemente con las dimensiones rol social y salud mental.
Respecto a las diferencias entre la evaluación basal y a los 3 meses (tabla 4), la HHS mostró diferencias significativas en las subescalas de dolor (mediana: 40-44), función (mediana: 17-35) y movilidad (mediana: 4,8-5,0), pero no en la deformidad. La puntuación mediana de la HHS pasó de 62 a 87,5. A los 3 meses de seguimiento, el 74,1 % de los pacientes se hallaban en valores de la HHS excelentes o buenos, el 12,4 % en valores moderados y el 13,5 % en valores de mal resultado. Respecto al MOS SF-36, las dimensiones función física (mediana:15-70) y dolor (mediana: 67-84) también mostraron una mejoría significativa en rol funcional de 0 a 75. Otras dos dimensiones del MOS SF-36 (rol social y salud mental) también experimentaron mejorías significativas, mientras que las dimensiones rol emocional, salud general y vitalidad no experimentaron cambios significativos (datos mostrados en un trabajo previo 26). Al final del período de seguimiento, el perfil de puntuaciones de los pacientes era muy similar al de la población general de sus grupos de edad y sexo 26.
El tamaño del efecto (tabla 5) fue muy elevado para la subescala de función y la puntuación global de la HHS, moderado para dolor y movimiento y pequeño para la deformidad. Las dimensiones función física, rol funcional y rol social del MOS SF-36 también mostraron un elevado tamaño del efecto, que fue moderado para la dimensión dolor y pequeño para el resto de dimensiones del MOS SF-36.
DISCUSION
Los resultados de este estudio muestran que la HHS no está afectada por los efectos suelo y techo (validez de contenido), se correlaciona bien con las dimensiones análogas de un patrón oro bien conocido como el MOS SF-36 en dos momentos diferenciados de la evolución del proceso, mientras que no lo hace o, en todo caso, en mucho menor medida, con dimensiones diferentes (validez de constructo) y es capaz de detectar diferencias en la situación de los pacientes en los dos momentos valorados, mostrando una elevada sensibilidad al cambio. En conjunto, estos resultados sitúan a la HHS como un instrumento válido cuando se utiliza en pacientes en rehabilitación tras artroplastia de cadera. Estos resultados son coincidentes con los de otros estudios que han estudiado la validez de la HHS en pacientes tras artroplastia de cadera 13 o su sensibilidad a los cambios en la artrosis de cadera bajo tratamiento rehabilitador 16.
Respecto a las diferentes subescalas de la HHS, dolor y función se comportan de forma similar a la puntuación global, pero las subescalas de movimiento y deformidad presentan problemas de validez y sensibilidad a los cambios. Estos resultados, ya relatados en otro estudio 13, se deben probablemente a que en origen estas subescalas se diseñaron para valorar pacientes provenientes de accidentes de tráfico con grandes deformidades, un problema infrecuente en la artroplastia, por lo que la casi totalidad de los pacientes obtienen la puntuación máxima (efecto techo) y muestran una baja validez de contenido. Probablemente son dimensiones innecesarias en la evaluación de la artroplastia, pero la escasa contribución de ambos dominios (4 y 5 puntos, sobre 100) a la puntuación total de la HHS hace que esta se vea muy poco afectada y mantenga sus propiedades clinimétricas. Respecto a la validez de constructo, hay que destacar que la HHS, y a diferencia de lo esperado, no mostró peores puntuaciones en pacientes de más edad, con comorbilidad o con diagnóstico previo distinto a la coxartrosis. Una de las explicaciones plausibles (ya que el MOS SF-36 tampoco mostró diferencias) es que los factores analizados tengan una importancia menor sobre los resultados finales, lo que en algunos casos coincidiría con otros trabajos 35. Otra explicación posible es la falta de poder estadístico en algunos de estos análisis, con variables distribuidas en varias categorías no equilibradas.
Respecto a las posibles limitaciones de este estudio hay que señalar, en primer lugar, que no se han valorado algunos componentes esenciales de la validez de estos instrumentos 36,37, en especial la fiabilidad y que la HHS no dispone de una versión española traducida conforme a los estándares para la adaptación transcultural de instrumentos de medición. Estas limitaciones podrían ser especialmente problemáticas en la versión autoaplicada de la HHS 38. Desde el punto de vista de la generalización en diferentes grupos de pacientes, las características de la población analizada en este estudio son muy similares a las de otros trabajos en pacientes con artroplastia de cadera y las puntuaciones finales de la HHS y el MOS SF-36 se sitúan en valores similares a los obtenidos en otros trabajos (en general, algo superiores frente a trabajos con seguimiento más corto y algo inferiores cuando el seguimiento de los trabajos de comparación fue más prolongado). No obstante, la HHS podría no mostrar las mismas propiedades en pacientes afectados de otros trastornos de cadera. Desde el punto de vista estadístico, y al margen de la comentada falta de poder en el análisis de los factores asociados a peores resultados, hay que destacar la realización de numerosas pruebas estadísticas sin correcciones para pruebas múltiples, que puede haber ocasionado detección de asociaciones significativas meramente espúreas. Finalmente, hay que reseñar el corto período de seguimiento, de sólo 3 meses, con la posibilidad de diferencias en los resultados a más largo plazo. Este aspecto podría afectar a las diferencias en sensibilidad a los cambios entre ambos instrumentos, ya que mientras la HHS fue valorado por un médico rehabilitador en un momento concreto del tiempo, buena parte de las preguntas del MOS SF-36 se refieren a las últimas 4 semanas, y aunque es previsible que las respuestas de los pacientes se sesguen hacia el estado en el momento de la cumplimentación del cuestionario, también cabe la posibilidad de que promedien, en alguna medida, los resultados del último mes.
En conjunto, los resultados de este estudio muestran que la HHS es un instrumento válido y sensible a los cambios, en nuestro entorno y en pacientes al inicio de la rehabilitación tras artroplastia de cadera, aunque su comportamiento es similar a las dimensiones de función física y dolor del MOS SF-36. Por lo tanto, la elección entre instrumentos, entre los que no puede olvidarse el WOMAC, puede depender sobre todo de factores contextuales. Probablemente, si interesa tener una visión global de la calidad de vida del paciente, el MOS SF-36 es el instrumento de elección, mientras que el WOMAC ofrecería una mayor sensibilidad a los cambios. La HHS, siempre que sea realizado externamente por profesionales, puede tener interés cuando se quieran minimizar algunos sesgos de las respuestas de los pacientes, como el de respuestas socialmente deseables, y cuando se desee realizar comparaciones, dado el gran número de trabajos que han utilizado esta escala.
AGRADECIMIENTOS
Este trabajo forma parte de un proyecto de investigación que contó con una ayuda de investigación de la Fundación Mapfre Medicina y una ayuda parcial de la Fundación Instituto de Investigación en Servicios de Salud (FIISS). El Health Institute, de los New England Medical Hospitals por mediación del Dr. Jordi Alonso (Institut Municipal d'Investigacions Mèdiques) nos cedió los derechos de uso de la versión española del MOS SF-36.








