metricas
covid
Buscar en
Fisioterapia
Toda la web
Inicio Fisioterapia Análisis psicométrico de la subescala manipulación de objetos de la escala pe...
Información de la revista
Vol. 33. Núm. 4.
Páginas 145-156 (julio - agosto 2011)
Compartir
Compartir
Descargar PDF
Más opciones de artículo
Visitas
5723
Vol. 33. Núm. 4.
Páginas 145-156 (julio - agosto 2011)
Original
Acceso a texto completo
Análisis psicométrico de la subescala manipulación de objetos de la escala peabody de desarrollo motor segunda edición (PDMS-2) con el modelo de Rasch
Psychometric analysis of the subscale object manipulation of the peabody developmental motor scale-second edition (PDMS-2) with the Rasch model
Visitas
5723
O. Dols Calatayuda,
Autor para correspondencia
oscar.dols@carm.es

Autor para correspondencia.
, J.A. López Pinab
a Departamento de Fisioterapia, Universidad de Murcia, Murcia, España
b Facultad de Psicología, Universidad de Murcia, Murcia, España
Este artículo ha recibido
Información del artículo
Resumen
Texto completo
Bibliografía
Descargar PDF
Estadísticas
Figuras (5)
Mostrar másMostrar menos
Tablas (2)
Tabla 1. Características demográficas de los 106 niños de la muestra
Tabla 2. Distribución por colegios de los niños de la muestra
Mostrar másMostrar menos
Resumen
Objetivo

Investigar las propiedades de medición de la subescala manipulación de objetos del PDMS-2 (Folio MR, Fewell RR, 2000) mediante la aplicación del modelo de Rasch, con vistas a determinar si ofrece una estructura unidimensional que permita obtener estimaciones de parámetros de dificultad de los ítems y habilidad invariantes.

Material y métodos

Un total de 106 niños (97 niños con desarrollo normal y 9 niños con algún tipo de alteración en el desarrollo motriz) fueron reclutados para dicho estudio psicométrico. Cada niño fue evaluado con la subescala manipulación de objetos, que consta de 24 ítems en orden creciente de dificultad. El análisis dicotómico de Rasch se utilizó en el análisis final de los datos porque fue el que mejor se adaptó al patrón de respuestas.

Resultados

El análisis de los datos mediante ambos modelos politómicos demostró que los datos del patrón de respuestas no se ajustaban a lo esperado por estos modelos para la mayoría de los ítems centrales de la escala. En cambio, el análisis dicotómico de Rasch demostró un buen ajuste de los datos, a pesar de que 8 ítems centrales (6 y del 8 al 14) se alejaban ligeramente de lo esperado por el modelo, lo que nos permite asegurar con cierta precaución que la variabilidad en las respuestas del conjunto de ítems estudiados obedece a una sola dimensión de habilidades manipulativas en niños.

Conclusiones

La metodología basada en el estudio del ajuste de los ítems a la familia de modelos de Rasch nos permite obtener estimaciones invariantes de los parámetros de habilidad de las personas y de dificultad de los ítems. Además, este estudio proporciona evidencia preliminar de que la simplificación de las escalas de calificación de la mayoría de los ítems de la escala manipulación de objetos del PDMS-2 a categorías dicotómicas podría optimizar sus cualidades de medición, ya que el modelo dicotómico de Rasch ha sido el que mejor ha explicado la variabilidad de las respuestas de los niños de la muestra.

Palabras clave:
Escala de desarrollo motor Peabody
Análisis psicométrico
Modelo de Rasch
Ajuste de modelos
Abstract
Objective

To investigate the measurement properties of the subscale object manipulation of the PDMS-2 (Folio MR, Fewell RR, 2000) by applying the Rasch model in order to determine if it offers a one-dimensional structure to obtain estimates of difficulty and skill invariant parameters.

Material and methods

A total of 106 children (97 children with normal development and 9 children with some kind of motor development alteration) were recruited for this psychometric study. Each child was assessed with the subscale object manipulation. This scale is made up of 24 items in increasing order of difficulty. The dichotomous Rasch analysis was used in the final analysis of the data because it was the best adapted to the pattern of responses.

Results

The data analysis using both polytomous data models showed that the pattern of responses did not conform to expectations for these models for most of the central items of the scale. In contrast, the dichotomous Rasch analysis showed a good fit of the data, although eight central items (6 and 8 to 14) moved slightly away from that expected by the model, allowing us to say with some caution variability in the responses of all the items studied is due to a single dimension of manipulative skills in children.

Conclusions

The methodology based on the study of fit of the items to the Rasch family of models allows us to obtain estimates of the invariant skill of people and item difficulty parameters. In addition, this study provides preliminary evidence that the simplification of the rating scales of most items of the scale object manipulation of the PDMS-2 to dichotomous categories could optimize their measurement qualities because the Rasch dichotomous model has been the one that has best explained the variability of the responses of children in the sample.

Keywords:
Peabody developmental motor scale
Psychometric analysis
Rasch model
Fit models
Texto completo
Introducción

Uno de los cambios más importantes de la fisioterapia en pediatría ha sido el paso del uso del enfoque de la neuromaduración y los reflejos para la evaluación de los niños a la medición de la discapacidad relacionada con las actividades funcionales. Este cambio parece haber sido impulsado por las teorías contemporáneas del desarrollo y el control motor, que apoyan el aprendizaje motor y los métodos de evaluación e intervención. Además, este cambio está relacionado con un mayor énfasis en la evaluación y la intervención terapéutica en el entorno del niño, ya que no es lo mismo el rendimiento motor en el entorno real que en un ambiente terapéutico, y es fundamental enfocar la intervención hacia las tareas que los niños necesitan llevar a cabo en su día a día1.

Un tipo de habilidad muy importante en el día a día de los niños, tanto a nivel social, por la interacción en el campo del juego, como a nivel de rendimiento académico en materias como educación física, es la habilidad de manejo de la pelota2. Esta destreza típicamente incluye lanzar, atrapar y chutar, conformando una actividad motriz global y no solo manual, fundamental en educación física porque es la piedra angular de la mayoría de los juegos.

Una prueba de referencia normativa del desarrollo motor que incluye la medida de las habilidades de manejo de la pelota y es ampliamente utilizada por los fisioterapeutas es el Peabody Developmental Motor Scale segunda edición (PDMS-2)3. El PDMS-2 está compuesto de 6 subtests que miden capacidades motoras interrelacionadas que se desarrollan temprano en la vida. Fue diseñado para evaluar las habilidades motoras en niños desde el nacimiento hasta la edad de 6 años.Los 6 subtests que componen el PDMS-2 son: respuestas motoras, estática, locomoción, manipulación de objetos (estas cuatro subescalas evalúan el desarrollo motor grueso), prensión y coordinación visuo-motora; estas dos últimas subescalas miden desarrollo motor fino. La subescala objeto de este estudio es la de manipulación de objetos, que consta de 24 ítems que miden la capacidad de un niño de manejar pelotas de diferentes tamaños. Ejemplos de las acciones medidas en ella incluyen coger, lanzar y chutar. Estas habilidades no son aparentes hasta que un niño ha alcanzado la edad de 11 meses, por lo que este subtest se emplea solo para niños a partir de los 12 y hasta los 72 meses.

Dentro del proceso de identificación de los niños con retrasos motores o trastornos en el desarrollo motor se incluye, en primer lugar, un screening o cribado, después una exhaustiva evaluación motriz, y por último, una o varias reevaluaciones para constatar avances o retrocesos con el paso del tiempo. El cribado tiene la finalidad de evaluar más a fondo solo a los niños que confirmen signos de alteración motriz. En segundo lugar, la selección de una escala de medida adecuada es una parte crucial del proceso de evaluación y de reevaluación y debe estar orientada hacia los criterios de la evaluación y las características del niño. El PDMS-2 constituye una de las pruebas de elección entre los expertos encargados en evaluar el desarrollo motor del niño4,5.

Este trabajo se realiza motivado por la relevancia del instrumento de medida PDMS-2 y el interés que despierta en el ámbito de la fisioterapia pediátrica y la atención temprana6, ya que en la actualidad se están tomando decisiones muy importantes de medida, evaluación, diagnóstico y tratamiento basándose en sus resultados. Aunque ha sido ampliamente validada7-9 y contrastada con otras escalas de desarrollo motor y, al mismo tiempo, ampliamente utilizada como instrumento de medida en proyectos de investigación10-12, hasta la fecha no existe evidencia científica sobre su aplicabilidad en nuestro entorno cultural.

Familia de modelos de Rasch

La familia de modelos de Rasch engloba un conjunto de modelos que permiten pronosticar cada una de las respuestas que una persona da a cada uno de los ítems de un test. Uno de los más utilizados es el modelo unidimensional de Rasch13, que afirma que cada persona tiene una y solo una habilidad esencial (θ) y el ítem tiene una y solo una dificultad (δ) relacionada con la dimensión que se mide. La habilidad de las personas solo se puede conocer enfrentándolas con los ítems del test, mientras que la dificultad de los ítems sólo se puede conocer haciendo que las personas de distintas habilidades los contesten. Además, ambos parámetros producen escalas de intervalo cuyo origen y unidad de escala son arbitrarios. Para ítems dicotómicos (acierto/fallo, sí/no), Rasch propuso que la relación entre la habilidad de las personas y la dificultad de los ítems se puede modelar probabilísticamente a través de la siguiente función matemática:

En la ecuación (1), θi es el parámetro de habilidad de la persona i, δj es el parámetro de dificultad del ítem j, exp es el número e, y P(θi) es la probabilidad de que la persona de habilidad θi acierte el ítem. La ecuación (1) es una función no lineal que genera una enorme complejidad a la hora de estimar los parámetros de habilidad de las personas y de dificultad de los ítems. A pesar de ello, esta cuestión se simplifica, ya que la suma de las respuestas a través de los ítems o de las personas permite obtener estimadores suficientes14 de los correspondientes parámetros.

Una condición esencial del modelo de Rasch15-17 y de otros modelos de TRI18 es que cualquier aplicación del modelo a un conjunto de datos de las respuestas a los ítems de un test requiere un estudio del ajuste de los ítems y del test completo al modelo especificado. El modelo de Rasch dispone de un conjunto de estadísticos de ajuste para los ítems y para el test completo, entre los que pueden destacarse los estadísticos basados en residuales entre la respuesta dada y la probabilidad esperada que se operativizan bajo diversas distribuciones (normal, chi al cuadrado). Si la diferencia entre las respuestas a los ítems y las probabilidades de respuesta se eleva al cuadrado y se suma a través de todas las casillas de la matriz de respuestas, obtendremos medias cuadráticas basadas en residuales cuya distribución se aproxima a la distribución chi al cuadrado, cuya esperanza matemática es 1. La transformación Wilson-Hilferty (en este trabajo, transformación t) permite transformar las medias cuadráticas a la distribución normal. Si el método de estimación de parámetros converge y los estadísticos de ajuste permiten afirmar que las respuestas de las personas pueden explicarse en función de la dificultad de los ítems que componen el test, entonces podemos asegurar que las estimaciones de los parámetros de las personas y de los ítems son independientes, es decir, que la habilidad estimada de cada persona no depende del número y el tipo de ítems que ha contestado ni la dificultad de los ítems depende del número y el tipo de personas que los han contestado. Este hecho es muy importante en la medida en ciencias de la salud, ya que en el modelo clásico de tests (MCT), que fue el modelo de medida más utilizado en las ciencias sociales y de la salud durante gran parte del siglo pasado, la puntuación observada de las personas depende del número de ítems que contiene el test y la dificultad de los ítems depende del número de personas que los contestan. De esta forma, si el número de ítems cambia, las puntuaciones observadas de las personas cambian, y si el tamaño del grupo aumenta, los índices de dificultad de los ítems cambian en función de las características del grupo. A diferencia del MCT que se aplica independientemente de la dimensionalidad del test y el formato de los ítems, el modelo de Rasch es, en realidad, un precursor de una familia de modelos que, manteniendo su esencia, se adapta a las condiciones de medida en las que trabajamos. De esta forma, existe una variante del modelo de Rasch para ítems con más de dos categorías (politómicos, también conocidos como tipo Likert) y para rangos antes que puntuaciones resultantes de la ejecución de una tarea. Estos modelos tienen variantes multidimensionales que permiten estimar parámetros en las dimensiones especificadas en el estudio. Entre los modelos unidimensionales para ítems politómicos destacan el modelo de escalas de valoración19,20 y el modelo de crédito parcial16,21. Ambos se caracterizan por producir, además de un parámetro de dificultad para cada ítem, k-1 parámetros para las categorías de los ítems. En el modelo de escalas de valoración, los parámetros de las categorías serán iguales para todos los ítems y siempre estarán ordenados de menor a mayor (categoría más baja a más alta), mientras que en el modelo de crédito parcial, los parámetros de las categorías pueden variar de ítem a ítem, e incluso no estar ordenados.

Como resultado de las importantes ventajas que este modelo ofrece, diferentes instrumentos de valoración del desarrollo motor en niños han sido recientemente validados mediante su aplicación, entre ellos la subescala de desarrollo motor fino del PDMS-2 (PDMS-FM-2, que engloba los 2 últimos subtests de la escala, prensión y coordinación visuo-motora), que fue estudiada para su validación con niños de Taiwán de edades comprendidas entre 0 y 5 años (de 0 a 60 meses)22.

El modelo de crédito parcial

El modelo de crédito parcial16,23 fue diseñado especialmente para ítems de ejecución cuyas categorías suponían un incremento de aprendizaje de una categoría a otra. El modelo, entonces, permite obtener estimaciones de los umbrales entre las categorías (parámetros de paso) que permiten determinar no sólo la dificultad del ítem en el grupo, sino si las categorías están bien ordenadas y espaciadas en cada uno de los ítems que componen el test. La función matemática de este modelo tiene la siguiente forma:

donde δjk es el umbral de la categoría k en el ítem j, y el resto de parámetros se interpreta como en (1). Como en el modelo de Rasch dicotómico, en el modelo de crédito parcial es preciso estimar los parámetros de habilidad de las personas, dificultad de los ítems y de las categorías con un método de máxima verosimilitud, así como probar el ajuste de los datos al modelo.

El modelo de escalas de valoración

El modelo de escalas de valoración20 fue ideado por Andrich (1978) y básicamente es equivalente al modelo de crédito parcial excepto en que asume que los umbrales de las categorías son iguales para todos los ítems que forman el test. La función matemática de este modelo tiene la forma:

donde δj es el parámetro de dificultad del ítem y τk es el umbral entre las categorías.

Objetivos de este estudio

Este estudio pretende demostrar la utilidad de los diferentes modelos de la familia de Rasch (Rasch dicotómico, de crédito parcial y de escalas de valoración) con una escala de desarrollo psicomotriz ampliamente utilizada en el ámbito de las ciencias de la salud conocida como Peabody Development Motor Scales-Second Edition (PDMS-2), para investigar las propiedades de medición de la subescala manipulación de objetos, englobada dentro de la sección de motricidad gruesa del PDMS-2.

Además, las influencias culturales podrían estar asociadas a diferencias en el desarrollo en las habilidades motrices entre niños de diferentes zonas geográficas y, además, podrían afectar a la idoneidad de las pruebas de los tests de valoración del desarrollo en algunos contextos interculturales. Por lo tanto, este estudio también pretende investigar la posibilidad de que los ítems de esta subescala del PDMS-2 puedan ser utilizados adecuadamente para evaluar los niveles de habilidad de manipulación de objetos de los niños y las niñas de nuestro entorno cultural.

Material y métodosParticipantes

Un total de 106 niños fueron reclutados en cuatro colegios de la Región de Murcia, entre el 1 de abril de 2010 y el 10 de junio de 2010. Los 97 niños con desarrollo normal desde el nacimiento constituyeron la muestra normativa, con los siguientes criterios: a) recién nacidos a término (nacidos entre las 36 y las 42 semanas); b) peso al nacer 2.500 g o más, y c) ausencia de déficits sensoriomotores conocidos y de enfermedades diagnosticadas (p. ej., cáncer o enfermedades del corazón) o alteraciones corporales (p. ej., amputaciones o fracturas recientes) que limitarían la capacidad del niño para realizar tareas de movimiento, de acuerdo con informes aportados por los padres.

Además, 9 niños que presentaron retrasos madurativos o diferentes patologías neurológicas congénitas fueron reclutados para constituir la muestra clínica. Los niños fueron incluidos en la muestra clínica si tenían un diagnóstico médico formal de un trastorno del desarrollo global como parálisis cerebral, retraso madurativo, síndrome de Down u otros trastornos sensoriomotrices.

Las características demográficas de los 106 niños incluidos en el estudio se presentan en la tabla 1.

Tabla 1.

Características demográficas de los 106 niños de la muestra

Variables demográficas  Muestra completa (n=106)  Muestra normativa (n1=97) (91,51%)  Muestra clínica (n2=9) (8,49%) 
Sexo n (%)
Niños  48 (45,28%)  43 (44,33%)  5 (55,6%) 
Niñas  58 (54,72%)  54 (55,67%)  4 (44,4%) 
Edad media (meses)
Media ± desviación estándar  50,44 ± 6,417  50,90 ± 6,101  45,56 ± 8,033 
Edad, n (%)
36-48 meses  51 (48,11%)  44 (45,36%)  7 (77,78%) 
49-60 meses  64 (60,38%)  62 (63,92%)  2 (22,22%) 
Diagnóstico, n (%)
PCI  –  –  4 (44,4%) 
Retraso madurativo  –  –  4 (44,4%) 
Síndrome de Down  –  –  1 (1,11%) 
Procedimiento

Tras ser aprobada la propuesta de estudio en los cuatro centros públicos de educación infantil donde se reclutaron a los niños participantes, todos los padres de los niños firmaron el consentimiento informado antes del comienzo del estudio.

A cada participante se le administró la subescala manipulación de objetos del PDMS-2 de forma individual en un entorno tranquilo en el centro en el que se encontrase escolarizado. En algunas pocas ocasiones a los cuidadores (auxiliares técnicos educativos encargados de atender a los niños con discapacidad en colegios) se les permitió que participaran en la administración de la prueba, si el niño parecía incómodo cuando se le dejaba a solas con el examinador. Tres fisioterapeutas entrenados previamente en la administración del PDMS-2 y con experiencia en el ámbito de la fisioterapia en pediatría llevaron a cabo las evaluaciones de todos los niños participantes. Los cuatro centros de educación infantil y primaria a los que pertenecen los niños de la muestra y los detalles de la asignación a cada centro se pueden ver en la tabla 2.

Tabla 2.

Distribución por colegios de los niños de la muestra

  Muestra completa (n=106)  Muestra normativa (n1=97)  Muestra clínica (n2=9) 
CEIP Nuestra Sra. del Rosario (Santomera, Murcia)  87  83 
CEIP Narciso Yepes (Murcia) 
CEIP Jara Carrillo (Alcantarilla, Murcia) 
CEIP Ramón Gaya (Santomera, Murcia) 
Instrumento y medidas

El PDMS-2 es una prueba de referencia normativa y su subescala manipulación de objetos consta de 24 ítems que se ordenan por grado de dificultad, de menor a mayor.

Cada ítem se puntúa en una escala de calificación de 3 puntos (0-1-2). Los criterios generales para anotar los puntos se describen de la siguiente manera: 0, lo que indica que el niño no puede realizar la prueba solicitada; 1, indica que el niño lleva a cabo la prueba, pero no logra satisfacer los criterios, y 2, indica que el niño puede completar la prueba de acuerdo con los criterios especificados por el ítem.

La forma de administrar las pruebas en este estudio se realizó siguiendo el procedimiento original, que consiste en un procedimiento estándar que se limita a la administración de los ítems entre el que se constituye como basal (3 pruebas consecutivas con máxima puntuación) y el que se constituye como techo (límite superior de habilidad con tres ítems con puntuación mínima). Los ítems por debajo del nivel basal o aquellos que superan el límite máximo (techo) no se administran, sino que se puntúan directamente con la máxima calificación los situados por debajo del nivel basal y con la mínima calificación los situados por encima del techo.

Por último, la administración de los ítems se llevó a cabo de forma ordenada según aparecen en la escala y siguiendo las instrucciones del manual de administración del PDMS-2 para cada prueba de cada ítem. La explicación para una adecuada comprensión de cada prueba por parte de los niños se llevó a cabo de forma oral, realizando la prueba (para favorecer la imitación) y ayudándonos de las imágenes explicativas de cada ítem.

Estimación de parámetros

La matriz de respuestas a los 24 ítems de la subescala obtenida de los 106 niños de la muestra fue sometida a un análisis de Rasch utilizando el programa informático ConQuest23.

El programa ConQuest permite estimar los parámetros de los ítems y de las personas, bajo la familia de modelos de Rasch, con ítems dicotómicos o politómicos, aunque también permite mezclar ítems de ambos formatos. Además, también puede obtener los parámetros de modelos unidimensionales y multidimensionales. En este caso, emplearemos el programa para obtener los parámetros asumiendo que solo existe una dimensión para explicar la variabilidad de las observaciones en los ítems de la subescala del PDMS-2.

ConQuest requiere un archivo con las órdenes necesarias para ejecutar el análisis y otro archivo con la matriz de datos, aunque la matriz de datos puede ir en el mismo archivo de las órdenes. Ambos archivos deben tener formato de texto. Una vez que se ejecuta el archivo de órdenes, si no se produce ningún problema de mala especificación de los comandos, ConQuest producirá un archivo con las estimaciones de los parámetros de los ítems, un mapa donde se despliega la distribución de las habilidades de las personas y las dificultades de los ítems, y de las categorías de los ítems en los ítems politómicos, y si se requiere, en un archivo aparte, una estimación de los parámetros de habilidad de las personas que forman el grupo de acuerdo con el método de estimación seleccionado. En la figura 1 aparece el archivo de comandos para el modelo de crédito parcial como ejemplo. Se puede ver que el modelo de crédito parcial se llama en ConQuest: item + item * step.

Figura 1.

Archivo de comandos de ConQuest.

(0.07MB).

En primer lugar, utilizamos el modelo de crédito parcial16,21 para el análisis de Rasch, que se usa para estimar los parámetros de las escalas con ítems politómicos (con más de una respuesta posible) y que produce un parámetro de dificultad para cada ítem analizado y otro para cada umbral entre las diferentes categorías de cada ítem. Este modelo fue seleccionado, en primer lugar, debido a que los ítems del PDMS- 2 utilizan una escala de calificación de 3 puntos (0, 1 y 2) y los criterios de puntuación de cada categoría de calificación varían entre ítems distintos.

En segundo lugar, realizamos el análisis de la matriz de datos utilizando el modelo de escalas de valoración20, que funciona básicamente igual que el modelo de crédito parcial, pero asumiendo que los umbrales de las diferentes categorías son iguales para todos los ítems que forman el test.

Estos dos análisis politómicos nos permitirán comprobar si los datos obtenidos mediante la subescala utilizada se adaptan al modelo de Rasch politómico o, por el contrario, sería necesario plantear un análisis mediante el modelo dicotómico de Rasch, así como comparar ambos análisis para estudiar qué modelo se adapta mejor a los datos recopilados y poder analizar con él la escala para corroborar si realmente todos los ítems forman un continuo y dependen sus respuestas de una única dimensión, en este caso la capacidad manipulativa de objetos.Para comprobar si el patrón de respuestas de la escala se acerca de forma significativa a la distribución esperada por los diferentes modelos de Rasch utilizados, observaremos los estadísticos de transformación t obtenidos en el análisis para cada ítem. Además, si queremos saber cuál de los modelos empleados es el que mejor representa la distribución del patrón de respuestas tenemos que comparar las desviaciones obtenidas en cada análisis. La desviación es un estadístico de ajuste relativo que sigue una distribución chi al cuadrado con un número determinado de grados de libertad. Si la diferencia en la desviación entre los modelos es significativa, entonces podemos afirmar que el modelo que ha obtenido la desviación más baja ajusta mejor la escala que el modelo que ha obtenido la desviación más elevada.

Resultados

En los análisis politómicos de Rasch realizados obtuvimos las estimaciones de los parámetros de dificultad de cada uno de los 24 ítems que componen la escala manipulación de objetos del PDMS-2, con sus correspondientes errores típicos y los estadísticos de ajuste basados en medias cuadráticas y sus correspondientes transformaciones t a la distribución normal aproximada. Además, cada estadístico de ajuste lleva aparejado un intervalo de confianza para las medias cuadráticas que permite juzgar si el parámetro obtenido se encuentra en el rango esperado según las características del grupo o no. La interpretación de los estadísticos de ajuste es crucial para decidir si los ítems siguen el modelo de Rasch. En este caso, realizaremos la interpretación individualizada en función de cada uno de los ítems. Cada ítem dispone de dos estadísticos de ajuste: uno no ponderado y otro ponderado. El primero no pondera los residuales, por lo que puede alterarse fácilmente por resultados extremos, niños muy hábiles que fallan ítems fáciles o niños poco hábiles que aciertan ítems difíciles. En cambio, el segundo pondera la estimación del residual en función de la cantidad de información que arrojan los ítems en el intervalo de habilidad, de modo que las personas con habilidad más cercana a la dificultad del ítem suelen influir más en el residual que las personas cuya habilidad está por debajo o por encima de la dificultad del ítem. Generalmente, ambos estadísticos se deben tener en cuenta para decidir si el ítem sigue el modelo de Rasch especificado. Cada uno de estos estadísticos tiene una esperanza matemática de 1, por lo que el ítem que ajusta el modelo perfectamente debe tener este valor. Si la media cuadrática es mayor que 1x, entonces el ítem tiene un x% más de variabilidad que la esperada por el modelo de Rasch, mientras que si la media cuadrática es menor que 1, entonces tiene un x% menos de variabilidad que la esperada por el modelo de Rasch.

La transformación t de Wilson-Hifferty puede utilizarse también para decidir sobre el ajuste de los ítems. Así, esperamos que los ítems que se ajustan al modelo de Rasch tengan sus estadísticos t en el intervalo [–2, +2]. En el caso del análisis de crédito parcial (fig. 2), casi ningún ítem se ajusta al modelo de Rasch si utilizamos el estadístico no ponderado, aunque si tenemos en cuenta el estadístico de ajuste ponderado, la mayor parte de los ítems sigue el modelo de Rasch, excepto los ítems 8, 9, 10, 12, 13, 14, 15 y 18. En principio, la estrategia aconsejada por los investigadores en este campo15 consiste en modificar o eliminar estos ítems hasta encontrar una escala que se ajuste en todos sus ítems al modelo de Rasch. No todos los investigadores están de acuerdo con esta solución, ya que un proceso de eliminación o modificación de ítems poco cuidadosa puede alterar gravemente el contenido del test que estamos construyendo. En principio, pues, los ítems 1, 2, 3, 4, 5, 6, 7, 11, 16, 17, 19, 20, 21, 22, 23 y 24 formarían una escala de Rasch unidimensional para evaluar el grado de habilidad en el manejo de objetos en una muestra de niños de las características que hemos utilizado en este estudio (fig. 2).

Figura 2.

Análisis con el modelo de crédito parcial.

(0.76MB).

El análisis de los datos mediante ambos modelos politómicos (modelo de crédito parcial y modelo de escalas de valoración) demostró que los datos del patrón de respuestas no se ajustan a lo esperado por los modelos para la mayoría de los ítems centrales de la escala, por lo que el ajuste no es el adecuado en ninguno de ambos casos.

A pesar de que el modelo de crédito parcial (fig. 2) se ajusta mejor que el de escalas de valoración, ya que la desviación es significativamente menor, el hecho de que en este análisis 7 ítems centrales (8, 9, 10, 12, 13, 14, 15 y 18) obtengan estadísticos t significativamente por encima del valor umbral ±2 nos da una idea de que hay demasiados ítems con patrones de respuesta que no se ajustan adecuadamente al modelo y que ofrecen datos que difieren significativamente de lo esperado. Además, en el análisis con el modelo de crédito parcial, la mayoría de estos ítems centrales presentan un índice de dificultad mayor para pasar de su categoría 0 a la 1 que para pasar de su categoría 1 a la 2 (12, 13, 14 y 15) —lo lógico es presentar mayor dificultad en el paso de la consecución parcial de la prueba a la consecución total, es decir, de la puntuación 1 a la 2—, lo que puede influir en la alteración de los resultados esperados y lo que indica que puede ser adecuada la reorganización de las tres categorías de clasificación (0, 1 y 2) en una dicotomía (0, 0, 1) para evitar el colapso de la categoría intermedia (1) combinándola con la categoría inferior (0).

Por lo tanto, decidimos descartar los dos modelos de análisis politómico para plantear un modelo dicotómico de Rasch (fig. 3) que represente con más fiabilidad la distribución de los datos del patrón de respuestas de la subescala de valoración estudiada del PDMS-2. Para ello, recodificamos todos los ítems transformando sus categoría de 3 a tan solo 2 posibles. Para ello reconvertimos el formato de respuesta múltiple (de 3 respuestas posibles) de los ítems de la escala estudiada a un formato dicotómico. Las puntuaciones de respuestas 0 y 1, que representan la no consecución o la consecución parcial de la prueba, se recodificaron como puntuación 0, y la puntuación 2, que representa la realización adecuada de la prueba, se recodificó como 1. Además, suprimimos el ítem número 1 para que no influya en los resultados del análisis, ya que debido a que todos los sujetos evaluados han puntuado con la máxima calificación posible (2) en este ítem no se puede analizar la variabilidad en sus resultados (fig. 3).

Figura 3.

Análisis con el modelo dicotómico de Rasch.

(0.43MB).

El análisis de los datos mediante el modelo dicotómico de Rasch demostró un buen ajuste de los datos, a pesar de que 8 ítems centrales (6 y del 8 al 14) presentaban un valor del estadístico t ligeramente por encima del valor umbral +2 desviaciones típicas, lo que nos indica que el patrón de respuestas a los ítems se aleja de forma sensible de lo esperado por el modelo de Rasch, pero que gracias al buen ajuste global nos permite a la vez asegurar con cierta precaución que la variabilidad en las respuestas del conjunto de ítems estudiados obedece a una sola dimensión de habilidades manipulativas en niños.

Según el análisis dicotómico de Rasch de la figura 3, los ítems con una dificultad más elevada fueron los 5 ítems más avanzados y en el siguiente orden creciente de dificultad: el ítem 22: coger una pelota en el aire, el 20: dar en el blanco por arriba, el 21: botar una pelota con una mano, el 23: dar una patada a un balón (con desplazamiento y un movimiento adecuado) y, el más difícil, el 24: coger una pelota que bota, con un índice de dificultad muy por encima de los anteriores. Mientras que los ítems más fáciles fueron los cuatro primeros del test (sin contar el primer ítem, que fue descartado para el análisis) en orden creciente de dificultad: el ítem 2: hacer rodar el balón, el 3: lanzar la pelota en cualquier dirección, el 4: dar una patada a un balón (sin llegar a desplazarlo) y el 5: lanzar la pelota estirando el brazo, todos ellos con un índice de dificultad muy similar. Para una mejor visualización de las propiedades de estos ítems es corriente graficar las probabilidades de los ítems para cada uno de los posibles niveles de habilidad de las personas en este grupo. Las curvas resultantes se conocen como curvas características de los ítems (CCI) y en ítems dicotómicos son siempre monotónicas crecientes. La figura 4 presenta las CCI de 3s ítems de este test.

Figura 4.

Representación de las CCI 17, 18 y 19 de la subescala manipulación de objetos.

(0.1MB).

Obsérvese que los 3 ítems representados cumplen el supuesto básico del modelo de Rasch según el cual a mayor habilidad de los sujetos existe una mayor probabilidad de realizar correctamente la prueba del ítem representado. Además, las CCI que siguen el modelo de Rasch tienen la misma forma y son paralelas entre sí, variando únicamente en su situación en relación con el continuo de habilidad, como se puede observar en el caso de los ítems del gráfico, aumentando con igual progresión la probabilidad de realizar correctamente la prueba con el aumento de habilidad de los sujetos evaluados. Cuanto más fácil es el ítem, más hacia la izquierda estará su CCI, mientras que cuanto más difícil sea, más a la derecha se encontrará la CCI. Llama la atención que el nivel de dificultad del ítem 18 sea menor que el del ítem 17, lo que indica que para la muestra de niños evaluada en este estudio supone una mayor habilidad realizar adecuadamente el ítem 17 que el 18, al contrario que para la muestra utilizada por los autores de la escala. Esto sucede también en algunos de los otros ítems de la escala, lo que analizaremos posteriormente con la ayuda del mapa de Wright.

Como ya hemos comentado, una de las mayores ventajas del modelo de Rasch es la propiedad de medición conjunta, en la que los parámetros de persona e ítems están en la misma escala, y que permite comparar sus distribuciones directamente (fig. 5). La presentación de ambas distribuciones de forma vertical, una frente a otra, se conoce como mapa de Wright24,25. Generalmente, el programa ConQuest centra la escala de dificultad de los ítems para tener media 0, con lo que los parámetros de dificultad de todos los ítems se distribuirán con más o menos amplitud alrededor de la media. Un test con unas adecuadas propiedades psicométricas será el formado por ítems que cubran el mayor rango posible de dificultades, de modo que todas las personas, independientemente de su habilidad, puedan ser evaluadas.

Figura 5.

Mapa de Wright de los ítems 2-24 de la escala.

(0.32MB).

En la figura 5 la primera columna por la izquierda representa ambas escalas (habilidad y dificultad) en el rango de –6 a 12. El ítem más difícil (ítem 24) aparece en la parte superior de la distribución y los ítems más fáciles (ítems 2, 3, 4 y 5) aparecen en la parte inferior de la distribución. Se observa también que en la parte central se acumulan unos pocos ítems (15, 13, 12, 14, 9 y 10) que quizás provocan cierta redundancia en la medida de las personas que ocupan el centro de la distribución. Sin embargo, esta situación es normal para este test en concreto, ya que fue construido según el MCT que prioriza los ítems de dificultad media frente a los ítems de dificultad baja o alta. Desde el punto de vista del modelo de Rasch, hubiera sido deseable una mayor amplitud de dificultad entre los ítems, cubriendo rangos de habilidad (intervalos –3 a –4 y +2 a +4) para los que no se dispone de ítems en esta subescala. No obstante, el modelo de Rasch ofrece (fig. 3, abajo) un coeficiente que permite estimar la separabilidad de los parámetros. Este coeficiente varía entre 0 y 1, y en nuestro caso su cuantía ha sido de 0,983, lo que nos indica que la separabilidad de los parámetros de dificultad de estos ítems ha sido suficiente para evaluar la habilidad de manipulación de objetos de los niños que forman este grupo.

Justo a la izquierda de la distribución de los parámetros de dificultad, aparece la distribución de los parámetros de habilidad de las personas (marcados con una X). Se puede observar en la figura 5 que la distribución de las personas se parece mucho a una distribución normal y los parámetros de los ítems se encuentran dispersos a lo largo del continuo dificultad, y ligeramente desequilibrados con respecto a la distribución de las personas. Si la habilidad media del grupo fuera igual a la dificultad media del test, ambas distribuciones se situarían una frente a la otra pero, en este caso, la falta de congruencia de ambas distribuciones quiere decir que la funcionalidad media de las personas evaluadas en este grupo está por encima de la dificultad media de los ítems empleados en este test.

Es importante resaltar también el hecho de que muchos de los ítems de la subescala analizada no siguen el orden de dificultad asignado por sus creadores en su desarrollo inicial. Se puede observar en el mapa de Wright que el ítem 6 supera al 7 en dificultad, los ítems 8, 9 y 10 superan al 11, los ítems 12 y 13 superan al 14, los ítems 16 y 17 superan al 18 (como se observaba en el gráfico de las CCI representado), y los ítems 20 y 21 superan al 22. Estos resultados indican que el nivel de dificultad asumido por los autores de la escala para estos ítems, según el nivel de habilidad de los sujetos de la muestra utilizada para su desarrollo, no es el mismo y no sigue el mismo orden que el que hemos encontrado para la muestra utilizada en este estudio.

Discusión

La unidimensionalidad de una escala de valoración hace referencia a que solo una dimensión sea capaz de explicar la variación de las respuestas de las personas a los ítems, aunque es posible que existan dimensiones secundarias necesarias para obtener esas respuestas, como puede ser la capacidad de comprensión en los niños para entender las indicaciones sobre la prueba de cada ítem y poder realizarla adecuadamente. En este caso, la dimensión o atributo al que todos los ítems de la escala estudiada deben referirse es la capacidad motriz gruesa relacionada con la manipulación de objetos. Según los análisis realizados, hemos encontrado que la subescala manipulación de objetos del PDMS-2 no es esencialmente o funcionalmente unidimensional (aunque así se plantea partiendo de su elaboración bajo el MCT) porque no hemos conseguido adaptar con éxito un modelo politómico unidimensional que explique de forma adecuada los resultados recogidos en la matriz de respuestas.

Este hecho puede haberse debido a diferentes factores intrínsecos relacionados con la escala, como la posibilidad de que, efectivamente, la escala no sea realmente unidimensional y haya ítems que dependan en su respuesta de más de una dimensión o atributo (como pueden ser los ítems centrales de la escala, que son los que más se alejan en su patrón de respuestas de lo esperado por ambos modelos politómicos), o que alguno de estos ítems no sean localmente independientes, es decir, que la probabilidad de que una persona acierte un ítem esté afectada por la probabilidad de que acierte otros o que la probabilidad de que dos o más personas acierten un ítem no sea independiente para cada uno de ellos.

La no unidimensionalidad encontrada también puede deberse a factores relacionados con las características de la muestra utilizada para analizar las propiedades psicométricas de la escala, como el hecho de que la muestra tenga una media de edad ligeramente por encima de la edad comparativa de dificultad de la subescala, o como el hecho de que el pequeño porcentaje de niños con alteraciones del desarrollo de la muestra clínica (8,49% de la muestra completa) esté afectando al ajuste del patrón de respuestas a los modelos de respuesta múltiple.

Sin embargo, en un posterior análisis con los ítems dicotomizados, sí que se encontró una evaluación unidimensional de las capacidades motrices medidas por la subescala analizada, probablemente debido a que al modificar el diseño politómico de respuesta múltiple y dicotomizar todos los ítems se optimizaron en gran medida las propiedades psicométricas de la subescala, ya que se evitó el colapso de la categoría intermedia de respuesta de los ítems.

Con este estudio, realizado sobre una única subescala de las seis que forman el PDMS-2, hemos demostrado la potencialidad de la familia de modelos de Rasch para obtener una evaluación más exacta de las personas en el atributo medido, a través de un proceso de análisis de la escala con los diferentes modelos de Rasch y paso a paso, lo cual solventa la mayor parte de las asunciones y dificultades de la metodología ofrecida por el MCT. La familia de modelos de Rasch no solo permite obtener una evaluación más exacta del atributo, sino que a la vez es un medio para confirmar la presencia de uno y solo un atributo medido a través de estadísticos de ajuste de los ítems. Además, las estimaciones de la habilidad de las personas no son un mero conteo de ítems contestados o acertados, sino que se estiman de acuerdo con un modelo matemático que incorpora supuestos a esas puntuaciones, como la unidimensionalidad de la medida y la independencia local de los ítems. De manera que si los datos recogidos presentan un buen ajuste al modelo de Rasch propuesto, en este caso el modelo dicotómico, entonces es posible afirmar que las estimaciones de los parámetros de los ítems y las estimaciones de los parámetros de habilidad de las personas evaluadas son independientes entre sí, hecho perseguido durante mucho tiempo en el diseño de escalas de medida en ciencias de la salud y no conseguido hasta ahora con ningún otro modelo de medida conocido.

La escala PDMS-23 es una de las herramientas de valoración más utilizadas en el ámbito de la fisioterapia pediátrica y de la atención temprana en general, tanto a nivel práctico5,6, como puramente investigador10-12, pero a pesar de ello todavía existe en la actualidad poca investigación acerca de sus propiedades de medida.

En este trabajo hemos encontrado diferencias significativas en cuanto a la dificultad de los ítems en comparación con el diseño de la subescala original. Hemos encontrado ítems muy fáciles para los niños incluidos en este estudio y que serían apropiados solamente para niños más pequeños o aquellos con problemas en el desarrollo motor. Por esta razón, estudios futuros desarrollados en la misma línea son necesarios para evitar problemas en la calificación real de la edad motriz establecida por la escala, mediante la optimización de las características psicométricas de los ítems.

Por último, este estudio proporciona evidencia preliminar de que la simplificación de las escalas de calificación de la mayoría de los ítems de la escala manipulación de objetos del PDMS-2 a categorías dicotómicas podría optimizar las cualidades de medición de la subescala, teniendo en cuenta que el modelo dicotómico de Rasch ha sido el que mejor ha funcionado para explicar la variabilidad de las respuestas de los niños y niñas de la muestra.

Agradecimientos

Agradecemos de corazón el apoyo prestado para la realización de este trabajo a todos los profesionales que lo han hecho posible, compañeros de la Consejería de Educación de la Región de Murcia, maestras de educación infantil y, por supuesto, a los tutores del Máster en Intervención e investigación en ejercicio físico, salud y dependencia de la Universidad de Murcia. Y con especial afecto y cariño, a los niños y a los padres que han colaborado con tesón en el proyecto.

Conflicto de intereses

Los autores declaran no tener ningún conflicto de intereses.

Bibliografía
[1]
S.R. Harris, I.R. McEwen.
Assessing motor skills.
Assessing infants and toddlers with special needs, pp. 305-333
[2]
K.D. Antonette, I.R. McEwen, D. Parker, J. Laskinet.
Effects of testing context on ball skill performance in 5-year-old children with and without developmental delay.
Phys Ther, 79 (1999), pp. 9
[3]
M.R. Folio, R.R. Fewell.
Peabody developmental motor scales: examiner's Manual.
2.ª ed., PROED, (2000),
[4]
B.L. Tieman, R.J. Palisano, A.C. Sutlive.
Assessment of motor development and function in preschool children.
Ment Retard Dev Disabil Res Rev, 11 (2005), pp. 189-196
[5]
K.S. Parmar Sanjay.
Applicability of Peabody developmental Motor Scales PDMS-2 as a developmental assessment scale for Indian children.
Occup Ther Int, 2 (2008), pp. 1-3
[6]
W. Cools, K. Martelaer, C. Samaey, C. Andries.
Movement skill assessment of typically developing preschool children: A review of seven movement skill assessment tools.
J Sports Sci Med, 8 (2009), pp. 154-168
[7]
H.H. Wang, H.F. Liao, C.L. Hsieh.
Reliability, sensitivity to change, and responsiveness of the Peabody developmental motor scales-second edition for children with cerebral palsy.
Phys Ther, 86 (2006), pp. 1351-1359
[8]
M.J. Van Hartingsveldt, E.H. Cup, R.A. Oostendorp.
Reliability and validity of the fine motor scale of the Peabody developmental motor scales-2.
Occup Ther Int, 12 (2005), pp. 1-13
[9]
B. Provost, S. Heimerl, C. McLain, B.A. Nae-Hwa Kim, B. Lopez, P. Kodituwakku.
Concurrent validity of the Bayley scales of infant development II motor scale and the Peabody developmental motor scales-2 in children with developmental delays.
Pediatr Phys Ther, 16 (2004), pp. 149-156
[10]
K.A. Evensen, J. Skranes, A.M. Brubakk, T. Vik.
Predictive value of early motor evaluation in preterm very low birth weight and term small for gestational age children.
Early Human Development, 85 (2009), pp. 511-518
[11]
D.C. Santos, R.E. Tolocka, J. Carvalho, L.R. Heringer, C.M. Almeida, A.F. Miquelote.
Gross motor performance and its association with neonatal and familial factors and day care exposure among children up to three years old.
Rev Bras Fisioter, 13 (2009), pp. 173-179
[12]
Y.P. Chen, L.J. Kang, T.Y. Chuang, J.L. Doong, S.J. Lee, M.W. Tsai, et al.
Use of virtual reality to improve upper-extremity control in children with cerebral palsy: a single-subject design.
Phys Ther, 87 (2007), pp. 1441-1457
[13]
W. Vander Linden.
Fundamental measurement and the fundamentals of Rasch measurement.
pp. 3-24
[14]
D. Andrich.
Rasch models for measurement.
Sage, (1988),
[15]
B.D. Wright, G.N. Masters.
Rating scale analysis.
MESA Press, (1982),
[16]
B.D. Wright, M. Stone.
Best test design.
MESA Press, (1979),
[17]
E.V. Smith, R.M. Smith.
Introduction to Rasch measurement.
JAM Press, (2004),
[18]
J.A. Lopez Pina.
Teoría de la respuesta al ítem: fundamentos.
DM-PPU, (1995),
[19]
D. Andrich.
A rating formulation for ordered response categories.
Psychometrika, 43 (1978), pp. 561-573
[20]
R. Lange, B. Greyson, J. Houran.
A Rasch scaling validation of a ‘core’ near-death experience.
Br J Psychol, 95 (2004), pp. 161-177
[21]
J.A. Lopez Pina.
Análisis psicométrico de la escala de marcha y equilibrio de Tinetti con el modelo de Rasch.
Fisioterapia, 31 (2009), pp. 192-202
[22]
C.W. Chien, T.G. Bond.
Measurement properties of fine motor scale of Peabody developmental motor scales-second edition. A Rasch analysis.
Am J Phys Med Rehab, (2009),
[23]
M.L. Wu, R.J. Adams, M.R. Wilson, S.A. Haldane.
ACER ConQuest. Version2. 0: generalised item response modelling software.
ACER Press, (2007),
[24]
T.G. Bond, M. Fox Ch.
Appying the Rasch model: Fundamental measurement in the human sciences.
LEA, (2001),
[25]
M. Wilson.
Constructing measures: An item response modelling approach.
LEA, (2005),
Copyright © 2011. Asociación Española de Fisioterapeutas
Opciones de artículo
es en pt

¿Es usted profesional sanitario apto para prescribir o dispensar medicamentos?

Are you a health professional able to prescribe or dispense drugs?

Você é um profissional de saúde habilitado a prescrever ou dispensar medicamentos