La habilidad inferencial es una de las habilidades más relevantes que contribuyen al complejo proceso de la comprensión lectora. Por ello, es importante disponer de una prueba para evaluarla y ayudar a los estudiantes con bajo desempeño en esta habilidad.
ObjetivoEste estudio tuvo como objetivo validar la prueba oral de inferencias (POI) que considera 4 de los 5 tipos de inferencias pragmáticas con una orientación didáctica.
MétodosLa muestra consistió en 213 estudiantes de 4.°, 5.° y 6.° curso de educación primaria, 104 niños y 109 niñas, de tres escuelas en Lima y Piura, Perú. La prueba se administró colectivamente y los ítems fueron leídos en voz alta por el aplicador.
ResultadosLa POI mostró una consistencia interna adecuada, que no se alteró con la eliminación de ningún ítem. La validez del constructo fue evaluada mediante un análisis factorial exploratorio, que sugirió un modelo de siete factores. Las correlaciones de la POI con otras pruebas de comprensión lectora fueron moderadas, indicando una buena validez de criterio.
ConclusionesLa POI demostró ser una herramienta válida y confiable para evaluar la comprensión inferencial en estudiantes de primaria. La ausencia de la influencia de la descodificación en esta prueba facilita su aplicación. Se recomienda realizar estudios adicionales con muestras más amplias y diversas para confirmar la aplicabilidad y optimización de esta prueba en diferentes contextos educativos.
Inferential ability is one of the most relevant skills that contribute to the complex process of reading comprehension. Therefore, it is important to have a test to evaluate it and assist students with low performance in this skill.
ObjectiveThis study aimed to validate the Oral Inference Test (OIT), which considers 4 of the 5 types of pragmatic inferences with a didactic orientation.
MethodsThe sample consisted of 213 students in 4th, 5th, and 6th grade, 104 boys and 109 girls, from three schools in Lima and Piura, Peru. The test was administered collectively, and the items were read aloud by the examiner.
ResultsThe OIT showed adequate internal consistency, which was not altered by the removal of any item. Construct validity was assessed using exploratory factor analysis, suggesting a seven-factor model. The correlations of the POI with other reading comprehension tests were moderate, indicating good criterion validity.
ConclusionsThe OIT proved to be a valid and reliable tool for assessing inferential comprehension in primary school students. The absence of decoding influence in this test facilitates its application. Further studies with larger and more diverse samples are recommended to confirm the applicability and optimization of this test in different educational contexts.
La habilidad inferencial permite una aprehensión más profunda de la realidad, gracias a su rol comunicativo que facilita la transmisión económica de la información (León, 2003). A este proceso se le conoce como construcción de inferencias, ya que se debe formar una representación coherente a través de la interacción entre los estímulos del entorno y los conocimientos y experiencias previas (Ripoll, 2019). Si bien dentro del ámbito pedagógico está estrechamente relacionado con la comprensión lectora, cabe resaltar que este proceso no es exclusivo de la lectura, sino que es considerado como el núcleo de la comprensión humana: su papel adaptativo en la predicción de conductas es fundamental; también es nuclear en el entendimiento de la realidad, en la comprensión de mensajes abstractos en el discurso, oral y escrito, y de los estímulos audiovisuales (Kendeou et al., 2008; Kendeou et al., 2020) que suelen tener ambigüedades, imprecisiones y vacíos de información (Escudero y León, 2007).
La habilidad inferencial se desarrolla desde edades tempranas, incluso antes del inicio del aprendizaje del lenguaje escrito y sigue un patrón de desarrollo evolutivo, donde se evidencia la contribución y progreso de ciertos tipos de inferencias hacia la comprensión auditiva de textos narrativos e imágenes (Filiatrault-Veilleux et al., 2015; Kim, 2016; Lepola et al., 2012; McMaster et al., 2019). Filiatrault-Veilleux et al. (2015) hallaron que, a partir de los 3 años, los niños y niñas son capaces de construir ciertos tipos de inferencias al escuchar un texto narrativo o al observar imágenes. Para ello se basan en las reacciones emocionales de los personajes o sus expresiones faciales, en lugar de sus conocimientos previos. Las inferencias sobre los objetivos de los personajes evidencian una mayor influencia hacia los 4 años. Las inferencias causales adquieren una mayor relevancia entre los 6 y 8 años, aunque según Lepola et al. (2012), los niños y niñas de 4 años ya logran construir estas inferencias. En cuanto a las emociones y acciones de los personajes, su contribución hacia la comprensión narrativa oral es significativa solo a los 8 años. Sin embargo, Kim (2016) sugiere que otras habilidades, como la memoria de trabajo y las habilidades sintácticas, juegan un papel más relevante en el proceso de comprensión.
La habilidad inferencial tiene un rol preponderante tanto en la comprensión del lenguaje, tanto a nivel oral como escrito. La comprensión lectora es un proceso complejo en el que intervienen diversos factores. Según el modelo directo y de la mediación inferencial (DIME, por sus siglas en inglés), además de las inferencias, también estarían involucradas las habilidades de descodificación, vocabulario, conocimientos previos y estrategias. (Ahmed et al., 2016; Ahmed et al., 2022; Cromley et al., 2010; Cromley y Azevedo, 2007; Härtig et al., 2022; Martínez-Cubelos y Ripoll, 2022). Diversas investigaciones refieren que la construcción de inferencias es una de las habilidades que tiene un impacto mayor en este proceso (Ahmed et al., 2016; Cromley et al., 2010; Ripoll, 2015). Ello se debería a que la persona que lee debe conectar la información explícita del texto con la información implícita, que proviene tanto de sus conocimientos como del mismo texto, para construir coherentemente su significado o para enriquecer la representación mental que se forma en su proceso de comprensión (León, 2003), es decir, para formar su modelo de situación (van Dijk y Kintsch, 1983). Este proceso se da a través de la adición, omisión, sustitución e integración de la información con los conocimientos evocados desde la memoria a largo plazo (van Dijk y Kintsch, 1983; Ripoll, 2019). No obstante, este proceso se hace más complejo debido a que el acto lector se circunscribe a un determinado contexto sociocultural, así como a la existencia de una amplia variedad de textos. Además, los y las lectoras presenta diferentes niveles de recursos de memoria, atención, vocabulario y habilidades de reconocimiento de la palabra y estrategias de lectura; pueden diferir sus niveles de conocimientos lingüísticos, específicos y generales; así como sus intereses y motivaciones para leer (Butterfuss et al., 2020).
La construcción de inferencias requiere que la persona que lee tenga ciertos conocimientos sobre el tema del texto; además, estos deben estar disponibles durante o después de la lectura (León, 2003; Ripoll, 2015; Ripoll, 2019; Tarchi, 2015). También resultan necesarios conocimientos lingüísticos para comprender y relacionar pronombres, determinantes, conectores y otros elementos referenciales (van Dijk y Kintsch, 1983), conocimientos culturales (Ripoll, 2019) y conocimientos literarios, por ejemplo, sobre los géneros literarios y sus convenciones (Elleman, 2017; Graesser et al., 1994; McKoon y Ratcliff, 1995). La memoria de trabajo es otro factor relevante, ya que permite que los conocimientos estén activos durante la lectura o después de esta
Taxonomía de las inferenciasLeón (2003) sostiene que el estudio de las inferencias requiere una base teórica sólida y una taxonomía que integre sus distintos tipos. Propone 10 criterios de clasificación según factores como probabilidad, temporalidad, recursos cognitivos, dirección de la búsqueda de información, relevancia para la comprensión, establecimiento de la coherencia local o global, fuente de información, nivel de representación y operaciones que se llevan a cabo. Sin embargo, se evidencian dificultades para desarrollar una taxonomía debido a la falta de un marco teórico unificado, métodos diversos y distintos enfoques de investigación (Ripoll, 2015; Ripoll, 2019). Además, los estudios sobre inferencias varían en metodología, materiales y objetivos, lo que dificulta la convergencia de sus conclusiones (León, 2003). Gran parte de la investigación se ha centrado en el curso temporal de las inferencias, su necesidad para la coherencia local y si estas se producen durante la lectura (Graesser et al., 1994; McKoon y Ratcliff, 1995). Otros estudios han indagado en los procesos cognitivos involucrados cuando se producen las inferencias, así como el compromiso de los tipos de memoria (León, 2003; Ripoll, 2019).
Además, León (2003) cita unas 17 clasificaciones, las cuales suelen tener un carácter dicotómico. La mayoría de las clasificaciones desarrolladas entre las décadas de los 70 y 80 tenían como criterio fundamental el tipo de recursos cognitivos empleados. En cambio, las clasificaciones que se desarrollaron a partir de la década de los 90 se basan en el curso temporal. En las distintas clasificaciones se distinguen más de 30 denominaciones y se constata que, muchas veces, a un mismo tipo de inferencia se le llama de diferentes formas. Por ejemplo, a las inferencias que relacionan elementos de tipo causal se les llama inferencias puente, automáticas, hacia atrás, obligatorias, necesarias para la coherencia, basadas en los conocimientos de la persona que lee o de meta. En otras ocasiones, reciben la misma denominación distintos tipos de inferencias.
A continuación, se comentarán algunas clasificaciones que se consideran relevantes. Keenan (1978) hace referencia al trabajo de Harris y Mónaco (1978), en el que se empiezan a estudiar las inferencias desde una perspectiva psicológica, proponiendo una diferenciación entre inferencias lógicas y pragmáticas. Las primeras están basadas en la estadística y son cuantitativas, ya que se derivan de fórmulas y procedimientos lógico-matemáticos. Las inferencias lógicas son ciertas si sus premisas son correctas, ya que una implica a la otra. En cambio, las inferencias pragmáticas no se valoran por ser ciertas o falsas, sino que presentan diferentes grados de probabilidad (Ripoll, 2019); es decir, su naturaleza es probabilística, incluso opcional (León, 2003). Estas inferencias parten del conocimiento compartido por un grupo de personas, miembros de un mismo grupo cultural. Se dan de forma espontánea y rápida, lo cual facilita su estudio.
La teoría minimalista de McKoon y Ratcliff (1995) clasifica las inferencias en automáticas y estratégicas. Las inferencias automáticas serían obligatorias porque son necesarias para mantener la coherencia del texto a nivel local. Se basan en información fácilmente accesible en el texto, en los conocimientos de la persona que lee, o en una combinación de ambos. Las inferencias estratégicas, por su parte, requieren de mayor tiempo para su elaboración y se basan en procesos específicos para generar conexiones de información no esenciales para lograr la coherencia local; por lo tanto, no surgen necesariamente durante la lectura de un texto. Para estos autores, el tiempo de reacción en los primeros cientos de milisegundos sería un indicador para diferenciar estos tipos de inferencias. No obstante, otras investigaciones sugieren que el nivel de conocimiento podría agilizar la construcción de ciertas inferencias, como las elaborativas, consideradas no automáticas (Saux, 2012).
La teoría construccionista de Graesser et al. (1994) plantea que, para la comprensión de los textos narrativos, se construyen algunas inferencias de tipo online durante el proceso de lectura y otras de tipo offline al concluir la lectura del texto. Sin embargo, estas últimas podrían darse de forma online bajo dos condiciones: cuando la persona que lee tiene un objetivo específico para generar dichas inferencias o cuando son muy predecibles.
Las propuestas de las teorías construccionista y minimalista brindan un importante aporte sobre la actitud que tiene la persona para comprender. Por un lado, puede hacer las inferencias mínimas necesarias para mantener la coherencia local o puede tener un enfoque global en el que se busca mantener la coherencia en otros niveles de representación del modelo de situación. Además, en ambas propuestas se admite la contribución de diferentes tipos de inferencias que calzan con la propuesta que se desarrolla en el presente trabajo.
Las clasificaciones comentadas se han desarrollado con fines de investigación. En vista de ello, Ripoll (2015) propone una clasificación con orientación didáctica, con cinco tipos de inferencias que responderían a cinco preguntas básicas. Cabe mencionar que el desarrollo y evaluación de inferencias a través de la formulación de preguntas ha demostrado ser efectivo, ya que permite la activación de información relevante y facilita su integración. Además, se sabe que su efecto se potencia aún más si se brinda un andamiaje con pistas, sugerencias y retroalimentación, ya que de esta manera se reactiva en la memoria la información necesaria para construir las inferencias (Kendeou et al., 2020).
Las preguntas de la mencionada clasificación son las siguientes:
Tipo I: ¿de qué (quién) habla el texto cuando dice…?Este tipo de inferencia trata de aclarar a qué se refieren las palabras y expresiones que están haciendo referencia a algún elemento que ya ha aparecido en el texto o que aún no se ha mencionado. Estas cobran especial relevancia cuando aparecen pronombres, sinónimos u otras expresiones que hacen referencia a un elemento. Dentro de este grupo de inferencias también podrían considerarse las operaciones para inducir el significado de las palabras desconocidas. Su elaboración requiere de conocimientos de las reglas de la lengua y sirven para mantener la coherencia local del texto.
Tipo II: ¿por qué, qué relación hay entre…?Estas inferencias permiten mantener la cohesión del texto, porque vinculan una causa con un efecto. De esta manera, se facilita relacionar la información presente en el texto con aquella que la persona que lee ha almacenado en sus conocimientos previos. Se basan en conocimientos sobre las relaciones causales entre los objetos y los comportamientos de las personas. Aunque muchas veces se realizan de forma automática, pueden construirse de forma estratégica cuando se detectan problemas en la coherencia del texto.
Tipo III: ¿qué se puede predecir sabiendo que…?Estas también podrían considerarse inferencias de tipo causa-consecuencia, pero en este caso se trata de anticipar una consecuencia a partir de información del texto. Estas inferencias pueden darse dentro de un contexto físico concreto, pueden estar referidas al estado mental de un personaje o a un cambio de situación. En cualquier caso, estas predicciones pueden confirmarse o no. Para elaborar este tipo de inferencias se requiere de conocimientos generales sobre las relaciones causales, conocimientos específicos sobre el tema del texto, y también pueden ser útiles los conocimientos sobre los géneros literarios y sus convenciones.
Tipo IV: ¿qué más se puede decir sobre esto?A diferencia de los otros tipos de inferencias, estas aportan información que no es necesaria para la comprensión del texto. No obstante, permiten que la persona que lee forme una representación más rica o detallada del contenido del texto.
Tipo V: ¿qué quiere decir todo esto?Este es el tipo de inferencia en el que la persona que lee se pregunta por las intenciones del autor del texto. Ejemplos de ello son algunas formas de lenguaje figurado, como las alegorías, la ironía y las historias con moralejas, que solo pueden ser interpretadas si se intuye la intención del autor implícita en el texto. Requieren de conocimientos generales y específicos; además, es importante contar con conocimientos sobre los géneros literarios y sus convenciones, así como sobre el autor y su contexto.
A continuación, se presenta la tabla 1 donde se muestran, a modo de ejemplo, las preguntas inferenciales de la clasificación de Ripoll (2015). Estas han sido formuladas en referencia al fragmento del cuento Las botellas y los hombres de Ribeyro (1964), el cual se puede consultar en el apéndice 1.
Ejemplos de preguntas inferenciales según la propuesta de Ripoll
| Tipo de inferencia | Ejemplo |
|---|---|
| I | ¿Qué quiere decir la palabra «chauchas»?¿Qué quiere decir que «secó la cerveza»?¿Quién sintió las que las piernas se le doblaban, Luciano o «el hombre»? |
| II | ¿Por qué el hombre esperaba a Luciano? |
| III | ¿Por qué Luciano sentía que sus piernas se le doblaban, y por un momento se desvió a la cantina antes de conversar con ese hombre?¿Luciano le dará dinero? |
| IV | ¿Qué se puede decir del hombre que esperaba a Luciano por su aspecto físico?¿Dónde está Luciano? |
| V | ¿Qué quiere dar a conocer el autor con este cuento? |
Fuente: Clasificación de inferencias basado en la propuesta de Ripoll (2015).
Dado el papel relevante de las inferencias en la comprensión lectora, muchos test que buscan valorar el nivel de comprensión lectora de la población de diversos niveles educativos contienen ítems con preguntas inferenciales. En consecuencia, la gran mayoría de estudios tanto en inglés como en castellano han empleado textos para valorar las inferencias.
En el ámbito de habla inglesa, la gran mayoría de estudios ha trabajado con pruebas de inferencias basadas en textos como el Bridge-IT, SMI Speed, o pruebas elaboradas por los investigadores (Ahmed et al., 2016, 2022; Cromley et al., 2010; Cromley y Azevedo, 2007). Un grupo menor, y generalmente con población de pre escolar, ha trabajado con imágenes (Härtig et al., 2022; Kendeou et al., 2008, 2020; Paris y Paris, 2003).
Dentro de las pruebas orales se puede mencionar a Oakhill (1982) quien desarrolló una tarea de inferencias e integración para niños de 7 a 8 años de edad, quienes debían escuchar 8 historias cortas. Luego, tenían que escuchar 4 oraciones de las cuales los dos últimos ítems, podrían considerarse inferenciales de tipo lógicas en algunos casos y de tipo I.
Por su parte Barnes et al. (1996) desarrollaron un test con la finalidad de conocer cómo el acceso al conocimiento se relaciona con la construcción de inferencias en escolares de 6 hasta los 15 años. El test consistía en que los escolares escuchen y evidencien que habían comprendido información sobre un planeta ficticio llamado Gan. Luego, escuchaban 10 breves textos sobre dicho planeta y respondían a 4 preguntas; dentro de las cuales una era de tipo literal, dos inferenciales de tipos II y IV.
Así mismo se puede mencionar el subtest denominado Supralingüística, del Comprehensive Assessment of Spoken Language (CASL) de Carrow-Woolfolk (1999) que tiene por objetivo la valoración del lenguaje no literal. Tiene dos formatos, uno para niños de 3 a 6 años y otro que abarca de los 7 hasta los 21 años. En el primer formato, los niños debían escuchar unas historias breves y responder a preguntas que requerían integrar la información del texto con sus conocimientos previos sobre el contexto, las cuales podrían corresponder a las inferencias de tipo IV.
También se han desarrollado pruebas orales para medir inferencias diseñadas para investigaciones generalmente con población pre escolar, las cuales se podrían clasificar como de tipos I, II y III (Kendeou et al., 2008).
En el ámbito de habla hispana, Picart y Ripoll (2017) iniciaron el proceso de validación de la prueba oral de inferencias (POI) y realizaron un recuento de las pruebas que, de alguna forma, evalúan inferencias pragmáticas.
La Batería Crítex de Alonso-Tapia y Corral (1992) está más relacionada con el razonamiento lógico y formal que con las inferencias pragmáticas, pero considera algunos ítems para este fin, sobre todo en las escalas 3.a y 4.a. Esta prueba, con sus 64 páginas, resulta muy extensa y su ámbito de aplicación solo abarca de 6.° de educación primaria a 2.° de educación secundaria obligatoria (ESO).
La prueba de neologismos GUB de González et al. (2006) evalúa la inferencia del significado de unas palabras inventadas. Estas están distribuidas en 20 textos conformados por 6 oraciones. Si bien se evaluó la fiabilidad y validez de esta prueba en una publicación (Ugarriza, 2006), no se publicaron las claves de corrección ni los baremos. Además, esta prueba está diseñada para universitarios y abarca solo un tipo de inferencia, que se podría considerar como de tipo I.
Canet-Juric et al. (2013) validaron un test de inferencias con niños de 8 y 9 años. Se trata de la adaptación al español rioplatense de una tarea experimental de evaluación de comprensión literal e inferencial. Para ello, emplean 4 textos narrativos seguidos de 6 preguntas, 2 de las cuales requerían la construcción de inferencias puente y 2 inferencias elaborativas. No se cuenta con los baremos y el rango de edad es muy reducido.
También hay pruebas de comprensión lectora que tienen ítems inferenciales como el test ACL creado por Catalá et al. (2007) para estudiantes de primaria. En dicho test, tras la lectura de textos de diferentes géneros, se plantean cuatro tipos de preguntas. Una de ellas corresponde a las preguntas inferenciales, generalmente predictivas o de tipo III. Las pruebas de comprensión lectora de la batería EMLE/TALE de Toro et al. (2002) plantean variadas preguntas inferenciales que se podrían clasificar dentro de los tipos I, II, III y IV. Su ámbito de aplicación es de 2.° de primaria a 4.° de la ESO. La batería EVALEC, de García Vidal et al. (2012), evalúa a alumnado desde el final de la educación infantil hasta 4.° curso de educación primaria, valorando si puede inferir el significado de palabras a partir del contexto o identificar el propósito del autor. La batería LEE, de Defior et al. (2006), evalúa la comprensión lectora de los estudiantes de 1.° a 4.° de primaria a través de 3 textos narrativos y expositivos. Por cada texto se realizan 3 preguntas inferenciales de coherencia, correspondientes a los tipos I y II y elaborativas de tipos III y IV. El test TLC creado por Abusamra et al. (2009) y las pruebas de screening de Ferreres et al. (2009) presentan diversos textos breves en los que se incluyen preguntas de comprensión inferencial para estudiantes de quinto de primaria a primero de ESO.
La batería PALABRA de Alonso-Tapia y Corral (1992) para estudiantes de 1.° y 2.° de la ESO presenta dos pruebas de comprensión, de textos narrativos y expositivos, a los que acompañan preguntas inferenciales que se pueden considerar de tipos I, II y V. La batería PROLEC-R, creada por Cuetos et al. (2007), valora la comprensión lectora y oral de textos narrativos y expositivos a través de las respuestas orales de los estudiantes de todos los cursos de primaria, las cuales podrían considerarse inferenciales y en varios casos de tipo II.
Como se observa, en las pruebas de comprensión someramente descritas líneas arriba predominan las tareas de comprensión lectora; solo en el PROLEC-R hay pruebas de comprensión oral. Por otro lado, el rango de población en el que se pueden aplicar es limitado, y en la mayoría de ellas no existen baremos exclusivos para las inferencias. Todo ello se sintetiza en la tabla 2.
Pruebas que evalúan la comprensión inferencial
| Autor | Año | Prueba | Grupo etario | Tipos de texto | Tipos de inferencias |
|---|---|---|---|---|---|
| Abusamra et al. | 2010 | Test TLC | 5.° de primaria a 1.° de la ESO | Textos breves y variados | El modelo sobre el que se basan contempla las inferencias, pero no explicita su tipología |
| Alonso-Tapia | 1992 | Batería Crítex | 6.° de primaria a 2.° de la ESO | Frases, textos cortos y gráficos | En su mayoría son lógicas, algunas son pragmáticas en las escalas 3.ª y 4.ª |
| Canet-Juric et al. | 2013 | Prueba de inferencias | 8 y 9 años | Cuatro textos narrativos con 6 preguntas, 4 de ellas inferenciales | Tipo II y IV |
| Catalá et al. | 2007 | ACL | 1.° y 6.° de primaria | Diferentes tipos de textos | La mayoría de preguntas inferenciales son de tipo III |
| Cuetos et al. | 2007 | PROLEC-R | 1.° a 6.° de primaria | Textos narrativos y expositivos | Inferencias de tipo II y III |
| Defior et al. | 2003 | LEE | 1.° a 4.° de primaria | Textos narrativos y expositivos | Preguntas inferenciales de tipo I, II, III y IV |
| Ferreres et al. | 2009 | Pruebas de screening | 5.° de primaria a 1.° de la ESO | Un texto narrativo y otro informativo | Preguntas inferenciales de tipo I y V |
| García Vidal et al. | 2012 | EVALEC | Desde finales de infantil hasta 3.° de la ESO | Preguntas inferenciales de tipo I y V | |
| González et al. | 2006 | Prueba de neologismos GUB | Estudiantes universitarios | Veinte textos compuestos por 6 oraciones que presentan una palabra inventada que está reemplazando a otra palabra real | Tipo I |
| Alonso-Tapia yCorral | 1992 | PALABRA | 1.° y 2.° de la ESO | Textos narrativos y expositivos | Inferencias de tipo I, II y V |
| Toro et al. | 2002 | EMLE/TALE | 2.° de primaria a 4.° de la ESO | Textos narrativos | Preguntas inferenciales de tipo I, II, III y IV |
Fuente: La clasificación del tipo de inferencias ha sido a criterio de Ripoll (2015), más no está especificado en las pruebas citadas.
El objetivo de este estudio es elaborar y validar la POI, diseñada para evaluar la comprensión de inferencias pragmáticas, incorporando diferentes tipos de inferencias. Esto permitirá obtener un perfil más detallado del desempeño y las dificultades de los escolares en la construcción de inferencias. En consecuencia, facilitará la predicción y evaluación de dificultades en la comprensión lectora, aunque podría utilizarse con fines relacionados dentro del ámbito escolar, pedagógico e investigativo. Cabe mencionar que la POI se ha desarrollado en el contexto de una investigación mayor que buscaba validar el modelo DIME en población hispanohablante, es por ello que se aplicó de forma grupal. No obstante, también se puede trabajar de forma individual.
Material y métodosParticipantesFueron evaluados 213 estudiantes, 104 niños (48.8%) y 109 niñas (51.2%), procedentes de tres escuelas: dos de la región Lima, una de gestión privada y la otra de gestión pública, y una tercera escuela de gestión privada de la región Piura. Los estudiantes de las escuelas públicas generalmente proceden del estrato socioeconómico bajo, en tanto que los estudiantes de escuelas privadas, del estrato medio.
La muestra fue elegida de forma incidental, es decir de forma directa e intencionada, siempre que se cumplieran los criterios de inclusión: que los participantes estuvieran matriculados en 4.°, 5.° y 6.° curso, que sus padres hubieran firmado el consentimiento informado, que no presentaran ningún tipo de discapacidad, según indicaron los maestros, y que realizaran todas las pruebas (139 participantes fueron descartados por no cumplir este criterio). Esto se debió a que los estudiantes participaban en un estudio más amplio donde se medían otras variables para validar un modelo de comprensión lectora (Salvador, 2025). En la tabla 3 se aprecia mayor información descriptiva de la muestra.
Características de la muestra
| Curso | Género | Total | Porcentaje | Rango de edadaproximada | ||
|---|---|---|---|---|---|---|
| Femenino | Masculino | |||||
| 4.° | 36 | 24 | 60 | 28.2 | 9 años y 6 meses a 10 años y 6 meses | |
| 5.° | 31 | 32 | 63 | 29.6 | 10 años y 6 meses a 11 años y 6 meses | |
| 6.° | 42 | 48 | 90 | 42.2 | 11 años y 6 meses a 12 años y 6 meses | |
| Muestra | Total | 109 | 104 | 213 | 100 | 9 años y 6 meses a 12 años y 6 meses |
| Porcentaje | 51.2 | 48.8 | 100 | |||
Fuente: Elaboración propia.
La POI considera cuatro de las cinco categorías de inferencias establecidas por Ripoll (2015). Nueve ítems corresponden a inferencias de tipo I, subdivididos en tres grupos: correferencia, pronombres y ambigüedades. Hay 12 ítems de inferencias de tipo II, que se dividen a su vez en sociales, físicas y de estado mental. De la misma forma se subdividen los 12 ítems para valorar las inferencias de tipo III. Finalmente, las inferencias de tipo IV contienen 6 preguntas y no presentan subcategorías. Los ítems de la POI están conformados por premisas breves que deben ser leídas por el evaluador, seguidas de una pregunta que el estudiante evaluado debe responder por escrito, eliminando así la interferencia de las habilidades de descodificación de los estudiantes.
En un primer intento de validar esta prueba, Picart y Ripoll (2017) aplicaron este instrumento a 35 estudiantes de posgrado para descartar ítems confusos. El criterio utilizado fue que el 70% de los participantes coincidieran en la respuesta correcta y que no más del 15% coincidiera en la misma respuesta equivocada. En consecuencia, se descartó el ítem 1.1 del grupo de inferencias de tipo I, quedando 8 de las 9 preguntas, y del grupo de preguntas de tipo II, se descartó el ítem 2.5, quedando 11 de las 12 preguntas. Tras esto, se reorganizaron los 37 ítems restantes. Los ítems eliminados se aprecian en el apéndice 3.
Posteriormente, la prueba pasó por un análisis de 8 jueces expertos donde se obtuvieron valores adecuados. Cada ítem fue valorado bajo los criterios de redacción y pertinencia. Para el criterio de redacción, se obtuvo un índice V de Aiken de .92, con intervalos de confianza entre .71 y .95. Para el criterio de pertinencia, el índice V de Aiken fue de .96, con intervalos de confianza entre .84 y .99. Aunque no se sugirió eliminar ningún ítem, se retiraron los ítems indicados en el trabajo de Picart y Ripoll (2017).
También se emplearon dos pruebas estandarizadas de comprensión lectora. El test ECL-2 tiene una fiabilidad, medida con el alfa de Cronbach, de .80. De la Batería EMLE/TALE se utilizó el texto 2, con una fiabilidad test-retest entre .76 y .82 para los cursos evaluados y una kappa de Cohen de .68 al medir el acuerdo entre las pruebas de la batería y el juicio del profesorado sobre la comprensión lectora de la muestra. Se emplearon estas pruebas debido a que estaban vinculadas con el proyecto general de validación de un modelo explicativo de la comprensión lectora (Salvador, 2025).
ProcedimientoEl estudio contó con la aprobación del comité de ética de la Universidad Privada San Juan Bautista de Perú (registro: N° 2478-2024-CIEI-UPSJB). Para la evaluación de la muestra, primero se solicitó permiso a la dirección de cada uno de los colegios y luego se conversó con los docentes. A través de ellos, se envió el documento de consentimiento informado a las familias. En algunos casos fue posible reunirse con los padres de familia para solicitarles el consentimiento y resolver sus dudas. Los grupos de participantes fueron evaluados en diversos momentos durante los años 2017, 2018 y 2019, dentro de sus horarios escolares. Dada la naturaleza de las evaluaciones, estas fueron colectivas. En las escuelas de Lima, la investigadora realizó la mayoría de las evaluaciones, y en las escuelas de Piura, los docentes, convenientemente preparados por la investigadora, administraron las pruebas. Para la administración grupal, se les indicó a los estudiantes que el aplicador iba a leer los enunciados y que ellos debían completar las respuestas por escrito en un formato breve en el espacio al lado del enunciado. En ambos tipos de aplicación se leyeron los enunciados dos veces para evitar errores producidos por problemas de atención o memoria. El tiempo aproximado de la aplicación fue de 20 a 30 minutos, lo cual resultó bastante factible. Posteriormente, a los estudiantes se les asignó una numeración correlativa para resguardar sus datos personales.
ResultadosPruebas de normalidadLa distribución de las puntuaciones totales de la prueba mostraba una asimetría de −1.44 y una curtosis de 3.68. La prueba de Lilliefors (D=.16; p<.0001) confirmó que las puntuaciones no seguían una distribución normal.
El test de Levene no resultó significativo (F=1.23; p=.29), indicando que las varianzas de los resultados obtenidos en los distintos cursos eran homogéneas.
Estadísticos descriptivosEn la tabla 4 se pueden encontrar los estadísticos descriptivos de la prueba. Los resultados reflejan variaciones en el desempeño de los estudiantes según el tipo de inferencia y el curso escolar. En las inferencias de tipos I, II y III, la medias de 5.° fue menor que la del grupo de 4.°. Las inferencias de tipo III muestran las puntuaciones promedio más altas, mientras que las de tipo IV registran los valores más bajos. Ello indicaría diferencias en la complejidad o en la facilidad de los tipos de inferencia evaluados.
Valores medios y desviación estándar de cada tipo de inferencia
| Tipos de inferencia | Curso | N | Media | DE | Mínimo | Máximo |
|---|---|---|---|---|---|---|
| Tipo I | 4.° | 60 | 5.20 | 1.14 | 0 | 6 |
| 5.° | 63 | 5.12 | 1.12 | 0 | 6 | |
| 6.° | 90 | 5.50 | 0.69 | 3 | 6 | |
| Total T I | 213 | 5.31 | 0.98 | 0 | 6 | |
| Tipo II | 4.° | 60 | 5.50 | 2.15 | 0 | 10 |
| 5.° | 63 | 5.34 | 1.84 | 0 | 9 | |
| 6.° | 90 | 5.71 | 2.19 | 0 | 10 | |
| Total T II | 213 | 5.54 | 2.08 | 0 | 10 | |
| Tipo III | 4.° | 60 | 10.18 | 2.1 | 0 | 12 |
| 5.° | 63 | 10.22 | 1.47 | 7 | 12 | |
| 6.° | 90 | 10.66 | 2.01 | 0 | 12 | |
| Total T III | 213 | 10.4 | 1.9 | 0 | 12 | |
| Tipo IV | 4.° | 60 | 3.33 | 1.37 | 0 | 5 |
| 5.° | 63 | 2.85 | 1.31 | 0 | 5 | |
| 6.° | 90 | 3.53 | 1.39 | 0 | 5 | |
| Total T IV | 213 | 3.28 | 1.39 | 0 | 5 | |
| Total POI | 213 | 24.53 | 4.7 | 0 | 32 |
DE: desviación estándar; POI: prueba oral de inferencias.
Nota: Clasificación de inferencias basado en la propuesta de Ripoll (2015).
La prueba completa presenta un alfa de Cronbach=.81. Este valor indica una buena consistencia interna de la prueba y no aumenta con la eliminación de ningún ítem. Sin embargo, cinco de ellos presentan una correlación ítem-test <.2. La correlación ítem-test mide la correlación de cada ítem con el total de la prueba. Un resultado muy bajo indica que ese ítem puede no estar midiendo el mismo constructo que el resto de la prueba. En ese sentido .2 es un límite arbitrario, pero bastante común para considerar que el ítem puede ser problemático. Por lo que se procedió a su eliminación; se trataba de los ítems: I.7 y I.8 del subtipo ambiguo; II.3 del subtipo social, II.5 del subtipo físico y IV.2 relacionada al uso de herramientas. La versión final de la prueba, con los 32 ítems, y las respuestas consideradas como válidas, están en el apéndice 2.
El valor obtenido para el alfa de Cronbach, tras esta modificación del test, se mantiene igual y la correlación ítem-test media es de .32, con una desviación típica de .07. Esto quiere decir que la consistencia interna es adecuada para el instrumento. Ello confirma que los ítems restantes del test siguen midiendo de manera coherente el constructo propuesto, a pesar de la eliminación de aquellos con menor correlación ítem-test. La correlación ítem-test media, de .32, indica que los ítems tienen una relación moderada con el puntaje total del test. Es decir que cada ítem contribuye al constructo global, aunque algunos ítems pueden no estar tan estrechamente vinculados como otros. No obstante, este valor es consistente con lo esperado en instrumentos que evalúan múltiples dimensiones o aspectos relacionados. La desviación típica de .07 indica que las correlaciones ítem-test presentan una baja variabilidad entre los ítems. Ello es favorable, ya que implica que los ítems mantienen una homogeneidad relativa en su capacidad para medir el constructo general, lo cual fortalece la validez interna del test.
ValidezLa validez de constructo se valoró inicialmente con un análisis factorial confirmatorio porque, al partir de un modelo previo se esperaba que los resultados concordasen con sus propuestas. Al no ser así se utilizó el análisis exploratorio para tratar de establecer cuáles eran los factores que realmente aparecían en la prueba.
La validez del constructo se valoró con un análisis factorial confirmatorio planteando la existencia de cuatro factores, correspondientes a cada tipo de inferencia. Los resultados obtenidos indicaron que este modelo no era adecuado para representar los datos: χ2 (gl=458)=662; p<.0001. Ante esa inadecuación del modelo, se realizó un análisis factorial exploratorio. El test de Kaiser-Meyer-Olkin (KMO) ofreció una medida global de adecuación del muestreo de .73 (mediana). El test de Bartlett resultó significativo (p<.001), indicando que puede ser útil un análisis factorial con los datos.
Los datos mostraban 11 autovalores mayores que 1; según la regla de Kaiser, esto indicaría que un modelo con 11 factores sería óptimo. Un análisis paralelo, según se puede ver en la figura 1, sugirió el uso de 5 o más factores.
Se realizó un análisis factorial con rotación oblicua (promax), asumiendo que los factores no eran independientes. El modelo aceptable con un número mínimo de factores fue el de 7 factores, que se aprecian en la tabla 5. El valor de χ2 (gl=293) fue 319 (p=.14).
Análisis factorial exploratorio de los ítems de la prueba oral de inferencias
| Tipo | Subtipo | Ítem | Factor 1 | Factor 2 | Factor 3 | Factor 4 | Factor 5 | Factor 6 | Factor 7 |
|---|---|---|---|---|---|---|---|---|---|
| I | Correferencia | I.1 | 1.05 | ||||||
| I.2 | .39 | ||||||||
| I.3 | |||||||||
| Pronombres | I.4 | .44 | |||||||
| I.5 | .53 | ||||||||
| Ambigua | I.6 | .36 | |||||||
| II | Social | II.1 | .62 | ||||||
| II.2 | .44 | ||||||||
| II.4 | .48 | .99 | |||||||
| Física | II.6 | .54 | |||||||
| II.7 | .57 | ||||||||
| Estado mental | II.8 | ||||||||
| II.9 | .38 | ||||||||
| II.10 | .38 | ||||||||
| II.11 | .40 | ||||||||
| III | Social | III.1 | |||||||
| III.2 | .49 | ||||||||
| III.3 | .70 | ||||||||
| III.4 | .77 | ||||||||
| Física | III.5 | .33 | |||||||
| III.7 | |||||||||
| Estado mental | III.8 | .73 | |||||||
| III.9 | .75 | ||||||||
| III.10 | .33 | ||||||||
| III.11 | .37 | ||||||||
| III.12 | −.35 | ||||||||
| III.13 | |||||||||
| IV | − | IV.1 | −.30 | ||||||
| IV.3 | .37 | ||||||||
| IV.4 | .35 | ||||||||
| IV.5 | .41 | ||||||||
| IV.6 | .40 |
Fuente: Elaboración propia.
Si bien se aprecia una distribución irregular de los ítems de los cuatro tipos de inferencias dentro de los 7 factores, en algunos de ellos sí se logra apreciar la presencia de ítems de un mismo tipo de inferencia, aunque puedan diferir en el subtipo de la misma. Lo cual indicaría que los ítems se agrupan con mayor regularidad en función al subtipo que al tipo de las inferencias planteadas. Además, según estos hallazgos, los ítems más sensibles de ser evaluados serían los del tipo III. Es decir, que las predicciones sobre las emociones y reacciones de otras personas son factibles de medirse a través de premisas breves.
En el factor 1 se agrupan ítems de los tipos de inferencia I, III y IV. En cuanto a las inferencias de tipo I, los dos ítems son del subtipo pronombres y ambiguo. Los dos ítems de las inferencias del tipo III son del subtipo social y solo un ítem corresponde a las inferencias del tipo IV. Todos los ítems del factor 2 pertenecen al tipo II, es decir, inferencias causales, en especial del subtipo físico y de estado mental; lo que podría indicar una mayor relación entre estos subtipos de inferencias, diferenciándose de alguna forma del subtipo social. El factor 3 incluye inferencias de los tres subtipos del tipo III, con 2 de los 4 ítems del subtipo estado mental. El factor 4 está formado solamente por dos ítems del tipo I. En el factor 5 se hallan dos ítems del tipo III, específicamente del subtipo estado mental y los otros tres ítems del tipo IV, siendo el factor donde se agrupan la mayoría de estos. El factor 6 está formado por un único ítem, del tipo II, que también se hallaba en el factor 2. Finalmente, en el factor 7 encontramos dos ítems del tipo II, del subtipo social y dos ítems de los tipos III y IV, pero que tienen un peso negativo.
Para la validación de criterio, se hallaron las correlaciones de la POI con una prueba de comprensión lectora (ECL) y con una prueba de comprensión lectora formada exclusivamente por ítems inferenciales (EMLE/TALE). Estas correlaciones se calcularon con el coeficiente de correlación (rho) de Spearman. La correlación entre la POI y la ECL fue rho=.42 y la correlación entre la POI y EMLE/TALE fue rho=.43 (p<.0001 en ambos casos). Estas pruebas se utilizaron por varias razones. En primer lugar, la POI fue desarrollada en el marco de la validación del modelo DIME, que postula que la habilidad inferencial influye en la comprensión lectora de manera general y no únicamente en la resolución de ítems de preguntas inferenciales. Además, dado que las evaluaciones se realizaron con grupos numerosos, no era viable emplear pruebas que requirieran aplicaciones individuales. Por último, como se ha señalado anteriormente, la mayoría de los instrumentos diseñados para evaluar inferencias están basados en tareas de lectura.
El contraste de Wilkoxon para muestras independientes no paramétricas encontró que no había diferencia significativa entre el resultado de 4.° y 5.° curso (W=2245; p=.071), ni entre 4.° y 6.° (W=3056; p=.17), pero sí entre 5.° y 6.° curso (W=3904; p<.0001). A partir de las puntuaciones de los participantes se elaboró la tabla 6 de percentiles generales.
DiscusiónEl objetivo de este estudio fue la elaboración y validación de una prueba para valorar la comprensión de inferencias pragmáticas, ya que es una habilidad fundamental para la comprensión del lenguaje y la comprensión lectora. Asimismo, se buscaba que este instrumento incluyese distintos tipos de inferencias, con el fin de evaluar con mayor especificidad el desempeño y las dificultades de los escolares en la comprensión inferencial. Además, dado que el estudiante debe escuchar las premisas y escribir su respuesta, se ha intentado limitar una posible interferencia de los procesos de descodificación, tal como sugirió León (2003) y que ha sido una limitante en varios estudios (Elleman, 2017). Esto cobra relevancia en contextos socialmente desfavorecidos, donde los estudiantes presentan estas dificultades hasta cursos superiores de la Educación Primaria (Ferroni, 2020; Ferroni y Jaichenco, 2020).
Entre todas las pruebas revisadas, la única que se presenta como prueba para la evaluación de la comprensión inferencial en hispanohablantes es la de Canet-Juric et al. (2013). Esta prueba es una adaptación de una tarea utilizada por Cain y Oakhill (1999) que presenta cuatro textos narrativos con seis preguntas para cada uno de ellos, de las que cuatro son inferenciales: dos anafóricas y dos elaborativas, de modo que podríamos considerar que equivalen a preguntas inferenciales de los tipos I y III, según la taxonomía seguida en este estudio. Además, cada texto incluía dos preguntas literales.
Los resultados de asimetría (-.79) y curtosis (.74) de las 24 preguntas de la prueba de Canet-Juric et al. (2013) son inferiores a los encontrados en la POI, sugiriendo una distribución normal de las puntuaciones recogidas. En las inferencias anafóricas, obtienen una correlación ítem-test de .46, y en las inferencias elaborativas, de .52, también superiores a la puntuación de .32 que se encuentra en la escala total de la POI. Canet-Juric et al. no reportan el alfa de Cronbach como medida de la consistencia interna ni realizan un análisis factorial de los ítems de la prueba. Tampoco correlacionan la prueba con una medida de comprensión inferencial, aunque sí lo hacen con valoraciones de detección de errores o incongruencias, decodificación (que no resulta significativa), vocabulario y resolución de analogías verbales.
Por otro lado, la GUB (Ugarriza, 2006), si bien presenta un coeficiente alfa de Cronbach aceptable de .75 y una adecuada consistencia interna, tal como se ha referido anteriormente, una de sus principales limitaciones es que solo trabaja un tipo de inferencias y con población universitaria. La POI ofrece una buena consistencia interna y, aunque el análisis factorial no refleja la estructura de cuatro factores que se pretendía conseguir, sí muestra que algunos ítems que evaluaban el mismo tipo de inferencia tienden a agruparse dentro de un mismo factor, especialmente los de inferencias del tipo II.
En cuanto a su correlación con las pruebas de lectura ECL y EMLE/TALE, en ambos casos se apreció una correlación positiva moderada y significativa entre la construcción de inferencias y la comprensión lectora. Esto sugiere una relación entre ellas, aunque no implica necesariamente una causalidad. Resulta particularmente interesante el caso de la prueba EMLE/TALE, que está conformada solo por ítems de preguntas inferenciales que se podrían considerar de los tipos I, II, III y IV. Es decir, que propone la valoración de variedad de inferencias similar a la POI, salvo por que en esta última no hay interferencia de la descodificación.
Aunque la prueba se ha administrado principalmente de forma grupal, dado que su validación se realizó en el marco de una investigación que evaluaba varios factores relacionados con la comprensión lectora (Salvador, 2025), también es posible aplicarla de manera individual.
La aplicación grupal presenta ventajas importantes, especialmente para evaluaciones psicopedagógicas a gran escala o para estudios de investigación, ya que permite evaluar a un número considerable de participantes en un rango de tiempo factible (Ahmed et al., 2016, 2022; Cromley y Azevedo, 2007). Sin embargo, también implica ciertos desafíos, como la posibilidad de que algunos niños queden rezagados en su avance. En estos casos, el aplicador debe estar atento para intervenir oportunamente, sugiriendo que los estudiantes continúen con el grupo y gestionando espacios adicionales para completar la prueba individualmente. Asimismo, en este formato, puede surgir dificultad para interpretar las respuestas de algunos estudiantes debido a problemas de caligrafía o errores ortográficos importantes. Estas situaciones se apreciaron en el marco de la aplicación de la POI para el presente trabajo. La aplicación individual ofrece la ventaja de que el evaluador pueda escuchar directamente las respuestas del participante, lo que permite un registro más detallado y minimiza el riesgo de malentendidos relacionados con la calidad de la escritura. Esto se observó en algunas aplicaciones piloto de la prueba. Adicionalmente, es oportuno mencionar que la POI podría ser de utilidad con alumnado de menor edad ya que al ser oral cabe la posibilidad de ser administrada al alumnado prelector. Sin embargo, este formato es menos práctico para su uso con grupos numerosos, debido al tiempo y los recursos que requiere (León, 2003).
Por último, cabe mencionar que se han encontrado algunas limitaciones. Una de ellas es que no se hallaron los cuatro factores esperados, correspondientes a los 4 tipos de inferencias. Lo cual podría sugerir que clasificación de la que se parte sea mejorable o que en la resolución de los ítems inferenciales intervienen otras variables. Anteriormente se mencionó a falta de representatividad de la muestra podría resultar cuestionable, pero para el análisis factorial confirmatorio es recomendable de 5 a 10 participantes por ítem. Estas condiciones si se ajustan a este estudio.
ConclusionesTeniendo en cuenta el análisis expuesto, el uso de la POI ha mostrado una adecuada validez y confiabilidad para la evaluación general de la habilidad inferencial, pero se advierte aún se requieren mayores estudios para que sea sensible de valorar la construcción de los distintos tipos de inferencias.
Adicionalmente, se considera un instrumento conveniente debido a que se puede administrar tanto de forma grupal como individual, según el objetivo de la valoración y el tiempo requerido es relativamente breve.
Las características psicométricas favorables de la POI, su facilidad de uso en formato grupal e individual y la escasez de pruebas orales para medir inferencias; le confieren a este instrumento importantes implicancias prácticas.
FinanciaciónLa presente investigación no ha recibido ayudas específicas provenientes de agencias del sector público, sector comercial o entidades sin ánimo de lucro.
Se agradece a las instituciones educativas que tuvieron a bien abrir sus puertas para la realización del presente trabajo.











