Validez de contenido por juicio de expertos de un instrumento para medir percepciones físico-emocionales en la práctica de disección anatómica

Bernal-García, Martha Inés; Salamanca Jiménez, David Ricardo; Perez Gutiérrez, Norton; Quemba Mesa, Mónica Paola

doi:10.1016/j.edumed.2018.08.008

Información del artículo

Resumen

Texto completo

Bibliografía

Descargar PDF

Estadísticas

Tablas (6)

Tabla 1. Valoración del coeficiente kappa (Landis y Koch, 1977)

Tabla 2. Fuerza de concordancia entre evaluadores para las dimensiones del instrumento original

Tabla 3. Concordancia por parejas entre los expertos

Tabla 4. Coeficiente de kappa de Fleiss y significación estadística de las características del instrumento original

Tabla 5. Versión final del instrumento validado en contenido por juicio de expertos

Tabla 6. Porcentaje de comprensión de las dimensiones y sus ítems en la versión final del instrumento validado

Mostrar másMostrar menos

Resumen

Introducción

La presente investigación tuvo como objetivo realizar validez de contenido a partir del juicio de expertos de un instrumento de medición que indaga 4 dimensiones: reacciones físicas, consecuencias, perturbaciones y métodos de afrontamiento de los estudiantes de medicina ante la práctica de disección anatómica.

Material y método

Estudio psicométrico de validez de contenido, en el que participaron 9 expertos que evaluaron cada ítem con base en las características de suficiencia, claridad, coherencia, relevancia y pertinencia, al igual que estimaciones relacionadas con la congruencia de los ítems, amplitud de contenido, redacción, claridad y pertinencia del instrumento original. Fueron tenidas en cuenta las observaciones cualitativas de los expertos. Se determinó el grado de acuerdo entre expertos con el coeficiente kappa de Fleiss. Se aplicó prueba de pretest, para medir el grado de comprensibilidad.

Resultados

Globalmente se obtuvo fuerza de concordancia en cada dimensión, como casi perfecta y por parejas de expertos, entre moderada y casi perfecta. Para las características, la pertinencia fue la más alta (0,8443) y en la significación estadística, la suficiencia (p=0,0268). Se ajustó la estructura del instrumento, sin afectar la validez de contenido. De los 39 ítems originales, se eliminaron 16 ítems y se conservaron 22, de los que 6 se corrigieron en redacción. El grado de comprensibilidad fue de rango alto para la nueva versión del instrumento.

Conclusión

El instrumento validado podrá ser explorado y aplicado para favorecer la comparación de poblaciones de diferentes facultades en este y otros países que hablen el mismo idioma español.

Palabras clave:

Validez de contenido

Juicio de expertos

Coeficiente kappa de Fleiss

Anatomía

Disección

Educación Médica

Abstract

Introduction

The objective of the present investigation was to carry out content validity based on expert judgment of a measurement instrument that investigates 4 dimensions: physical reactions, consequences, disturbances and coping methods of students of medicine before the practice of anatomical dissection.

Material and method

Psychometric study of content validity, in which 9 experts participated who evaluated each item based on the characteristics of sufficiency, clarity, coherence, relevance and pertinence, as well as estimates related to the congruence of the items, breadth of content, writing, clarity and relevance of the original instrument. The qualitative observations of the experts were taken into account. The degree of agreement between experts was determined with the Fleiss kappa coefficient. A preliminary test was applied to measure the degree of comprehensibility.

Results

Globally, almost perfect strength of agreement was obtained in each dimension, and in pairs of experts, between moderate and almost perfect. For the characteristics, the relevance was the highest (0.8443) and in the statistical significance, the sufficiency (p=.0268). The structure of the instrument was adjusted, without affecting the content validity. Of the 39 original items, 16 items were eliminated, and 22 items were retained, of which 6 were corrected in writing. The degree of comprehensibility was of high rank for the new version of the instrument.

Conclusion

The validated instrument can be explored and applied to favor the comparison of populations of different faculties in this and other countries that speak the same Spanish language.

Keywords:

Content validity

Experts judgment

Fleiss kappa coefficient

Anatomy

Dissection

Medical education

Texto completo

Introducción

En el proceso de validación de instrumentos de investigación, como tema de interés en el área de la salud, es necesario disponer de escalas de medición para valorar los atributos subjetivos que integran constructos y dimensiones complejas1 como lo son las físicas, psicológicas o sociales, entre otras, cuyo diseño admite reunir de forma válida y confiable la percepción del sujeto en diferentes momentos2–4 conducente a la generación de nuevo conocimiento. En ese sentido, se ha comunicado la descripción de los estándares que han venido evolucionando a través del tiempo para los conceptos de validez, últimamente basada en la evidencia y el marco de validación centrado en el contenido, los procesos de respuesta, la estructura interna, las relaciones con otras variables y las consecuencias del uso5. De estos, el concepto de validez de contenido ha sido objeto de múltiples transformaciones desde sus orígenes. Sin embargo, han estado más bien focalizadas en otorgarle importancia como fuente de evidencia de validez que en su definición operativa, que ha permanecido esencialmente estable, por lo que se hace necesaria para realizar interpretaciones de las puntuaciones a los ítems del instrumento de medida, instrucciones para su administración y los criterios para su corrección y puntuación6,7. Existen variados métodos para estimar la validez de contenido, entre ellos el basado en el juicio de expertos, que se caracteriza por contar con un número de expertos que bien proponen los ítems o dimensiones que deben conformar el constructo de interés o evalúan los diferentes ítems en función de su relevancia y representatividad7.

El incremento de la tasa poblacional y la necesidad de investigación multicultural conducen a la generación de datos fiables y válidos a partir de medidas de valoración cruzada como fuentes de estudio reproducibles en la población humana8,9. No obstante, es limitada la información encontrada en la literatura que explique el proceso de validación de contenido de instrumentos para investigaciones específicas en el campo de la Medicina, aplicados en áreas básicas de formación profesional, como la asignatura de morfología humana, que lleva inmerso en su contenido programático diferentes técnicas de estudio y sesiones prácticas, entre la que se destaca la disección anatómica10, como método de enseñanza más antiguo.

Diversos estudios han demostrado que la disección estimula positivamente a los estudiantes por conocer en detalle el cuerpo humano, promueve el trabajo en equipo, desarrolla habilidades prácticas, ayuda a la comprensión de la variabilidad anatómica, fomenta el aprendizaje con la interacción entre compañeros y ayuda a apreciar la vida humana a través de la comprensión de la muerte11,12. Sin embargo, el primer acercamiento puede generar reacciones fisiológicas y psicológicas, no contempladas en varias facultades de medicina, lo cual podría tener repercusión en el proceso de aprendizaje, así como en la futura relación médico paciente desde la concepción del cuerpo humano como ente físico-espiritual13. Por ello, es necesario valorar objetivamente la percepción de los estudiantes frente a la práctica de disección anatómica, teniendo como pilar un instrumento de recolección de datos funcional, según la naturaleza del contenido, que simplifique la experiencia vivida por el estudiante en el anfiteatro.

Así, el presente trabajo de investigación tiene como propósito realizar proceso de validación de contenido a partir del juicio de expertos en el área de anatomía, de un instrumento de medición que indaga 4 dimensiones principales: reacciones físicas, consecuencias, perturbaciones y métodos de afrontamiento de los estudiantes de medicina ante la práctica de disección anatómica.

Método

Estudio descriptivo, psicométrico de validez de contenido por medio de juicio de expertos, realizado en la Universidad de Boyacá (Colombia).

Participantes

La población fue conformada por profesionales con experiencia de 10 o más años en la docencia e investigación en el campo de la anatomía humana con formación profesional posgradual de maestría o doctorado. La muestra, por intencionalidad, incluyó 9 expertos de diferentes Facultades de Medicina pertenecientes a Universidades públicas y privadas de Colombia, que aceptaron voluntariamente participar. Los criterios de exclusión utilizados fueron revocatoria del consentimiento informado e incumplimiento en la entrega del material evaluado en el plazo fijado.

Se contó con la participación de 2 asesores estadísticos con maestría en este campo.

Instrumentos

La validación fue aplicada sobre los test diseñados originalmente por Maribel Miguel y colaboradores para el estudio desarrollado durante 6 años, con 350 estudiantes en la población de primero de medicina de la Facultad de Medicina-Campus de Bellvitge de la Universidad de Barcelona, cuyo objetivo principal fue dar a conocer las actitudes, reacciones y medios de adaptación de los estudiantes, mientras realizaban las clases prácticas de Anatomía Humana del Aparato Locomotor14. El contenido se basó en la teoría Clásica de los Test, con ítems conceptuales para estudiar las reacciones de los estudiantes de primero de medicina ante la sala de disección, originalmente constituido por 39 ítems agrupados en 4 dimensiones: las reacciones físicas con 9 ítems, consecuencias con 7 ítems, perturbaciones con 9 ítems y métodos de afrontamiento con 14 ítems, percibidas en el anfiteatro (sala de disección) durante las prácticas de disección anatómica, como variables descritas previamente por esos autores. Para efectos de la presente investigación, se obtuvo permiso escrito de la autora Maribel Miguel.

La evaluación de los test agrupados en 4 partes (dimensiones) se hizo a partir de la valoración de cada ítem, utilizando la plantilla Juicio de expertos, propuesta por Escobar-Pérez y Cuervo-Martínez15, cuya calificación establece 4 niveles1: no cumple con el criterio2, Bajo nivel3, Moderado 4 y Alto nivel, con base en la definición de indicadores en correspondencia con las características a evaluar: suficiencia, claridad, coherencia, relevancia y pertinencia, considerando además las observaciones cualitativas de los expertos, para cada uno de los 39 ítems que conformaron el instrumento original. Finalmente, cada uno de los expertos diligenció y firmó una constancia de validación, donde evaluaron globalmente las apreciaciones relacionadas con la congruencia de los ítems, amplitud de contenido, redacción, claridad y pertinencia del instrumento original.

Procedimiento

Los datos recogidos fueron almacenados en el programa Microsoft Excel 2016 y procesados estadísticamente en el programa STATA versión 14.0. Consecutivamente, se determinó el grado de acuerdo entre los expertos con el coeficiente kappa de Fleiss, como estadístico de análisis, utilizado para evaluar la concordancia entre 3 o más evaluadores que juzgan independientemente criterios de medida, a través de un instrumento, que consiste en un determinado número de categorías de naturaleza ordinal16,17. Aplicable a estudios interjuicio, como en este caso, que asignó rangos a los ítems, basados en los datos ordinales y grado de varianza de la suma de los rangos 1-4, obtenidos por los diferentes expertos. El mínimo valor asumido por el coeficiente es 0 y el máximo 114. Para la interpretación de este coeficiente se tuvo en cuenta la escala establecida por Landis y Koch (1977)18 que expresa cualitativamente la fuerza de concordancia entre los evaluadores (originalmente en inglés), detallada en la tabla 1.

Tabla 1.

Valoración del coeficiente kappa (Landis y Koch, 1977)

Coeficiente kappa de Fleiss	Fuerza de concordancia
0,00	Pobre (Poor)
0,1-0,20	Leve (Slight)
0,21-0,40	Aceptable (Fair)
0,41-0,60	Moderada (Moderate)
0,61-0,80	Considerable (Substantial)
0,81-1,0	Casi perfecta (Almost perfect)

Fuente: Landis y Koch18.

Para el análisis de las apreciaciones cualitativas de las jueces consignadas en la constancia de validación, sobre la congruencia de los ítems, amplitud de contenido, redacción, claridad y pertinencia, se utilizó una escala de valoración tipo Likert, atribuyendo categorías y puntos de calificación, deficiente1, aceptable2, bueno3 y excelente4, según su consideración. Se estimaron adecuados los ítems que cumplieron con la totalidad de los requisitos establecidos, parcialmente adecuados los ítems que exigieron algunos cambios e inadecuados los que expresaron total incongruencia en relación con los criterios expresados. Se solicitó a los jueces la devolución del material tras el análisis y juicio final, vía electrónica a los investigadores, dentro del plazo establecido de 30 días. En los casos donde se consideró inadecuada, los motivos fueron explicados, las sugerencias descritas y los contenidos rehechos y mejorados.

Posteriormente, el instrumento obtenido de la validación de contenido por juicio de expertos fue sometido a la prueba de pretest estándar, con una codificación de respuestas, en función del número de opciones dicotómicas sí/no, sobre la interpretación de los ítems, en cada una de las dimensiones, para medir aplicabilidad/viabilidad; en una muestra aleatoria de 110 estudiantes, que cursaban la asignatura de morfología, en el programa de Medicina de la Universidad de Boyacá (Colombia), de los que se obtuvo individualmente el consentimiento informado, aceptado y firmado voluntariamente. Con estos datos se determinó el porcentaje de comprensión para todos los ítems y el grado de comprensibilidad en los siguientes rangos: Alta comprensibilidad igual o superior al 85%: mediana comprensibilidad del 80-85%; y Baja comprensibilidad, menor del 80%, de la nueva versión obtenida.

La presente investigación tuvo en cuenta los principios éticos de la declaración de Helsinki, de la Asociación Médica Mundial, y la resolución 008430 de 1993 del Ministerio de Salud y Protección social de Colombia, en la que todos los participantes tuvieron pleno conocimiento de los propósitos, la participación fue voluntaria y se aceptó con la firma del consentimiento informado. Asimismo, contó con el aval del Comité de investigación de la Facultad de Ciencias de la Salud y del Comité de ética de la Universidad de Boyacá (Colombia)

ResultadosValidación de contenido por juicio de expertos

Sobre la evaluación del instrumento original, el cálculo del coeficiente kappa de Fleiss, tuvo en cuenta la proporción de posibles acuerdos que ocurrieron en cada dimensión, y estimó la magnitud en la fuerza de concordancia, interpretada como casi perfecta por el conjunto de los jueces, según se detalla en la tabla 2.

Tabla 2.

Fuerza de concordancia entre evaluadores para las dimensiones del instrumento original

Dimensiones	Coeficiente kappa de Fleiss	Fuerza de concordanciaInterpretaciónLandis y Koch, 1977
Sociodemográficas	0,970	Casi perfecta (Almost perfect)
Reacciones físicas	0,788	Considerable (Substantial)
Consecuencias	0,894	Casi perfecta (Almost perfect)
Perturbaciones	0,885	Casi perfecta (Almost perfect)
Métodos de afrontamiento	0,836	Casi perfecta (Almost perfect)

De la misma manera se obtuvo magnitud en la fuerza de concordancia por parejas de expertos, de los cuales fue evidente la variabilidad entre moderada y casi perfecta, demostrando discordancia, especialmente en la dimensión de las reacciones físicas. Resultados detallados en la tabla 3.

Tabla 3.

Concordancia por parejas entre los expertos

Dimensiones	Coeficiente kappa de Fleiss - Concordancia por parejas de expertos
Dimensiones	1-9	2-8	3-7	4-6	5-4	6-3	7-2	8-1	9-5
Sociodemográficas	1	0,866	1	1	1	1	1	0,866	1
Reacciones físicas	0,722	0,863	1	0,572	0,694	0,766	1	0,669	0,805
Consecuencias	0,594	0,809	1	0,857	0,971	0,857	1	0,695	0,971
Perturbaciones	0,594	1	1	0,888	0,888	1	1	0,805	0,788
Métodos de afrontamiento	0,779	1	1	0,888	0,888	1	1	0,805	0,788

Asimismo, fueron estimadas las características del instrumento, para los indicadores categóricos de suficiencia, claridad, coherencia, relevancia y pertinencia, con base en la escala de medición ordinal; se encontró una fuerza de concordancia entre considerable y casi perfecta, siendo la característica de pertinencia la más alta (0,8443) según el grado de acuerdo global entre los jueces. En cuanto a la significación estadística de estas características, tuvo un comportamiento del 95% de seguridad llevando implícito una p<0,05, en la que fue relevante la característica de suficiencia p=0,0268. Así, el comportamiento estadístico que arroja coeficiente kappa de Fleiss y valor p como valor más informativo de cada característica es representado en la tabla 4.

Tabla 4.

Coeficiente de kappa de Fleiss y significación estadística de las características del instrumento original

Características	Coeficiente kappa de Fleiss	p
Suficiencia	0,804	0,026
Claridad	0,833	0,029
Coherencia	0,775	0,033
Relevancia	0,832	0,028
Pertinencia	0,844	0,031

Posteriormente se valoraron las apreciaciones cualitativas globales del instrumento dentro de la constancia final de validación, con promedio (?) de puntuación asignada por los expertos como apreciación final y desviación estándar (σ) medidas cuantitativamente en 5 dominios: Congruencia de ítem (? 3,6; con σ 0,5), Amplitud de contenido (? 3,3; con σ 0,7), Redacción de los ítems (? 3,3; con σ 0,7), Claridad y precisión(? 3,1; con σ 0,6), Pertinencia (? 3,6; con σ 0,5). Así, se obtuvo un resultado de calificación excelente en la valoración final, con puntuación promedio oscilante entre bueno3 y excelente4, mostrando que la concordancia entre los expertos estuvo homogéneamente de acuerdo, como comportamiento general, de las variables categóricas, según la estructura del instrumento de medida.

Con los resultados anteriormente descritos, y considerando las observaciones y recomendaciones emitidas cualitativamente por los expertos especialmente relacionadas con la claridad y precisión al conjunto de los 39 ítems contenidos en las dimensiones establecidas, fueron utilizadas para ajustar la estructura del instrumento de medida, por lo cual se eliminaron 17 ítems (2 de reacciones, 4 de consecuencias, 5 de perturbaciones y 6 de métodos de afrontamiento); de los 22 ítems que quedaron, 6 se corrigieron en redacción. Así, se obtuvo un instrumento de medida más claro, con menor número de ítems que permite disminuir el tiempo de aplicación y mejorar la objetividad para las opciones de respuesta.

La nueva versión del instrumento validado se organizó en 2 partes, teniendo en cuenta la temporalidad de su aplicación, la primera y última práctica; presenta un encabezado que otorga el título «Estudio de percepción en la práctica de disección-2 partes» versión corta, y abreviatura de identificación EPPD-2p, recoge datos sociodemográficos del participante, tiene de manera breve las indicaciones de diligenciamiento y detalla en cada dimensión los ítems, definiendo formato de numeración con nivel de lista y escalas de valoración En la tabla 5 se presenta la versión final del instrumento validado en la presente investigación.

Tabla 5.

Versión final del instrumento validado en contenido por juicio de expertos

Título del instrumento	Estudio de percepción en la práctica de disección-2 partes. Versión cortaEPPD-2p
Datos sociodemográficos del participante	A. Nombre
	B. Edad
	C. Sexo
Indicaciones de diligenciamiento	Lea atentamente uno a uno los ítems que integra cada dimensión a evaluar, tenga en cuenta el momento de aplicación de este instrumento y señale con una X en el espacio lineado, según corresponda: primera práctica ____ última práctica_____, seleccione de manera objetiva y sincera, y asigne con una X la opción de respuesta que mejor se ajuste a su percepción

Dimensiones	Ítem	Sí	No
1. Reacciones físicas ante la sala de disección (anfiteatro)	1a. Vértigo
	1b. Náuseas
	1c. Desmayo
	1d. Palpitaciones
	1e. Temblores
	1f. Sudoración
	1g. Abandono de la sala de disección (anfiteatro) si fuera posible
2. Consecuencias	2a. Insomnio
	2b. Pérdida del apetito
	3c. Tener imágenes visuales recurrentes de los cadáveres
3. Perturbaciones	3a. Olor de la sala de disección (anfiteatro)
	3b. Ver todo el cadáver
	3c. Ver una pieza anatómica
	3d. Miedo a la infección
4. Métodos de afrontamiento o evitación	4a. Pensar en otras cosas
	4b. Relajación
	4c. Pedir consejo a los compañeros
	4d. Pedir consejo al profesor
	4e. Usar tranquilizantes
	4f. Evitar comer antes de entrar a la sala de disección (anfiteatro)
	4g. Usar implementos de bioseguridad
	4h. Evitar tocar el cadáver

Pretest

Según el número de casos procesados (n=110), no se excluyó ninguno y se obtuvo como resultado el porcentaje de comprensión mediante respuesta dicotómica sí o no, asignada por los estudiantes en cada uno de los ítems que conformaron la estructura de la versión final instrumento validado por expertos. Con base en la distribución porcentual de comprensión obtenida para cada uno de los ítems (tabla 6), se determinó el grado de comprensibilidad en el rango alto (igual o superior al 85%), estableciendo así una comprensibilidad global esta nueva versión del instrumento de un 95%.

Tabla 6.

Porcentaje de comprensión de las dimensiones y sus ítems en la versión final del instrumento validado

Dimensiones	Ítem	Porcentaje de comprensión %
Dimensiones	Ítem	Sí	No
Reacciones físicas ante la sala de disección (anfiteatro)	Vértigo	89,1	10,9
	Náuseas	100	0
	Desmayo	99,1	0,9
	Palpitaciones	90,0	10
	Temblores	97,3	2,7
	Sudoración	100	0
	Abandono de la sala de disección (anfiteatro) si fuera posible	90	10
Consecuencia	Insomnio	97,3	2,7
	Pérdida del apetito	97,3	2,7
	Tener imágenes visuales recurrentes de los cadáveres	90	10,0
Perturbaciones	Olor de la sala de disección (anfiteatro)	100	0
	Ver todo el cadáver	98,2	1,8
	Ver una pieza anatómica	100	0
	Miedo a la infección	90,9	9,1
Métodos de afrontamiento o evitación	Pensar en otras cosas	93,6	6,4
	Relajación	95,5	4,5
	Pedir consejo a los compañeros	96,4	3,6
	Pedir consejo al profesor	97,3	2,7
	Usar tranquilizantes	83,6	16,4
	Evitar comer antes de entrar a la sala de disección (anfiteatro)	92,7	7,3
	Usar implementos de bioseguridad	100	0
	Evitar tocar el cadáver	91,8	8,2

Discusión

Se presenta el proceso de validación de contenido por juicio de expertos en un instrumento que determina las percepciones físico-emocionales de los estudiantes de medicina frente a la práctica de disección anatómica en el anfiteatro. La fortaleza del estudio se relaciona con el proceso de adaptación, validación de las propiedades psicométricas y redacción del instrumento, el cual fue estructurado originalmente por investigadores españoles y validado culturalmente al contexto de la práctica académica colombiana, a partir de un diseño metodológico que sintetiza paso por paso los distintos aspectos psicométricos, rigor y ayuda estadística19,20 que todo trabajo de investigación en medicina requiere para exponer resultados de impacto, principalmente para el campo de la educación en salud, dado que la metodología para adaptar instrumentos es poco conocida por profesionales sanitarios, lo que explica la existencia y uso indiscriminado de instrumentos adaptados de manera incompleta o traducciones simplemente literarias, por lo que requiere de un proceso dinámico y continuo que nunca acaba20,21.

El presente trabajo de investigación es coherente con el interés en la realización y el uso apropiado de instrumentos de medición, partiendo del hecho de que la educación médica en las ciencias básicas constituye el pilar fundamental de la formación profesional22,23. Evaluar las características de los ítems y preguntas es un criterio esencial para determinar la calidad en la medición de un instrumento24, el cual es válido cuando es pertinente en la cultura donde se pretende aplicar; así, la adaptación de una escala internacional es muestra de la necesidad de indagar objetiva y comprensiblemente un sinnúmero de variables, que permiten cumplir los estándares estadísticos que fundamentan su aplicación25.

Sin embargo, es previsible la aparición de dificultades inherentes al proceso validación de contenido, como la definición del número de expertos, el cual difiere considerablemente al consultar diferentes autores, dado que no hay acuerdo unánime para su determinación26,27 Algunos señalan que deben ser 3 como mínimo28, otros, fundamentados en la aplicación de variables estadísticas, concluyen que la cantidad ideal varía entre 15 y 25 expertos29,30; sin embargo, varios señalan que el número dependerá de los objetivos del estudio, con un rango entre 7 y 30 expertos31,32. En ese sentido, el presente estudio seleccionó 9 expertos, atendiendo a los objetivos planteados, valor que se encuentra relacionado con la aproximación numérica citada por diversos autores.

La presente investigación convocó a expertos, basados en los criterios publicados especialmente enfocados a un proceso fundamental para asegurar asertividad en la evaluación; algunos de esos criterios son referidos a la experiencia del juez en la emisión de juicios y toma de decisiones, nivel de reputación en la comunidad académica y científica, disponibilidad y motivación para participar, mantener un importante grado de imparcialidad y cumplimiento15, estar capacitado en las técnicas de clasificación de preguntas para validez de contenido33. Así, se buscaron expertos con el perfil descrito, para evitar sesgos de contenido en el análisis de datos.

Para el procesamiento analítico es importante definir una herramienta informática que determine el valor estadístico de la prueba. Clásicamente, este criterio ha sido abordado con el coeficiente kappa, originalmente propuesto por Cohen (1960) para evaluar el grado de concordancia entre 2 evaluadores34; sin embargo, en el presente trabajo se aplicó la versión generalizada conocida como índice kappa de Fleiss, por tratarse de múltiples expertos (más de 3), basado en el concepto de noción de acuerdo entre diversos pares que incrementan la veracidad de los resultados16. Paralelamente, se realizó un análisis individualizado a cada ítem, empleando 4 criterios por indicador (suficiencia, claridad, coherencia y relevancia)35 donde este coeficiente aseguró el rigor estadístico que soporta su aplicabilidad. Además, el análisis cualitativo de los ítems derivado de las observaciones de los expertos relacionadas con la congruencia, amplitud de contenido, redacción de los ítems, claridad y precisión, y pertinencia, permitió precisar razonamientos para corregir, conservar o eliminar ítems sin poner en riesgo la validez de contenido, cumpliendo con el proceso requerido para el estudio.

Utilizar un instrumento validado favorece el análisis de hipótesis aplicadas al campo de la educación36 permitiendo acciones oportunas y eficaces para mejorar el proceso de aprendizaje en materias de alta dificultad para los estudiantes, como es el caso de la anatomía (morfología) humana. Ahora, tras haber completado el primer peldaño de la investigación, se presentará en una segunda comunicación, en conjunto con otras universidades colombianas, la percepción del alumnado ante la práctica de disección anatómica como actividad imprescindible en el proceso de formación médica.

Una medición realizada debe valorar apreciaciones teóricas y empíricas, por tanto, la medición se enfoca en la relación entre indicadores y conceptos no medibles directamente, como lo son las percepciones de una actividad académica, que establece la inferencia requerida al evaluar la aplicabilidad empírica de las proposiciones teóricas37, obedeciendo con ello a las necesidades de la educación superior y expectativas de formación de futuros profesionales en medicina

Se hace ineludible realizar investigaciones similares que fortalezcan el campo de la educación básica en anatomía humana38–41. Diversos autores convergen a la idea de que los estudiantes llegan a la práctica de disección con incertidumbre y múltiples sensaciones de ansiedad, precipitando la aparición de reacciones físicas y emocionales que podrían dificultar su proceso de aprendizaje. Tener conocimiento de estos factores y sensibilizar al alumno antes del comienzo de la actividad en el anfiteatro generaría beneficios mentales y emocionales necesarios para hacer su trabajo con entusiasmo y confianza.

Por lo anterior, es pertinente cuestionar las consecuencias vividas por los estudiantes en el anfiteatro, ya que la disección se ha mantenido como una herramienta de enseñanza primaria en la historia de la medicina y, como tal, se debe optimizar el recurso pedagógico que integra su reproducibilidad. La enseñanza basada en la disección es referida como esencial hasta la fecha. Su utilidad también se refleja en la percepción de los estudiantes, opinando que la disección les proporciona una base fundamental para el desarrollo de habilidades clínicas. Los investigadores incluso han sugerido que puede restablecerse la disección como el método central de enseñanza de la anatomía para garantizar la práctica médica segura42,43.

Así, al haber cumplido con el objetivo primario de validar un instrumento de medición, consolidado y adaptado, podrá ser explorado y aplicado en diferentes comunidades académicas para determinar la percepción ante la práctica de disección, con nuevas pruebas psicométricas que avalen mayor validez y favorezcan la comparación de poblaciones de diferentes facultades en este y otros países que hablen el mismo idioma español, y establecer acciones oportunas que faciliten el proceso de aprendizaje orientado a las actividades prácticas propias de la anatomía macroscópica en el anfiteatro y otras salas de disección.

Conflicto de intereses

Los autores declaran no tener ningún conflicto de intereses.

Bibliografía

[1]

J.A. Luján-Tangarife, J.A. Cardona-Arias.

Construction and validation of measurement scales in health: A review of psychometric properties.

Arch Med., 11 (2015), pp. 1-10

[2]

E. Montero-Rojas.

Referentes conceptuales y metodológicos sobre la noción moderna de validez de instrumentos de medición: implicaciones para el caso de personas con necesidades educativas especiales.

AP., 27 (2013), pp. 113-128

[3]

R. Ahmed, M. McCarroll, A. Schwartz, D. Gothard, S. Atkinson, P. Hughes, et al.

Development, validation, and implementation of a medical judgment metric.

Medical Decision Making Policy & Practice (MDM P&P)., 2 (2017), pp. 1-9

http://dx.doi.org/10.1177/0022034520979147 | Medline

[4]

R. Sánchez, C. Gómez.

Conceptos básicos sobre la validación de escalas.

Rev Col Psiquiatría., 27 (1998), pp. 121-130

[5]

S. Sireci, J. Padilla.

Validating assessments: Introduction to the special section.

Psicothema., 26 (2014), pp. 97-99

http://dx.doi.org/10.7334/psicothema2013.255 | Medline

[6]

I. Pedrosa, Suárez-Álvarez, E. García-Cueto.

Evidencias sobre la validez de contenido: avances teóricos y métodos para su estimación.

Acción Psicológica., 10 (2013), pp. 3-20

[7]

F.J. Abad, J. Olea, V. Ponsoda, C. García.

Medición en ciencias sociales y de la salud.

Editorial Síntesis, (2011),

[8]

V.D. Sousa, J.A. Zauszniewski, I.A.C. Mendes, M.L. Zanetti.

Cross-cultural equivalence and psychometric properties of the Portuguese version of the Depressive Cognition Scale.

J Nurs Meas., 13 (2005), pp. 87-99

http://dx.doi.org/10.1891/jnum.2005.13.2.87 | Medline

[9]

V.D. Sousa, W. Rojjanasrirat.

Translation, adaptation and validation of instruments or scales for use in cross-cultural health care research: A clear and user-friendly guideline.

J Eval Clin Pract., 17 (2011), pp. 268-274

http://dx.doi.org/10.1111/j.1365-2753.2010.01434.x | Medline

[10]

P. Vivekananda-Schmidt, M. Lewis, A.B. Hassell, D. Coady, D. Walker, L. Kay, et al.

Validation of MSAT: An instrument to measure medical students’ self-assessed confidence in musculoskeletal examination skills.

Med Educ., 41 (2007), pp. 402-410

http://dx.doi.org/10.1111/j.1365-2929.2007.02712.x | Medline

[11]

R. Elizondo, S. Guzman, M. García.

Dissection as a teaching tool: Past, present, and future.

Anat Rec B New Anat., 285 (2005), pp. 11-15

http://dx.doi.org/10.1002/ar.b.20070 | Medline

[12]

B.G. Montemayor.

El significado de la práctica de disección para los estudiantes de medicina.

Int J Morphol., 24 (2006), pp. 575-580

[13]

A. Jagua-Gualdrón, D.Z. Urrego-Mendoza.

Actitudes de los estudiantes colombianos de medicina hacia la práctica de la disección en anatomía y su relación con el puntaje en la escala de empatía médica de Jefferson.

Rev Fac Med., 59 (2011), pp. 10-20

[14]

M. Miguel, N. Porta, J. Ortiz, A. Martínez.

Human anatomy: reactions of first year medical students to the dissection room.

Educación Médica., 10 (2007), pp. 105-113

[15]

J. Escobar-Pérez, Á. Cuervo-Martínez.

Validez de contenido y juicio de expertos: Una aproximación a su utilización.

Av En Medición., 6 (2008), pp. 27-36

[16]

M.L. McHugh.

Interrater reliability: The kappa statistic.

Biochem Medica., 22 (2012), pp. 276-282

[17]

R. Falotico, P. Quatto.

Fleiss’ kappa statistic without paradoxes.

Qual Quant., 49 (2015), pp. 463-470

[18]

J. Landis, G. Koch.

The measurement of observer agreement for categorical data.

Biometrics, 33 (1977), pp. 159-174

Medline

[19]

J.M. Argimon, J. Jiménez.

Validación de cuestionarios. Métodos de investigación clínica y epidemiológica.

Elsevier, (2004),

[20]

A. Carvajal, C. Centeno, R. Watson, M. Martínez, Á. Sanz Rubiales.

¿Cómo validar un instrumento de medida de la salud?.

An Sist Sanit Navar., 34 (2011), pp. 63-72

http://dx.doi.org/10.4321/s1137-66272011000100007 | Medline

[21]

F. Abad, J. Garrido, J. Olea, V. Ponsada.

Introducción a la Psicometría: Teoría Clásica de los Tests y Teoría de la Respuesta al Ítem.

Universidad Autónoma de Madrid, (2006), pp. 61-118

[22]

J. Lamprea, C. Gómez.

Validez en la evaluación de escalas.

Rev Colomb Psiquiat., 36 (2007), pp. 340-348

[23]

R. Sánchez, J. Echeverry.

Validación de escalas de medición en salud.

Rev Salud Pública., 6 (2004), pp. 302-318

Medline

[24]

D.F. Polit, C.T. Beck.

Nursing research: principles and methods.

7th ed., Lippincott Williams & Wilkins, (2003),

[25]

A. Alarcón, S. Muñoz.

Medición en salud: Algunas consideraciones metodológicas.

Rev Méd Chile, 136 (2008), pp. 125-130

http://dx.doi.org//S0034-98872008000100016 | Medline

[26]

C. Powell.

The Delphi technique: Myths and realities.

J Adv Nurs., 41 (2003), pp. 376-382

http://dx.doi.org/10.1046/j.1365-2648.2003.02537.x | Medline

[27]

J. Cabero, M.C. Llorente.

La aplicación del juicio de experto como técnica de evaluación de las tecnologías de la información (TIC).

Eduweb, 7 (2013), pp. 11-22

[28]

E. Delgado-Rico, H. Carretero-Dios, W. Ruch.

Content validity evidences in test development: An applied perspective.

Intern J Clin Health Psych., 12 (2012), pp. 449-460

[29]

L. García, S.J. Fernández.

Procedimiento de aplicación de trabajo creativo en grupo de expertos.

Rev Ingeniería Energética., 29 (2008), pp. 46-50

[30]

Y. Corral.

Validez y confiabilidad de los instrumentos de Investigación para la recolección de datos.

Rev FCE., 19 (2009), pp. 229-247

[31]

M. Varela Ruiz, L. Diaz-Bravo, R. García-Durán.

Descripción y usos de la técnica Delphi en investigaciones en áreas de la salud.

Inv Ed Med., 1 (2012), pp. 90-95

[32]

M. Urrutia, S. Barrios, Ñ. Gutiérrez, M. Mayorga.

Métodos óptimos para determinar validez de contenido.

Educ Med Super., 28 (2014), pp. 547-558

[33]

M.E. Garrido, S. Romero, E. Ortega, M.L. Zagalaz.

Designing and validation of a questionnaire on parents for children in sport.

J Sport Health Res., 3 (2011), pp. 59-70

[34]

D. Marasini, P. Quatto, E. Ripamonti.

Assessing the inter-rater agreement for ordinal data through weighted indexes.

Stat Methods Med Res., 25 (2016), pp. 2611-2633

http://dx.doi.org/10.1177/0962280214529560 | Medline

[35]

J. Dorantes-Nova, J. Hernández-Mosqueda, S. Tobón-Tobón.

Judgment of experts for the validation of an instrument of measurement of burnout syndrome in teaching.

Ra Ximhai., 12 (2016), pp. 327-346

[36]

C.L. Kimberlin, A.G. Winterstein.

Validity and reliability of measurement instruments used in research.

Am J Health Syst Pharm, 65 (2008), pp. 2276-2284

http://dx.doi.org/10.2146/ajhp070364 | Medline

[37]

A.M. Soriano.

Design and validation of measurement instruments.

Ed Universidad Don Bosco., 8 (2014), pp. 19-40

[38]

D. Getachew.

Reaction of medical students to experiences in dissection room.

Ethiop J Health Sci., 20 (2014), pp. 337-342

[39]

K. Qamar, M. Osama.

Role of dissection in light of students’ perceptions.

J Pak Med Assoc., 64 (2014), pp. 1021-1024

Medline

[40]

J. Van-Wyk, C. Rennie.

Learning anatomy through dissection: Perceptions of a diverse medical student cohort.

Int J Morphol., 33 (2015), pp. 89-95

[41]

M. Bob, C.A. Popescu, S.M. Suciu, A.D. Buzoianu.

First year medical students’ attitude toward anatomical corpse dissection and its relationship with their personality.

Rom J Morphol Embryol., 56 (2015), pp. 321-324

Medline

[42]

S.K. Chosh, Sanjib.

Cadaveric dissection as an educational tool for anatomical sciences in the 21st Century.

Anat Sci Educ, 10 (2017), pp. 286-299

http://dx.doi.org/10.1002/ase.1649 | Medline

[43]

A. Winkelmann.

Anatomical dissection as a teaching method in medical school: A review of the evidence.

Med Educ., 41 (2007), pp. 15-22

http://dx.doi.org/10.1111/j.1365-2929.2006.02625.x | Medline

Indexada en:

Síguenos:

Indexada en:

Síguenos:

Suscríbase a la newsletter