En el campo de la investigación biomédica, independientemente del tipo y diseño del estudio, la estadística tiene un papel fundamental. Nos proporciona métodos para organizar, resumir y analizar los datos con el fin de extraer conclusiones válidas que conducirán a tomas de decisiones. Dada esta importancia de la estadística para garantizar el rigor y la validez de las conclusiones derivadas del análisis de los datos, es crucial una buena planificación de los métodos y procedimientos estadísticos que se emplearán en las distintas etapas del proyecto de investigación. De un tiempo a esta parte, las revistas científicas más prestigiosas solicitan adjuntar un Plan de Análisis Estadístico que describa detalladamente los métodos estadísticos previstos para analizar los datos del proyecto y que acompañe al manuscrito para valorar su publicación1,2. Citando al escritor norteamericano Alan Lakein, «Planificar es traer el futuro al presente para que puedas hacer algo al respecto ahora». A lo largo del presente documento explicaremos qué es un Plan de Análisis Estadístico (conocido como SAP por sus siglas en inglés), por qué es importante y cómo elaborarlo.
¿Qué es un SAP?Un SAP, o Plan de Análisis Estadístico, es un documento independiente del protocolo del estudio que describe y detalla los métodos estadísticos previstos que se emplearán para analizar los datos recopilados en un estudio de investigación. En resumen, describe qué variables y resultados se recopilarán y qué métodos estadísticos se utilizarán para analizarlos3.
Generalmente en el protocolo del estudio se especifica el diseño del estudio, los criterios de elegibilidad, los objetivos primarios y secundarios, los métodos estadísticos para analizar las variables principales, el poder estadístico y el tamaño de la muestra debidamente justificado. Si bien es cierto que el protocolo del estudio ya contiene las principales características del análisis estadístico, el SAP acostumbra a ser un documento mucho más completo, con detalles técnicos exhaustivos sobre el análisis clínico previsto para las variables principales, la gestión de las variables secundarias, de control y/o confusoras, los intervalos de confianza que se utilizarán para la presentación de los resultados, la gestión de los datos faltantes o missings, y otras especificaciones relevantes3,4.
¿Por qué es importante elaborar un SAP?En el contexto de la investigación moderna y la ciencia abierta, la transparencia y la reproducibilidad son dos conceptos básicos a considerar en las buenas prácticas de investigación para garantizar que dichos métodos y procedimientos estadísticos sean accesibles y reproducibles por parte de otros investigadores5. Disponer de un SAP, en primer lugar, aumenta la transparencia de los análisis. Al establecer un plan detallado que describe cómo se analizarán los datos antes de comenzar el estudio, se proporciona claridad sobre los métodos y procedimientos estadísticos que se utilizarán. Esto permite a los investigadores y a la comunidad científica comprender de manera transparente y concisa cómo se obtuvieron los resultados, facilitando la reproducibilidad de los análisis estadísticos por personal ajeno al equipo de investigación. Esto es esencial para validar y garantizar la fiabilidad de los hallazgos, contribuyendo a la confianza y a la credibilidad de la investigación biomédica6,7. Además, otra ventaja destacable en la elaboración de un Plan de Análisis Estadístico es la eficiencia resultante de la necesaria comunicación entre el estadístico y el investigador a la hora de elaborar dicho documento1. El hecho de que tanto el equipo investigador como el estadístico participen activamente en la elaboración de la planificación estadística que se llevará a cabo, ahorrará tiempo en las decisiones estadísticas y metodológicas que haya que tomar durante el proceso de análisis de datos. Si bien es cierto que la elaboración del SAP supone un tiempo de dedicación considerable, este será, sin duda, una inversión.
En resumen, la elaboración de un SAP en proyectos de investigación biomédica es esencial para garantizar la transparencia, la reproducibilidad, la objetividad y la validez de los análisis, al tiempo que promueve una comunicación efectiva entre los investigadores y estadísticos. Esto contribuye significativamente a la calidad y a la credibilidad del proyecto en cuestión.
¿Cuándo debe elaborarse el SAP?El SAP debe elaborarse o bien al mismo tiempo o bien poco después de terminar el protocolo8. En el caso de los estudios experimentales, si fuera necesario, el SAP puede ser actualizado hasta antes de abrir el ciego del estudio para garantizar la transparencia, el rigor y la validez de los análisis9. En los estudios observacionales prospectivos el SAP debería estar terminado antes de la inclusión del primer paciente10. Cuando el estudio es observacional retrospectivo también es recomendable disponer de un SAP y, en este caso, su versión debe ser definitiva antes de cerrar la base de datos para iniciar el análisis3. Un aspecto a considerar, sea cual sea la tipología de estudio, es detallar cada actualización con su debida versión fechada.
¿Cómo elaborar un SAP?Como hemos comentado anteriormente, dado el nivel de detalle y especificidad que exige el documento, es imprescindible que el personal investigador y la persona o personas que vayan a responsabilizarse del análisis estadístico colaboren en la elaboración del SAP. Existen publicaciones científicas que sirven de guía para elaborar los SAP3,9,10, e incluso una reciente publicación pone a disposición de la comunidad científica una extensa y completa plantilla con los distintos apartados a incluir y cómo deben cumplimentarse8.
Apartados que debe incluir un SAPEl Plan de Análisis Estadístico debe abordar distintos apartados con el objetivo de detallar la gestión estadística que se llevará a cabo para permitir que otros investigadores puedan replicar el análisis con conjuntos de datos similares. Existe cierto consenso entre la comunidad científica sobre las principales secciones y apartados que debe contener el SAP, gracias al trabajo de Gamble et al.9 en el año 2017:
- 1.
Información administrativa. Se incluye el título del proyecto, la versión del SAP y del protocolo, las distintas revisiones que haya habido, las firmas de aquellas personas implicadas en la elaboración del documento, así como sus roles.
- 2.
Introducción. En esta sección se contextualiza el proyecto con su justificación científica y las preguntas de investigación que tratarán de responderse.
- 3.
Diseño y métodos. Descripción detallada de la metodología del estudio. También se incluye en este apartado la justificación estadística del cálculo del tamaño de la muestra, así como los procedimientos de aleatorización que se vayan a realizar, en caso de que apliquen. Además, en este apartado se especifican los análisis intermedios que se planea realizar y los criterios para detener tempranamente el estudio en función de los resultados obtenidos en dichos análisis.
- 4.
Asunciones estadísticas. En esta sección se detallan tanto los intervalos de confianza como el nivel de significancia estadística que se va a asumir. Otro apartado que se incluye en esta sección es la definición de la adherencia, las desviaciones de protocolo y la población que se analizará (por intención de tratar, por protocolo, etc.).
- 5.
Población de estudio. Aquí quedan explicitados los criterios de elegibilidad de la muestra, así como el tiempo de seguimiento, la gestión de las pérdidas de seguimiento, etc. También se detallan las características basales que se recogerán para cada uno de los participantes del estudio.
- 6.
Análisis de los datos. Esta es la sección más amplia y detallada, ya que es donde se debe ampliar aquello expuesto en el protocolo. Deben quedar bien documentadas todas las variables que se van a analizar, primarias y secundarias, así como las unidades de medida para cada una de ellas. También se detallan todos los análisis estadísticos previstos para estas variables, la gestión de los datos faltantes (o missings) y el software estadístico que se empleará para el desarrollo del análisis.
Existen algunas pequeñas diferencias entre el contenido de un SAP según el tipo de estudio. En la tabla 1 se especifican los distintos apartados que se deben incluir en los ensayos clínicos aleatorizados, en los observacionales prospectivos y retrospectivos.
Secciones y apartados que debe contener el Plan de Análisis Estadístico para ensayos clínicos aleatorizados, estudios observacionales prospectivos y observacionales retrospectivos
| Tipo de estudio | ||||
|---|---|---|---|---|
| Secciones y apartados que debe contener el SAP | Ensayo clínico aleatorizado | Observacional prospectivo | Observacional retrospectivo | |
| 1 | Título del proyecto | X | X | X |
| 2 | Número de registro del estudio | X | ||
| 3 | Número y fecha de la versión del SAP | X | X | X |
| 4 | Versión del protocolo del estudio | X | X | X |
| 5 | Histórico de revisiones del SAP | X | X | X |
| 6 | Motivo de revisiones del SAP | X | X | X |
| 7 | Momento de las revisiones del SAP en relación con los análisis intermedios | X | X | |
| 8 | Colaboradores del SAP, con responsabilidades y roles | X | X | X |
| 9 | Nombre de la persona que redacta el SAP | X | X | X |
| 10 | Nombre del estadístico senior | X | X | X |
| 11 | Nombre del investigador principal | X | X | X |
| 12 | Antecedentes y justificación del estudio | X | X | X |
| 13 | Hipótesis y objetivos | X | X | X |
| 14 | Tipo de estudio | X | X | X |
| 15 | Detalles de la aleatorización | X | ||
| 16 | Cálculo y justificación del tamaño muestral, si aplica | X | X | X |
| 17 | Enfoque de las pruebas de hipótesis de superioridad, equivalencia o no inferioridad | X | ||
| 18 | Análisis intermedio, momento del análisis y persona que realiza el análisis, si aplica | X | X | |
| 19 | Ajuste del nivel de significancia debido al análisis intermedio | X | X | |
| 20 | Indicaciones para la finalización temprana del estudio | X | X | |
| 21 | Momento del análisis final | X | X | X |
| 22 | Calendario de visitas e intervalo de tiempo para evaluar cada resultado | X | X | |
| 23 | Niveles de significación estadística (valores p) y si es unilateral o bilateral | X | X | X |
| 24 | Plan y justificación del ajuste por multiplicidad, si procede, incluido cómo se controla el error de tipo 1 | X | X | X |
| 25 | Intervalos de confianza que deben notificarse y si son unilaterales o bilaterales | X | X | X |
| 26 | Definición de la adherencia a la intervención y cómo se presentará | X | ||
| 27 | Definición y resumen de las desviaciones del protocolo | X | X | |
| 28 | Definición de la población analizada | X | X | X |
| 29 | Informe de los datos de cribado para describir la representación de la población del estudio, si procede | X | X | X |
| 30 | Criterios de inclusión y exclusión | X | X | X |
| 31 | Estrategia para el reclutamiento | X | X | |
| 32 | Nivel y momento de la retirada temprana de los pacientes del estudio | X | X | |
| 33 | Presentación de los datos de retirada temprana y seguimiento | X | X | |
| 34 | Características basales de los pacientes y cómo se resumirán descriptivamente | X | X | X |
| [Los puntos 35-37 aplican a cada uno de los resultados primarios y secundarios] | ||||
| 35 | Definiciones de resultados y secuencia de medición | X | X | X |
| 36 | Medidas y unidades específicas para cada variable | X | X | X |
| 37 | Cálculos o transformaciones utilizados para obtener el resultado | X | X | X |
| 38 | Métodos de análisis utilizados | X | X | X |
| 39 | Presentación de los efectos del tratamiento o intervención | X | ||
| 40 | Covariables y ajustes | X | X | X |
| 41 | Métodos para comprobar los supuestos de distribución | X | X | X |
| 42 | Métodos alternativos utilizados si los supuestos de distribución no se cumplen | X | X | X |
| 43 | Análisis de sensibilidad para cada resultado, si procede | X | X | X |
| 44 | Definición y análisis de subgrupos, si procede | X | X | X |
| 45 | Método para la gestión de los datos faltantes (missings) | X | X | X |
| 46 | Análisis estadísticos adicionales, si procede | X | X | X |
| 47 | Detalles sobre el resumen de los datos de seguridad | X | X | |
| 48 | Paquetes estadísticos utilizados para el análisis | X | X | X |
| 49 | Referencia al procedimiento operativo estándar o a documentos adicionales | X | X | X |
Adaptación de Yuan et al.3, bajo permisos de licencia.





