La veracidad de las conclusiones alcanzadas por revisiones sistemáticas (RS) y metaanálisis está en gran parte determinada por la presencia de sesgo en los estudios empíricos que hayan sido incluidos. Es por ello que el análisis del riesgo de sesgo se ha convertido en una etapa ineludible en el proceso de realización de RS y metaanálisis, cuyos resultados se deben tener en cuenta para la interpretación de los hallazgos.
En el Manual Cochrane de revisiones sistemáticas de intervenciones, el sesgo o error sistemático se define como la desviación de los resultados de un estudio del verdadero efecto, bien de una intervención (o fuera del ámbito de la intervención, de un factor de exposición). El grado de sesgo puede ser variable y el efecto puede ser sobreestimado o infraestimado1. Los factores relacionados con el diseño y la realización del estudio y el análisis de los datos son los que dan lugar a estas amenazas contra la validez interna.
Dado que es imposible saber con certeza en qué medida los resultados de un estudio se han visto afectados por sesgos, se habla de «riesgo de sesgo». Es importante diferenciar este concepto de otros como la calidad metodológica o los estándares para la publicación (reporting standards). El primero hace referencia a escalas (generalmente cuantitativas) que valoran las características del diseño de un estudio, aunque han sido muy utilizadas para evaluar los estudios incluidos en una revisión, cada vez se usan menos debido a sus resultados controvertidos2. El segundo se refiere a los estándares para la publicación de informes de investigación y consisten en su mayoría en listas de verificación de la información que debe ser incluida en los diferentes tipos de estudios, un ejemplo sería la guía CONSORT (Consolidated Standards of Reporting Trials) para ensayos clínicos aleatorios.3
Para la evaluación del riesgo de sesgo en un estudio ha de tenerse en cuenta el diseño del estudio y el efecto (o desenlace) objeto de interés en la revisión. En función del diseño del estudio, se seleccionará la herramienta adecuada para la evaluación del riesgo de sesgo. En la tabla 1 se presentan algunas herramientas de uso frecuente para la evaluación del riesgo de sesgo en diferentes diseños.
Herramientas para la evaluación del riesgo de sesgo en RS y metaanálisis
| Herramienta | Diseños |
|---|---|
| RoB 24 | Ensayos clínicos aleatorios. Versiones para ensayos paralelos, cruzados y de conglomerados |
| ROBINS-I5 | Ensayos clínicos no aleatorizados |
| MINOR6 | Ensayos clínicos no aleatorizados (o de un solo grupo) |
| ROBINS-E7 | Estudios de cohortes prospectivas |
| Newcastle-Ottawa Scale (NOS)8 | Versiones para:Estudios de cohorte prospectivaEstudios de caso-control |
MINOR: methodological index for non-randomized studies; NOS: Newcastle-Ottawa Scale; ROBINS-E: Risk Of Bias In Non-randomized Studies - of Exposure; ROBINS-I: Risk Of Bias In Non-randomized Studies - of Interventions; RoB 2: revised tool for Risk of Bias in randomized trials; RS: revisiones sistemáticas.
Los estudios de intervención constituyen una de las principales fuentes de evidencia en el ámbito de la cirugía. Los ensayos clínicos aleatorios son los estudios de intervención cuyo diseño ofrece mayores garantías de validez interna, lo cual no significa que estén libres de sesgo. La Colaboración Cochrane ha señalado diferentes fuentes de procedencia del sesgo en los ensayos aleatorizados9: sesgo relacionado con el proceso de aleatorización, con las desviaciones de las intervenciones previstas, con la falta de datos de resultados, con la medición del resultado y con la selección del resultado informado (tabla 2).
Dominios para la evaluación del riesgo de sesgo en ensayos clínicos aleatorizados en la herramienta RoB 2 de la Colaboración Cochrane
| Dominio | Potenciales fuentes de sesgo |
|---|---|
| Proceso de aleatorización | Uso de elementos no aleatorios en la asignación, ausencia de doble ciego, o presencia de desequilibrios entre los grupos de comparación |
| Desviaciones de las intervenciones previstas | Cambios en las intervenciones previstas en el protocolo debido a factores del contexto del estudio |
| Falta de datos de resultados | Elevada mortalidad experimental. Falta de análisis por intención de tratamiento |
| Medición del resultado | Falta de adecuación de las medidas utilizadas para medir los resultados, utilización de diferentes medidas en los diferentes grupos, conocimiento de la intervención asignada en la aplicación de las medidas |
| Selección del resultado informado | Falta de coincidencia entre los análisis planeados en los protocolos y los publicados. Selección de la medida de resultado o del análisis de los datos en función de los resultados |
RoB 2: revised tool for Risk of Bias in randomized trials.
Asimismo, la dificultad para la realización de estudios aleatorizados en el ámbito de la cirugía ha llevado al desarrollo de otras herramientas específicas en este ámbito, para la valoración del riesgo de sesgo en estudios de intervención cuasiexperimentales con o sin grupos de comparación6.
Tanto en la medicina en general, como en el ámbito de la cirugía en particular, los factores ambientales, sociales y comportamentales tienen importantes efectos en la salud7, por lo que mucha de la evidencia proviene de investigaciones con metodologías no experimentales. Las escalas Newcastle-Ottawa son las más utilizadas hasta el momento en estudios de cohortes y caso-control, en estas, los aspectos que se consideran más relevantes para la evaluación del riesgo de sesgo son la selección de los grupos de interés, la comparabilidad de los grupos y la determinación de la exposición8.
Una de las principales dificultades para valorar el riesgo de sesgo en un estudio es la falta de información. Por ejemplo, aunque los autores de un ensayo clínico definan este como aleatorio, los procedimientos de aleatorización y ocultación de la condición experimental a los participantes y los investigadores no son descritos con detalle10. Un mayor conocimiento de las potenciales fuentes de sesgo, así como los esfuerzos para minimizar sus efectos llevarán a que los resultados de los estudios empíricos, y por ende de las RS y los metaanálisis, reflejen de forma más precisa el verdadero efecto de interés.






