Analizar la capacidad predictiva de mortalidad de las principales escalas pronósticas (NEWS, qSOFA, GYM) empleadas en los servicios de urgencias hospitalarios (SUH) en pacientes ancianos que acuden por procesos infecciosos.
MétodoSe incluyeron todos los pacientes de ≥65años que acudieron a 52 SUH españoles por un proceso infeccioso entre el 1 y el 7 de abril de 2019 (cohorte EDEN [Emergency Department and Elder Needs]) y entre el 30 de marzo y el 5 de abril de 2020 (cohorte EDEN-COVID). Se consignaron variables demográficas, comorbilidad, situación funcional y datos clínicos relacionados con las escalas. Se estimó la capacidad predictiva para mortalidad a 30días de cada escala calculando el área bajo la curva (ABC) de la característica operativa del receptor (COR), y se calcularon la sensibilidad y la especificidad para diferentes puntos de corte.
ResultadosSe analizaron 6.054 pacientes (edad mediana: 80años; 45,3% mujeres). Fallecieron 993 pacientes (16,4%). La escala NEWS tuvo mejor ABC de las curvas COR que qSOFA (0,765; IC95%: 0,725-0,806, versus 0,700; IC95%: 0,653-0,746; p<0,001) y que GYM (0,716; IC95%: 0,675-0,758; p=0,024), y no hubo diferencia entre qSOFA y GYM (p=0,345). En la escala GYM el punto de corte GYM ≥1 destacó como el más sensible, mientras que en la escala qSOFA el punto de corte ≥2 presentó una alta especificidad. La escala NEWS ≥4 presentó una alta sensibilidad, mientras que NEWS ≥8 presentó una alta especificidad.
ConclusiónLa escala NEWS mostró la mayor capacidad predictiva de mortalidad a 30días. La escala GYM con punto de corte en 1punto o más presentó una gran sensibilidad. La escala qSOFA se caracterizó por una mayor especificidad, pero una menor sensibilidad.
To analyze the prognostic accuracy of the scores NEWS, qSOFA, GYM used in hospital emergency department (ED) in the assessment of elderly patients who consult for an infectious disease.
MethodsData from the EDEN (Emergency Department and Elderly Needs) cohort were used. This retrospective cohort included all patients aged ≥65years seen in 52 Spanish EDs during two weeks (from 1/4/2019 to 7/4/2019 and 30/3/2020 to 5/4/2020) with an infectious disease diagnosis in the emergency department. Demographic variables, comorbidities, Charlson and Barthel index and needed scores parameters were recorded. The predictive capacity for 30-day mortality of each scale was estimated by calculating the area under the receiver operating characteristic (ROC) curve, and sensitivity and specificity were calculated for different cut-off points. The primary outcome variable was 30-day mortality.
ResultsSix thousand fifty-four patients were analyzed. Median age was 80years (IQR 73-87) and 45.3% women. Nine hundred and ninety-three (16.4%) patients died. NEWS score had better AUC than qSOFA (0.765; 95%CI: 0.725-0.806, vs. 0.700; 95%CI: 0.653-0.746; P<.001) and GYM (0.716; 95%CI: 0.675-0.758; P=.024), and there was no difference between qSOFA and GYM (P=.345). The highest sensitivity scores for 30-day mortality were GYM ≥1 point (85.4%) while the qSOFA score ≥2 points showed high specificity. In the case of the NEWS scale, the cut-off point ≥4 showed high sensitivity, while the cut-off point NEWS ≥8 showed high specificity.
ConclusionNEWS score showed the highest predictive capacity for 30-day mortality. GYM score ≥1 showed a great sensitivity, while qSOFA ≥2 scores provide the highest specificity but lower sensitivity.
Desde hace décadas se ha realizado un gran esfuerzo por parte de la comunidad científica para poder establecer el pronóstico de los pacientes con un proceso infeccioso, especialmente en situaciones de sepsis. En ese sentido se plantearon las primeras definiciones de sepsis en base a los criterios del Systemic Inflammatory Response Syndrome (SIRS)1. Sin embargo, las limitaciones de esta escala en cuanto a su especificidad y el cambio en la definición de sepsis en 2016, en el que la presencia de disfunción orgánica pasó a ser la piedra angular, obligó a analizar nuevos métodos de cribado2. Así pues, la escala quick Sepsis-related Organ Failure Assessment (qSOFA) se introdujo con la nueva definición Sepsis-33. Sin embargo, en estudios posteriores se hizo patente la limitada sensibilidad de qSOFA4,5. Esto ha llevado a analizar otras escalas con mejor capacidad predictiva. Entre ellas destaca la escala National Early Warning Score (NEWS), caracterizada por valorar siete parámetros vitales con el objetivo de cuantificar la situación clínica del paciente6. Desde entonces, varios estudios han sugerido que escalas como NEWS podrían ser una mejor herramienta de cribado para el paciente séptico7,8. La mayor parte de estos trabajos son realizados en pacientes relativamente jóvenes, por lo que su utilidad para identificar al paciente mayor de alto riesgo puede verse afectada por otros factores asociados a este grupo etario. Este es el caso de la comorbilidad y la dependencia funcional, aspectos que influyen en la fragilidad de estos pacientes que con frecuencia se ven abocados a acudir a los servicios de urgencias hospitalarios (SUH), lo que obliga a estos servicios al reto de adaptarse para asegurar una óptima atención9,10. Por ese motivo, un estudio realizado en España, en el que se analizaban pacientes de más de 75años, reveló que las variables supuestamente asociadas a mortalidad a 30días eran la comorbilidad, la taquipnea y la alteración del estado mental. Ello permitió definir la escala Glasgow coma score <15, tachypnea, severe co-Morbidity (GYM) como herramienta con buena capacidad para predecir mortalidad a 30días11. En un estudio posterior se analizó la comparación de esta escala con qSOFA y SIRS, presentando una mejor sensibilidad y postulándose como una alternativa de cribado del paciente de mayor edad con infección para predecir fallecimiento a los 30días12.
Teniendo en cuenta estos datos, el objetivo del presente estudio fue analizar en el paciente de mayor edad (≥65años) la capacidad predictiva de las principales escalas pronósticas (NEWS, qSOFA, GYM) empleadas en la valoración de los pacientes que acuden a los SUH debido a un proceso infeccioso.
MétodoDescripción de la red SIESTA y el proyecto EDENLa red SIESTA (Spanish Investigators in Emergency Situations TeAm) está formada por investigadores que desempeñan su actividad en los SUH y tiene como finalidad principal afrontar retos investigadores multidisciplinares de práctica clínica relacionados con la medicina de urgencias y emergencias desde una perspectiva multicéntrica con una amplia representación de SUH españoles. La red SIESTA se creó en 202013. Su primer reto investigador lo constituyó el reto COVID-19, en el que participaron 62SUH (aproximadamente el 20% de SUH públicos españoles). Los resultados de dicho reto han sido recientemente publicados14.
El reto EDEN es el segundo proyecto de la red de investigación SIESTA que tiene el objetivo de proporcionar un conocimiento amplio acerca de aspectos clínicos, sociodemográficos, organizativos, asistenciales y evolutivos de la población de 65 o más años atendida en los SUH españoles. Para ello, se creó un registro multipropósito que incluyó a todos los pacientes que consultaron en los SUH de los hospitales integrantes de la red, independientemente del motivo de consulta, durante un periodo pre-COVID (1 al 7 de abril de 2019, cohorte EDEN) y otro durante la primera ola pandémica de COVID-19 (30 de marzo-5 de abril de 2020, cohorte EDEN-COVID). Finalmente completaron la inclusión de todos sus pacientes 52SUH participantes en el estudio. Se recogieron una serie de variables primarias correspondientes a la visita índice. El seguimiento se realizó de forma telemática mediante la consulta de la historia clínica del paciente y el registro de las variables se realizó mediante un cuaderno de recogida de datos electrónico. Los detalles extendidos del proyecto se han descrito previamente en dos artículos publicados15,16.
Diseño del estudio EDEN-5El estudio EDEN-5 se diseñó específicamente para analizar la capacidad predictiva de las principales escalas pronósticas empleadas en la valoración de los pacientes que acuden a urgencias debido a un proceso infeccioso. Estas escalas incluyen qSOFA, NEWS y GYM. Para ello se incluyeron todos los pacientes del registro EDEN (52 hospitales participantes) que presentaban un diagnóstico de sospecha de un proceso infeccioso a su llegada a urgencias y que recibieron tratamiento antibiótico. No se incluyeron pacientes en los que se hiciera mención expresa de limitación de esfuerzo terapéutico. Para el análisis de las escalas se analizaron exclusivamente aquellos pacientes que contaban con todos los ítems necesarios para el cálculo, siendo la principal causa de exclusión la ausencia de datos necesarios en la historia clínica en algún ítem requerido para el cálculo de estas escalas.
Se analizaron dos variables demográficas (edad y sexo), 22 antecedentes de patologías previas, el índice de comorbilidad de Charlson —que se clasificó como no comorbilidad (0 puntos), comorbilidad leve (1-2 puntos), moderada (3-4 puntos) y grave (≥5 puntos)—, así como la situación funcional basal según el índice de Barthel (IB), considerando situación basal independiente (IB=100), dependencia leve-moderada (IB<100 y ≥60) y dependencia grave (IB<60). Además, se obtuvieron datos sobre aspectos clínicos relacionados con las escalas pronósticas (presión arterial, nivel de consciencia según la escala de Glasgow, frecuencia respiratoria, temperatura, saturación de O2, necesidad de oxígeno suplementario y frecuencia cardiaca) y se estableció el modelo de infección en base a los diagnósticos obtenidos por la codificación CIE-10 en aquellos casos en los que estaba disponible. La variable resultado fue la mortalidad por cualquier causa a los 30días.
Las escalas pronósticas fueron calculadas en función de sus parámetros definitorios3,8,12. Se consideraron como valores de corte aquellos asociados en la bibliografía a mal pronóstico (qSOFA ≥2, NEWS ≥5, NEWS ≥7, GYM ≥1 y GYM ≥2puntos6,11,12,17.
Análisis estadísticoLas variables cualitativas se expresaron con valores absolutos y relativos. Las variables cuantitativas ajustadas a una distribución simétrica se muestran con la media y la desviación estándar, o con la mediana y el rango intercuartil (RIC) si no se ajustan a dicha distribución. Las diferencias entre grupos se evaluaron mediante la prueba de ji-cuadrado (o la prueba exacta de Fisher si fue necesario) para las variables cualitativas y la prueba no paramétrica de Mann-Whitney para las variables cuantitativas. La magnitud de las asociaciones se expresó como odds ratio (OR) sin ajustar con un intervalo de confianza (IC) del 95%. Se construyó la curva de la característica operativa del receptor (COR) para las escalas qSOFA, NEWS y GYM. Se presentaron de cada una de ellas las áreas bajo la curva (ABC) y su intervalo de confianza del 95% (IC95%) y se analizaron las diferencias estadísticas comparando las curvas COR mediante el test de Delong. Además, se calcularon la sensibilidad (Se), la especificidad (E) y los valores predictivos positivo y negativo (VPP y VPN, respectivamente), los cocientes de verosimilitud positiva y negativa (CVP y CVN, respectivamente) y los intervalos de confianza (IC) del 95% para las diferentes puntuaciones de cada escala. La comparativa de proporciones se realizó con el test de McNemar para los valores de qSOFA, NEWS y GYM según los diferentes puntos de corte. Para todas las pruebas se aceptó un valor de significación de p<0,05. Todo el procesamiento estadístico se realizó mediante el paquete estadístico SPSS Statistics v.26 (IBM, Armonk, Nueva York, EE.UU.) y STATA v14.
Consideraciones éticasEl proyecto EDEN fue aprobado por el Comité Ético en Investigación Clínica del Hospital Clínico San Carlos de Madrid (protocolo HCSC/22/005-E). La creación de la cohorte EDEN y los trabajos que emanan de ella han seguido en todo momento los principios éticos de la Declaración de Helsinki.
ResultadosDe los 35.709 pacientes atendidos durante ambos periodos de estudio, 6.054 (16,95%) acudieron a los SUH por un cuadro infeccioso, de los cuales 3.139 (51,8%) casos correspondieron al periodo pre-COVID (cohorte EDEN) y 2.915 (48,14) al periodo COVID (cohorte EDEN-COVID) (fig. 1). La mediana de edad fue de 80años (RIC: 73-87) y el 45,3% fueron mujeres, siendo las comorbilidades más frecuentes la hipertensión arterial (73%), la dislipemia (51,6%), la diabetes mellitus (33%) y la enfermedad pulmonar obstructiva crónica (EPOC) (26,6%). Se observó comorbilidad moderada o grave en el 44,8%, siendo la comorbilidad significativamente mayor en el periodo pre-COVID (p de tendencia lineal <0,001). Así mismo, la situación de dependencia funcional fue mayor en el periodo pre-COVID (p de tendencia lineal <0,001) (tabla 1). El modelo de infección más frecuente en los dos periodos fue el respiratorio, siendo significativamente mayor en el periodo COVID (1.261 [47,3%] pacientes en periodo pre-COVID vs 2.070 [88,3%] en periodo COVID; p<0,001) a expensas del diagnóstico de infección por SARS-CoV-2 (1.236 [52,8%] pacientes) y en detrimento del resto de modelos de infección (tabla 2).
Comorbilidad y grado de dependencia en ambos periodos del estudio
Todos los pacientesn=6.054n (%) | Periodo pre-COVIDn=3.139n (%) | Periodo COVIDn=2.915n (%) | p (tendencia lineal) | |
---|---|---|---|---|
Índice de Comorbilidad de Charlson | p<0,001 | |||
Sin comorbilidad (0 puntos | 974 (16,1) | 368 (11,7) | 606 (20,8) | |
Comorbilidad leve (1-2 puntos) | 2.366 (39,1) | 1.192 (38) | 1.174 (40,3) | |
Comorbilidad moderada (3-4 puntos) | 1.502 (24,8) | 873 (27,8) | 629 (21,6) | |
Comorbilidad grave (≥ 5 puntos) | 1.212 (20) | 706 (22,5) | 506 (8,4) | |
Situación basal - Índice de Barthel | p<0,001 | |||
Independiente (100 puntos) | 3.269 (54) | 1.525 (48,6) | 1.744 (59,8) | |
Dependencia leve-moderada (60-95 puntos) | 1.720 (28,4) | 970 (30,9) | 750 (25,7) | |
Dependencia grave (< 60 puntos) | 1.165 (17,5) | 644 (20,5) | 421 (14,4) |
Modelos de infección obtenidos en la codificación diagnóstica CIE-10
Todos los pacientesn=6.054n (%) | Periodo pre-COVIDn=3.139n (%) | Periodo COVIDn=2.915n (%) | p | |
---|---|---|---|---|
Modelo de infección | ||||
Respiratorio | 4.060 (67,1) | 1.485 (47,3) | 2.575 (88,3)a | p<0,001 |
Urinario | 515 (8,5) | 386 (12,3) | 129 (4,4) | p<0,001 |
Piel y partes blandas | 135 (2,2) | 110 (3,5) | 25 (0,9) | p<0,001 |
Abdominal | 393 (6,5) | 282 (9) | 111 (3,8) | p<0,001 |
Otros | 950 (15,7) | 876 (27,9) | 74 (2,5) | p<0,001 |
Del global de pacientes analizados fallecieron 993 (16,5%): 365 (11,6%) en el periodo pre-COVID y 628 (21,5%) en el periodo COVID, siendo estas diferencias estadísticamente significativas (p<0,001). El ABC global para mortalidad a los 30días de la escala NEWS fue 0,765 (IC95%: 0,725-0,806; p<0,001), 0,70 (IC95%: 0,653-0,746) para la escala qSOFA y 0,716 en la escala GYM (IC95%: 0,675-0,758; p<0,001). Las diferencias estadísticas comparando las curvas COR fueron: qSOFA vs NEWS, p<0,001; GYM vs NEWS, p=0,024; qSOFA vs GYM, p=0,345 (fig. 2). Los resultados de curvas COR y ABC de escalas qSOFA, NEWS y GYM desglosados por edad, periodo, comorbilidad, dependencia y sexo se muestran en la tabla 3. Destacar que la escala NEWS presenta mayor ABC frente a GYM y qSOFA en todos los desgloses realizados.
Resultado de curvas COR de escalas qSOFA, NEWS y GYM.
El ABC-COR para mortalidad a los 30 días de la escala NEWS fue 0,765 (IC95%: 0,725-0,806; p<0,001), siendo 0,70 (IC95%: 0,653-0,746) de la escala qSOFA y 0,716 de la escala GYM (IC95%: 0,675-0,758; p<0,001). Las diferencias estadísticas comparando las curvas de rendimiento diagnóstico (COR) fueron: qSOFA vs NEWS p<0,001; GYM vs NEWS p=0,024; qSOFA vs GYM p=0,345.
Resultado de curvas COR y ABC de escalas qSOFA, NEWS y GYM por edad, periodo, comorbilidad, dependencia y sexo en relación con la predicción de mortalidad a 30 días
NEWS | GYM | qSOFA | |
---|---|---|---|
ABC (IC) | ABC (IC) | ABC (IC) | |
Por edad | |||
0,79(0,72-0,86) | 0,76(0,69-0,82) | 0,72a(0,64-0,79) | |
80-89 años | 0,72(0,65-0,78) | 0,69(0,62-0,76) | 0,67(0,60-0,75) |
≥ 90 años | 0,76(0,67-0,86) | 0,66a(0,55-0,76) | 0,67a(0,58-0,78) |
Por periodo | |||
Pre-COVID | 0,76(0,69-0,83) | 0,71(0,65-0,78) | 0,67a(0,60-0,75) |
COVID | 0,76(0,71-0,82) | 0,73(0,67-0,78) | 0,71a(0,65-0,77) |
Por comorbilidad (índice de Charlson) | |||
No comorbilidad | 0,87(0,79-0,95) | 0,72a(0,59-0,89) | 0,75a(0,60-0,90) |
Comorbilidad leve | 0,83(0,77-0,89) | 0,74a(0,66-0,81) | 0,77a(0,70-0,84) |
Comorbilidad moderada | 0,71(0,63-0,79) | 0,64a(0,56-0,72) | 0,62a(0,54-0,70) |
Comorbilidad grave | 0,72(0,64-0,80) | 0,65a(0,58-0,73) | 0,67(0,59-0,75) |
Por dependencia (índice de Barthel) | |||
Independiente | 0,79(0,68-0,83) | 0,80(0,74-0,87) | 0,76(0,68-0,83) |
Dependencia leve-moderada | 0,73(0,66-0,79) | 0,65a(0,58-0,72) | 0,66a(0,59-0,73) |
Dependencia grave | 0,70(0,62-0,78) | 0,60a(0,519-0,68) | 0,63a(0,55-0,71) |
Por sexo | |||
Varón | 0,75(0,69-0,81) | 0,73(0,68-0,78) | 0,70a(0,65-0,76) |
Mujer | 0,78(0,72-0,83) | 0,69a(0,62-0,75) | 0,69a(0,62-0,76) |
En la tabla 4 se describen la sensibilidad, la especificidad, el VPP, el VPN y los cocientes de verosimilitud positivos (CVP) y negativos (CVN) de cada uno de los puntos de corte para las tres escalas. En la escala GYM el punto de corte GYM ≥1 destacó como el más sensible, con CVN de 0,33, mientras que en la escala qSOFA el punto de corte qSOFA ≥2 presentó una alta especificidad con CVP >3. En el caso de la escala NEWS, el punto de corte NEWS ≥4 presentó una alta sensibilidad, con CVN<0,3, mientras que el punto de corte NEWS ≥8 presentó una alta especificidad, con CVP>3.
Capacidad predictiva de mortalidad a 30 días de las diferentes escalas qSOFA, NEWS y GYM en función de los diferentes puntos de corte
Escalas, n (%) | Se %(IC 95%) | Es %(IC 95%) | VPP %(IC 95%) | VPN %(IC 95%) | Cociente de verosimilitud positivo | Cociente de verosimilitud negativo |
---|---|---|---|---|---|---|
qSOFA | ||||||
≥ 1n=1.196 (39,9) | 34,74(31,8-37,8) | 83,19(82,12-84,2) | 28,85(26,31-31,52) | 86,66(85,67-87-6) | 2,07(1,86-2,29) | 0,78(0,75-0,82) |
≥ 2n=217 (7,2) | 21,57(18,22-25,34) | 95,7(94,83-96,43) | 50,60(43,86-57,5) | 85,61(84,23-86,88) | 5,01(3,91-6,42) | 0,82(0,78-0,86) |
≥ 3n=28 (0,9) | 2,01(1,27-3,15) | 99,84(99,68-99,93) | 71,43(51,13-86,05) | 83,85(82,89-84,77) | 12,74(5,63-28,85) | 0,98(0,97-0,99) |
NEWS | ||||||
≥ 1n=835 (96,9) | 98,91(95,69-99,81) | 3,68(2,45-5,47) | 21,68(18,96-24,66) | 92,59(74,25-98,71) | 1,03(1,01-1,05) | 0,3(0,07-1,24) |
≥ 2n=716 (83,1) | 95,08(90,58-97,58) | 20,18(17,26-23,44) | 24,3(21,24-27,65) | 93,84(88,27-96,96) | 1,19(1,13-1,25) | 0,29(0,13-0,47) |
≥ 3n=601 (69,7) | 90,71(85,31-94,33) | 35,94(32,34-39,94) | 27,62(24,12-31,41) | 93,49(89,59-96,04) | 1,42(1,32-1,52) | 0,26(0,16-0,41) |
≥ 4n=513 (59,5) | 86,34(80,3-90,8) | 47,72(43,91-51,55) | 30,8(26,87-35,02) | 92,84(89,47-95,22) | 1,65(1,51-1,81) | 0,29(0,2-0,42) |
≥ 5n=399 (46,3) | 77,6(71,02-83,03) | 62,15(58,44-65,72) | 35,59(30,93-40,53) | 91,14(88,09-93,50) | 2,05(1,81-2,32) | 0,36(0,27-0,48) |
≥ 6n=313 (36,3) | 69,4(62,2-75,87) | 72,61(69,06-75,9) | 40,58(35,13-46,26) | 89,80(86,88-92,14) | 2,53(2,17-2,96) | 0,42(034-0,53) |
≥ 7n=247(28,7) | 57,92(50,68-64,84) | 79,23(76,02-82,12)) | 42,91(36,70-49,35) | 87,48(84,54-89,94) | 2,79(2,3-3,38) | 0,53(0,45-0,63) |
≥ 8n=185 (21,5) | 50,27(42,83-57,7) | 84,13(80,86-86,94) | 49,73(42,34-57,13) | 84,42(81,16-87,21) | 3,17(2,5-4,01) | 0,59(0,51-0,69) |
≥ 9n=132 (15,5) | 39,34(32,3-46,85) | 91,16(88,71-93,14) | 54,55(45,67-63,15) | 84,79(81,94-87,28) | 4,45(3,29-6,02) | 0,67(0,59-0,75) |
≥ 10n=103 (11,9) | 31,69(25,14-39,04) | 93,22(90,97-94,96) | 56,31(46,2-65,95) | 83,2(80,27-85,78) | 4,68(3,28-6,66) | 0,73(0,66-0,81) |
≥ 11n=61 (7,1) | 20,22(14,8-26,92) | 96,47(94,71-97,67) | 60,66(47,31-72,66) | 81,77(78,88-84,35) | 5,72(3,51-9,31) | 0,82(0,77-0,89) |
≥ 12n=43 (5) | 15,85(11,03-22,14) | 97,94(96,48-98,82) | 67,44(51,34-80,46) | 81,2(78,31-83,78) | 7,69(4,15-14,24) | 0,86(0,81-0,92) |
≥ 13n=33 (3,8) | 13,11(8,75-19,08) | 98,67(97,41-99,35) | 72,73(54,21-86,06) | 80,82(77,94-83,41) | 9,89(4,68-20,92) | 0,88(0,83-0,93) |
≥ 14n=22 (2,6) | 9,29(5,67-14,69) | 99,26(98,19-99,73) | 77,27(54,18-91,31) | 80,24(77,35-82,85) | 12,62(4,72-33,74) | 0,91(0,87-0,96) |
≥ 15n=11(2,3) | 4,92(2,42-9,42) | 99,71(98,82-99,95) | 81,82(47,75-96,79) | 79,55(76,65-82,18) | 16,7(3,64-76-61) | 0,95(0,92-0,99) |
≥ 16n=3(0,3) | 1,64(0,42-5,1) | 100(99,3-99,99) | 100(31-96,82) | 79,05(76,14-81,69) | − | 0,98(0,97-1) |
≥ 17n=2(0,2) | 1,09(0,19-4,31) | 100(99,3-99,99) | 100(19,79-95,11) | 78,95(76,04-81,6) | − | 0,99(0,97-1) |
GYM | ||||||
≥ 1n=1955(61,3) | 85,45(82,11-88,27) | 43,45(41,55-45,36) | 23,43(21,58-25,38) | 93,65(92,1-94,92) | 1,51(1,44-1,59) | 0,33(0,27-0,41) |
≥ 2n=574(18) | 39,37(35,23-43,66) | 86,29(84,92-87,54) | 36,76(32,83-40,87) | 87,54(86,2-88,77) | 2,87(2,49-3,31) | 0,7(0,66-0,75) |
≥ 3n=68(2,1) | 7,84(5,77-10,53) | 99,02(98,54-99,34) | 61,76(49,15-73,05) | 84,14(82,8-85,4) | 7,98(4,94-12,89) | 0,93(0,91-0,95) |
Es: especificidad; Se: sensibilidad; VPP: valor predictivo positivo; VPN: valor predictivo negativo.
En negrita los puntos de corte empleados en la bibliografía como los principales puntos de corte.
En el presente estudio se comparan las principales escalas pronósticas empleadas en la detección precoz del paciente grave infectado aplicadas al subgrupo de pacientes de mayor edad. En nuestro estudio la escala NEWS presentó la mejor capacidad predictiva de mortalidad respecto a las escalas GYM y qSOFA a nivel global. En los últimos años se han publicado varios estudios que comparaban las escalas qSOFA y NEWS con resultados similares, aunque realizados por lo general en una población etaria más joven17,18. De hecho, Churpek et al.19 analizaron fuera del ámbito de la unidad de cuidados intensivos la escala NEWS frente a la escala qSOFA y SIRS, obteniendo un ABC similar a la de nuestro estudio, si bien dicho estudio fue realizado en pacientes con una edad media en torno a los 58años, donde incluían no solo pacientes valorados en los SUH sino también en las plantas de hospitalización. Del mismo modo, Usman et al.20 compararon en los SUH la escala NEWS frente a qSOFA y SIRS en pacientes más jóvenes, presentando mejor capacidad predictiva de la primera (ABC: 0,91) para la detección de sepsis o shock séptico (S/SS). Sin embargo, en el presente estudio no se analizó la probabilidad de S/SS, sino que la variable resultado estudiada fue la mortalidad a 30días. Por otro lado, Arévalo-Buitrago et al.21 publicaron recientemente un estudio realizado en España en el que analizaban la capacidad de una variante de esta escala (NEWS-2) como predictor de ingreso hospitalario y de aparición de eventos adversos (EA) desde el triaje de los SUH en pacientes de la población general que acudían a urgencias, demostrando una excelente capacidad predictiva de ingreso en la UCI, de mortalidad, así como de ingreso hospitalario. En cualquier caso, la mayoría de los estudios publicados son realizados en una población de menor edad que el considerado en nuestro estudio. En ese sentido, González del Castillo et al.11 publicaron un trabajo en el que se analizaban los factores asociados a mortalidad en pacientes ancianos, proponiendo la escala GYM como alternativa a SIRS para predecir mortalidad. Del mismo modo, en un posterior trabajo se comparó dicha escala con qSOFA, evidenciando un ABC de 0,73 frente a 0,69, respectivamente12. Estos resultados son similares a los obtenidos en nuestro estudio, en el cual, si bien la escala GYM presenta un ABC algo mayor, las diferencias frente a qSOFA no fueron estadísticamente significativas. Por otro lado, no hemos encontrado bibliografía en la que se realice la comparación pronóstica entre la escala GYM y la escala NEWS en pacientes de cualquier edad. En el estudio EDEN-5 la capacidad predictiva de mortalidad de la escala NEWS fue mayor que la de la escala GYM. Este aspecto podría ser esperable, ya que la escala GYM y la escala qSOFA comparten dos de los tres ítems de que se componen, alguno de los cuales son parámetros que representan habitualmente síntomas de fallo orgánico tardío, como la alteración del estado mental. Del mismo modo, a pesar de que la escala GYM presentó un ABC superior a la escala qSOFA, estas diferencias no resultaron estadísticamente significativas. Por otro lado, el análisis del ABC del presente estudio se hizo teniendo en cuenta aspectos relacionados con la edad, el periodo de estudio, la comorbilidad, la situación funcional y el sexo. En todos los análisis realizados, la escala NEWS mostró la mejor capacidad predictiva para mortalidad, sin evidenciarse diferencias significativas entre las escalas GYM y qSOFA. Por ese motivo, en nuestro estudio cabría destacar que la escala NEWS mantuvo una buena capacidad predictiva, independientemente de aspectos como la edad, el sexo, la situación de dependencia funcional o la comorbilidad.
En relación con la sensibilidad de las escalas estudiadas, cabe destacar que la escala GYM con el punto de corte en 1punto fue una de las de mayor sensibilidad, junto a la escala NEWS, usando esta como punto de corte los 4 puntos. Sin embargo, la escala qSOFA fue la de menor sensibilidad en cualquiera de sus puntos de corte. Estos resultados son similares al estudio de González del Castillo et al.12, donde la escala GYM se postulaba como un buen método de cribado en ancianos en virtud a su mayor sensibilidad. Así mismo, la baja sensibilidad del qSOFA para predecir muerte ha sido constatada en diferentes trabajos4,19,20,22. Esto ha llevado a algunos autores a no recomendar la utilización de la escala qSOFA como único método de cribado de sepsis debido a su baja sensibilidad23. Así, Serafim et al.4 comparan en su metaanálisis la capacidad predictiva de qSOFA frente a SIRS, en la que se constató la menor sensibilidad de la primera para detectar sepsis, aunque una mayor capacidad predictiva de mortalidad intrahospitalaria, especialmente basándose en su gran especificidad; sin embargo, no se compararon otras escalas empleadas en el presente estudio. Por otro lado, en un metaanálisis y revisión sistemática realizada por Fernando et al.22 se analizaron la sensibilidad y la especificidad de qSOFA, y se diferenciaron los pacientes provenientes de los SUH, donde la sensibilidad y la especificidad fueron del 46% y del 81%, respectivamente. Sin embargo, los autores no realizaron distinciones con relación a la edad de los pacientes. En nuestro estudio se obtuvo una sensibilidad de qSOFA menor a estos datos, aunque similar a la de estudios realizados en pacientes de mayor edad12.
Por otro lado, la escala NEWS se ha utilizado ampliamente en la bibliografía con los puntos de corte en 5 y 7puntos. Este aspecto ha sido analizado en varios trabajos, donde se constata la gran sensibilidad del punto de corte ≥5 puntos (Se: 87%-89%, Es: 40%-42%) así como su excelente valor predictivo negativo17,18. Por ese motivo, algunos autores han planteado recomendar la utilización de la escala NEWS como test de cribado para la detección de sepsis en los SUH desde la primera atención en el triaje20. Así mismo, nuestros resultados son acordes a la recomendación de las guías de la Surviving Sepsis Campaign (SSC) 2021, que se postula en contra del uso de qSOFA comparado con SIRS, NEWS o Modified Early Warning Score (MEWS) como única herramienta de cribado para la detección de sepsis o shock séptico23. En el estudio EDEN-5, la escala NEWS con corte en ≥5puntos presentó una buena sensibilidad, con mayor especificidad que la escala GYM ≥1. Sin embargo, obtuvimos como puntos de corte óptimos puntuaciones de NEWS ≥4 y ≥8puntos, respectivamente. Estos puntos de corte han sido también referidos en el estudio de Usman et al.20, en el que comparaban las escalas SIRS, qSOFA y NEWS para la identificación precoz de sepsis en los SUH. En el mencionado trabajo plantearon además que NEWS podría ofrecer una mayor flexibilidad de puntuación en relación con SIRS y qSOFA, al permitir la creación de múltiples categorías de gravedad desde bajo y moderado hasta alto riesgo, sugiriendo la obtención de lactato en casos de riesgo moderado y una estrategia de diagnóstico y tratamiento precoz en aquellos con riesgo alto.
En relación con la especificidad, la escala qSOFA fue la de mayor especificidad en el estudio EDEN-5. Estos datos son similares a los de estudios previos publicados, en los que la escala qSOFA gozaba de una alta especificidad4,17-20,22. Por otro lado, la utilidad de escala GYM se ha planteado fundamentalmente en base a su alta sensibilidad cuando el punto de corte se encuentra en 1punto12. Sin embargo, en el presente estudio se observó una gran especificidad cuando el punto de corte se encontraba en 2puntos, si bien dicha especificidad fue algo menor a la de la escala qSOFA. En el caso de la escala NEWS con punto de corte en ≥8puntos, cabe destacar su mayor especificidad. Este aspecto ha sido reflejado en publicaciones como la de Liu et al.24, en la que destacaba la alta especificidad de la escala NEWS, con mejor perfil de sensibilidad incluso usando un punto de corte en ≥8 puntos.
Finalmente, consideramos que las tres escalas se basan en parámetros accesibles y fácilmente medibles desde la cabecera del paciente o desde el tiraje, lo que hace que sean aplicables desde la primera atención del paciente, aspecto especialmente útil para la atención en los SUH o incluso para la atención extrahospitalaria. En ese sentido las puntuaciones más sensibles de estas escalas, como el caso de GYM ≥1 o NEWS ≥4 puntos, aportan la capacidad de detectar precozmente al paciente con peor pronóstico, lo que permitiría iniciar las medidas diagnósticas y terapéuticas adecuadas con el fin de mejorar la supervivencia del paciente. Esto podría incluir la activación del código sepsis tanto desde el ámbito hospitalario como desde el extrahospitalario, coordinado con los servicios implicados en los protocolos de sepsis. Si bien en nuestro estudio no se analizó la capacidad predictiva de estas escalas en relación con la probabilidad de sepsis, entendemos que la capacidad de las mismas para la detección de muerte supone un adecuado cribado para seleccionar aquellos casos sobre los puedan iniciar medidas terapéuticas precoces y que posteriormente podrán ser categorizados como sepsis tras la obtención de todos los resultados diagnósticos necesarios.
LimitacionesEl presente estudio tiene varias limitaciones. En primer lugar, los 52SUH que han aportado pacientes al registro EDEN no fueron escogidos al azar, sino que mostraron su disponibilidad a participar. Sin embargo, la amplia representación, tanto territorial (14 de las 17 comunidades autónomas estaban representadas) como en tipología (hospitales universitarios, de alta tecnología y comarcales), hace que el sesgo en este sentido probablemente sea escaso. En segundo lugar, el análisis que se presenta no se realizó por grupos nosológicos, sino de forma global. Esto puede suponer que los hallazgos estén condicionados por ciertos procesos específicos, que en este trabajo no se analizan. En tercer lugar, podría existir un cierto sesgo de información debido al alto número de personas implicadas en la recopilación de datos. Sin embargo, todos los investigadores involucrados en la recolección de datos habían recibido capacitación previa, y toda la información fue verificada por un investigador principal de cada centro. Los distintos criterios, definiciones y parámetros fueron definidos previamente por el comité científico del reto EDEN y fueron consensuados entre los investigadores. En cuarto lugar, el presente manuscrito implica un análisis secundario de una cohorte multipropósito, por lo que las asociaciones que se presentan pueden estar influidas por factores no contemplados en el diseño de la cohorte. Por tanto, los hallazgos deben considerarse generadores de hipótesis que deberán confirmarse con estudios específicamente diseñados a tal fin. En quinto lugar, dado el diseño retrospectivo del estudio, se han podido perder casos e información en los diferentes episodios al compilar los datos presentes en las historias clínicas. Así mismo, la ausencia de datos necesarios en algún ítem requerido para el cálculo de estas escalas implicó la exclusión de pacientes por datos insuficientes. Sin embargo, con el fin de evitar sesgos se calcularon los parámetros inherentes a las tres escalas pronósticas exclusivamente en aquellos que tenían todos los parámetros recogidos. Finalmente, los pacientes incluidos en el presente trabajo fueron aquellos con sospecha clínica de un proceso infeccioso por el médico de urgencias, de forma que no se obtuvo la confirmación microbiológica de infección. Aunque la falta de verificación del diagnóstico final puede representar un sesgo del estudio, consideramos que este enfoque basado en el diagnóstico de sospecha era más similar a la vida real y a las decisiones tomadas durante la evaluación inicial de los pacientes en los SUH.
ConclusionesEn conclusión, la escala NEWS mostró la mayor capacidad predictiva de mortalidad a 30días respecto a las escalas qSOFA y GYM, presentando el corte óptimo de especificidad en 8puntos y de sensibilidad cuando el punto de corte fue de 4puntos. La escala GYM con punto de corte en 1punto o más presentó una gran sensibilidad, por lo que se postula como una buena herramienta de cribado en el paciente anciano con infección. La escala qSOFA se caracterizó por una mayor especificidad pero una menor sensibilidad, lo que a priori descartaría el uso de esta escala como cribado inicial del paciente anciano infectado.
FinanciaciónEl presente trabajo se realizó sin ningún tipo de apoyo financiero directo o indirecto.
Contribución de los autoresTodos los autores debatieron la idea y el diseño del estudio y proporcionaron pacientes. El análisis de datos y la redacción del primer borrador fueron llevados a cabo EJGL, OM y JGC. Todos los autores leyeron este borrador y proporcionaron información para la versión final. EJGL es el garante del documento, asumiendo la responsabilidad de la integridad del trabajo en su conjunto, desde el inicio hasta la publicación.
Conflicto de interesesNingún autor declara ningún conflicto de intereses directa o indirectamente relacionado con este manuscrito.