El concepto de pacientes policonsultantes (PPC) ha sido abordado desde distintas perspectivas: económica, de eficiencia, de oportunidad, de efectividad y de impacto en los recursos destinados a la atención sanitaria. Las diversas definiciones de PPC se asocian a frecuencias o percentiles de consultas en los servicios de salud, en un período determinado, pero estandarizadas dentro de ese rango.
ObjetivoGenerar una definición dinámica de PPC de Servicio de Atención Primaria de Urgencias de Alta Resolución (SAR) utilizando Data Science.
DiseñoInvestigación cuantitativa, descriptiva, retrospectiva, de datos secundarios de pacientes atendidos en un SAR de Chile, usando Data Science.
ResultadosSe analizaron 174.593 atenciones que correspondieron a 55.715 pacientes y variables de texto, categóricas y numéricas, con análisis univariado, bivariado y multivariado, identificando que un PPC es aquel que asiste más de una vez bimensualmente, es decir, que consulta en un año ≥7veces. Usando clusterización, se identificaron sobre el 90% de PPC, con 9,1 consultas, con una duración de 0,5horas, frecuentando el sistema cada 40,3días, con edad promedio de 34,3años y cuyo diagnóstico de egreso se clasifica en la Familia «J» de CIE-10.
ConclusiónEste tipo de segmentación utilizando variables de tipo texto, categóricas y variables numéricas permite obtener una aproximación dinámica al concepto de PPC, mediante Data Science, según la configuración distribucional de la población de estudio. Estos resultados son relevantes para la toma de decisiones considerando el contexto y las características de la población para optimizar los recursos del sistema de acuerdo a las dinámicas propias de la sociedad en una zona geográfica dada.
The concept of frequent patients (FP) has been approached from different perspectives: economic, efficiency, opportunity, effectiveness, and impact on resources allocated to healthcare. The various definitions of FP are associated with frequencies or percentiles of consultations in health services, within a specific period, but standardized within that range.
ObjectiveTo generate a dynamic definition of FP for the High-Resolution Emergency Primary Care Service (SAR) using Data Science.
MethodologyQuantitative, descriptive, retrospective research using secondary data from patients treated in a SAR in Chile, employing Data Science.
Results174,593 patient visits were analyzed, corresponding to 55,715 patients. Text, categorical, and numerical variables were used in univariate, bivariate, and multivariate analyses. A patient FP was identified as someone who attends more than once every two months, meaning they consult ≥7times per year. Using clustering, over 90% of FPs were identified, with 9.1 visits, an average duration of 0.5hours, frequent visits to the system every 40.3days, an average age of 34.3years, and a discharge diagnosis classified in ICD-10 Family «J».
ConclusionsThis type of segmentation using text, categorical, and numerical variables allows for a dynamic approach to the concept of FP, using Data Science based on the distributional configuration of the study population. These results are relevant for decision-making, considering the context and characteristics of the population, to optimize system resources according to the dynamics of society in a given geographic area.
La policonsulta ha sido concebida como la consulta repetida del mismo usuario a los servicios de salud, convirtiéndose en un fenómeno complejo que enfrenta los sistemas sanitarios y que genera aumento de los costos, aumento de los tiempos de espera con la consecuente insatisfacción de la atención, y aumento de la carga laboral para los profesionales de salud1-7. En Europa, el término más utilizado para estos pacientes es hiperfrecuentador, aunque también se conoce como asistencia frecuente, uso intensivo o alta utilización5,8, mientras que en Chile el nombre más utilizado es policonsultante2,9. A pesar de esta diferenciación en términos conceptuales, la evidencia condiciona el perfil del paciente según el contexto territorial y sociocultural2. Variados autores han indagado en este fenómeno, pero no existe una definición globalmente aceptada del paciente policonsultante o asistente frecuente8-10.
Kivelä et al.1 generan una definición teórica y un modelo conceptual del paciente policonsultante (PC) o asistente frecuente (AF). El modelo se basa en cuatro atributos: los sentimientos de los síntomas, el mal estado de salud percibido, la baja calidad de vida y las visitas frecuentes a un proveedor de atención primaria de salud (APS). Además, incorporaron datos relativos al contexto temporal del concepto: antecedentes y consecuencias. Los antecedentes incluyeron las características individuales del paciente, el sistema de atención primaria de salud y la relación médico-paciente. Las consecuencias se dividieron en dos categorías: las de los asistentes frecuentes y las de la sociedad. En las consecuencias para los asistentes frecuentes consideraron: investigaciones y visitas de seguimiento, desventajas sociales y costos económicos. En las consecuencias para la sociedad determinaron: los costos para la economía nacional y el consumo de recursos para el cuidado de la salud1.
Así mismo, de acuerdo a cada definición, existen diversas caracterizaciones de pacientes hiperfrecuentadores (HF), las que van a depender de factores habilitadores, en especial el sistema de salud de cada país, que, de acuerdo con su modelo, establece la relación entre usuario y prestador. Esta relación, determinada por las carteras de servicios, también involucra la dimensión financiera del servicio, en algunos casos considerada en el conjunto de prestaciones y en otros como gasto de bolsillo5. El conjunto de prestaciones que otorga el sistema es determinante en la solución o no de los problemas de salud de los usuarios, lo que deriva en la frecuencia de asistencia a los servicios sanitarios. Un ejemplo de ello es en Alemania, donde se evidenció que, entre el grupo de los más ancianos, la asistencia frecuente se asoció positivamente con un peor estado de salud física (p.ej., número de enfermedades crónicas), pero negativamente con la depresión. Esto podría indicar que el sistema de salud alemán responde a las necesidades físicas, pero no psicológicas, de los ancianos11.
Es así como Kivelä et al.1, al analizar 59 artículos de 15 diferentes países, evidenciaron 23 diferentes clasificaciones de policonsultantes, basadas principalmente en el número de consultas con un proveedor de atención primaria de salud, lo que consideraron como insuficiente para clarificar el concepto. En este contexto genera un modelo que integra cuatro atributos definitorios de los asistentes frecuentes, como son: 1)sensación de los síntomas; 2)percepción de mal estado de salud; 3)disminución de la calidad de vida, y 4)visitas frecuentes a un centro de atención primaria de salud1. Estos atributos, además, incluyen las características individuales del paciente, las características del sistema de APS y la relación médico-paciente. Este último lo conceptualiza como la actitud del paciente frente a los médicos, a la creencia del paciente respecto a si el tratamiento que recibe es adecuado, a la falta de entendimiento mutuo médico-paciente, y a si los pacientes tienen tendencia a consultar con el mismo profesional o consultan ampliamente con una gran cantidad de médicos1,9.
Al evaluar los factores relacionados con la asistencia frecuente, se evidencian similitudes independientemente del contexto médico o la nación de origen. En el caso de los servicios ambulatorios, se ha evidenciado que los AF utilizan una cantidad de recursos médicos con un efecto terapéutico limitado. En los países occidentales que cuentan con médicos públicos y sistemas de derivación, este fenómeno ha sido ampliamente discutido por su impacto en la distribución de los recursos médicos y la calidad de la atención9. Diversos estudios han categorizado los factores relacionados con la AF en: a)factores relacionados con el paciente siguiendo un patrón habitual de enfermedad crónica, edad, malestar psicológico, vulnerabilidad social y bajo nivel educativo3,7,8,12-16; b)factores organizativos enfocados con la accesibilidad al centro de salud, la proporción de médicos por habitante, los servicios ofrecidos y la continuidad de la atención2,7,9,12-14,17, y c)factores relacionados con el médico, como orientación al paciente o a la enfermedad, edad, sexo, educación, experiencia, personalidad, estabilidad laboral, habilidades para la toma de decisiones y diferencias en la forma en que organizan su trabajo, la capacidad de escuchar y la complacencia al recetar medicamentos1,3,13. Se han descrito como factores de riesgo: predominio femenino, trastornos psicológicos/somatomorfos, distrés psiquiátrico, enfermedades pulmonares obstructivas crónicas, diabetes mellitus y cáncer, además de vulnerabilidad social3,7,12-14 y situación de desempleo5.
Un estudio reciente, en Chile, observó una mayor disposición hacia la policonsulta en mujeres, alcanzando el 81% de la muestra, agrupadas en torno a los 60 y 79años con una media total de 60,1años2, pero además ha aumentado la población de niños y adolescentes, identificados como «paciente médicamente complejo» (PMC) y que han sobrevivido gracias a la tecnología existente, que se convierten en pacientes policonsultantes, que requieren más hospitalizaciones y recursos en general, y un equipo multidisciplinario y coordinado16.
Chile no es ajeno a este contexto: en el año 2014, Miranda y Saffie hacen referencia a MINSAL 2005 y Pintado en su tesis de 2001, señalando que «si bien no hay una definición clara de lo que se entiende por paciente PC, existe cierto consenso en que dicha denominación responde a pacientes que presentan un elevado número de consultas espontáneas —más de siete en un año— en un mismo centro de salud». Pero esta valorización, en la actualidad, carece de fundamento9. En nuestro país hay investigadores que están abordando este tema en sus proyectos, pero aún falta evidencia que aborde la definición teórica del concepto y los referentes empíricos propuestos de cada atributo, que se deben utilizar para medir el grupo objetivo, validar la comprensión del concepto y desarrollar una aplicación basada en la teoría. Además, dado que los pacientes PC, HF o AF tienen diferentes necesidades dependiendo de su enfermedad y situación de vida, también se necesita investigación futura para ayudar a desarrollar y evaluar las intervenciones en el contexto chileno, a nivel de macro, meso y microgestión9.
El objetivo de este estudio es generar una definición dinámica de pacientes policonsultantes (PPC) de Servicio de Atención Primaria de Urgencias de Alta Resolución (SAR) utilizando Data Science.
MetodologíaInvestigación cuantitativa, descriptiva, retrospectiva, de datos secundarios de pacientes atendidos en un SAR de Chile entre los años 2017-2019 extraído del registro clínico electrónico Rayen®. Se utilizó análisis descriptivo en Ciencia de Datos con las etapas de: Planteamiento del problema, Recolección de datos, Preprocesamiento de datos, Limpieza de datos e Ingeniería de atributos y Análisis exploratorio. Se contó con la aprobación del Comité Ético Científico del Servicio de Salud Metropolitano Sur (SSMS).
ResultadosEl número de atenciones disponibles fueron 174.593, que correspondieron a 55.715 pacientes. Se analizaron variables de tipo texto, categóricas y numéricas, que se señalan en la tabla 1.
Listado de variables y porcentaje de completitud en la base de datos
| Variable | Descripción | N.° de registros con valor | % Cobertura |
|---|---|---|---|
| FECHA_ADMISION | Fecha de admisión (dd-mm-aaaa) | 174.593 | 100% |
| HORA_ADMISION | Hora de admisión (hh:mm:ss) | 174.593 | 100% |
| FECHA_EGRESO | Fecha de egreso (dd-mm-aaaa) | 174.593 | 100% |
| HORA_EGRESO | Hora de egreso (hh:mm:ss) | 174.593 | 100% |
| ATEN_ID | Identificación de atención (numérico) | 174.593 | 100% |
| USP_ID | Identificación del paciente (numérico) | 174.593 | 100% |
| SEX_DESCRIPCION | Masculino/Femenino | 162.419 | 93% |
| FECHA_DE_NACIMIENTO | dd-mm-yyyy | 162.419 | 93% |
| EDAD | Numérico | 162.524 | 93% |
| DIRECCION | Dirección del paciente (ingreso manual) | 158.299 | 91% |
| COMUNA | Código de comuna | 156.854 | 90% |
| REGION | Código de región | 156.854 | 90% |
| CODIGO_FAMILIA | Identificador | 157.857 | 90% |
| PREVISION | Previsión del paciente | 158.296 | 91% |
| CONVENIO | Convenio de Salud | 163.798 | 94% |
| MOTIVO_CONSULTA | Texto libre | 169.062 | 97% |
| INDICAION_MEDICAMENTOS | Texto libre | 131.674 | 75% |
| INMUNIZACIONES | Texto libre | 89.231 | 51% |
| RIESGO_DESCRIPCION | Texto libre | 10.269 | 6% |
| RIESGO_OBSERVACION | Texto libre | 4.947 | 3% |
| HABITO_DESCRIPCION | Texto libre | 7.225 | 4% |
| HABITO_INDICE | Texto libre | 6.043 | 3% |
| HABITO_OBSERVACION | Texto libre | 4.103 | 2% |
| CODIGO_DIAGNOSTICO | Código CIE-10 | 161.207 | 92% |
| DESCRIPCION_DIAGNOSTICO | Descripción del código en texto | 161.207 | 92% |
| ALERTAS | Texto libre | 8.593 | 5% |
| ALERGIA | Texto libre | 2.301 | 1% |
En esta etapa se preprocesaron los datos de cada una de las variables del registro clínico, variables de tipo texto, variables categóricas y variables numéricas. Para el caso de las variables de tipo categórica y numérica, se realizó un trabajo estándar de análisis que será tratado posteriormente. Sin embargo, para las variables de tipo texto se ha hecho un tratamiento diferenciado.
Variable Motivo ConsultaA modo de contexto, el proceso de atención de un paciente en el SAR se inicia con su recepción en el centro de salud por parte de un administrativo, quien pregunta por el motivo de consulta y registra la descripción que hace el paciente de sus signos, síntomas y contexto de la situación, en formato de texto libre en la plataforma RAYEN®. RAYEN® es una aplicación web que contiene diversos subsistemas creados para la gestión clínica y administrativa18.
Con esta información, se deriva a la enfermera/o, quien lo categoriza según su nivel de urgencia de atención en función de su condición y la necesidad de recursos (triage).
El ingreso de datos en formato de texto libre generó dificultades dada la falta de estandarización de ellos, al utilizar por parte del recepcionista léxico no reconocido, variantes ortográficas, variantes de significado contextual, abreviaciones informales, algunas de ellas propias de cada usuario del sistema, y expresiones coloquiales o informales. Esta problemática se observó en todas las variables cuyo ingreso de datos era de manera manual.
Para abordar estos problemas y buscar representar la información en un formato manejable, se utilizó una estrategia basal de minería de textos, basada en dos principios básicos: remoción de stop words (palabras que no aportan información relevante), normalización y generación de n-gramas (descomposición de palabras en conceptos esenciales de significado). Lo anterior logró la simplificación de la información inicial, lo que llevó al equipo a realizar un trabajo de imputación de una categoría asociada al estándar de la familia diagnóstica de patologías de la Clasificación Estadística Internacional de Enfermedades y Problemas Relacionados con la Salud versión10 (CIE-10).
Variable DiagnósticoEn la base de datos, la variable de diagnóstico estaba representada como texto, y como una variable categórica bajo la estandarización CIE-10, consignando el diagnóstico de egreso, según la evaluación médica y en otros casos de enfermería.
En algunos casos existió más de un diagnóstico registrado para una atención; por ello se optó por definir un criterio simplificado para sintetizar esta información. Para ello, se definieron los siguientes criterios: a)se consideró la familia diagnóstica del diagnóstico específico de egreso según CIE-10, y b)se excluyeron aquellos diagnósticos de la familia «Z», ya que estos eran ingresados por enfermeras/os al atender a pacientes que requerían un procedimiento o un control. Por ende, en estos casos, la policonsulta era inducida.
Con los pasos anteriores, se elige la moda de las familias de diagnóstico de cada atención.
Limpieza de datos e Ingeniería de atributosParte de la depuración de la muestra de datos es que, por las diferentes variables antes mencionadas, se realizó una exploración en la búsqueda de registros con datos faltantes. En la siguiente sección se mostrará una descripción de las variables finalmente seleccionadas.
El concepto de ingeniería de atributos se relaciona con la construcción de nuevos atributos (o variables) a partir de variables ya existentes. En este sentido, los nuevos atributos pueden generarse como: una categorización de una variable numérica, re-categorizar una variable a partir de otra variable categoría, combinar atributos para crear uno nuevo, entre otras alternativas. El siguiente listado se enmarca en una ingeniería de atributos:
- •
Previsión: público/privada/NA.
- •
Familia Diagnóstico: a partir del proceso detallado en «Variable Diagnóstico».
- •
Duración de atención: diferencial entre momento de egreso y admisión (en horas).
- •
Diferencia entre atenciones: diferencial de días entre atenciones por cada paciente.
- •
Marcador de antigüedad: binario que identifica a los pacientes con más de un año de historial de consultas, desde la consulta más antigua en la muestra.
Dadas las variables creadas en la sección anterior, y en búsqueda de un grupo de individuos comparables, se definió como grupo de análisis a los pacientes y sus consultas que cumplan con lo siguiente:
- •
Paso N.° 1: todos los pacientes que tienen, al menos, un año de historial de consultas en el período de estudio, desde su primera consulta.
- •
Paso N.° 2: de los pacientes del paso N.° 1, solo las consultas hasta un año de antigüedad, desde la primera consulta en el período de estudio.
Esta selección genera una muestra que representa el 23,5% del total de información de pacientes disponible en la base de datos original. Es decir, los criterios anteriores generan una reducción de 55.715 a 13.071 pacientes.
Análisis univariadoEn relación con las variables numéricas del conjunto de pacientes analizados, se observó que la edad de ingreso presentó un promedio de 35,0años (DE: 24,7), con una mediana de 32 años (Q1-Q3: 13-55) y un rango entre 0 y 97años (n=12.634). La duración de la atención tuvo un promedio de 0,4 horas (DE: 0,5) y una mediana de 0,2horas (Q1-Q3: 0,1-0,5), con valores entre 0,0 y 9,6horas (n=13.071). Respecto al intervalo entre atenciones, se observó un promedio de 51,2días (DE: 48,2), con una mediana de 47,5días (Q1-Q3: 0,0-83,2) y un rango entre 0 y 182,5días (n=13.071). El número de consultas en el año presentó un promedio de 2,9 (DE: 2,5) y una mediana de 2consultas (Q1-Q3: 1-4), con valores entre 1 y 58 consultas. Finalmente, el número de consultas durante el primer semestre mostró un promedio de 1,0 (DE: 1,5), con una mediana de 1consulta (Q1-Q3: 0-1) y un rango entre 0 y 42 consultas (n=13.071). En cuanto a las variables categóricas consideradas en el análisis, se incluyeron familia de diagnóstico, sexo y previsión. Cabe señalar que 437 pacientes no registraron información respecto al sexo.
Análisis bivariadoCon el fin de explorar la relación entre la familia diagnóstica y las variables numéricas del estudio, se realizó una caracterización de la muestra considerando el promedio de consultas en el año, la duración de la atención y la edad de ingreso para cada grupo diagnóstico.
Las familias diagnósticas con mayor número promedio de consultas en el año fueronJ (3,3 consultas; n=5.005), I(3,2 consultas; n=523) y E(3,0 consultas; n=96). De manera similar, las familias K, G, M, R, N y F presentaron valores cercanos a 3 consultas anuales en promedio, con tamaños muestrales que oscilaron entre 216 y 1.402 pacientes.
En relación con la duración promedio de la atención, los valores más elevados se observaron en las familiasE (1,1horas), Y (1,0horas) e I (0,9horas), mientras que la mayoría de los restantes grupos diagnósticos presentó duraciones cercanas a 0,3-0,5horas por atención.
Respecto a la edad promedio de ingreso, las mayores edades se observaron en las familiasE (63,4años) e I (61,5años), seguidas por D (50,6años) y C (50,7años). En contraste, las edades promedio más bajas se registraron en la familiaP (9,8años) y B (21,9años).
En términos de tamaño muestral, la familia diagnóstica J concentró el mayor número de pacientes (n=5.005), seguida por K (n=1.402), R (n=1.346), S (n=1.190) y M (n=1,002), mientras que otras familias presentaron frecuencias considerablemente menores.
Clasificación de paciente policonsultanteEn la etapa siguiente, mediante análisis univariado, bivariado y multivariado, se logró identificar que un PPC es aquel que asiste más de una vez bimensualmente al SAR, es decir, que consulta en un año ≥7veces. Al realizar la clusterización mediante k-means, se identificaron sobre el 90% de PPC, con 9,1 consultas, con una duración de 0,5horas, frecuentando el sistema cada 40,3días en un período anual de atención, con edad promedio de 34,3años y cuyo diagnóstico de egreso se categorizó en la familia «J» de la CIE-10, que corresponde a «Enfermedades del sistema respiratorio», lo que forma parte del perfil epidemiológico de la población chilena.
Para determinar el número óptimo de clústers, la selección del hiperparámetrok (número de clústers) se torna una decisión clave cuando hablamos de k-means, ya que este valor requiere una decisión del equipo de investigación. Sin embargo, existen criterios cuantitativos complementarios que acompañan a esta decisión, para así evitar una decisión puramente arbitraria. Los criterios utilizados en este estudio fueron a)el método del codo (Elbow Method) y b) el coeficiente de silueta (Silhouette Score).
Método del codoEl método del codo evalúa la inercia intraclúster o Within-Cluster Sum of Squares (WCSS) para distintos valores del parámetrok. La inercia se define como19:
WCSS(k)=Σ_(j=1)^k Σ_(x_i∈C_j) (| x_i-μ_j |)2
donde C_j es el conjunto de observaciones asignadas al clústerj, y μ_j es el centroide de dicho clúster. Este indicador mide la compacidad interna de los clústers: a mayork, menor WCSS, pero con rendimientos marginales decrecientes. Es decir, se puede establecer que el criterio general de decisión es: el valor óptimo de k corresponde al punto donde la curva WCSS presenta su mayor cambio de pendiente (segunda derivada máxima), indicando un balance eficiente entre reducción de varianza intraclúster y parsimonia del modelo.
En esta investigación, al evaluar la inercia para k ∈ {2, 3, …, 10}, se observó una reducción pronunciada de la WCSS desde k=2 (∼36.000) hasta k=4 (∼25.000), con una caída de aproximadamente 11.000 unidades en dos pasos. A partir de k=4, la curva se aplana de forma visible: la reducción entre k=4 y k=5 fue de ∼3.000 unidades, y entre k=5 y k=10 continuó decayendo de forma gradual sin presentar nuevas inflexiones relevantes. Este patrón es consistente con la presencia de un codo en k=4, confirmando que aumentar el número de clústers más allá de 4 no aportaría una mejora sustancial en la compacidad intraclúster que justifique la mayor complejidad del modelo.
La figura 1 representa el resultado visual del análisis descrito anteriormente.
Coeficiente de siluetaEl coeficiente de silueta es un indicador que cinetifica simultáneamente la cohesión interna de cada clúster y la separación respecto de los clústers vecinos19. Para cada observación i, se define:
s(i)=(b(i) - a(i))/(max {a(i),b(i)})
donde a(i): distancia promedio de i a todos los demás puntos de su mismo clúster (cohesión interna), y b(i): distancia promedio mínima de i al clúster más cercano que no es el suyo (separación externa).
El valor s(i) oscila en el rango [–1,1], con la interpretación que se muestra en la tabla 2).
El coeficiente de silueta global es el promedio de los s(i) sobre todas las observaciones. Con lo anterior, se puede definir como criterio general de decisión que: el valor óptimo de k es aquel que maximiza el coeficiente de silueta global. Se considera una segmentación aceptable cuando el coeficiente supera 0,25, y buena cuando supera 0,5.
En este estudio, al calcular el Silhouette Score para k ∈ {2, 3, …, 10} sobre una muestra aleatoria de 5.000 observaciones de entrenamiento, el valor máximo se obtuvo en k=4 (score ≈0,31). El score para k=2 fue de ∼0,29, y para los valores k ≥5 los scores oscilaron entre 0,29 y 0,30, sin superar el máximo observado en k=4. Aunque los valores son relativamente homogéneos entre los distintos k, el peak absoluto en k=4 confirma que esta partición ofrece el mejor balance entre cohesión interna y separación interclúster en esta muestra.
La figura 2 representa el resultado visual del análisis descrito anteriormente.
Como se mencionó anteriormente, los diferentes prismas que entregan una definición de paciente policonsultante lo describen como una tasa de asistencia en un período de tiempo determinado. La caracterización de asistencia de los pacientes que forman parte de este estudio se describe como una contabilización de asistencias en el período de un año, desde la primera asistencia de ese paciente dentro de la ventana de este estudio. Es decir, la contabilización de «historial de un año» queda fijada al momento de la primera consulta del paciente, y no mediante un corte de tiempo transversal, como se define en una gran porción de estudios sobre policonsultantes.
Ahora bien, para tener un marco de comparabilidad con otros estudios, la cantidad de asistencias que clasifican a un paciente como policonsultantes queda condicionado a un enfoque particular de cada estudio y de cada muestra. En este caso, para nuestra investigación, un paciente que asiste más de una vez bimensualmente, o sea con un número de consultas en un año ≥7, será clasificado como policonsultante.
Con lo anterior, nuestra muestra queda distribuida como 897 policonsultantes, equivalentes al 6,9% del total de pacientes seleccionados.
Policonsultante vs variables numéricasAl analizar la distribución de las variables numéricas según condición de policonsulta, se observan diferencias relevantes en la edad de ingreso y en el intervalo entre atenciones.
En relación con la edad, los pacientes policonsultantes presentan una mayor concentración en los extremos del ciclo vital, particularmente en neonatos y en personas cercanas a la tercera edad, mientras que los pacientes no policonsultantes muestran una distribución etaria más homogénea. Respecto al intervalo de días entre atenciones, los policonsultantes tienden a concentrarse en intervalos aproximados de 30 a 50días entre consultas, mientras que los pacientes no policonsultantes presentan una distribución más dispersa y con mayor presencia de intervalos más prolongados entre consultas.
En cuanto a la duración de la atención, tanto policonsultantes como no policonsultantes muestran una alta concentración de consultas con tiempos inferiores a 30minutos, lo que sugiere patrones similares entre ambos grupos para esta variable.
En conjunto, estos resultados indican que las principales diferencias entre ambos grupos se observan en la frecuencia de consultas y en ciertos grupos etarios, mientras que la duración de la atención presenta comportamientos comparables.
Policonsultantes y variables categóricasEn relación con las variables categóricas analizadas, no se observan diferencias relevantes en la distribución de policonsultantes según sexo, ya que la proporción de pacientes policonsultantes es similar entre hombres y mujeres.
Respecto a la variable de previsión, la mayor parte de los pacientes pertenecen al sistema público de salud, tanto en el grupo de policonsultantes como en el de no policonsultantes. Esta fuerte concentración en previsión pública sugiere que dicha variable podría tener baja capacidad discriminatoria para identificar patrones de policonsulta en la muestra analizada.
A modo de complementar las gráficas anteriores, es importante explorar posibles relaciones lineales entre las variables (fig. 3). Para ello, en la figura 4 se exhibe la matriz de correlación entre los atributos.
Asimismo, se puede explorar la matriz de correlación en conjunto con la variable objetivo, y revisamos el comportamiento relacional entre el conjunto de variables.
Análisis multivariableComo se observa en la matriz de correlación presentada previamente, no se identifican relaciones lineales fuertes entre pares de variables, lo que sugiere la necesidad de explorar métodos alternativos capaces de capturar relaciones no lineales. Una aproximación utilizada para este propósito fue la clusterización de pacientes, con el objetivo de caracterizar la población de estudio e identificar posibles patrones asociados al grupo de policonsultantes. Para ello, se aplicó el algoritmo k-means utilizando variables numéricas. Posteriormente, se analizó la composición de cada clúster obtenido con el fin de evaluar si alguno de ellos presentaba una mayor concentración de pacientes policonsultantes. Para la implementación del método, los 13.071 pacientes fueron divididos en un conjunto de entrenamiento (80%) y un conjunto de testeo (20%), utilizando una partición estratificada con el fin de preservar la proporción de policonsultantes en ambos subconjuntos. Tras excluir los pacientes con información incompleta, el conjunto de entrenamiento quedó conformado por 10.107 pacientes, de los cuales 714 correspondían a policonsultantes (7%). Por su parte, el conjunto de testeo incluyó 2.527 pacientes, entre los cuales 178 eran policonsultantes (7%). Finalmente, mediante un proceso iterativo de evaluación, se determinó que una solución de cuatro clústers ofrecía un equilibrio adecuado entre segmentación de la población y tamaño de los grupos resultantes.
En la figura 5 se muestra la representación visual del proceso de clusterización sobre las variables numéricas.
Numéricamente, cada uno de los clústers queda representado a través de sus centroides según el resultado de la tabla 3.
Distribución de clúster
| Clústers | N.° policonsultantes | N.° pacientes | N.° consultas | Duración de atención (horas) | Días entre atenciones | Edad ingreso (años) | Familia diagnóstico | Previsión |
|---|---|---|---|---|---|---|---|---|
| 0 | 27 | 4.172 | 3,2 | 0,3 | 95,8 | 30,7 | J | Pública |
| 1 | 9 | 3.983 | 1,5 | 0,2 | 11,1 | 33,6 | J | Pública |
| 2 | 658 | 945 | 8,4 | 0,5 | 42,3 | 35,0 | J | Pública |
| 3 | 20 | 1.007 | 2,4 | 1,5 | 40,3 | 58,4 | J | Pública |
Según los centroides y el nivel de concentración de pacientes policonsultantes, el clúster etiquetado con el número «2» representaría la caracterización de policonsultantes. Sin embargo, esta caracterización no es contundente, debido a que:
- 1.
La variable más diferenciadora tiene una correlación mayor al 50% con la variable que etiqueta (y define) a policonsultante, que es el número de consultas en un año.
- 2.
Para esta población, la familia de diagnóstico y previsión no es informativa, es decir, a priori, no aporta información para segmentar.
Cabe destacar que la proporción en cada clúster es inherentemente desbalanceada, reflejo directo de la distribución subyacente de los datos: los pacientes policonsultantes constituyen el 6,9% de la muestra total del estudio (897 de 13.071 pacientes), por lo que sería imposible que el clúster que los concentra represente el 10% del total y al mismo tiempo capture sobre el 90% de ellos sin que exista una sobrerrepresentación natural en ese clúster. Los resultados de la clusterización sobre el conjunto de entrenamiento (n≈10.107 pacientes) muestran la distribución que se muestra en la tabla 4.
Resultados de definiciónLuego de haber calibrado la clusterización, la tabla 5 muestra el resultado aplicado sobre la base del test.
Caracterización de clústers en el conjunto de test
| Clústers | N.° policonsultantes | N.° pacientes | N.° consultas | Duración de atención (horas) | Días entre atenciones | Edad ingreso (años) | Familia diagnóstico | Previsión |
|---|---|---|---|---|---|---|---|---|
| 0 | 17 | 1.070 | 3,3 | 0,3 | 94,0 | 31,0 | J | Pública |
| 1 | 3 | 1.029 | 1,5 | 0,2 | 10,4 | 33,9 | J | Pública |
| 2 | 150 | 187 | 9,1 | 0,5 | 40,3 | 34,3 | J | Pública |
| 3 | 8 | 241 | 2,7 | 1,5 | 40,7 | 61,1 | J | Pública |
En esta caracterización de los centroides se observa que el clúster N.°2, antes definido como el clúster que determinaba «de mejor manera» a los pacientes policonsultantes, se observa en esta iteración, que preserva la identificación de estos pacientes, capturando sobre el 90% de los pacientes policonsultantes.
El clúster N.°2 se caracteriza por la composición de la familiaJ (Enfermedades del sistema respiratorio) que domina el clúster con 482 pacientes (50,5% del clúster). El detalle de sus tasas de policonsulta aperturado para el resto de familias CIE-10 se muestra en la tabla 6.
Caracterización del clúster N.° 2
| Familia CIE-10 | n | Policonsultantes (n) | Consultas/año (media) | % policonsultantes | Edad media |
|---|---|---|---|---|---|
| I (Cardiocirculatorio) | 42 | 30 | 9,9 | 71,4% | 68,6 años |
| F (Salud mental) | 16 | 13 | 8,8 | 81,2% | 38,9 años |
| L (Piel) | 5 | 4 | 7,4 | 80,0% | 23,8 años |
| J (Respiratorio) | 482 | 351 | 8,4 | 72,8% | 24,2 años |
| N (Genitourinario) | 25 | 17 | 8,7 | 68,0% | 51,2 años |
| K (Digestivo) | 106 | 76 | 8,9 | 71,7% | 40,2 años |
La tabla 6 indica que la familia J es la predominante en el clúster N.°2, con un total de 351 pacientes policonsultantes de un total de 482 pacientes. Esto representa un 72,8% de proporción de policonsultantes para esta familia dentro de este clúster, y a su vez concentra el 53,3% del total de policonsultantes para este clúster (351/658). Si bien se observan otras tasas de policonsultantes interesantes para familias, como la F y la L, se deben hacer estudios más profundos para estudiar su significancia estadística.
Asimismo, se observa que las diferentes familias CIE-10, dentro de este clúster, tienen edades medias con una varianza significativa. Esto sugiere que, para este agrupamiento, podría haber una curva bimodal de edades. De forma equivalente al hallazgo anterior, se deben hacer análisis más avanzados para revelar su significancia estadística.
DiscusiónDurante el proceso de desarrollo de esta investigación se han explorado distintas alternativas para determinar, caracterizar y definir a los pacientes policonsultantes atendidos en un SAR. Los resultados tienen un carácter exploratorio, con una estrategia de clusterización que presenta una alternativa para profundizar en la identificación de policonsultantes en el contexto asistencial. Se observó que, usando una clusterización mediante k-means, se logró identificar sobre el 90% de pacientes que fueron clasificados en el clúster denominado como «policonsultante», conforme a la definición establecida en el documento, lo que permite generar una definición dinámica de ellos de acuerdo a las variables determinadas.
Otro elemento que se ha evidenciado durante este estudio es la incorporación de variables que reportan información textual al análisis, como la variable «diagnóstico», que fue incorporada al análisis. Sin embargo, en lo concerniente al registro de «motivo de ingreso» del paciente, este debería ser explorado en mayor profundidad para buscar relaciones con policonsultante. Se hace importante trabajar en alguna estrategia de estandarización en este tipo de información que presenta una extensa variabilidad textual, para así poder explotar de una manera más directa el atributo en cuestión. Cabe mencionar que, gracias al avance de la inteligencia artificial, este tipo de información puede ser explotada masivamente y detectar exitosamente características complementarias a los atributos numérico-categóricos que se trabajan en la gran mayoría de trabajos de pacientes policonsultantes.
Finalmente, el fenómeno de policonsultante está presente en gran parte diferentes centros de salud del mundo1-10,12-17,20-25, en particular en Chile. Esto conlleva a que la obtención de datos de más de una unidad o servicio sería deseable para lograr generalizar alguna definición de policonsultante más allá del SAR que fue estudiado en esta investigación. Con ello, incorporando otros elementos dinámicos, como la distribución poblacional, sería posible llegar a una definición dinámica de policonsultantes aún más detallada. Además, se podrían sumar otros elementos particulares de submuestras de la población que tengan efectos puntuales o permanentes en el tiempo.
El diseño utilizado ha sido parte de otras investigaciones20,22,24. La limitación de esta investigación se centra en que la muestra es local, en atención primaria, prepandémica, que tiene características propias, pero además es la característica que potencia los elementos «dinámicos» que deben ser la base para definir PPC.
La literatura sugiere estudiar mecanismos de análisis de PPC para proveer alternativas decisionales estratégicas en tiempo real8 con discordancia con las diversas formas de definir a un paciente policonsultante, según la «frecuencia repetida, en un período de tiempo dado de asistencia a un servicio de salud»1,2,4,9-12,17,25. Estos estudios definen un umbral de corte de asistencias, con carácter fijo, lo que excluye las dinámicas poblacionales inherentes que se pueden generar, como el marco económico de la zona de estudio, las decisiones gubernamentales en materias de salud, el comportamiento de la población según tramo etario y las dinámicas propias de la sociedad en una zona geográfica dada, entre otras.
En esa línea, la aplicación de clusterización utilizando variables mixtas (k-means) para la segmentación del espacio geométrico, usando variables numéricas y categóricas, podría entregar un resultado más robusto que el obtenido en este estudio. Otra alterativa sería segmentar el espacio bajo técnicas como DBSCAN o el método distributivo t-SNE en futuras investigaciones.
Sin duda, abordar el fenómeno de la policonsulta en los sistemas de salud es un problema dinámico que permitiría gestionar las necesidades y problemas de los usuarios y favorecer la optimización de recursos materiales, financieros y de los equipos de salud. Por ello, la identificación de pacientes policonsultantes en urgencias de atención primaria es vital para reducir los costos de la atención sanitaria, optimizar los procesos de atención, aumentar la satisfacción usuaria, disminuir la carga laboral y prevenir el burnout de los equipos, entre otras consecuencias. Esto se puede lograr con la implementación de variadas intervenciones basadas en telemedicina, en la promoción de la continuidad asistencial y la mejora de la alfabetización sanitaria para abordar el problema de la sobrepoblación en los servicios de urgencias14,15,17.
Las futuras investigaciones deberían enfocarse en determinar las consecuencias de la pandemia COVID-19 vivida en el mundo durante los años 2020-2022 y su relación con la policonsulta y las variables que se podrían incorporar a la definición dinámica de pacientes policonsultas o hiperfrecuentadores de los servicios de urgencia de la atención primaria. Estos elementos serían replicables a los servicios de urgencias hospitalarios para aquellos países que deben fortalecer la APS.
- •
El concepto de pacientes policonsultantes (PPC) o hiperfrecuentadores ha sido abordado desde distintas perspectivas.
- •
Se ha analizado el concepto desde la perspectiva económica, de eficiencia, de oportunidad, de efectividad y de impacto en los recursos destinados a la atención sanitaria.
- •
Las diversas definiciones de PPC se asocian a frecuencias, percentiles, porcentajes de consultas en los servicios de salud, en un período de tiempo determinado, pero estandarizadas dentro de ese rango.
- •
La clusterización mediante k-means es una alternativa para seguir profundizando en la tarea de identificación de policonsultantes en el contexto asistencial.
- •
Se agregan al análisis variables que reportan información textual, como la variable «diagnóstico». La variable «motivo de ingreso» del paciente debería ser explorada en mayor profundidad para buscar relaciones con policonsultante.
- •
El avance de la inteligencia artificial permite explorar las variables de texto de manera masiva y detectar, exitosamente, características complementarias de pacientes policonsultantes.
- •
Se incorpora una metodología que se puede aplicar de manera dinámica a la población de estudio, que recoja la configuración distribucional de los usuarios.
Esta investigación ha sido financiada por la Vicerrectoría de Investigación y Doctorados de la Universidad Andrés Bello, mediante el Concurso de Proyectos Internos de Investigación, adjudicándose con el registro DI-02-21/CBC.
Consideraciones éticasEl estudio fue aprobado por el Comité Ético Científico del Servicio de Salud Metropolitano Sur, de Chile, con el código 59-03082021
Consentimiento informadoNo se usó consentimiento informado a pacientes dado que se cumplieron con los aspectos éticos del uso de datos electrónicos de usuarios y del resguardo de ellos.
Declaración sobre el uso de inteligencia artificialLos autores declaran que no se utilizó inteligencia artificial generativa ni herramientas automatizadas para la redacción, análisis o elaboración de este artículo.
Contribución de los autoresConcepción y diseño del estudio, o adquisición de datos, o análisis e interpretación de los datos: Katiuska Reynaldos-Grandón, Daniel Aguayo Villegas, Erick Cortez-Pinto, Joaquín Ureta-Achurra, Juana Cubas-Sancho.
Borrador del artículo o revisión crítica del contenido intelectual: Katiuska Reynaldos-Grandón, Javier Rojas Ávila, Daniel Aguayo Villega, Erick Cortez-Pint, Joaquín Ureta-Achurra, Juana Cubas-Sancho.
Aprobación definitiva de la versión que se presenta: Katiuska Reynaldos-Grandón, Javier Rojas Ávila, Daniel Aguayo Villega, Erick Cortez-Pint, Joaquín Ureta-Achurra, Juana Cubas-Sancho.
Conflicto de interesesLos autores declaran no tener ningún conflicto de intereses.












