metricas

Atención Primaria

Sugerencias
Atención Primaria Definición de pacientes policonsultantes en atención primaria de salud mediant...
Información de la revista
Visitas
138
Original
Acceso a texto completo

Definición de pacientes policonsultantes en atención primaria de salud mediante Data Sience

Definition of polyconsultant patients in primary health care using Data Science
Visitas
138
Katiuska Reynaldos-Grandóna, Javier Rojas-Ávilab,
Autor para correspondencia
javier.errojas@gmail.com

Autor para correspondencia.
, Daniel Aguayo Villegasc, Erick Cortez-Pintod, Joaquín Ureta-Achurrae, Juana Cubas-Sanchof
a Instituto de Investigación del Cuidado en Salud (IICS), Facultad de Enfermería, Universidad Andrés Bello, Santiago, Chile
b Facultad de Ciencias para el Cuidado de la Salud, Universidad San Sebastián, Concepción, Chile
c Instituto de Tecnología para la Innovación en Salud y Bienestar (ITiSB), Facultad de Ingeniería, Universidad Andrés Bello, Viña del Mar, Chile
d Escuela de Ingeniería Civil Biomédica, Facultad de Ingeniería, Universidad de Santiago de Chile, Santiago, Chile
e Facultad de Economía y Negocios, Universidad Andrés Bello, Santiago, Chile
f Escuela Profesional de Enfermería, Facultad de Medicina, Universidad Nacional Mayor de San Marcos, Lima, Perú
Este artículo ha recibido
Información del artículo
Resumen
Texto completo
Bibliografía
Descargar PDF
Estadísticas
Figuras (5)
fig0005
fig0010
fig0015
fig0020
fig0025
Tablas (6)
Tabla 1. Listado de variables y porcentaje de completitud en la base de datos
Tablas
Tabla 2. Interpretación valor s(i)
Tablas
Tabla 3. Distribución de clúster
Tablas
Tabla 4. Distribución de clúster en porcentajes
Tablas
Tabla 5. Caracterización de clústers en el conjunto de test
Tablas
Tabla 6. Caracterización del clúster N.° 2
Tablas
Resumen
Introducción

El concepto de pacientes policonsultantes (PPC) ha sido abordado desde distintas perspectivas: económica, de eficiencia, de oportunidad, de efectividad y de impacto en los recursos destinados a la atención sanitaria. Las diversas definiciones de PPC se asocian a frecuencias o percentiles de consultas en los servicios de salud, en un período determinado, pero estandarizadas dentro de ese rango.

Objetivo

Generar una definición dinámica de PPC de Servicio de Atención Primaria de Urgencias de Alta Resolución (SAR) utilizando Data Science.

Diseño

Investigación cuantitativa, descriptiva, retrospectiva, de datos secundarios de pacientes atendidos en un SAR de Chile, usando Data Science.

Resultados

Se analizaron 174.593 atenciones que correspondieron a 55.715 pacientes y variables de texto, categóricas y numéricas, con análisis univariado, bivariado y multivariado, identificando que un PPC es aquel que asiste más de una vez bimensualmente, es decir, que consulta en un año ≥7veces. Usando clusterización, se identificaron sobre el 90% de PPC, con 9,1 consultas, con una duración de 0,5horas, frecuentando el sistema cada 40,3días, con edad promedio de 34,3años y cuyo diagnóstico de egreso se clasifica en la Familia «J» de CIE-10.

Conclusión

Este tipo de segmentación utilizando variables de tipo texto, categóricas y variables numéricas permite obtener una aproximación dinámica al concepto de PPC, mediante Data Science, según la configuración distribucional de la población de estudio. Estos resultados son relevantes para la toma de decisiones considerando el contexto y las características de la población para optimizar los recursos del sistema de acuerdo a las dinámicas propias de la sociedad en una zona geográfica dada.

Palabras clave:
Hiperfrecuentador
Urgencias
Atención primaria
Abstract
Introduction

The concept of frequent patients (FP) has been approached from different perspectives: economic, efficiency, opportunity, effectiveness, and impact on resources allocated to healthcare. The various definitions of FP are associated with frequencies or percentiles of consultations in health services, within a specific period, but standardized within that range.

Objective

To generate a dynamic definition of FP for the High-Resolution Emergency Primary Care Service (SAR) using Data Science.

Methodology

Quantitative, descriptive, retrospective research using secondary data from patients treated in a SAR in Chile, employing Data Science.

Results

174,593 patient visits were analyzed, corresponding to 55,715 patients. Text, categorical, and numerical variables were used in univariate, bivariate, and multivariate analyses. A patient FP was identified as someone who attends more than once every two months, meaning they consult ≥7times per year. Using clustering, over 90% of FPs were identified, with 9.1 visits, an average duration of 0.5hours, frequent visits to the system every 40.3days, an average age of 34.3years, and a discharge diagnosis classified in ICD-10 Family «J».

Conclusions

This type of segmentation using text, categorical, and numerical variables allows for a dynamic approach to the concept of FP, using Data Science based on the distributional configuration of the study population. These results are relevant for decision-making, considering the context and characteristics of the population, to optimize system resources according to the dynamics of society in a given geographic area.

Keywords:
Frequent attenders
Emergency
Primary health care
Texto completo
Introducción

La policonsulta ha sido concebida como la consulta repetida del mismo usuario a los servicios de salud, convirtiéndose en un fenómeno complejo que enfrenta los sistemas sanitarios y que genera aumento de los costos, aumento de los tiempos de espera con la consecuente insatisfacción de la atención, y aumento de la carga laboral para los profesionales de salud1-7. En Europa, el término más utilizado para estos pacientes es hiperfrecuentador, aunque también se conoce como asistencia frecuente, uso intensivo o alta utilización5,8, mientras que en Chile el nombre más utilizado es policonsultante2,9. A pesar de esta diferenciación en términos conceptuales, la evidencia condiciona el perfil del paciente según el contexto territorial y sociocultural2. Variados autores han indagado en este fenómeno, pero no existe una definición globalmente aceptada del paciente policonsultante o asistente frecuente8-10.

Kivelä et al.1 generan una definición teórica y un modelo conceptual del paciente policonsultante (PC) o asistente frecuente (AF). El modelo se basa en cuatro atributos: los sentimientos de los síntomas, el mal estado de salud percibido, la baja calidad de vida y las visitas frecuentes a un proveedor de atención primaria de salud (APS). Además, incorporaron datos relativos al contexto temporal del concepto: antecedentes y consecuencias. Los antecedentes incluyeron las características individuales del paciente, el sistema de atención primaria de salud y la relación médico-paciente. Las consecuencias se dividieron en dos categorías: las de los asistentes frecuentes y las de la sociedad. En las consecuencias para los asistentes frecuentes consideraron: investigaciones y visitas de seguimiento, desventajas sociales y costos económicos. En las consecuencias para la sociedad determinaron: los costos para la economía nacional y el consumo de recursos para el cuidado de la salud1.

Así mismo, de acuerdo a cada definición, existen diversas caracterizaciones de pacientes hiperfrecuentadores (HF), las que van a depender de factores habilitadores, en especial el sistema de salud de cada país, que, de acuerdo con su modelo, establece la relación entre usuario y prestador. Esta relación, determinada por las carteras de servicios, también involucra la dimensión financiera del servicio, en algunos casos considerada en el conjunto de prestaciones y en otros como gasto de bolsillo5. El conjunto de prestaciones que otorga el sistema es determinante en la solución o no de los problemas de salud de los usuarios, lo que deriva en la frecuencia de asistencia a los servicios sanitarios. Un ejemplo de ello es en Alemania, donde se evidenció que, entre el grupo de los más ancianos, la asistencia frecuente se asoció positivamente con un peor estado de salud física (p.ej., número de enfermedades crónicas), pero negativamente con la depresión. Esto podría indicar que el sistema de salud alemán responde a las necesidades físicas, pero no psicológicas, de los ancianos11.

Es así como Kivelä et al.1, al analizar 59 artículos de 15 diferentes países, evidenciaron 23 diferentes clasificaciones de policonsultantes, basadas principalmente en el número de consultas con un proveedor de atención primaria de salud, lo que consideraron como insuficiente para clarificar el concepto. En este contexto genera un modelo que integra cuatro atributos definitorios de los asistentes frecuentes, como son: 1)sensación de los síntomas; 2)percepción de mal estado de salud; 3)disminución de la calidad de vida, y 4)visitas frecuentes a un centro de atención primaria de salud1. Estos atributos, además, incluyen las características individuales del paciente, las características del sistema de APS y la relación médico-paciente. Este último lo conceptualiza como la actitud del paciente frente a los médicos, a la creencia del paciente respecto a si el tratamiento que recibe es adecuado, a la falta de entendimiento mutuo médico-paciente, y a si los pacientes tienen tendencia a consultar con el mismo profesional o consultan ampliamente con una gran cantidad de médicos1,9.

Al evaluar los factores relacionados con la asistencia frecuente, se evidencian similitudes independientemente del contexto médico o la nación de origen. En el caso de los servicios ambulatorios, se ha evidenciado que los AF utilizan una cantidad de recursos médicos con un efecto terapéutico limitado. En los países occidentales que cuentan con médicos públicos y sistemas de derivación, este fenómeno ha sido ampliamente discutido por su impacto en la distribución de los recursos médicos y la calidad de la atención9. Diversos estudios han categorizado los factores relacionados con la AF en: a)factores relacionados con el paciente siguiendo un patrón habitual de enfermedad crónica, edad, malestar psicológico, vulnerabilidad social y bajo nivel educativo3,7,8,12-16; b)factores organizativos enfocados con la accesibilidad al centro de salud, la proporción de médicos por habitante, los servicios ofrecidos y la continuidad de la atención2,7,9,12-14,17, y c)factores relacionados con el médico, como orientación al paciente o a la enfermedad, edad, sexo, educación, experiencia, personalidad, estabilidad laboral, habilidades para la toma de decisiones y diferencias en la forma en que organizan su trabajo, la capacidad de escuchar y la complacencia al recetar medicamentos1,3,13. Se han descrito como factores de riesgo: predominio femenino, trastornos psicológicos/somatomorfos, distrés psiquiátrico, enfermedades pulmonares obstructivas crónicas, diabetes mellitus y cáncer, además de vulnerabilidad social3,7,12-14 y situación de desempleo5.

Un estudio reciente, en Chile, observó una mayor disposición hacia la policonsulta en mujeres, alcanzando el 81% de la muestra, agrupadas en torno a los 60 y 79años con una media total de 60,1años2, pero además ha aumentado la población de niños y adolescentes, identificados como «paciente médicamente complejo» (PMC) y que han sobrevivido gracias a la tecnología existente, que se convierten en pacientes policonsultantes, que requieren más hospitalizaciones y recursos en general, y un equipo multidisciplinario y coordinado16.

Chile no es ajeno a este contexto: en el año 2014, Miranda y Saffie hacen referencia a MINSAL 2005 y Pintado en su tesis de 2001, señalando que «si bien no hay una definición clara de lo que se entiende por paciente PC, existe cierto consenso en que dicha denominación responde a pacientes que presentan un elevado número de consultas espontáneas —más de siete en un año— en un mismo centro de salud». Pero esta valorización, en la actualidad, carece de fundamento9. En nuestro país hay investigadores que están abordando este tema en sus proyectos, pero aún falta evidencia que aborde la definición teórica del concepto y los referentes empíricos propuestos de cada atributo, que se deben utilizar para medir el grupo objetivo, validar la comprensión del concepto y desarrollar una aplicación basada en la teoría. Además, dado que los pacientes PC, HF o AF tienen diferentes necesidades dependiendo de su enfermedad y situación de vida, también se necesita investigación futura para ayudar a desarrollar y evaluar las intervenciones en el contexto chileno, a nivel de macro, meso y microgestión9.

El objetivo de este estudio es generar una definición dinámica de pacientes policonsultantes (PPC) de Servicio de Atención Primaria de Urgencias de Alta Resolución (SAR) utilizando Data Science.

Metodología

Investigación cuantitativa, descriptiva, retrospectiva, de datos secundarios de pacientes atendidos en un SAR de Chile entre los años 2017-2019 extraído del registro clínico electrónico Rayen®. Se utilizó análisis descriptivo en Ciencia de Datos con las etapas de: Planteamiento del problema, Recolección de datos, Preprocesamiento de datos, Limpieza de datos e Ingeniería de atributos y Análisis exploratorio. Se contó con la aprobación del Comité Ético Científico del Servicio de Salud Metropolitano Sur (SSMS).

Resultados

El número de atenciones disponibles fueron 174.593, que correspondieron a 55.715 pacientes. Se analizaron variables de tipo texto, categóricas y numéricas, que se señalan en la tabla 1.

Tabla 1.

Listado de variables y porcentaje de completitud en la base de datos

Variable  Descripción  N.° de registros con valor  % Cobertura 
FECHA_ADMISION  Fecha de admisión (dd-mm-aaaa)  174.593  100% 
HORA_ADMISION  Hora de admisión (hh:mm:ss)  174.593  100% 
FECHA_EGRESO  Fecha de egreso (dd-mm-aaaa)  174.593  100% 
HORA_EGRESO  Hora de egreso (hh:mm:ss)  174.593  100% 
ATEN_ID  Identificación de atención (numérico)  174.593  100% 
USP_ID  Identificación del paciente (numérico)  174.593  100% 
SEX_DESCRIPCION  Masculino/Femenino  162.419  93% 
FECHA_DE_NACIMIENTO  dd-mm-yyyy  162.419  93% 
EDAD  Numérico  162.524  93% 
DIRECCION  Dirección del paciente (ingreso manual)  158.299  91% 
COMUNA  Código de comuna  156.854  90% 
REGION  Código de región  156.854  90% 
CODIGO_FAMILIA  Identificador  157.857  90% 
PREVISION  Previsión del paciente  158.296  91% 
CONVENIO  Convenio de Salud  163.798  94% 
MOTIVO_CONSULTA  Texto libre  169.062  97% 
INDICAION_MEDICAMENTOS  Texto libre  131.674  75% 
INMUNIZACIONES  Texto libre  89.231  51% 
RIESGO_DESCRIPCION  Texto libre  10.269  6% 
RIESGO_OBSERVACION  Texto libre  4.947  3% 
HABITO_DESCRIPCION  Texto libre  7.225  4% 
HABITO_INDICE  Texto libre  6.043  3% 
HABITO_OBSERVACION  Texto libre  4.103  2% 
CODIGO_DIAGNOSTICO  Código CIE-10  161.207  92% 
DESCRIPCION_DIAGNOSTICO  Descripción del código en texto  161.207  92% 
ALERTAS  Texto libre  8.593  5% 
ALERGIA  Texto libre  2.301  1% 
Preprocesamiento de datos

En esta etapa se preprocesaron los datos de cada una de las variables del registro clínico, variables de tipo texto, variables categóricas y variables numéricas. Para el caso de las variables de tipo categórica y numérica, se realizó un trabajo estándar de análisis que será tratado posteriormente. Sin embargo, para las variables de tipo texto se ha hecho un tratamiento diferenciado.

Variable Motivo Consulta

A modo de contexto, el proceso de atención de un paciente en el SAR se inicia con su recepción en el centro de salud por parte de un administrativo, quien pregunta por el motivo de consulta y registra la descripción que hace el paciente de sus signos, síntomas y contexto de la situación, en formato de texto libre en la plataforma RAYEN®. RAYEN® es una aplicación web que contiene diversos subsistemas creados para la gestión clínica y administrativa18.

Con esta información, se deriva a la enfermera/o, quien lo categoriza según su nivel de urgencia de atención en función de su condición y la necesidad de recursos (triage).

El ingreso de datos en formato de texto libre generó dificultades dada la falta de estandarización de ellos, al utilizar por parte del recepcionista léxico no reconocido, variantes ortográficas, variantes de significado contextual, abreviaciones informales, algunas de ellas propias de cada usuario del sistema, y expresiones coloquiales o informales. Esta problemática se observó en todas las variables cuyo ingreso de datos era de manera manual.

Para abordar estos problemas y buscar representar la información en un formato manejable, se utilizó una estrategia basal de minería de textos, basada en dos principios básicos: remoción de stop words (palabras que no aportan información relevante), normalización y generación de n-gramas (descomposición de palabras en conceptos esenciales de significado). Lo anterior logró la simplificación de la información inicial, lo que llevó al equipo a realizar un trabajo de imputación de una categoría asociada al estándar de la familia diagnóstica de patologías de la Clasificación Estadística Internacional de Enfermedades y Problemas Relacionados con la Salud versión10 (CIE-10).

Variable Diagnóstico

En la base de datos, la variable de diagnóstico estaba representada como texto, y como una variable categórica bajo la estandarización CIE-10, consignando el diagnóstico de egreso, según la evaluación médica y en otros casos de enfermería.

En algunos casos existió más de un diagnóstico registrado para una atención; por ello se optó por definir un criterio simplificado para sintetizar esta información. Para ello, se definieron los siguientes criterios: a)se consideró la familia diagnóstica del diagnóstico específico de egreso según CIE-10, y b)se excluyeron aquellos diagnósticos de la familia «Z», ya que estos eran ingresados por enfermeras/os al atender a pacientes que requerían un procedimiento o un control. Por ende, en estos casos, la policonsulta era inducida.

Con los pasos anteriores, se elige la moda de las familias de diagnóstico de cada atención.

Limpieza de datos e Ingeniería de atributos

Parte de la depuración de la muestra de datos es que, por las diferentes variables antes mencionadas, se realizó una exploración en la búsqueda de registros con datos faltantes. En la siguiente sección se mostrará una descripción de las variables finalmente seleccionadas.

El concepto de ingeniería de atributos se relaciona con la construcción de nuevos atributos (o variables) a partir de variables ya existentes. En este sentido, los nuevos atributos pueden generarse como: una categorización de una variable numérica, re-categorizar una variable a partir de otra variable categoría, combinar atributos para crear uno nuevo, entre otras alternativas. El siguiente listado se enmarca en una ingeniería de atributos:

  • Previsión: público/privada/NA.

  • Familia Diagnóstico: a partir del proceso detallado en «Variable Diagnóstico».

  • Duración de atención: diferencial entre momento de egreso y admisión (en horas).

  • Diferencia entre atenciones: diferencial de días entre atenciones por cada paciente.

  • Marcador de antigüedad: binario que identifica a los pacientes con más de un año de historial de consultas, desde la consulta más antigua en la muestra.

Análisis exploratorioDefinición del muestreo para análisis

Dadas las variables creadas en la sección anterior, y en búsqueda de un grupo de individuos comparables, se definió como grupo de análisis a los pacientes y sus consultas que cumplan con lo siguiente:

  • Paso N.° 1: todos los pacientes que tienen, al menos, un año de historial de consultas en el período de estudio, desde su primera consulta.

  • Paso N.° 2: de los pacientes del paso N.° 1, solo las consultas hasta un año de antigüedad, desde la primera consulta en el período de estudio.

Esta selección genera una muestra que representa el 23,5% del total de información de pacientes disponible en la base de datos original. Es decir, los criterios anteriores generan una reducción de 55.715 a 13.071 pacientes.

Análisis univariado

En relación con las variables numéricas del conjunto de pacientes analizados, se observó que la edad de ingreso presentó un promedio de 35,0años (DE: 24,7), con una mediana de 32 años (Q1-Q3: 13-55) y un rango entre 0 y 97años (n=12.634). La duración de la atención tuvo un promedio de 0,4 horas (DE: 0,5) y una mediana de 0,2horas (Q1-Q3: 0,1-0,5), con valores entre 0,0 y 9,6horas (n=13.071). Respecto al intervalo entre atenciones, se observó un promedio de 51,2días (DE: 48,2), con una mediana de 47,5días (Q1-Q3: 0,0-83,2) y un rango entre 0 y 182,5días (n=13.071). El número de consultas en el año presentó un promedio de 2,9 (DE: 2,5) y una mediana de 2consultas (Q1-Q3: 1-4), con valores entre 1 y 58 consultas. Finalmente, el número de consultas durante el primer semestre mostró un promedio de 1,0 (DE: 1,5), con una mediana de 1consulta (Q1-Q3: 0-1) y un rango entre 0 y 42 consultas (n=13.071). En cuanto a las variables categóricas consideradas en el análisis, se incluyeron familia de diagnóstico, sexo y previsión. Cabe señalar que 437 pacientes no registraron información respecto al sexo.

Análisis bivariado

Con el fin de explorar la relación entre la familia diagnóstica y las variables numéricas del estudio, se realizó una caracterización de la muestra considerando el promedio de consultas en el año, la duración de la atención y la edad de ingreso para cada grupo diagnóstico.

Las familias diagnósticas con mayor número promedio de consultas en el año fueronJ (3,3 consultas; n=5.005), I(3,2 consultas; n=523) y E(3,0 consultas; n=96). De manera similar, las familias K, G, M, R, N y F presentaron valores cercanos a 3 consultas anuales en promedio, con tamaños muestrales que oscilaron entre 216 y 1.402 pacientes.

En relación con la duración promedio de la atención, los valores más elevados se observaron en las familiasE (1,1horas), Y (1,0horas) e I (0,9horas), mientras que la mayoría de los restantes grupos diagnósticos presentó duraciones cercanas a 0,3-0,5horas por atención.

Respecto a la edad promedio de ingreso, las mayores edades se observaron en las familiasE (63,4años) e I (61,5años), seguidas por D (50,6años) y C (50,7años). En contraste, las edades promedio más bajas se registraron en la familiaP (9,8años) y B (21,9años).

En términos de tamaño muestral, la familia diagnóstica J concentró el mayor número de pacientes (n=5.005), seguida por K (n=1.402), R (n=1.346), S (n=1.190) y M (n=1,002), mientras que otras familias presentaron frecuencias considerablemente menores.

Clasificación de paciente policonsultante

En la etapa siguiente, mediante análisis univariado, bivariado y multivariado, se logró identificar que un PPC es aquel que asiste más de una vez bimensualmente al SAR, es decir, que consulta en un año ≥7veces. Al realizar la clusterización mediante k-means, se identificaron sobre el 90% de PPC, con 9,1 consultas, con una duración de 0,5horas, frecuentando el sistema cada 40,3días en un período anual de atención, con edad promedio de 34,3años y cuyo diagnóstico de egreso se categorizó en la familia «J» de la CIE-10, que corresponde a «Enfermedades del sistema respiratorio», lo que forma parte del perfil epidemiológico de la población chilena.

Para determinar el número óptimo de clústers, la selección del hiperparámetrok (número de clústers) se torna una decisión clave cuando hablamos de k-means, ya que este valor requiere una decisión del equipo de investigación. Sin embargo, existen criterios cuantitativos complementarios que acompañan a esta decisión, para así evitar una decisión puramente arbitraria. Los criterios utilizados en este estudio fueron a)el método del codo (Elbow Method) y b) el coeficiente de silueta (Silhouette Score).

Método del codo

El método del codo evalúa la inercia intraclúster o Within-Cluster Sum of Squares (WCSS) para distintos valores del parámetrok. La inercia se define como19:

WCSS(k)=Σ_(j=1)^k Σ_(x_i∈C_j) (| x_i-μ_j |)2

donde C_j es el conjunto de observaciones asignadas al clústerj, y μ_j es el centroide de dicho clúster. Este indicador mide la compacidad interna de los clústers: a mayork, menor WCSS, pero con rendimientos marginales decrecientes. Es decir, se puede establecer que el criterio general de decisión es: el valor óptimo de k corresponde al punto donde la curva WCSS presenta su mayor cambio de pendiente (segunda derivada máxima), indicando un balance eficiente entre reducción de varianza intraclúster y parsimonia del modelo.

En esta investigación, al evaluar la inercia para k ∈ {2, 3, …, 10}, se observó una reducción pronunciada de la WCSS desde k=2 (∼36.000) hasta k=4 (∼25.000), con una caída de aproximadamente 11.000 unidades en dos pasos. A partir de k=4, la curva se aplana de forma visible: la reducción entre k=4 y k=5 fue de ∼3.000 unidades, y entre k=5 y k=10 continuó decayendo de forma gradual sin presentar nuevas inflexiones relevantes. Este patrón es consistente con la presencia de un codo en k=4, confirmando que aumentar el número de clústers más allá de 4 no aportaría una mejora sustancial en la compacidad intraclúster que justifique la mayor complejidad del modelo.

La figura 1 representa el resultado visual del análisis descrito anteriormente.

Figura 1.

Análisis con método de codo.

Coeficiente de silueta

El coeficiente de silueta es un indicador que cinetifica simultáneamente la cohesión interna de cada clúster y la separación respecto de los clústers vecinos19. Para cada observación i, se define:

s(i)=(b(i) - a(i))/(max {a(i),b(i)})

donde a(i): distancia promedio de i a todos los demás puntos de su mismo clúster (cohesión interna), y b(i): distancia promedio mínima de i al clúster más cercano que no es el suyo (separación externa).

El valor s(i) oscila en el rango [–1,1], con la interpretación que se muestra en la tabla 2).

Tabla 2.

Interpretación valor s(i)

Valor  Interpretación 
Cercano a +1  Punto bien asignado: compacto en su clúster y alejado de los demás 
Cercano a 0  Punto en la frontera entre clústers 
Cercano a −1  Punto posiblemente mal asignado 

El coeficiente de silueta global es el promedio de los s(i) sobre todas las observaciones. Con lo anterior, se puede definir como criterio general de decisión que: el valor óptimo de k es aquel que maximiza el coeficiente de silueta global. Se considera una segmentación aceptable cuando el coeficiente supera 0,25, y buena cuando supera 0,5.

En este estudio, al calcular el Silhouette Score para k ∈ {2, 3, …, 10} sobre una muestra aleatoria de 5.000 observaciones de entrenamiento, el valor máximo se obtuvo en k=4 (score ≈0,31). El score para k=2 fue de ∼0,29, y para los valores k ≥5 los scores oscilaron entre 0,29 y 0,30, sin superar el máximo observado en k=4. Aunque los valores son relativamente homogéneos entre los distintos k, el peak absoluto en k=4 confirma que esta partición ofrece el mejor balance entre cohesión interna y separación interclúster en esta muestra.

La figura 2 representa el resultado visual del análisis descrito anteriormente.

Figura 2.

Coeficiente de silueta por número de clústers.

Como se mencionó anteriormente, los diferentes prismas que entregan una definición de paciente policonsultante lo describen como una tasa de asistencia en un período de tiempo determinado. La caracterización de asistencia de los pacientes que forman parte de este estudio se describe como una contabilización de asistencias en el período de un año, desde la primera asistencia de ese paciente dentro de la ventana de este estudio. Es decir, la contabilización de «historial de un año» queda fijada al momento de la primera consulta del paciente, y no mediante un corte de tiempo transversal, como se define en una gran porción de estudios sobre policonsultantes.

Ahora bien, para tener un marco de comparabilidad con otros estudios, la cantidad de asistencias que clasifican a un paciente como policonsultantes queda condicionado a un enfoque particular de cada estudio y de cada muestra. En este caso, para nuestra investigación, un paciente que asiste más de una vez bimensualmente, o sea con un número de consultas en un año ≥7, será clasificado como policonsultante.

Con lo anterior, nuestra muestra queda distribuida como 897 policonsultantes, equivalentes al 6,9% del total de pacientes seleccionados.

Policonsultante vs variables numéricas

Al analizar la distribución de las variables numéricas según condición de policonsulta, se observan diferencias relevantes en la edad de ingreso y en el intervalo entre atenciones.

En relación con la edad, los pacientes policonsultantes presentan una mayor concentración en los extremos del ciclo vital, particularmente en neonatos y en personas cercanas a la tercera edad, mientras que los pacientes no policonsultantes muestran una distribución etaria más homogénea. Respecto al intervalo de días entre atenciones, los policonsultantes tienden a concentrarse en intervalos aproximados de 30 a 50días entre consultas, mientras que los pacientes no policonsultantes presentan una distribución más dispersa y con mayor presencia de intervalos más prolongados entre consultas.

En cuanto a la duración de la atención, tanto policonsultantes como no policonsultantes muestran una alta concentración de consultas con tiempos inferiores a 30minutos, lo que sugiere patrones similares entre ambos grupos para esta variable.

En conjunto, estos resultados indican que las principales diferencias entre ambos grupos se observan en la frecuencia de consultas y en ciertos grupos etarios, mientras que la duración de la atención presenta comportamientos comparables.

Policonsultantes y variables categóricas

En relación con las variables categóricas analizadas, no se observan diferencias relevantes en la distribución de policonsultantes según sexo, ya que la proporción de pacientes policonsultantes es similar entre hombres y mujeres.

Respecto a la variable de previsión, la mayor parte de los pacientes pertenecen al sistema público de salud, tanto en el grupo de policonsultantes como en el de no policonsultantes. Esta fuerte concentración en previsión pública sugiere que dicha variable podría tener baja capacidad discriminatoria para identificar patrones de policonsulta en la muestra analizada.

A modo de complementar las gráficas anteriores, es importante explorar posibles relaciones lineales entre las variables (fig. 3). Para ello, en la figura 4 se exhibe la matriz de correlación entre los atributos.

Figura 3.

Relaciones lineales entre variables.

Figura 4.

Matriz de correlación con policonsultantes.

Asimismo, se puede explorar la matriz de correlación en conjunto con la variable objetivo, y revisamos el comportamiento relacional entre el conjunto de variables.

Análisis multivariable

Como se observa en la matriz de correlación presentada previamente, no se identifican relaciones lineales fuertes entre pares de variables, lo que sugiere la necesidad de explorar métodos alternativos capaces de capturar relaciones no lineales. Una aproximación utilizada para este propósito fue la clusterización de pacientes, con el objetivo de caracterizar la población de estudio e identificar posibles patrones asociados al grupo de policonsultantes. Para ello, se aplicó el algoritmo k-means utilizando variables numéricas. Posteriormente, se analizó la composición de cada clúster obtenido con el fin de evaluar si alguno de ellos presentaba una mayor concentración de pacientes policonsultantes. Para la implementación del método, los 13.071 pacientes fueron divididos en un conjunto de entrenamiento (80%) y un conjunto de testeo (20%), utilizando una partición estratificada con el fin de preservar la proporción de policonsultantes en ambos subconjuntos. Tras excluir los pacientes con información incompleta, el conjunto de entrenamiento quedó conformado por 10.107 pacientes, de los cuales 714 correspondían a policonsultantes (7%). Por su parte, el conjunto de testeo incluyó 2.527 pacientes, entre los cuales 178 eran policonsultantes (7%). Finalmente, mediante un proceso iterativo de evaluación, se determinó que una solución de cuatro clústers ofrecía un equilibrio adecuado entre segmentación de la población y tamaño de los grupos resultantes.

En la figura 5 se muestra la representación visual del proceso de clusterización sobre las variables numéricas.

Figura 5.

Proceso de clusterización.

Numéricamente, cada uno de los clústers queda representado a través de sus centroides según el resultado de la tabla 3.

Tabla 3.

Distribución de clúster

Clústers  N.° policonsultantes  N.° pacientes  N.° consultas  Duración de atención (horas)  Días entre atenciones  Edad ingreso (años)  Familia diagnóstico  Previsión 
27  4.172  3,2  0,3  95,8  30,7  Pública 
3.983  1,5  0,2  11,1  33,6  Pública 
658  945  8,4  0,5  42,3  35,0  Pública 
20  1.007  2,4  1,5  40,3  58,4  Pública 

Según los centroides y el nivel de concentración de pacientes policonsultantes, el clúster etiquetado con el número «2» representaría la caracterización de policonsultantes. Sin embargo, esta caracterización no es contundente, debido a que:

  • 1.

    La variable más diferenciadora tiene una correlación mayor al 50% con la variable que etiqueta (y define) a policonsultante, que es el número de consultas en un año.

  • 2.

    Para esta población, la familia de diagnóstico y previsión no es informativa, es decir, a priori, no aporta información para segmentar.

Cabe destacar que la proporción en cada clúster es inherentemente desbalanceada, reflejo directo de la distribución subyacente de los datos: los pacientes policonsultantes constituyen el 6,9% de la muestra total del estudio (897 de 13.071 pacientes), por lo que sería imposible que el clúster que los concentra represente el 10% del total y al mismo tiempo capture sobre el 90% de ellos sin que exista una sobrerrepresentación natural en ese clúster. Los resultados de la clusterización sobre el conjunto de entrenamiento (n10.107 pacientes) muestran la distribución que se muestra en la tabla 4.

Tabla 4.

Distribución de clúster en porcentajes

Clúster  N.° pacientes  % del total  Policonsultantes (n)  % policonsultantes 
4.172  41,1%  27  0,65% 
3.983  39,4%  0,23% 
945  9,4%  658  68,96% 
1.007  10,1%  20  1,95% 
Resultados de definición

Luego de haber calibrado la clusterización, la tabla 5 muestra el resultado aplicado sobre la base del test.

Tabla 5.

Caracterización de clústers en el conjunto de test

Clústers  N.° policonsultantes  N.° pacientes  N.° consultas  Duración de atención (horas)  Días entre atenciones  Edad ingreso (años)  Familia diagnóstico  Previsión 
17  1.070  3,3  0,3  94,0  31,0  Pública 
1.029  1,5  0,2  10,4  33,9  Pública 
150  187  9,1  0,5  40,3  34,3  Pública 
241  2,7  1,5  40,7  61,1  Pública 

En esta caracterización de los centroides se observa que el clúster N.°2, antes definido como el clúster que determinaba «de mejor manera» a los pacientes policonsultantes, se observa en esta iteración, que preserva la identificación de estos pacientes, capturando sobre el 90% de los pacientes policonsultantes.

El clúster N.°2 se caracteriza por la composición de la familiaJ (Enfermedades del sistema respiratorio) que domina el clúster con 482 pacientes (50,5% del clúster). El detalle de sus tasas de policonsulta aperturado para el resto de familias CIE-10 se muestra en la tabla 6.

Tabla 6.

Caracterización del clúster N.° 2

Familia CIE-10  Policonsultantes (n)  Consultas/año (media)  % policonsultantes  Edad media 
I (Cardiocirculatorio)  42  30  9,9  71,4%  68,6 años 
F (Salud mental)  16  13  8,8  81,2%  38,9 años 
L (Piel)  7,4  80,0%  23,8 años 
J (Respiratorio)  482  351  8,4  72,8%  24,2 años 
N (Genitourinario)  25  17  8,7  68,0%  51,2 años 
K (Digestivo)  106  76  8,9  71,7%  40,2 años 

La tabla 6 indica que la familia J es la predominante en el clúster N.°2, con un total de 351 pacientes policonsultantes de un total de 482 pacientes. Esto representa un 72,8% de proporción de policonsultantes para esta familia dentro de este clúster, y a su vez concentra el 53,3% del total de policonsultantes para este clúster (351/658). Si bien se observan otras tasas de policonsultantes interesantes para familias, como la F y la L, se deben hacer estudios más profundos para estudiar su significancia estadística.

Asimismo, se observa que las diferentes familias CIE-10, dentro de este clúster, tienen edades medias con una varianza significativa. Esto sugiere que, para este agrupamiento, podría haber una curva bimodal de edades. De forma equivalente al hallazgo anterior, se deben hacer análisis más avanzados para revelar su significancia estadística.

Discusión

Durante el proceso de desarrollo de esta investigación se han explorado distintas alternativas para determinar, caracterizar y definir a los pacientes policonsultantes atendidos en un SAR. Los resultados tienen un carácter exploratorio, con una estrategia de clusterización que presenta una alternativa para profundizar en la identificación de policonsultantes en el contexto asistencial. Se observó que, usando una clusterización mediante k-means, se logró identificar sobre el 90% de pacientes que fueron clasificados en el clúster denominado como «policonsultante», conforme a la definición establecida en el documento, lo que permite generar una definición dinámica de ellos de acuerdo a las variables determinadas.

Otro elemento que se ha evidenciado durante este estudio es la incorporación de variables que reportan información textual al análisis, como la variable «diagnóstico», que fue incorporada al análisis. Sin embargo, en lo concerniente al registro de «motivo de ingreso» del paciente, este debería ser explorado en mayor profundidad para buscar relaciones con policonsultante. Se hace importante trabajar en alguna estrategia de estandarización en este tipo de información que presenta una extensa variabilidad textual, para así poder explotar de una manera más directa el atributo en cuestión. Cabe mencionar que, gracias al avance de la inteligencia artificial, este tipo de información puede ser explotada masivamente y detectar exitosamente características complementarias a los atributos numérico-categóricos que se trabajan en la gran mayoría de trabajos de pacientes policonsultantes.

Finalmente, el fenómeno de policonsultante está presente en gran parte diferentes centros de salud del mundo1-10,12-17,20-25, en particular en Chile. Esto conlleva a que la obtención de datos de más de una unidad o servicio sería deseable para lograr generalizar alguna definición de policonsultante más allá del SAR que fue estudiado en esta investigación. Con ello, incorporando otros elementos dinámicos, como la distribución poblacional, sería posible llegar a una definición dinámica de policonsultantes aún más detallada. Además, se podrían sumar otros elementos particulares de submuestras de la población que tengan efectos puntuales o permanentes en el tiempo.

El diseño utilizado ha sido parte de otras investigaciones20,22,24. La limitación de esta investigación se centra en que la muestra es local, en atención primaria, prepandémica, que tiene características propias, pero además es la característica que potencia los elementos «dinámicos» que deben ser la base para definir PPC.

La literatura sugiere estudiar mecanismos de análisis de PPC para proveer alternativas decisionales estratégicas en tiempo real8 con discordancia con las diversas formas de definir a un paciente policonsultante, según la «frecuencia repetida, en un período de tiempo dado de asistencia a un servicio de salud»1,2,4,9-12,17,25. Estos estudios definen un umbral de corte de asistencias, con carácter fijo, lo que excluye las dinámicas poblacionales inherentes que se pueden generar, como el marco económico de la zona de estudio, las decisiones gubernamentales en materias de salud, el comportamiento de la población según tramo etario y las dinámicas propias de la sociedad en una zona geográfica dada, entre otras.

En esa línea, la aplicación de clusterización utilizando variables mixtas (k-means) para la segmentación del espacio geométrico, usando variables numéricas y categóricas, podría entregar un resultado más robusto que el obtenido en este estudio. Otra alterativa sería segmentar el espacio bajo técnicas como DBSCAN o el método distributivo t-SNE en futuras investigaciones.

Sin duda, abordar el fenómeno de la policonsulta en los sistemas de salud es un problema dinámico que permitiría gestionar las necesidades y problemas de los usuarios y favorecer la optimización de recursos materiales, financieros y de los equipos de salud. Por ello, la identificación de pacientes policonsultantes en urgencias de atención primaria es vital para reducir los costos de la atención sanitaria, optimizar los procesos de atención, aumentar la satisfacción usuaria, disminuir la carga laboral y prevenir el burnout de los equipos, entre otras consecuencias. Esto se puede lograr con la implementación de variadas intervenciones basadas en telemedicina, en la promoción de la continuidad asistencial y la mejora de la alfabetización sanitaria para abordar el problema de la sobrepoblación en los servicios de urgencias14,15,17.

Las futuras investigaciones deberían enfocarse en determinar las consecuencias de la pandemia COVID-19 vivida en el mundo durante los años 2020-2022 y su relación con la policonsulta y las variables que se podrían incorporar a la definición dinámica de pacientes policonsultas o hiperfrecuentadores de los servicios de urgencia de la atención primaria. Estos elementos serían replicables a los servicios de urgencias hospitalarios para aquellos países que deben fortalecer la APS.

Lo conocido sobre el tema

  • El concepto de pacientes policonsultantes (PPC) o hiperfrecuentadores ha sido abordado desde distintas perspectivas.

  • Se ha analizado el concepto desde la perspectiva económica, de eficiencia, de oportunidad, de efectividad y de impacto en los recursos destinados a la atención sanitaria.

  • Las diversas definiciones de PPC se asocian a frecuencias, percentiles, porcentajes de consultas en los servicios de salud, en un período de tiempo determinado, pero estandarizadas dentro de ese rango.

Qué aporta este estudio

  • La clusterización mediante k-means es una alternativa para seguir profundizando en la tarea de identificación de policonsultantes en el contexto asistencial.

  • Se agregan al análisis variables que reportan información textual, como la variable «diagnóstico». La variable «motivo de ingreso» del paciente debería ser explorada en mayor profundidad para buscar relaciones con policonsultante.

  • El avance de la inteligencia artificial permite explorar las variables de texto de manera masiva y detectar, exitosamente, características complementarias de pacientes policonsultantes.

  • Se incorpora una metodología que se puede aplicar de manera dinámica a la población de estudio, que recoja la configuración distribucional de los usuarios.

Financiación

Esta investigación ha sido financiada por la Vicerrectoría de Investigación y Doctorados de la Universidad Andrés Bello, mediante el Concurso de Proyectos Internos de Investigación, adjudicándose con el registro DI-02-21/CBC.

Consideraciones éticas

El estudio fue aprobado por el Comité Ético Científico del Servicio de Salud Metropolitano Sur, de Chile, con el código 59-03082021

Consentimiento informado

No se usó consentimiento informado a pacientes dado que se cumplieron con los aspectos éticos del uso de datos electrónicos de usuarios y del resguardo de ellos.

Declaración sobre el uso de inteligencia artificial

Los autores declaran que no se utilizó inteligencia artificial generativa ni herramientas automatizadas para la redacción, análisis o elaboración de este artículo.

Contribución de los autores

Concepción y diseño del estudio, o adquisición de datos, o análisis e interpretación de los datos: Katiuska Reynaldos-Grandón, Daniel Aguayo Villegas, Erick Cortez-Pinto, Joaquín Ureta-Achurra, Juana Cubas-Sancho.

Borrador del artículo o revisión crítica del contenido intelectual: Katiuska Reynaldos-Grandón, Javier Rojas Ávila, Daniel Aguayo Villega, Erick Cortez-Pint, Joaquín Ureta-Achurra, Juana Cubas-Sancho.

Aprobación definitiva de la versión que se presenta: Katiuska Reynaldos-Grandón, Javier Rojas Ávila, Daniel Aguayo Villega, Erick Cortez-Pint, Joaquín Ureta-Achurra, Juana Cubas-Sancho.

Conflicto de intereses

Los autores declaran no tener ningún conflicto de intereses.

Bibliografía
[1]
K. Kivelä, S. Elo, M. Kääriäinen.
Frequent attenders in primary health care: a concept analysis.
Int J Nurs Stud., 86 (2018), pp. 115-124
[2]
N. Fuster Sánchez, D. Rivera López, R. Cabrera del Valle.
Síntomas de muchas e inexplicables vidas: hiperfrecuentación, policonsulta y gestión de síntomas múltiples de áreas metropolitanas en atención primaria en salud.
Bol Rev Esp Salud Pública., 9 (2024), pp. 1-22
[3]
A. Ramos, R. Pujol, C. Palma.
Reducing patients’ rate of frequent attendance through a training intervention for physicians.
BMC Med Educ., 24 (2024), pp. 758
[4]
R. Sharabani, I. Kagan, S. Cojocaru.
Frequent attenders in primary health care: a mixed-methods study of patient and staff perspectives.
J Clin Nurs., 32 (2023), pp. 7135-7146
[5]
A. Hajek, B. Kretzler, H.H. König.
Determinants of frequent attendance in primary care. A systematic review of longitudinal studies.
Front Med (Lausanne)., 8 (2021),
[6]
C. Marshall, A. Kumar, S. Saraiva, R.M. West, S.M. Mason, C.D. Burton, et al.
Trimodal age distribution of frequent attendance at the emergency department: a descriptive analysis of national, English, secondary care data using a retrospective cohort.
[7]
C.A. Leitão, S.R. Santos, A.S. Aguiar, V.L. Sousa, H.A. Lanhas, F.M. Alves.
Determinants of frequent use of open consultations: a study on patient demographics, chronic conditions, and utilization patterns in primary care.
Porto Biomed J., 10 (2025), pp. e282
[8]
E. Williams, S.N. Brice, D. Price.
Mathematical methodology for defining a frequent attender within emergency departments.
Front Disaster Emerg Med., 3 (2025),
[9]
K. Reynaldos-Grandón, V. Nasabún-Flores, V. Pedrero-Castillo, E. Cortez-Pinto, J. Ureta-Achurra, T. Pavlov-Sepúlveda.
Pacientes policonsultores: variabilidad del concepto.
Rev Med Chil., 148 (2020), pp. 128-129
[10]
D.M. Shukla, E.B. Faber, B. Sick.
Defining and characterizing frequent attenders: systematic literature review and recommendations.
J Patient Cent Res Rev., 7 (2020), pp. 255-264
[11]
E. Buczak-Stec, A. Hajek, H. van den Bussche, M. Eisele, B. Wiese, S. Mamone, et al.
Frequent attendance in primary care in the oldest old: evidence from the AgeCoDe-AgeQualiDe study.
Aging Clin Exp Res., 32 (2020), pp. 2629-2638
[12]
S.C. Kang, C.C. Lin, C.C. Tsai, Y.H. Lu, C.F. Huang, Y.C. Chen.
Characteristics of frequent attenders compared with non-frequent attenders in primary care: study of remote communities in Taiwan.
Healthcare (Basel)., 8 (2020), pp. 96
[13]
L. Funcasta, M.J. Hernández-Lloreda, D. Martínez-Íñigo.
The effects of patient's frequency of attendance and etiology of symptoms on the general practitioners’ wellbeing.
Eur Rev Appl Psychol., 71 (2021),
[14]
D. Sánchez-Gómez, M. Pabón-Carrasco, J. Fagundo-Rivera, R. Romero-Castillo, J. Vega-Escaño, N. Jiménez-Picón.
Profile of European frequent attenders in primary health care: a systematic review and meta-analysis.
[15]
Z. Barca-Ruso, N. Montoro-Pérez, R. Montejano-Lozoya, A. Sanjuán-Quiles, J. Perpiñá-Galvañ.
Interventions aimed at reducing non-urgent presentations and frequent attendance in paediatric emergency departments: a rapid systematic review.
Emerg Care Med., 2 (2025), pp. 7
[16]
G.B. Von Dessauer.
El desafío de la pediatría ante el cambio epidemiológico: la complejidad de la población infantojuvenil.
Andes Pediatrica., 95 (2024), pp. 131-133
[17]
J.B. Nielsen, H.S. Andersen.
Characteristics of patients with frequent contact with general practice: a retrospective study.
[18]
RayenSalud. Manual Admisión RAYEN. Versión 15.1.0.13. 2020 [consultado 25 Feb 2026]. Disponible en: https://www.saludtarapaca.gob.cl/wp-content/uploads/2023/11/Software-RAYEN-Manual-Admision.pdf
[19]
K. Murphy, S. López-Pernas, M. Saqr.
Dissimilarity-based cluster analysis of educational data: a comparative tutorial using R.
Learning Analytics Methods and Tutorials: A Practical Guide Using R, Springer Nature Switzerland, (2024), pp. 231-283
[20]
Liu W. Wang Z. Liu X. Yue W. Bell D. A clustering approach to triage categorization in A&E departments. 2017 23rd International Conference on Automation and Computing (ICAC); 2017; Huddersfield, UK. 1-6. doi: 10.23919/IConAC. 2017.8081975.
[21]
M. Godbout-Parent, N. Julien, H.L. Nguena Nguefack, M.G. Pagé, L. Guénette, L. Blais, et al.
A sex- and gender-based analysis plus of frequent healthcare utilization among individuals living with chronic pain: a cohort study.
BMC Health Serv Res., 25 (2025), pp. 1261
[22]
J.A. Huang, R.H. Weng, C.S. Lai, J.S. Hu.
Exploring medical utilization patterns of emergency department users.
J Formos Med Assoc., 107 (2008), pp. 119-128
[23]
J. Estarlich-Corominas, N. Soler-Abril, A. Casanellas-Chuecos, S. Becerra-Corzo, A.S. Bianco, P. Torán-Monserrat, et al.
Nurse management of minor problems in primary care emergencies: a non-randomized controlled trial.
[24]
R.W. Grant, J. McCloskey, M. Hatfield, C. Uratsu, J.D. Ralston, E. Bayliss, et al.
Use of latent class analysis and k-means clustering to identify complex patient profiles.
[25]
F. Reid, S.J. Pravinkumar, R. Maguire, A. Main, H. McCartney, L. Winters, et al.
Using machine learning to identify frequent attendance at accident and emergency services in Lanarkshire.
Copyright © 2026. The Authors
Descargar PDF
Opciones de artículo
Herramientas