Aplicaciones de aprendizaje automático en salud

Aracena, Claudio; Villena, Fabián; Arias, Felipe; Dunstan, Jocelyn

doi:10.1016/j.rmclc.2022.10.001

Información del artículo

Resumen

Texto completo

Bibliografía

Descargar PDF

Estadísticas

Figuras (4)

Mostrar másMostrar menos

Resumen

El presente trabajo tiene por objetivo mostrar algunas aplicaciones recientes de aprendizaje automático en el área de la salud. El aprendizaje automático o machine learning es una rama de la inteligencia artificial que ha logrado grandes avances en la extracción de patrones y análisis predictivo obteniendo el estado del arte en varias tareas. Por lo mismo, esta tecnología es utilizada en varios sistemas dentro de hospitales y clínicas. Este trabajo introduce a la temática de aprendizaje automático y algunos de sus usos en salud. Posteriormente, se muestran algunas aplicaciones divididas según los tipos de datos que utilizan.

Palabras clave:

Aprendizaje Automático

Aprendizaje Profundo

Registros Electrónicos de Salud

Sistemas de Visión Computacional

Procesamiento de Lenguaje Natural

Abstract

This work aims to show recent applications of machine learning in health. Machine learning is a branch of artificial intelligence that has produced excellent results in pattern recognition and predictive analysis achieving state-of-the-art performance in several tasks. For that reason, this technology is used in multiple hospital systems. This article introduces machine learning, important algorithms, and ethical considerations as well as commenting on various applications in health sorted by the type of data used in those studies.

Keywords:

Machine Learning

Deep Learning

Electronic Health Records

Computer Vision Systems

Natural Language Processing

Texto completo

1Introducción

El aprendizaje automático está presente en la vida cotidiana con sus diversas aplicaciones; desde la recomendación de una serie de televisión hasta la predicción del tiempo de viaje de transporte. El aprendizaje automático corresponde a una rama de la inteligencia artificial que permite la extracción de patrones significativos a partir de un conjunto de datos. La inteligencia artificial es un término general para referirse a los sistemas informáticos que imitan la inteligencia humana1.

En salud, el aprendizaje automático y la inteligencia artificial han contribuido al desarrollo de diversas aplicaciones como el diagnóstico basado en imágenes, la predicción de resultados clínicos, el monitoreo de pacientes, entre otros. Sin embargo, este camino no ha estado exento de desafíos, comenzando por la disponibilidad de datos de calidad para entrenar los modelos y la infraestructura tecnológica para alojar estos sistemas, hasta las consideraciones éticas del uso de datos y modelos2.

Este trabajo tiene por objetivo mostrar las aplicaciones del aprendizaje automático en salud. Para ello se introducirán definiciones y conceptos necesarios para entender cómo funciona el aprendizaje automático y una pequeña discusión sobre la ética asociada al área. A continuación, se detallarán aplicaciones en salud, comenzando por la utilización de datos estructurados, como los registros médicos electrónicos y datos administrativos, para continuar con datos no estructurados, como las imágenes médicas y el texto clínico.

2Definiciones

El aprendizaje automático se define como el campo que estudia los algoritmos computacionales que mejoran a partir de la experiencia3. En términos simples, se refiere a la generación de programas computacionales que mejoran en alguna métrica de evaluación con el uso de datos.

Algunos conceptos que se usan comúnmente en el área de aprendizaje automático pueden ser desconocidos para el personal médico. A continuación, introducimos las definiciones de los conceptos más relevantes1,4:

Datos etiquetados: se refiere a los ejemplos con sus variables correspondientes que tienen etiquetas o valores reales para su variable objetivo. Por ejemplo, imágenes de células con la etiqueta de cancerígenas o benignas.

Conjunto de entrenamiento: subconjunto de datos etiquetados que se utiliza para entrenar un modelo.

Conjunto de prueba: subconjunto de los datos etiquetados que se utiliza para calcular métricas de evaluación del rendimiento del modelo. Este subconjunto no es utilizado para entrenar el modelo.

Modelo: se refiere al conjunto de parámetros entrenados a partir de los datos del conjunto de entrenamiento. El modelo puede ser de diversos tipos (ecuaciones matemáticas, árboles o grafos, reglas lógicas, entre otros) y debe ser definido previamente.

Algoritmo: serie de pasos o rutina que permiten entrenar un modelo, es decir, seleccionar los valores de los parámetros a partir de los datos del conjunto de entrenamiento.

Enfoques de aprendizaje automático

Dos importantes enfoques de aprendizaje que ayudan a comprender los tipos de aplicaciones existentes son el aprendizaje supervisado y no supervisado.

Aprendizaje supervisado: generación de un modelo que utiliza un conjunto de entrenamiento para predecir una variable objetivo. Un ejemplo de aprendizaje supervisado es utilizar imágenes de fondo de ojo para predecir retinopatía diabética en pacientes. Para entrenar un modelo que pueda “aprender” a predecir esta tarea, se requiere un conjunto de imágenes de fondo de ojo con etiquetas de condición normal y con retinopatía diabética (Fig. 1).

Fig. 1.

Esquema de aprendizaje supervisado. Los datos de entrenamiento son utilizados por el algoritmo de machine learning para generar un modelo, que es validado en los datos de prueba. Es posible iterar el proceso hasta obtener resultados satisfactorios. Finalmente, el modelo entrenado es utilizado para realizar predicciones.

Aprendizaje no supervisado: entrenamiento de un modelo que utiliza datos sin etiquetas para realizar análisis descriptivo de los mismos (agrupación, asociaciones o detección de anomalías). Un ejemplo de aprendizaje no supervisado sería generar grupos o clúster de pacientes de acuerdo a un conjunto de variables, que permita focalizar ciertos tratamientos (Fig. 2).

Fig. 2.

Esquema de aprendizaje no supervisado. Los datos de entrada son utilizados por el algoritmo de machine learning para generar un modelo que se utilizará para generar algún tipo de descripción de los datos.

3Técnicas de aprendizaje automático

Algunos algoritmos que se han utilizado extensivamente para realizar modelos de aprendizaje automático han sido Random Forest, Support Vector Machines y Redes Neuronales. Adicionalmente, el Deep Learning o aprendizaje profundo se utiliza en aplicaciones más actuales.

Random Forest: se refiere a un algoritmo que genera un modelo de varios árboles de decisión y cada uno de ellos tiene un voto en la predicción final. En la generación de árboles se utiliza un subconjunto de variables escogidas aleatoriamente para obtener variabilidad entre ellos.

Support Vector Machines: es un algoritmo que genera un hiperplano separador entre los datos con sus respectivas etiquetas. El objetivo es encontrar un hiperplano con la máxima separación y que cometa la menor cantidad de errores.

Redes Neuronales: técnica que genera un modelo basado en nodos o neuronas interconectadas, donde en cada una de ellas se aplica una función de activación a la multiplicación entre los parámetros y los valores de entrada (Fig. 3).

Fig. 3.

Esquema de una red neuronal. los xi son las entradas, hi la capa oculta (hidden en inglés) e y es la salida de la red.

Deep Learning: Durante la última década el uso de redes neuronales se fue haciendo intensivo y nuevas arquitecturas comenzaron a surgir. La mayoría de ellas tienen una gran cantidad de neuronas y con varias capas de profundidad, por lo cual esta nueva sub-área fue denominada deep learning. Dentro de esta subárea de estudio se encuentran la mayoría de los avances actuales en torno a modelos predictivos en imágenes, texto, audio y video. Algunos ejemplos de arquitecturas relevantes son las Redes Neuronales Convolucionales (CNN, por sus siglas en inglés), utilizadas ampliamente en procesamiento de imágenes, o Transformers, utilizados en procesamiento de lenguaje natural.

3.1Base de datos en salud

Para entrenar modelos de aprendizaje automático es necesario contar con datos. En el área de la salud son varias las iniciativas que buscan recopilar datos para que posteriormente puedan ser utilizados en investigación o aplicaciones, en particular, para aprendizaje automático. Dentro de las iniciativas existentes es posible destacar al banco de datos de registros clínicos y administrativos de la Universidad de Washington5 y el UK Biobank6. Adicionalmente, existen esfuerzos en la unificación de la terminología para que sea posible integrar datos de distintas fuentes. Uno de estos esfuerzos es SNOMED CT7, que busca ser la terminología clínica más comprehensiva del mercado.

4APLICACIONES DE APRENDIZAJE AUTOMÁTICO EN SALUD4.1Registros médicos electrónicos y datos administrativos

En la era de los grandes datos, el uso de registros médicos electrónicos y datos administrativos de salud se ha convertido en una fuente valiosa de información para entrenar modelos que puedan realizar predicciones. Los registros médicos electrónicos de buena calidad pueden ayudar a predecir la mortalidad intrahospitalaria, la readmisión de pacientes, el diagnóstico de enfermedades, y otras problemáticas. Por su parte, los datos administrativos pueden ayudar a generar modelos para mejorar y optimizar la gestión hospitalaria, como la predicción de inasistencia de pacientes, organización de horas médicas y de pabellón, etc. En esta sección se presentan algunas investigaciones que trabajan tanto con registros médicos electrónicos como con datos administrativos.

4.1.1Mortalidad intrahospitalaria

La mortalidad intrahospitalaria es definida como la muerte de un paciente una vez que se ha hecho un ingreso al hospital donde es atendido. Diversos estudios han intentado realizar una estimación certera de la mortalidad intrahospitalaria utilizando técnicas de aprendizaje automático. En general, los estudios intentan realizar una predicción con una anticipación entre 24 y 48 horas desde el ingreso del paciente hasta el deceso de este.

El trabajo de Ye et al.9 por ejemplo, tuvo como objetivo monitorear el riesgo de mortalidad con un sistema de alerta temprana en tiempo real en dos hospitales de Estados Unidos. Para entrenar distintos modelos de aprendizaje automático utilizaron datos de 42.484 pacientes entre 2015 y 2016, y la evaluación de los modelos se realizó con datos de 11.762 pacientes durante el 2017. A partir de la evaluación se identificó el algoritmo Random Forest como el de mejor desempeño. Las variables utilizadas para la predicción no solo incluyeron datos tradicionales, tales como signos vitales y datos de laboratorio, sino que también incluyeron historial médico como diagnósticos médicos e indicadores de utilización clínicos. El sistema logró predecir 99 pacientes del grupo de evaluación como de alto riesgo, de los cuales 40 fallecieron dentro de las 24 horas siguientes y 68 dentro de los 7 días siguientes. Estos resultados son comparativamente mejores que sistemas similares. Los autores mencionan que el sistema será integrado a los hospitales donde se realizó el estudio.

Di Castelnuovo et al.10, analizaron los factores de riesgo cardiovasculares y la mortalidad intrahospitalaria en cerca de 3.900 pacientes con COVID-19 en Italia. Mediante técnicas de aprendizaje automático se identificaron factores de riesgo asociados a la mortalidad. Para ello se entrenó un modelo de Random Forest con variables como edad, género, comorbilidades crónicas, proteína c-reactiva (CRP, por sus siglas en inglés), tasa de filtración glomerular estimada (eGFR por sus siglas en inglés), entre otras. Con ello fue posible identificar que las variables más relevantes para predecir la mortalidad intrahospitalaria son la eGFR y CRP, seguidas por la edad. Este estudio fue uno de los primeros realizados con grandes cantidades de datos al inicio de la pandemia del COVID-19, lo que permitió alertar a la comunidad científica de factores de riesgo en mortalidad intrahospitalaria.

4.1.2Diagnóstico de enfermedades

El uso de registros médicos electrónicos con aprendizaje automático para determinar un puntaje de riesgo o diagnosticar enfermedades es cada vez más común en los sistemas de salud. Existen diversos estudios que implementan modelos con datos clínicos para dichas tareas. Por ejemplo, en el caso de la Diabetes Mellitus tipo 2, varios estudios se han focalizado en screening y diagnóstico para apoyar la toma de decisiones médicas11. Uno de estos estudios12 obtiene resultados con un excelente rendimiento. La investigación utiliza diversos grupos de variables extraídas de los registros médicos electrónicos, y posteriormente elimina variables correlacionadas y unifica algunas de ellas para generar 5 variables que son utilizadas para entrenar varios algoritmos de aprendizaje automático, siendo Random Forest el que obtiene el mejor resultado detectando 98% de los casos con la enfermedad. Las variables son extraídas de reportes de comunicación, reportes de alta, reportes de diagnóstico, exámenes y prescripciones médicas.

4.1.3Inasistencia de pacientes

Los datos administrativos de salud también son útiles para resolver problemas que se presentan en la gestión de la salud. Uno de esos problemas es la inasistencia de pacientes a sus horas médicas. En una investigación13 se probaron diversos algoritmos de aprendizaje automático para lograr predecir el fenómeno. El mejor modelo logra detectar 82% de las citas con inasistencia utilizando el clasificador Naive Bayes. Las variables más relevantes para la predicción fueron la cantidad de días entre la programación de la hora y la realización de la cita, horas perdidas por el paciente con anterioridad, número de días desde la última hora, entre otras.

En Chile, la magnitud del problema de inasistencia de pacientes alcanza el 16,5% de las citas. Un estudio realizado bajo el proyecto FONDEF, “Soluciones tecnológicas, basadas en técnicas matemáticas avanzadas de aprendizaje de máquinas, para aumentar la eficiencia en la gestión hospitalaria”, logró detectar un 65% de las citas no atendidas en cuatro hospitales del Servicio de Salud Metropolitano Sur entre el 2018 y 202014.

4.2Imágenes médicas

La inteligencia artificial en el área de análisis de imágenes médicas está mostrando un papel importante y disruptivo. Los continuos avances tecnológicos han permitido introducir nuevas modalidades en consultas médicas, como la tomografía computarizada (TC), resonancia magnética (RM), tomografía por emisión de positrones (TEP), TEP/TC y TEP/RM. El análisis de grandes cantidades de datos de imagen de alta complejidad creados por estas modalidades se ha convertido en un gran desafío, tanto por la demanda en aumento de estos exámenes, y por el elevado tiempo dedicado en su análisis debido a la escasez de radiólogos15.

La disponibilidad de estas imágenes médicas ofrece diversas oportunidades, como por ejemplo, la caracterización de variaciones (normales y anormales) entre sujetos16, detección de anomalías en pacientes, descubrimiento temprano de progresión de enfermedades (biomarcadores)17, selección de tratamiento y predicción de estos (radiómica)18, y correlación de hallazgos en genotipo y fenotipo19. El análisis de estas imágenes, asistido por un computador, permite extraer y cuantificar la información relevante para apoyar la interpretación clínica20.

El análisis de imágenes médicas implica el cálculo de mediciones, mediante la cuantificación de sus diversas propiedades. La estimación de estos cálculos de forma manual por parte de personal médico puede estar sujeta a variabilidad de los observadores, lo que podría afectar significativamente la interpretación de resultados, reproducibilidad en estudios frente a otras variables o la sensibilidad que se requiere. Ante la necesidad de métodos más eficaces, fiables y validados, que también puedan emplear una cantidad masiva de datos, surgen los algoritmos de aprendizaje automático como un apoyo al análisis de imágenes médicas.

4.2.1Patología digital

La patología digital incorpora la obtención, gestión, intercambio e interpretación de información patológica. Las imágenes corresponden a las capturas de tejido fijado sobre portaobjetos de vidrio a través del escaneo de alta resolución. Una aplicación de machine learning en esta área es la identificación del carcinoma de células escamosas de orofaringe21. Este trabajo se realizó con el objetivo de identificar células escamosas de orofaringe relacionado con el virus del papiloma humano, en donde los pacientes desarrollan enfermedades recurrentes como metástasis en el 10% de los casos, y los restantes pueden presenciar una morbilidad importante por el tratamiento, por lo que es fundamental poder identificar la presencia de tumores agresivos o indolentes. Los datos con los que se trabajaron corresponden a escaneos de portaobjetos teñidos con hematoxilina y eosina de una cohorte de micromatrices de casos. El clasificador denominado “QuHblC” predijo correctamente los resultados de 140 pacientes obteniendo un 87,5% de precisión. Se concluyó que, con pequeñas aplicaciones de hematoxilina y eosina, el clasificador QuHblC puede predecir fuertemente el riesgo de recurrencia. Con una validación prospectiva, este clasificador puede ser útil para estratificar a los pacientes en diferentes grupos de tratamiento.

4.2.2Radiología

Radiómica es un método de extracción masiva de características de imágenes médicas nacido del trabajo de Lambin et al.22. Esta extracción se realiza a través de algoritmos de caracterización de datos de exámenes radiológicos como TC, RM, TEP/TC o TEP/RM. Este método tiene como objetivo descubrir patrones y/o características que a simple vista no son notorias para predecir pronósticos o respuestas terapéuticas para varios tipos de cáncer.

Un ejemplo de aplicación es un trabajo realizado en 2019 en cáncer de pulmón23. Los métodos manuales y semiautomáticos de segmentación de tumores para la extracción de características también están sujetos a la variabilidad de los observadores, lo que conduce a una sobreestimación o subestimación de las propiedades del tumor. Este trabajo tuvo como objetivo el uso de las características radiómicas centradas en cada píxel de los datos radiológicos obtenidos a partir de exámenes TC en 8 pacientes. Se empleó un set de datos con 25 características de textura para el entrenamiento de modelos de árboles de decisión. Los principales resultados indican que el modelo predice con precisión la ubicación del tumor en el conjunto de prueba (área bajo la curva ROC (AUC)= 83,9%).

4.3Texto clínico

En la atención clínica del paciente, el texto juega un rol de suma importancia. Uno de los medios que el profesional de salud tiene para persistir el conocimiento generado en el proceso de cuidado del paciente es el texto en el registro clínico, siendo este medio el único por el cual el profesional personalmente puede volcar el conocimiento adquirido en el proceso de anamnesis y examen clínico24. El texto clínico es la fuente más rica de información existente en el registro clínico, por ende, es fundamental el desarrollo de herramientas para extraer información desde estas fuentes de datos. El texto es difícil de analizar, porque al contrario de las fuentes de datos estructuradas, como, por ejemplo, los resultados de laboratorio, no existe un modelo subyacente que gobierne la estructura de estos datos25.

El Procesamiento de Lenguaje Natural (PLN) es un área de intersección entre las ciencias de la computación y la lingüística que busca analizar de manera automática el lenguaje humano. Esta área se utiliza principalmente para extracción automática de información, traducción y transcripción automáticas de voz25. Para resolver estas tareas y tomando en cuenta la naturaleza no estructurada de los datos de texto, el estado del arte en PLN está basado en deep learning.

Los principales avances del PLN clínico se han originado en el lenguaje inglés y para poder transferir estos conocimientos a otros lenguajes se necesita una recopilación masiva de datos de texto del dominio en el idioma deseado26. El acceso a datos de texto clínico es un desafío en sí mismo, dada la naturaleza privada de los datos clínicos25. Por lo mismo, se necesitan esfuerzos conjuntos entre el área académica y la industria de la salud para poder avanzar en el conocimiento del PLN clínico al idear formas de extraer información clínica sin atentar contra la privacidad de los pacientes.

En general, las tareas más importantes que resuelve el PLN y que tienen aplicaciones importantes en medicina son la extracción de información, la clasificación de documentos y el análisis de voz24.

En la tarea de extracción de información buscamos sistematizar el conocimiento contenido en datos de texto para extraer piezas importantes que puedan aportarnos información sobre un fenómeno27. Dentro de esta tarea podemos destacar el reconocimiento de entidades médicas, en donde buscamos piezas de texto que pertenecen a una categoría predeterminada, llámese enfermedades, partes del cuerpo o cualquier otra categoría. Específicamente, alrededor de esta tarea se han organizado competencias que buscan seleccionar el modelo que mejor se comporte en un desafío específico y es desde estas tareas donde nacen muchas aplicaciones interesantes en medicina. La competencia ProfNER, por ejemplo, buscaba encontrar ocupaciones médicas dentro de texto libre no estructurado, específicamente en redes sociales28. En MEDDOCAN, por su parte, se buscaba detectar información sensible dentro de texto clínico no estructurado para realizar la anonimización automática de los documentos29. Finalmente, en eHealth-KD se buscaba detectar toda la información importante desde el punto de vista semántico, dentro del texto clínico y las relaciones entre cada mención30.

En la tarea de clasificación, buscamos asociar automáticamente una categoría a un documento de texto. Esta es una de las tareas más simples y más utilizada en el análisis de texto clínico31. Utilizando técnicas de clasificación de texto podemos analizar distintos tipos de texto clínico, tales como reportes de radiología para detectar patologías en reportes de tomografías computarizadas de cabeza32, certificados de defunción para detectar causas de muerte33, tuits para detectar infecciones por influenza34, entre otros.

El análisis de voz busca información relevante dentro de datos de audio de discurso humano. Con estas técnicas de procesamiento de lenguaje natural podemos detectar biomarcadores de voz para la enfermedad de Parkinson35, analizar disartria36, detectar COVID-19 a través de dispositivos móviles37, entre otras.

5APLICACIONES EN CHILE

En Chile, se han realizado avances significativos en pos de empujar los límites del estado del arte en PLN clínico en español. Para apoyar la optimización de la lista de espera, se desarrolló un detector de clasificaciones erróneas de pacientes con problemas de salud pertenecientes a las garantías explícitas de salud que estaban en la lista de espera incorrecta38. Para simplificar el análisis de los datos de texto libre no estructurado de la lista de espera chilena, se aplicó un método de resumen a través de nubes de palabras del contenido de las interconsultas incluidas en la lista de espera39. Se estimó la incidencia de psoriasis al extraer datos de diagnósticos desde los atributos de texto libre de la lista de espera chilena40. Desde nuestro país se han hecho aportes significativos al desafiante problema que es el PLN clínico en español.

Entre otros trabajos realizados en Chile se destaca una herramienta de detección automática de retinopatía diabética (RD) denominada DART desarrollada en 202141,42, en donde se analizan fotografías del fondo del ojo mediante IA para la implementación en el programa nacional chileno de detección de RD. Este estudio se realizó con una muestra de 1.123 exámenes oculares para diabéticos bajo un protocolo diseñado por una comisión compuesta por el Ministerio de Salud y especialistas de retinas, utilizando la metodología de doble ciego para oftalmólogos y la herramienta diseñada con IA.

El trabajo consistió en la detección precisa de anomalías en las imágenes del fondo del ojo a través de 2 CNN. La primera CNN se utilizó para la detección de signos de edema macular diabético (EMD) y la otra CNN se utilizó para detectar signos de RD, en donde finalmente se ponderan ambas salidas para obtener la probabilidad de RD por ojo. Se obtuvo como resultado una sensibilidad de 94,6%, especificidad del 74,3% y valor predictivo negativo del 98,1%, concluyendo que DART es una herramienta válida para implementarse en el sistema de salud chileno. En la actualidad DART es una herramienta del sistema de salud chileno del modelo de atención en salud denominado Hospital Digital, donde busca prevenir la principal causa de ceguera en Chile en todos los pacientes con diabetes mellitus en control en los centros de atención primaria del país (Fig. 4).

Fig. 4.

Resultados de detección de retinopatía diabética. Las imágenes (a), (e), (c) y (g) corresponden a imágenes originales y las imágenes (b), (f), (d) y (h) muestran: localización de disco óptico y posición real (objeto circular); detección de lesiones (azul); detección de lesiones rojas (verde). Fuente: Arenas-Cavalli JT. et al.24.

6DISCUSIÓN Y CONCLUSIONES

El presente trabajo introdujo el área del aprendizaje automático, mostrando diversas aplicaciones en salud. Como se puede notar, existen investigaciones que utilizan aprendizaje automático y logran rendimientos considerables en tareas que antes estaban relegadas a ser realizadas por humanos. Este hecho abre una ventana de posibilidades para mejorar la eficiencia de los servicios y prestaciones de salud, brindando un apoyo a la decisión clínica.

No obstante, es importante considerar los aspectos éticos relacionados al uso de estas herramientas. Como indica el documento preparado por la Organización Mundial de la Salud43, se pueden identificar seis aspectos claves para un enfoque ético del uso de IA en salud:

1.
Proteger la autonomía humana (humanos deben mantener el control de los sistemas y la toma de decisiones)
2.
Promover el bienestar humano, la seguridad y el interés público (IA no debería producir daño y debería incluir medidas de mejoramiento continuo)
3.
Asegurar la transparencia e inteligibilidad (debería ser entendible para desarrolladores, clínicos, pacientes y supervisores. El diseño y despliegue debe ser suficientemente documentado)
4.
Responsabilidad (humanos deberían ser capaces de asegurar la calidad a partir de un conocimiento claro de las tareas que la IA está realizando)
5.
Inclusividad y equidad (garantizar un uso que no discrimine por edad, género, etnia, orientación sexual, u otra característica protegida por los derechos humanos)
6.
Sustentabilidad (consistente con los esfuerzos mundiales de reducir el impacto humano en el medio ambiente, así como anticiparse a posibles pérdidas de trabajo debido a la automatización)

Kohli y Geis8 establecen que los aspectos éticos de IA en salud pueden estar asociados a tres áreas principales: los datos, los algoritmos y las prácticas. En el caso de los datos utilizados, se debe considerar el consentimiento informado, la privacidad, la propiedad, la objetividad y la brecha de acceso a la información entre los que tienen o no los recursos para la gestión y análisis de estos. Por el lado de los algoritmos, se debe considerar la seguridad (mantener la confianza de los sistemas), transparencia (interpretabilidad de los modelos) y alineación de valores con el fin de optimizar los resultados en pos de los pacientes. Por último, considerar la ética en las prácticas, informando el código de conducta de las personas y organizaciones que participan en todo el ciclo de vida del desarrollo de estas herramientas, la innovación realizada, la investigación, el diseño, la construcción, la implementación, su paso a producción y la descontinuación de esta.

Esperamos que este artículo permita un acercamiento de profesionales de la salud al aprendizaje automático. Esta área es intrínsecamente interdisciplinaria44, y para potenciar su uso responsable se requiere un entendimiento común tanto de quienes desarrollan las aplicaciones como de quienes las usan y legislan sobre ellas.

Financiamiento

Este trabajo ha sido financiado por la ANID a través de los Fondos Basales para Centros de Excelencia FB210005 (Centro de Modelamiento Matemático), Fondecyt de Iniciación 11201250 (J. Dunstan) y Beca de Doctorado Nacional 21211659 (C. Aracena) y 21220200 (F. Villena). Además, la investigación conducida por J. Dunstan es apoyada por los Institutos Milenio ICN2021_004 (iHealth) e ICN17_002 (IMFD).

Declaración de conflicto de interés

Los autores declaran no tener conflictos de intereses.

Bibliografía

[1]

B.J. Erickson, P. Korfiatis, Z. Akkus, T.L. Kline.

Machine Learning for Medical Imaging.

Radiographics., 37 (2017), pp. 505-515

http://dx.doi.org/10.1148/rg.2017160130 | Medline

[2]

K.H. Yu, A.L. Beam, I.S. Kohane.

Artificial intelligence in healthcare.

Nat Biomed Eng., 2 (2018), pp. 719-731

http://dx.doi.org/10.1038/s41551-018-0305-z | Medline

[3]

Mitchell T. Machine Learning [Internet]. McGraw-Hill; 1997 [citado 18 de octubre de 2022]. Disponible en: https://www.cs.cmu.edu/∼tom/mlbook.html.

[4]

Lantz B. Machine Learning with R: Expert techniques for predictive modeling, 3rd Edition. Birmingham Mumbai; 2019.

[5]

HEALTH SCIENCES LIRARY. Data Resources in the Health Sciences [Internet]. [citado 19 de octubre de 2022]. Disponible en: https://guides.lib.uw.edu/hsl/data/home.

[6]

C. Sudlow, J. Gallacher, N. Allen, V. Beral, P. Burton, J. Danesh, P. Downey, et al.

UK biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age.

PLoS Med., 12 (2015), pp. e1001779

http://dx.doi.org/10.1371/journal.pmed.1001779 | Medline

[7]

SNOMED [Internet]. SNOMED. [citado 19 de octubre de 2022]. Disponible en: https://www.snomed.org/.

[8]

M. Kohli, R. Geis, Ethics.

Artificial Intelligence, and Radiology.

J Am Coll Radiol., 15 (2018), pp. 1317-1319

http://dx.doi.org/10.1016/j.jacr.2018.05.020 | Medline

[9]

C. Ye, O. Wang, M. Liu, L. Zheng, M. Xia, S. Hao, et al.

A Real-Time Early Warning System for Monitoring Inpatient Mortality Risk: Prospective Study Using Electronic Medical Record Data.

J Med Internet Res., 21 (2019), pp. e13719

http://dx.doi.org/10.2196/13719 | Medline

[10]

A. Di Castelnuovo, M. Bonaccio, S. Costanzo, A. Gialluisi, A. Antinori, N. Berselli, et al.

COvid-19 RISk and Treatments (CORIST) collaboration, Common cardiovascular risk factors and in-hospital mortality in 3,894 patients with COVID-19: survival analysis and machine learning-based findings from the multicentre Italian CORIST Study.

Nutr Metab Cardiovasc Dis., 30 (2020), pp. 1899-1913

http://dx.doi.org/10.1016/j.numecd.2020.07.031 | Medline

[11]

S. Abhari, S.R. Niakan Kalhori, M. Ebrahimi, H. Hasannejadasl, A. Garavand.

Artificial Intelligence Applications in Type 2 Diabetes Mellitus Care: Focus on Machine Learning Methods.

Healthc Inform Res., 25 (2019), pp. 248-261

http://dx.doi.org/10.4258/hir.2019.25.4.248 | Medline

[12]

T. Zheng, W. Xie, L. Xu, X. He, Y. Zhang, M. You, et al.

A machine learning-based framework to identify type 2 diabetes through electronic health records.

Int J Med Inform, 97 (2017), pp. 120-127

http://dx.doi.org/10.1016/j.ijmedinf.2016.09.014 | Medline

[13]

I. Mohammadi, H. Wu, A. Turkcan, T. Toscos, B.N. Doebbeling.

Data Analytics and Modeling for Appointment No-show in Community Health Centers.

J Prim Care Community Health, 9 (2018 Jan-Dec),

[14]

Gillies N. Efectos de la pandemia de COVID-19 en modelos de predicción de pacientes que no se presentan a citas presenciales y teleconsultas [Internet]. Universidad de Chile; 2022. Disponible en: https://cimt.uchile.cl/wp-content/uploads/2022/06/Tesis_MIM_Natalia-Gillies.pdf.

[15]

SOCHRADI. Disponible en: https://www.sochradi.cl/wp-content/uploads/radiologia-2.1.pdf.

[16]

H.F. Chan, A.R. Clark, E.A. Hoffman, D.T. Malcolm, M.H. Tawhai.

Quantifying normal geometric variation in human pulmonary lobar geometry from high resolution computed tomography.

J Biomech Eng., 137 (2015), pp. 051010

http://dx.doi.org/10.1115/1.4029919 | Medline

[17]

S.E. Counts, M.D. Ikonomovic, N. Mercado, I.E. Vega, E.J. Mufson.

Biomarkers for the Early Detection and Progression of Alzheimer's Disease.

Neurotherapeutics., 14 (2017), pp. 35-53

http://dx.doi.org/10.1007/s13311-016-0481-z | Medline

[18]

M.R. Chetan, F.V. Gleeson.

Radiomics in predicting treatment response in non-small-cell lung cancer: current status, challenges and future perspectives.

Eur Radiol., 31 (2021), pp. 1049-1058

http://dx.doi.org/10.1007/s00330-020-07141-9 | Medline

[19]

Okuda DT, Srinivasan R, Oksenberg JR, Goodin DS, Baranzini SE, Beheshtian A, et al., Genotype-Phenotype correlations in multiple sclerosis: HLA genes influence disease severity inferred by 1HMR spectroscopy and MRI measures. Brain. 2009; 132(Pt 1):250-9. doi: 10.1093/brain/awn301.

[20]

Ranschaert ER, Morozov S, Algra PR, eds. Artificial Intelligence in Medical Imaging: Opportunities, Applications and Risks. New York, NY; 2019.

[21]

J.S. Lewis Jr., S. Ali, J. Luo, W.L. Thorstad, A. Madabhushi.

A quantitative histomorphometric classifier (QuHbIC) identifies aggressive versus indolent p16-positive oropharyngeal squamous cell carcinoma.

Am J Surg Pathol., 38 (2014), pp. 128-137

http://dx.doi.org/10.1097/PAS.0000000000000086 | Medline

[22]

Lambin P, Rios-Velazquez E, Leijenaar R, Carvalho S, van Stiphout RG, Granton P, et al., Radiomics: extracting more information from medical images using advanced feature analysis. Eur J Cancer. 2012 Mar;48(4):441-6. doi: 10.1016/j.ejca.2011.11.036.

[23]

Clifton H, Vial A, Miller A, Ritz C, Field M, Holloway L, et al., Using Machine Learning Applied to Radiomic Image Features for Segmenting Tumour Structures. En: 2019 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). 2019: 1981-1988, doi: 10.1109/APSIPAASC47483.2019.9023077.

[24]

Dalianis H. Clinical Text Mining [Internet]. Cham: Springer International Publishing; 2018 [citado 10 de julio de 2019]. Disponible en: http://link.springer.com/10.1007/978-3-319-78503-5.

[25]

Jurafsky D, Martin J. Introduction. En: Speech and Language Processing, 2nd Edition. Upper Saddle River, N.J; 2008.

[26]

A. Névéol, H. Dalianis, S. Velupillai, G. Savova, P. Zweigenbaum.

Clinical Natural Language Processing in languages other than English: opportunities and challenges.

J Biomed Semant. 30 de, 9 (2018), pp. 12

[27]

K. Kreimeyer, M. Foster, A. Pandey, N. Arya, G. Halford, S.F. Jones, et al.

Natural language processing systems for capturing and standardizing unstructured clinical information: A systematic review.

J Biomed Inform., 73 (2017), pp. 14-29

http://dx.doi.org/10.1016/j.jbi.2017.07.012 | Medline

[28]

Miranda-Escalada A, Farré-Maduell E, Lima-López S, Gascó L, Briva-Iglesias V, Agüero-Torales M, et al., The ProfNER shared task on automatic recognition of occupation mentions in social media: systems, evaluation, guidelines, embeddings and corpora. En: Proceedings of the Sixth Social Media Mining for Health (#SMM4H) Workshop and Shared Task [Internet]. Mexico City, Mexico: Association for Computational Linguistics; 2021:13-20. Disponible en: https://aclanthology.org/2021.smm4h-1.3.

[29]

Marimon M, Gonzalez-Agirre A, Intxaurrondo A, Martin JAL, Villegas M. Automatic De-Identiﬁcation of Medical Texts in Spanish: the MEDDOCAN Track, Corpus, Guidelines, Methods and Evaluation of Results. Proc Iberian Lang Eval Forum (IberLEF 2019).

[30]

A. Piad-Morffis, Y. Gutiérrez, H. Cañizares-Diaz, S. Estévez-Velarde, R. Muñoz, A. Montoyo, et al.

Overview of the eHealth Knowledge Discovery Challenge at IberLEF 2020.

In: Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2020). CEUR Workshop Proc. 2664, pp. 71-84

[31]

G. Mujtaba, L. Shuib, N. Idris, W.L. Hoo, R.G. Raj, K. Khowaja, et al.

Clinical text classification research trends: Systematic literature review and open issues.

Expert Syst Appl., 116 (2019), pp. 494-520

[32]

Shin B, Chokshi FH, Lee T, Choi JD. Classification of Radiology Reports Using Neural Attention Models [Internet]. arXiv; 2017. doi: 10.48550/arXiv.1708.06828.

[33]

H. Wu, M.D. Wang.

Infer Cause of Death for Population Health Using Convolutional Neural Network.

ACM BCB., 2017 (2017), pp. 526-535

http://dx.doi.org/10.1145/3107411.3107447 | Medline

[34]

Dai X, Bikdash M. Hybrid classification for tweets related to infection with influenza. En: SoutheastCon 2015. 2015. doi. 10.1109/SECON. 2015.7133015.

[35]

J. Rusz, J. Hlavnička, M. Novotný, T. Tykalová, A. Pelletier, J. Montplaisir, et al.

Speech Biomarkers in Rapid Eye Movement Sleep Behavior Disorder and Parkinson Disease.

Ann Neurol., 90 (2021), pp. 62-75

http://dx.doi.org/10.1002/ana.26085 | Medline

[36]

B.F. Zaidi, S.A. Selouani, M. Boudraa, M. Sidi Yakoub.

Deep neural network architectures for dysarthric speech analysis and recognition.

Neural Comput Appl., 33 (2021), pp. 9089-9108

[37]

B. Stasak, Z. Huang, S. Razavi, D. Joachim, J. Epps.

Automatic Detection of COVID-19 Based on Short-Duration Acoustic Smartphone Speech Analysis.

J Healthc Inform Res., 5 (2021), pp. 201-217

http://dx.doi.org/10.1007/s41666-020-00090-4 | Medline

[38]

F. Villena, J. Pérez, R. Lagos, J. Dunstan.

Supporting the classification of patients in public hospitals in Chile by designing, deploying and validating a system based on natural language processing.

BMC Med Inform Decis Mak., 21 (2021), pp. 208

http://dx.doi.org/10.1186/s12911-021-01565-z | Medline

[39]

F. Villena, J. Dunstan.

Obtención automática de palabras clave en textos clínicos: una aplicación de procesamiento del lenguaje natural a datos masivos de sospecha diagnóstica en Chile. [Automatic keyword retrieval from clinical texts: an application of natural language processing to massive data of Chilean suspected diagnosis].

Rev Med Chil., 147 (2019), pp. 1229-1238

http://dx.doi.org/10.4067/s0034-98872019001001229 | Medline

[40]

C. Lecaros, J. Dunstan, F. Villena, D.M. Ashcroft, R. Parisi, C.E.M. Griffiths, et al.

The incidence of psoriasis in Chile: an analysis of the National Waiting List Repository.

Clin Exp Dermatol., 46 (2021), pp. 1262-1269

http://dx.doi.org/10.1111/ced.14713 | Medline

[41]

J.T. Arenas-Cavalli, I. Abarca, M. Rojas-Contreras, F. Bernuy, R. Donoso.

Clinical validation of an artificial intelligence-based diabetic retinopathy screening tool for a national health system.

Eye (Lond), 36 (2022), pp. 78-85

http://dx.doi.org/10.1038/s41433-020-01366-0 | Medline

[42]

J.T. Arenas-Cavalli, S.A. Ríos, M. Pola, R. Donoso.

A Web-based Platform for Automated Diabetic Retinopathy Screening.

Procedia Comput Sci., 60 (2015), pp. 557-563

[43]

WHO. Ethics and governance of artificial intelligence for health [Internet]. 2021 [citado 18 de octubre de 2022]. Disponible en: https://www.who.int/publications/i/item/9789240029200.

[44]

Dunstan J, Maass A, Tobar F. Una mirada a la era de los datos. Ed. Universitaria; 2022.

Indexada en:

Síguenos:

Indexada en:

Síguenos:

Suscríbase a la newsletter