18 - VALIDACIÓN EXTERNA DEL ANÁLISIS DE IMÁGENES FACIALES ASISTIDO POR INTELIGENCIA ARTIFICIAL EN ENFERMEDAD OCULAR TIROIDEA: RESULTADOS EN UNA COHORTE DE PACIENTES ESPAÑOLES
1Servicio de Oftalmología, Hospital Universitario Virgen Macarena, Sevilla. 2Servicio de Endocrinología y Nutrición, Hospital Universitario Virgen Macarena, Sevilla. 3Thyroscope Inc., Seúl, República de Corea.
Introducción y objetivos: Se han desarrollado 3 soluciones de software asistidas por inteligencia artificial (IA) –Glandy CAS, EXO y LID– para evaluar la actividad y la gravedad de la enfermedad ocular tiroidea (EOT) a partir de fotografías faciales. Este estudio tuvo como objetivo validar externamente su rendimiento en una cohorte de pacientes españoles.
Métodos: Se analizaron un total de 1.118 imágenes faciales de 140 pacientes con EOT para evaluar la actividad de la enfermedad mediante Glandy CAS, que clasifica la EOT como activa (CAS #1 3) o inactiva. El rendimiento del sistema se comparó con las puntuaciones CAS de referencia determinadas a través de evaluaciones presenciales por un especialista en oculoplastia, y con evaluaciones fotográficas realizadas por un oftalmólogo general. Para evaluar la gravedad se utilizaron 1.102 imágenes de 137 pacientes para estimar el exoftalmos con Glandy EXO y 1.119 imágenes de 140 pacientes para evaluar la retracción palpebral con Glandy LID. Los estándares de referencia incluyeron la exoftalmometría clínica para el exoftalmos y las distancias margen-reflejo medidas manualmente (MRD1, MRD2) para la posición palpebral. El rendimiento de los modelos se evaluó mediante la puntuación F1, sensibilidad, especificidad, error absoluto medio (MAE), error porcentual absoluto medio (MAPE) y coeficiente de correlación de Pearson.
Resultados: Glandy CAS alcanzó una puntuación F1 de 0,77, sensibilidad del 80,5% y especificidad del 87,8%, superando al oftalmólogo general. Para el exoftalmos, Glandy EXO mostró una fuerte concordancia con el estándar clínico (r = 0,7043 con una sola imagen y r = 0,7611 al promediar tres imágenes). Glandy LID también demostró un excelente rendimiento (r MRD1 = 0,9387; r MRD2 = 0,9123).
Conclusiones: Este estudio confirma el sólido rendimiento de Glandy CAS, EXO y LID en la evaluación de la actividad y la gravedad de la EOT a partir de imágenes faciales en una cohorte española, lo que respalda su uso en la práctica clínica real.



