ISSN: 2530-0164

Endocrinología, Diabetes y Nutrición es la revista órgano de expresión de la Sociedad Española de Endocrinología y Nutrición (SEEN) y de la Sociedad Española de Diabetes (SED). La publicación recoge el apasionante progreso registrado en el conocimiento de la fisiopatología endocrina tanto en el ámbito clínico como experimental, y es un fiel exponente de los avances de esta especialidad en nuestro país. Además de las secciones Originales y Notas clínicas, en las que se publican trabajos de gran calidad elaborados por diversos centros endocrinológicos clínicos y experimentales, la revista publica artículos de Revisión y Editoriales escritos por reconocidos especialistas de la endocrinología española con el fin de actualizar conocimientos y dar a conocer los avances más relevantes en la actualidad.

Ver más Opción Open Access

Indexada en:

Index Medicus/MEDLINE, Excerpta Medica/EMBASE, SCOPUS, Science Citation Index Expanded, Journal Citation Reports/Science Edition, IBECS

Congreso

Contenidos del congreso

Congreso

66 Congreso Nacional de la Sociedad Española de Endocrinología y Nutrición

Granada, 15 - 17 octubre 2025

Listado de sesiones

Descargar el PDF completo del suplemento

66 Congreso Nacional de la Sociedad Española de Endocrinología y Nutrición

Listado de sesiones

Descargar el PDF completo del suplemento

Comunicación

Comunicación anterior

Comunicación siguiente

23. EJERCICIO Y MISCELÁNEA

Texto completo

Descargar PDF

418 - EVALUACIÓN COMPARATIVA DEL RENDIMIENTO DE PLATAFORMAS DE INTELIGENCIA ARTIFICIAL GENERATIVA MÁS COMUNES (CHATGPT, GEMINI Y COPILOT) EN 1.140 PREGUNTAS DE ENDOCRINOLOGÍA Y NUTRICIÓN

C. Lozano Aida¹, R. Gómez Almendros², P. Pérez Castro³, R. Fernández García-Salazar⁴, A. Gutiérrez Hurtado⁴, J. Napky Rajo², D. Rivas Otero¹, I. Masid Sánchez¹, E. Redondo⁵ y M. García Villarino⁶

¹Hospital Universitario Central de Asturias, Instituto de Investigación Sanitaria del Principado de Asturias, Oviedo. ²Hospital Universitario Torrecárdenas, Almería. ³Complejo Hospitalario Universitario de Vigo. ⁴Hospital Universitario Central de Asturias, Oviedo. ⁵Hospital Universitario Clínico San Cecilio, Granada. ⁶Instituto de Investigación Sanitaria del Principado de Asturias.

Introducción: Las plataformas de inteligencia artificial generativa (IAG) han irrumpido como herramientas potenciales en educación médica. Su rendimiento en contextos específicos, como la resolución de preguntas clínicas tipo test en el ámbito médico, y más concretamente en el área de la endocrinología y la nutrición, aún no ha sido evaluado de forma sistemática.

Objetivos: Comparar el rendimiento de ChatGPT, Copilot y Gemini –en sus versiones gratuitas y de pago– al resolver preguntas tipo test de endocrinología y nutrición extraídas de oposiciones oficiales del sistema sanitario español.

Métodos: Se incluyeron un total de 1.140 preguntas tipo test procedentes de exámenes de oposición en endocrinología y nutrición celebrados entre los años 2022 y 2024 en diversas comunidades autónomas españolas, eliminándose las impugnadas. Cada pregunta fue introducida simultáneamente en seis modelos de IAG (ChatGPT 4mini, ChatGPT4o, Gemini, Gemini Advanced, Copilot y Copilot Pro). Se evaluó el porcentaje de aciertos y la concordancia intermodelo mediante el índice Kappa.

Resultados: El análisis de rendimiento mostró que la plataforma con mayor tasa de aciertos fue ChatGPT-4o (versión de pago), con un 81,4% de respuestas correctas. Le siguieron Gemini Advanced (74,6%) y Copilot Pro (70,7%). Entre las versiones gratuitas, Copilot (69,2%) y ChatGPT 4mini (68,3%) presentaron resultados similares, mientras que Gemini gratuito obtuvo el porcentaje más bajo (61,8%). La concordancia entre modelos fue moderada (κ = 0,45 entre ChatGPT 4mini y Copilot), siendo superior en las versiones de pago.

Conclusiones: Todas las versiones de pago mostraron un rendimiento superior a un 70%, siendo superior ChatGPT-4o con más de un 80%, por lo que es evidente que las IAG podrían constituir una herramienta de apoyo útil en formación médica, especialmente si se utilizan de forma complementaria. Estos datos no son equiparables a los resultados obtenidos en el examen MIR, lo que puede ser debido a una menor dificultad del mismo.