Un reciente estudio liderado por investigadores de la Universidad del País Vasco (UPV/EHU) y el Instituto de Investigación Sanitaria Biobizkaia ha revelado que los modelos avanzados de inteligencia artificial (IA) pueden obtener mejores resultados que los candidatos humanos en el examen nacional de acceso a la especialidad de Enfermería (EIR).

El trabajo, publicado en la revista Informática + Salud, evaluó el rendimiento de cinco modelos de IA -ChatGPT 3.5, Gemini Ultra 1.0, ChatGPT-4, Bing AI (Copilot) y Gemini Advance 1.5 (LaMDA)- al enfrentarse al examen EIR 2023, compuesto por 210 preguntas de opción múltiple. Los resultados de las IA se compararon con los de 6.845 aspirantes humanos que participaron en la convocatoria oficial.

Resultados destacados

  • ChatGPT-4 alcanzó la máxima puntuación, situándose en el percentil 100 y superando a todos los participantes humanos, con una nota de 130,3 puntos frente a la media humana de 51 puntos.
  • Bing AI (Copilot) obtuvo el segundo mejor resultado, con 103,7 puntos (percentil 99,4).
  • Gemini Ultra 1.0 y Gemini Advance 1.5 lograron percentiles del 89,6 y 81,3, respectivamente, mientras que ChatGPT 3.5 se situó en el percentil 84,4.
  • Ningún aspirante humano fue capaz de superar el rendimiento de ChatGPT-4, incluso teniendo en cuenta la dificultad histórica del examen EIR 2023.

Metodología y contexto

El estudio empleó un enfoque de “zero-shot prompting”, es decir, los modelos de IA recibieron el examen sin entrenamiento previo ni ejemplos, replicando así las condiciones a las que se enfrentan los candidatos humanos. Las respuestas se analizaron y compararon en términos de aciertos netos y percentiles.

Los autores del estudio destacan que estos resultados posicionan a la IA -especialmente a ChatGPT-4 y Bing AI- como herramientas con un alto potencial para la comprensión y resolución de preguntas clínicas y académicas en Enfermería. Sin embargo, advierten que la comparación entre modelos debe interpretarse con cautela, ya que no todos pudieron responder a las preguntas basadas en imágenes.

Implicaciones para la formación y la evaluación en salud

Este estudio abre nuevas perspectivas sobre el papel de la IA en la educación y evaluación de competencias en ciencias de la salud. Los resultados sugieren que los modelos de IA pueden ser aliados valiosos en la preparación de futuros profesionales, el diseño de bancos de preguntas y la evaluación de conocimientos, aunque también plantean retos éticos y metodológicos sobre su uso y supervisión.

Los autores subrayan la necesidad de seguir investigando el rendimiento de la IA en diferentes contextos y tipos de exámenes, así como de garantizar la equidad, la transparencia y la explicabilidad de estos sistemas en entornos educativos y clínicos.

 


Autoría: Alex Larrozea y Sendoa Ballesteros.

Artículo con revisión editorial. No existen conflictos de interés con relación al presente artículo. Las opiniones expresadas son responsabilidad exclusiva de los/las autores/as y no reflejan, necesariamente, los puntos de vista de los/las editores/as. Artículo bajo licencia de Creative Commons: Reconocimiento 4.0 Internacional.

Este documento debe citarse como: “Larrozea A, Ballesteros S. La inteligencia artificial supera a los aspirantes humanos en el examen nacional de Enfermería (EIR). [Internet]. Enfermería Activa del Siglo XXI: blog abierto; 26 de mayo de 2025. Disponible en: www.enfermeriaactiva.com”

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *