El estudio dirigido por profesores de la Universidad de Reading refleja cómo la inteligencia artificial está impactando la educación, trayendo consigo una serie de retos para los profesores.
El plagio impulsado por herramientas de IA generativa como ChatGPT y Gemini, es uno de los principales problemas a los que se enfrenta el sector educativo hoy en día. Es por eso que con el objetivo de probar la capacidad de estos modelos para engañar a los profesores, un grupo de investigadores de una universidad del Reino Unido realizaron un experimento en el que la IA demostró una gran habilidad para contestar exámenes, incluso superando a los humanos en la mayoría de los casos.
IA demuestra su capacidad para obtener mejores calificaciones que estudiantes
El estudio publicado en la revista PLOS ONE se llevó a cabo en la Universidad de Reading, donde los líderes de la institución están trabajando para identificar posibles riesgos y oportunidades de la IA para la investigación, la enseñanza, el aprendizaje y la evaluación de asignaturas académicas.
Para la realización del estudio, los investigadores tomaron como referencia exámenes de distintas materias de la carrera de licenciatura en psicología. Posteriormente solicitaron al popular chatbot de OpenAI, ChatGPT, que los respondiera y entregaron los resultados a los profesores utilizando nombres de estudiantes falsos, sin que ellos supieran que habían sido contestados por un modelo de IA.
Los exámenes se conformaban de tres secciones distintas, la primera era opción múltiple, la segunda requería que los estudiantes contestaran preguntas con respuestas cortas de un máximo de 200 palabras y la tercera que desarrollaran algún tema mediante ensayos más complejos de alrededor de 1,500 palabras.
Los profesores, quienes desconocían el estudio, calificaron los exámenes y sorprendentemente solo identificaron el 6% de las respuestas que fueron generadas con ChatGPT.
Además de lo anterior, los investigadores subrayaron que los maestros no solamente creyeron que el 94% de las respuestas fueron creadas por humanos, sino que en promedio obtuvieron mejores calificaciones más altas que la mayoría de los estudiantes de psicología.
El impacto de los hallazgos descubiertos en el estudio
Los profesores de la Universidad de Reading y coautores de la investigación, Peter Scarfe y Etienne Roesch, calificaron su trabajo como el “estudio ciego más grande y sólido” sobre el impacto de la IA en la educación hasta el momento, por lo que afirman que demuestra cómo ChatGPT ha superado la prueba de Turing, que consiste en comprobar qué tanto puede una máquina imitar las capacidades de un humano.
Por otro lado, concluyeron que los hallazgos de su investigación deberían ser una “llamada de atención” para los educadores en todo el mundo, ya que consideran que su trabajo demuestra a la perfección cómo la IA está revolucionando la educación en general, trayendo como consecuencia una serie de complejos desafíos para la docencia.
“Nuestro estudio pone de relieve la responsabilidad que tenemos como productores y consumidores de información”, declaró Etienne Roesch en la presentación de su trabajo. “Necesitamos redoblar nuestro compromiso con la integridad académica y la investigación”.
Finalmente, los investigadores proponen que se cambie la forma en que se evalúa a los estudiantes, sugiriendo que se deberían de incorporar herramientas de IA al proceso de revisión para detectar cuando alguien está usándolo para hacer trampa.