Repensando la Integridad Académica en la Era de la IA Un Análisis Comparativo de ChatGPT y Estudiantes Universitarios en 32 Cursos

Repensando la Integridad Académica en la Era de la IA Análisis Comparativo de ChatGPT y Estudiantes Universitarios en 32 Cursos

La inteligencia artificial (IA) que genera nuevo contenido utilizando algoritmos de aprendizaje automático para ampliar la información previamente creada en texto, audio o imágenes se conoce como IA generativa. Muchas personas ahora ven este sector como un “cambio de juego al que la sociedad y la industria deben estar preparados” debido a los avances recientes en el área y su accesibilidad sin precedentes. Por ejemplo, Stable Diffusion y DALL-E han llamado mucho la atención en el mundo del arte por su capacidad para producir obras en varios géneros. Otra tecnología generativa de IA, Amper Music, se ha utilizado previamente para construir álbumes completos y generar canciones en cualquier género musical.

La herramienta más reciente en este campo es ChatGPT, que puede producir respuestas textuales que se asemejan a respuestas humanas a diferentes estímulos en varios idiomas. Para ser más precisos, lo hace de manera conversacional, permitiendo a los usuarios expandirse orgánicamente sobre estímulos anteriores en forma de diálogo continuo. Por su valor casi ilimitado en múltiples aplicaciones, incluyendo escritura creativa, marketing, servicio al cliente y periodismo, esta herramienta ha sido calificada como un “éxito extraordinario” y una “revolución en la productividad”. Con ChatGPT alcanzando un millón de usuarios en solo cinco días después de su lanzamiento y superando los 100 millones de usuarios mensuales en solo dos meses, las capacidades de la herramienta han despertado mucha atención.

A pesar de sus increíbles capacidades, la IA generativa ha enfrentado problemas éticos. Ha habido una discusión continua sobre quién posee las vastas cantidades de datos disponibles en línea y que se utilizan para entrenar modelos de IA generativa. Además, a medida que estas herramientas se desarrollan, se vuelve más difícil distinguir entre creaciones humanas y algorítmicas. El uso de ChatGPT para producir escritos académicos y soluciones de tareas ha generado debates relacionados con la integridad académica de estudiantes de escuelas secundarias y universidades. Por ejemplo, los distritos educativos de la ciudad de Nueva York, Los Ángeles y Baltimore han prohibido su uso en los Estados Unidos.

De manera similar, las universidades australianas han expresado su deseo de retomar los exámenes escritos a mano para desalentar a los estudiantes a utilizar la tecnología para escribir ensayos. Debido a preocupaciones sobre el plagio, académicos de universidades como la Universidad George Washington, la Universidad Rutgers y la Universidad Estatal de Appalachian han decidido eliminar por completo las tareas para realizar en casa con libros abiertos. Varios congresos y publicaciones también han prohibido el uso de ChatGPT para producir escritos académicos, lo cual no es sorprendente considerando que se ha demostrado que los resúmenes generados por ChatGPT son idénticos al material generado por humanos.

Sin embargo, varias personas han defendido e incluso promovido el uso de ChatGPT para mejorar la producción de escritos. En el ámbito educativo, investigaciones anteriores han analizado la efectividad y utilidad de los grandes modelos de lenguaje en campos como medicina y atención médica, informática y ciencia de datos, derecho, negocios, periodismo y medios de comunicación, y adquisición de idiomas. Aunque estos estudios encontraron resultados mixtos al comparar el rendimiento de ChatGPT en pruebas estandarizadas con el de los estudiantes, aquellos que compararon específicamente el rendimiento del modelo con el de modelos de lenguaje grandes anteriores encontraron que la tarea de responder preguntas había mejorado significativamente.

Investigadores que evaluaron el rendimiento de ChatGPT en el Examen de Licencia Médica de los Estados Unidos descubrieron que ChatGPT obtuvo resultados similares o cercanos al nivel de aprobación en cada una de las tres fases del examen sin necesidad de entrenamiento especializado adicional. De manera similar, otros probaron el modelo ChatGPT en el examen Fundamentos de Ingeniería de los Estados Unidos para evaluar su rendimiento en el contexto de la ingeniería. En su estudio, demostraron cómo el rendimiento del modelo fluctuaba según las diversas secciones del examen, obteniendo altas calificaciones en algunas, como Práctica Profesional y Ética, mientras obtenía calificaciones bajas en otras, como Hidrología.

A pesar de estos casos, se necesita una investigación sistemática que compare el rendimiento de ChatGPT con el de estudiantes de diferentes áreas académicas en la misma universidad para mejorar la literatura existente. Además, es necesario aclarar la posición de estudiantes e instructores sobre el uso de esta tecnología a nivel global. Por último, no está claro si las soluciones de tareas generadas por ChatGPT son detectables. En este sentido, investigadores de la Universidad de Nueva York en Abu Dhabi comparan el rendimiento de ChatGPT con el de estudiantes de 32 cursos universitarios de ocho campos diferentes para analizar su potencial como herramienta para detectar plagio. También investigan la viabilidad de un enfoque de obfuscación que podría utilizarse para evitar algoritmos especialmente diseñados para detectar texto generado por ChatGPT.

Encuestaron a participantes (N=1601) seleccionados de cinco países diferentes, a saber, Brasil, India, Japón, Reino Unido y Estados Unidos, para comprender mejor las perspectivas de los estudiantes y educadores sobre la utilidad de ChatGPT y los problemas éticos y normativos que surgen con su uso. También realizaron encuestas más detalladas a 151 estudiantes universitarios y 60 profesores en la universidad de los autores para examinar las variaciones en cómo diferentes campos ven a ChatGPT. Descubrieron que ChatGPT tiene un rendimiento tan bueno como, e incluso mejor que, los estudiantes en nueve de los 32 cursos. También encontraron que los algoritmos de detección actuales a menudo identifican erróneamente las respuestas de ChatGPT como generadas por IA en lugar de generadas por humanos.

Para empeorar las cosas, un ataque de ofuscación vuelve inútiles estos algoritmos, perdiendo el 95% de las respuestas de ChatGPT. Finalmente, parece haber acuerdo entre los estudiantes de que utilizarán ChatGPT para sus trabajos académicos y entre los instructores de que hacerlo será considerado como plagio. Dada la tensión inherente entre estos dos aspectos, las instituciones educativas deben desarrollar regulaciones aceptables de integridad académica para la IA generativa en general y ChatGPT en particular. En la era de la IA generativa, sus hallazgos proporcionan perspectivas contemporáneas que podrían orientar las conversaciones políticas sobre la reforma educativa.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Las Nuevas Implicaciones Éticas de la Inteligencia Artificial Generativa

El rápido progreso del IA generativa hace necesario implementar urgentemente salvaguardias éticas contra los riesgos ...

Inteligencia Artificial

Microsoft redefine los 7 TB de 'Project Silica' como solución de almacenamiento en la nube usando vidrio como medio

Microsoft dijo que su tecnología de almacenamiento de medios de vidrio Project Silica puede conservar aproximadamente...

Inteligencia Artificial

Investigadores de Microsoft proponen DeepSpeed-VisualChat Un salto adelante en el entrenamiento de modelos de lenguaje multi-modal escalables.

Los modelos de lenguaje grandes son sistemas de inteligencia artificial sofisticados creados para comprender y produc...

Inteligencia Artificial

Robo-Dog establece el récord mundial de los 100 metros en la categoría sprint según el Guinness World Records

Guinness World records etiquetó a un robot parecido a un perro creado por un equipo del Instituto Avanzado de Ciencia...

Inteligencia Artificial

Miles de autores instan a las compañías de IA a dejar de usar trabajos sin permiso

Casi 8,000 autores acaban de firmar una carta dirigida a los líderes de seis empresas de inteligencia artificial, inc...

Ciencia de Datos

10 hiperparámetros confusos de XGBoost y cómo ajustarlos como un profesional en 2023.

Un tutorial detallado y visual sobre cómo ajustar 10 de los hiperparámetros más confusos de XGBoost con Optuna.