Las herramientas de trampa de IA están ganando. La detección no es el objetivo.
Los videos están por todas partes, y la oferta siempre es la misma. Deja que la IA haga tu tarea, y no te atraparán.
Según una investigación del New York Times, TikTok y YouTube están ahora llenos de tutoriales que venden a los estudiantes dos tipos de herramientas. Los humanizadores reescriben el texto generado por IA para que ya no suene como un chatbot. Los autocompletadores hacen algo más astuto: introducen las palabras en un documento durante horas, simulando errores tipográficos, eliminaciones y ediciones para que un ensayo terminado parezca una sesión de escritura real.
Ambos están diseñados para derrotar el software que los profesores utilizan para atrapar a la IA.
Las mismas empresas venden la enfermedad y la cura
Aquí está la parte incómoda. Algunas de las empresas que venden herramientas de detección también venden las herramientas que las superan.
Grammarly, ahora propiedad de Superhuman, ofrece a los profesores un verificador de "autoría" que escanea el historial de un documento en busca de signos de IA. La misma aplicación también generará texto desde cero, lo "humanizará" y reescribirá frases que podrían activar un detector. GPTZero, un detector nacido como una tesis de Princeton, también puede escribir un trabajo completo, con citas, en segundos.
El NYT encontró que un comercializador había construido una falsa personalidad de asistente de enseñanza en TikTok para promocionarlo entre los estudiantes.
Jenny Maxwell, quien dirige la educación en Superhuman, fue clara sobre a dónde conduce esto. La carrera entre la detección y la evasión es, dijo, "en última instancia, un callejón sin salida". Su resumen: "Gato más grande, ratón más grande".
Los detectores apenas funcionan de todos modos
Ella tiene un punto, porque los gatos no son muy buenos.
Investigadores de la Universidad de Florida probaron los cinco detectores de texto de IA más populares y encontraron tasas de falsos negativos de hasta el 99.6 por ciento, con un solo ajuste de vocabulario suficiente para derrotar a la mayoría de ellos, informó Digital Trends. Las herramientas también generan falsos positivos, señalando desproporcionadamente a hablantes no nativos de inglés.
Así que las escuelas que disciplinan a los estudiantes basándose en lo que dice un detector están sobre hielo muy delgado. La tecnología en la que confían es, según la propia admisión de sus creadores, deficiente.
De exámenes orales a apagones de internet
Ante eso, las instituciones están improvisando, y las respuestas van desde lo sensato hasta lo extremo. En el extremo más calmado, los profesores de Harvard están apoyándose más en exámenes orales y en papel y lápiz, que un chatbot no puede hacer por ti.
En el otro extremo se encuentra la coerción.
Para detener el fraude en su examen nacional de ingreso a la escuela de medicina, India ordenó bloquear Telegram durante varios días, informó The Register, después de que el examen fue anulado y reprogramado tras una sospecha de filtración. Más de dos millones de personas se presentan a ese examen por aproximadamente 100,000 plazas.
Los grupos de derechos digitales calificaron el cierre de desproporcionado, y es parte de un patrón más amplio de gobiernos que reprimen el uso indebido de la IA con instrumentos muy contundentes.
El número siempre fue el problema
Retrocediendo, la pánico por el fraude parece un síntoma de algo más antiguo. La escuela convirtió el aprendizaje en un solo número, la calificación, hace mucho tiempo.
El filósofo C. Thi Nguyen llama a esto "captura de valor": adoptas una métrica externa, luego dejas que reemplace silenciosamente la cosa que se suponía que debía medir. En su libro "The Score", revisado esta semana por MIT Technology Review, señala el GPA como el caso clásico. Los estudiantes dejan de buscar comprensión y comienzan a perseguir la calificación. Es la Ley de Goodhart en una mochila: cuando una medida se convierte en un objetivo, deja de ser una buena medida.
La IA es solo el optimizador más eficiente que se ha inventado para ese objetivo. Si el objetivo del ensayo es la puntuación, no el pensamiento, entonces descargar el pensamiento es el movimiento racional, incluso cuando los estudios advierten que este tipo de descarga cognitiva permite que las habilidades reales se marchiten.
Un pedal de gas, sin freno
Las personas que construyen esta tecnología también están inquietas.
Jack Clark, cofundador de Anthropic, dijo a la BBC que la industria "tiene un pedal de gas, pero no tiene un pedal de freno", y señaló que el propio modelo de Anthropic ahora escribe la mayor parte de su código. Su empresa ha pedido un freno coordinado en la IA de frontera. Maxwell, desde el otro lado, argumenta que negar la IA a los estudiantes es "mala práctica educativa", ya que la usarán en el trabajo independientemente.
Ambas cosas pueden ser ciertas.
La carrera armamentista de detección no se puede ganar, y la detección nunca fue la verdadera pregunta. La más difícil, la que las escuelas han eludido durante un siglo, es para qué sirve realmente la calificación. La IA no creó ese problema. Simplemente hizo imposible seguir ignorándolo. Hasta que alguien lo responda, el gato más grande seguirá persiguiendo al ratón más grande, y el ratón seguirá ganando.
Otros artículos
Las herramientas de trampa de IA están ganando. La detección no es el objetivo.
Los humanizadores de IA y los autocompletadores ahora superan a los detectores destinados a atrapar a los tramposos. El verdadero problema no son las herramientas, sino lo que las escuelas eligen medir.
