Claude escribe el 80% de su código, pide una pausa de IA.
TL;DRAnthropic revela que Claude ahora escribe más del 80% de su código de producción, con ingenieros enviando 8 veces más código por trimestre que en 2024. El nuevo documento del Anthropic Institute mapea el camino hacia la auto-mejora recursiva y llama a un mecanismo de pausa global verificable.
Uno de los ingenieros de Anthropic no ha escrito una línea de código en cinco meses. No porque el trabajo se haya agotado, sino porque Claude lo hace ahora. A partir de mayo de 2026, más del 80% del código fusionado en la base de código de producción de Anthropic fue escrito por Claude, un aumento desde cifras de un solo dígito cuando Claude Code se lanzó en febrero de 2025.
Esa cifra, publicada el miércoles en un nuevo documento del Anthropic Institute titulado “Cuando la IA se construye a sí misma”, no es el titular en el que la empresa quiere que te enfoques. El titular es lo que viene a continuación: IA que puede diseñar y entrenar a su propio sucesor. Anthropic dice que aún no ha llegado allí, pero podría estar más cerca de lo que la mayoría de las instituciones están preparadas.
Los números detrás del cambio
Las ganancias de productividad son notables. En el segundo trimestre de 2026, el ingeniero típico de Anthropic fusionó ocho veces más código por día que en 2024. Una encuesta interna de 130 investigadores encontró que el encuestado mediano estimó aproximadamente cuatro veces más producción con el último modelo de Anthropic, Mythos Preview, en comparación con trabajar sin IA.
En los problemas de ingeniería más complejos y abiertos, la tasa de éxito de Claude aumentó al 76% en mayo de 2026, un aumento de 50 puntos porcentuales en seis meses. Anthropic da un ejemplo concreto: cuando una actualización rutinaria comenzó a fallar decenas de miles de trabajos de entrenamiento, un ingeniero dirigió a Claude al incidente en vivo con poco más que un contexto textual y acceso al clúster. Claude aisló una bandera de depuración oscura, reprodujo el fallo y confirmó una solución en aproximadamente dos horas. Eso normalmente tomaría de dos a tres días.
La brecha en la calidad del código también se está cerrando. El personal de Anthropic dice que el código escrito por Claude era “algo peor” que el código escrito por humanos a finales de 2025, está en una paridad aproximada hoy y se espera que sea estrictamente mejor dentro de un año. Un revisor automatizado de Claude ahora verifica cada cambio propuesto a la base de código de Anthropic antes de que pueda fusionarse. Un análisis retrospectivo encontró que habría capturado aproximadamente un tercio de los errores detrás de los incidentes pasados de claude.ai antes de que llegaran a producción.
De la codificación a la investigación
Escribir código es la parte fácil. La pregunta más difícil es si Claude puede hacer investigación, el tipo de razonamiento científico abierto que impulsa a la IA hacia adelante.
La evidencia de Anthropic aquí es más preliminar pero aún impactante. En abril de 2026, la empresa publicó una demostración de Claude ejecutando un proyecto de investigación de seguridad de IA abierto de principio a fin. Nueve agentes paralelos recibieron un problema, se les dejó proponer hipótesis, realizar experimentos, compartir hallazgos a través de un foro común e iterar. Durante más de 800 horas acumulativas y aproximadamente $18,000 en computación, los agentes recuperaron el 97% de la brecha de rendimiento en la tarea. Dos investigadores humanos, trabajando durante una semana, recuperaron el 23%.
Otro experimento interno midió si Claude podía elegir un “siguiente paso” mejor que un investigador humano en momentos difíciles durante sesiones de investigación reales. En noviembre de 2025, Claude coincidió con el juicio humano el 51% del tiempo. Para abril de 2026, eso aumentó al 64%. El trabajo diario de la investigación es en gran medida una cadena de estas decisiones de siguiente paso. Si esa tendencia continúa, la brecha entre IA como asistente e IA como investigador se estrecha rápidamente.
La curva del horizonte de tareas
Los datos internos de Anthropic se alinean con un patrón más amplio rastreado por METR, una organización sin fines de lucro que evalúa las capacidades de IA. La duración de las tareas que la IA puede completar de manera confiable por su cuenta se ha duplicado aproximadamente cada cuatro meses, acelerándose desde un ritmo anterior de cada siete meses.
En marzo de 2024, Claude Opus 3 podía manejar tareas que a un humano le llevan aproximadamente cuatro minutos. A principios de 2025, Claude Sonnet 3.7 logró tareas de una hora y media. Hoy, Claude Opus 4.6 maneja tareas de 12 horas, y METR encontró que Mythos Preview podría sostener trabajo durante al menos 16 horas, en el extremo superior de lo que el conjunto de pruebas actual puede medir. Si la tendencia se mantiene, las tareas que requieren días de trabajo humano calificado estarán al alcance este año. Las tareas de semanas podrían seguir en 2027.
La infraestructura se está resquebrajando
Los efectos a nivel inferior ya son visibles. GitHub, la plataforma sobre la que se construye la mayor parte del software del mundo, vio aproximadamente mil millones de commits de código en todo 2025. Para mediados de 2026, la plataforma estaba procesando 275 millones de commits por semana, a un ritmo de 14 mil millones durante el año. Claude Code solo representa el 4.5% de todos los commits públicos en GitHub, generando 2.6 millones semanalmente.
El COO de GitHub ha dicho que la empresa está “presionando increíblemente fuerte” en capacidad solo para mantenerse al día. Dentro de Anthropic, el cuello de botella ya se ha desplazado: a medida que Claude genera más código, la revisión de código humano se ha convertido en la restricción. La empresa dice que ha encontrado un ejemplo de libro de texto de la ley de Amdahl, donde acelerar una parte de un proceso simplemente revela el siguiente eslabón más lento.
La pregunta de la pausa
La sección más significativa del documento no trata sobre productividad. Es un llamado a un mecanismo global verificable para ralentizar o pausar temporalmente el desarrollo de IA de frontera.
Anthropic es cuidadoso con el marco. Una pausa unilateral por un laboratorio simplemente cambiaría quién lidera, no crearía el proceso deliberativo que la empresa dice que falta. Lo que Anthropic propone en su lugar es un sistema donde múltiples laboratorios de frontera, en múltiples países, podrían acordar detenerse bajo las mismas condiciones y verificar que los demás realmente lo hayan hecho. Traza un paralelo con el control de armas nucleares pero reconoce las diferencias: las ejecuciones de entrenamiento son mucho más fáciles de ocultar que los silos de misiles, las entradas son de propósito general y el incentivo para desertar en silencio es enorme.
“Si fuera posible ralentizar efectivamente el desarrollo de esta tecnología para darnos más tiempo para lidiar con sus inmensas implicaciones, creemos que eso probablemente sería algo bueno”, dice el documento. El mercado de codificación de IA ahora vale decenas de miles de millones. Pedir a la industria que se detenga es pedirle que deje dinero sobre la mesa mientras confía en que los competidores, incluidos los de China, harán lo mismo.
Lo que significaría la auto-mejora recursiva
El documento presenta tres futuros posibles. En el primero, la tendencia se detiene, pero incluso las capacidades actuales remodelan la economía. En el segundo, el desarrollo de IA se automatiza sustancialmente mientras los humanos aún establecen la dirección de la investigación, lo que significa que empresas de 100 personas podrían hacer el trabajo de organizaciones de 100,000 personas. En el tercero, los sistemas de IA logran una auto-mejora recursiva completa y comienzan a diseñar sus propios sucesores.
Anthropic dice que no tiene “buenas intuiciones” sobre cómo se ve ese tercer escenario. Pero ofrece una observación: incluso la inteligencia recursiva no puede acelerar todo. No puede aprender lo que hace un medicamento durante décadas de uso, celebrar elecciones antes de lo que dicta una constitución, o convertir a un extraño en un viejo amigo en un fin de semana. El ritmo sentido de este futuro, para la mayoría de las personas, aún estaría determinado por los cuellos de botella.
El creciente impulso empresarial de la compañía hace que el momento de este documento sea notable. Anthropic está vendiendo simultáneamente a Claude como una revolución de productividad y advirtiendo que la trayectoria que habilita podría requerir un freno de emergencia global. Si esa tensión es transparencia principista o posicionamiento estratégico depende de lo que suceda a continuación.
Otros artículos
Claude escribe el 80% de su código, pide una pausa de IA.
Claude ahora es autor del 80% del código de producción de Anthropic. El nuevo documento de la empresa traza el camino hacia la auto-mejora recursiva y pide un mecanismo de pausa global.
