Arena, la tabla de clasificación de IA que todos usan, acaba de convertirse en un negocio de 100 millones de dólares.

Arena, la tabla de clasificación de IA que todos usan, acaba de convertirse en un negocio de 100 millones de dólares.

      TL;DRArena, la tabla de clasificación de IA nacida en UC Berkeley, alcanzó 100 millones de dólares en ingresos anuales ocho meses después de lanzar su servicio de evaluación paga. Arena, la tabla de clasificación de IA basada en la multitud que comenzó como un proyecto de investigación de UC Berkeley en 2023, ha alcanzado 100 millones de dólares en ingresos anuales solo ocho meses después de lanzar su primer producto comercial. La plataforma es mejor conocida por permitir a los usuarios comparar las respuestas de dos modelos de IA anónimos lado a lado y votar cuál es mejor. Más de 10 millones de esas evaluaciones han sido enviadas hasta ahora. Los ingresos provienen de Evaluaciones de IA, un servicio pago que Arena introdujo en septiembre y que ofrece a laboratorios de modelos y empresas análisis de rendimiento detallados extraídos de su comunidad de usuarios. Para diciembre, el servicio había alcanzado 30 millones de dólares en ingresos anuales. Desde entonces, se ha más que triplicado. Hay una advertencia en el número destacado. Mientras Arena describe la cifra como ARR, el CEO Anastasios Angelopoulos dijo a TechCrunch que los clientes pagan por consumo, lo que significa que los ingresos no son recurrentes en el sentido tradicional de SaaS. “Mucha gente ni siquiera entiende que nuestro negocio está generando dinero, todavía nos ven como un proyecto de código abierto”, dijo. El 💜 de la tecnología de la UE Los últimos rumores de la escena tecnológica de la UE, una historia de nuestro sabio fundador Boris y un arte de IA cuestionable. Es gratis, cada semana, en tu bandeja de entrada. ¡Regístrate ahora! Arena no tiene competidor directo que se mantenga en pie. Sí, la única otra startup de selección de modelos de IA basada en la multitud, Yupp, cerró en marzo después de recaudar 33 millones de dólares del Chris Dixon de a16z crypto. Angelopoulos dijo que Arena compite “por el mismo dólar” que las empresas de etiquetado humano como Mercor, Surge y Scale AI, todas las cuales ayudan a los creadores de modelos a refinar su IA durante el post-entrenamiento. Ese mercado está creciendo rápidamente. Los ingresos anuales de Handshake por capacitación de IA casi se duplicaron de 550 millones de dólares en enero a casi mil millones de dólares en abril, según The Information. Los ingresos anuales de Mercor también superaron mil millones de dólares a principios de este año, aunque una violación de la cadena de suministro ha complicado desde entonces su relación con clientes clave, incluyendo Meta. Arena fue cofundada por Angelopoulos y Wei-Lin Chiang, ambos investigadores postdoctorales en UC Berkeley, junto con Ion Stoica, el profesor de UC Berkeley y cofundador de Databricks que asesoró el proyecto antes de que se incorporara en abril de 2025. La compañía recaudó 150 millones de dólares en una ronda de Serie A en enero a una valoración de casi dos mil millones de dólares, llevando su financiamiento total a 250 millones de dólares de inversores como Felicis, Andreessen Horowitz, Kleiner Perkins y Lightspeed. La plataforma ahora clasifica modelos de IA en texto, codificación, visión y generación de imágenes, así como flujos de trabajo de agentes complejos a través de un Modo de Agente recientemente introducido. Su tabla de clasificación se ha convertido en el marcador de hecho para modelos de IA de vanguardia, con laboratorios desde OpenAI hasta Anthropic y Google citando rutinariamente las clasificaciones de Arena en sus propios anuncios de lanzamiento. Convertir esa influencia en un negocio de 100 millones de dólares en menos de un año sugiere que evaluar la IA puede ser casi tan lucrativo como construirla.

Otros artículos

Cursor lanza una aplicación de iOS para que los desarrolladores puedan crear agentes de codificación desde su teléfono. Cursor lanza una aplicación de iOS para que los desarrolladores puedan crear agentes de codificación desde su teléfono. La nueva aplicación de iOS de Cursor permite a los desarrolladores lanzar y gestionar agentes de codificación independientes desde su teléfono, a medida que el desarrollo impulsado por IA va más allá del escritorio. WhatsApp ahora te permite reservar un nombre de usuario para que nunca tengas que compartir tu número de teléfono nuevamente. WhatsApp ahora te permite reservar un nombre de usuario para que nunca tengas que compartir tu número de teléfono nuevamente. WhatsApp está abriendo reservas de nombres de usuario para sus tres mil millones de usuarios, permitiendo a las personas conectarse sin compartir su número de teléfono por primera vez. Esta PC para juegos de $1,299 quiere ser una Steam Machine sin esperar a Valve. Esta PC para juegos de $1,299 quiere ser una Steam Machine sin esperar a Valve. MetaPCs ha abierto las preventas para Steamroller, un escritorio de juegos SteamOS de $1,299 construido con piezas de PC estándar en lugar de un diseño personalizado estilo consola. Los anuncios de streaming dolorosamente ruidosos que interrumpen tu programa finalmente están siendo reducidos. Los anuncios de streaming dolorosamente ruidosos que interrumpen tu programa finalmente están siendo reducidos. Una nueva ley de California prohíbe a las plataformas de streaming reproducir anuncios más fuertes que los programas que interrumpen, a partir del 1 de julio. La ruptura de Comcast es la advertencia más contundente hasta ahora de que el paquete de cable está perdiendo su control. La ruptura de Comcast es la advertencia más contundente hasta ahora de que el paquete de cable está perdiendo su control. La separación de NBCUniversal de Comcast no debería interrumpir Peacock o Xfinity de inmediato, pero señala una ruptura más profunda entre el servicio de internet y los beneficios de streaming a medida que el antiguo paquete de cable pierde poder. La IA hizo que cada individuo fuera más fuerte y cada equipo más fragmentado. Yimao Zhou está construyendo el sistema operativo para revertir eso. La IA hizo que cada individuo fuera más fuerte y cada equipo más fragmentado. Yimao Zhou está construyendo el sistema operativo para revertir eso. El fundador de Emagen AI, Yimao Zhou, argumenta que la industria de agentes de IA está optimizando la unidad equivocada. Su respuesta es Cagen, un sistema operativo organizacional donde la IA impulsa el trabajo y llama a los humanos cuando los necesita.

Arena, la tabla de clasificación de IA que todos usan, acaba de convertirse en un negocio de 100 millones de dólares.

Arena, la tabla de clasificación de IA basada en la colaboración colectiva utilizada por todos los principales laboratorios, ha alcanzado 100 millones de dólares en ingresos anuales de su servicio de evaluación de pago.