Si codificas aplicaciones de Android con IA, el nuevo estándar de Google facilita la elección del modelo adecuado.

Si codificas aplicaciones de Android con IA, el nuevo estándar de Google facilita la elección del modelo adecuado.

      Android Bench evalúa qué tan bien manejan diferentes modelos de IA las tareas de codificación de Android en el mundo real.

      Para los desarrolladores de aplicaciones de Android que dependen de la IA para codificar, elegir el modelo adecuado puede ser complicado. No todos los modelos están construidos de la misma manera, y muchos no están específicamente entrenados para los flujos de trabajo de desarrollo de Android. Para abordar esto, Google ha introducido un nuevo benchmark para ayudar a los desarrolladores a entender qué tan bien se desempeñan diferentes modelos de IA en tareas de codificación de Android en el mundo real.

      Llamado Android Bench, el nuevo benchmark está diseñado para evaluar qué tan bien los modelos de lenguaje grande (LLMs) manejan tareas típicas de desarrollo de Android. Google explica que el benchmark evalúa modelos utilizando tareas del mundo real de proyectos públicos en GitHub y pide a los modelos que recrean solicitudes de extracción reales y resuelvan problemas similares a los que los desarrolladores encuentran al construir aplicaciones de Android. Los resultados se verifican para ver si realmente resuelven el problema.

      Elegir el mejor ✨ modelo de IA para tu tarea puede sentirse abrumador cuando hay tantas opciones, por lo que la industria busca benchmarks de LLM para orientación. El problema para los desarrolladores de Android es que estos benchmarks no están ponderados para evaluar realmente los tipos de tareas que… pic.twitter.com/nz7Uxnc6l2— Mishaal Rahman (@MishaalRahman) 5 de marzo de 2026

      En términos más simples, el benchmark verifica si el código generado por los modelos de IA realmente soluciona el problema en lugar de parecer correcto en la superficie. Esto ayuda a Google a medir cuán útiles son realmente los diferentes modelos cuando se trata de resolver problemas reales de desarrollo de Android.

      Google

      Con la primera versión de Android Bench, Google planeó “medir puramente el rendimiento del modelo y no centrarse en el uso de agentes o herramientas.” Los resultados destacan una amplia brecha, con modelos que completan con éxito entre el 16% y el 72% de las tareas del benchmark. La compañía dice que publicar estos resultados debería facilitar a los desarrolladores comparar modelos y elegir aquellos que realmente son capaces de manejar problemas de codificación de Android en el mundo real.

      Además de guiar a los desarrolladores, el benchmark también podría impulsar a las empresas de IA a mejorar la comprensión de sus modelos sobre el desarrollo de Android. Para apoyar ese esfuerzo, Google ha publicado la metodología, el conjunto de datos y el marco de pruebas de Android Bench en GitHub. Con el tiempo, esto podría llevar a herramientas de IA que estén mejor equipadas para navegar por complejas bases de código de Android y ayudar a los desarrolladores a construir y arreglar aplicaciones de manera más efectiva.

      Pranob es un periodista tecnológico experimentado con más de ocho años de experiencia cubriendo tecnología de consumo. Su trabajo ha sido…

      La carga inalámbrica de 25W del Galaxy S26 Ultra podría no funcionar como se anunció

      El último buque insignia de Samsung hace que la carga inalámbrica de 25W sea más difícil de lo que debería ser. Con el Galaxy S26 Ultra, Samsung introdujo un montón de actualizaciones a la batería y la carga. Obtuvimos un ligero aumento en el tamaño de la batería, velocidades de carga por cable e inalámbrica. Después de años de quejas de los fanáticos, el último buque insignia de Samsung finalmente actualiza la carga inalámbrica a 25W. Este fue un salto notable desde 15W, que era el estándar en su línea premium. Pero parece que alcanzar esas velocidades podría ser más difícil de lo esperado.

      Leer más

      Los problemas de VPN en tu teléfono son aparentemente un error no solucionado de Android 16

      Un nuevo error reportado en Android 16 está generando preocupaciones entre expertos en seguridad y proveedores de VPN, con evidencia que sugiere que un error a nivel de sistema podría interrumpir silenciosamente las conexiones VPN en los dispositivos afectados. El problema, que supuestamente ha persistido durante meses, podría dejar a los usuarios expuestos sin saberlo mientras creen que su tráfico de internet sigue protegido. Un fallo silencioso en el sistema de red de Android

      Leer más

      Samsung te alquilará un Galaxy S26 Ultra a mitad del precio de etiqueta durante un año

      Y aún no es una buena oferta para los usuarios si hacen las cuentas de comprar vs. alquilar (con la tarifa adicional del programa Galaxy Forever) y el menor valor de recompra que obtienen después de un año. Samsung ha ideado una nueva forma de atraer a más clientes hacia la serie Galaxy S26 en uno de sus mercados clave. A través de un comunicado de prensa publicado hoy, la compañía anunció un nuevo programa “Galaxy Forever” en India. El nombre puede ser un poco confuso, pero es esencialmente un programa de propiedad o actualización periódica en el que los compradores pueden obtener el Galaxy S26 Ultra (disponible desde $1502) o el Galaxy S26 Plus (disponible desde $1,288) pagando el 50% del precio del dispositivo por adelantado, distribuido en 12 cuotas mensuales sin intereses. El Galaxy S26 regular no es elegible.

      Leer más

Si codificas aplicaciones de Android con IA, el nuevo estándar de Google facilita la elección del modelo adecuado. Si codificas aplicaciones de Android con IA, el nuevo estándar de Google facilita la elección del modelo adecuado. Si codificas aplicaciones de Android con IA, el nuevo estándar de Google facilita la elección del modelo adecuado. Si codificas aplicaciones de Android con IA, el nuevo estándar de Google facilita la elección del modelo adecuado. Si codificas aplicaciones de Android con IA, el nuevo estándar de Google facilita la elección del modelo adecuado. Si codificas aplicaciones de Android con IA, el nuevo estándar de Google facilita la elección del modelo adecuado.

Otros artículos

Las pruebas muestran que el Apple M5 Max supera al AMD y establece un récord de rendimiento. Las pruebas muestran que el Apple M5 Max supera al AMD y establece un récord de rendimiento. El M5 Max de Apple acaba de establecer un nuevo récord de rendimiento, superando al mejor de AMD en pruebas de un solo núcleo e incluso superando al propio chip M3 Ultra de Apple en rendimiento multinúcleo. iRU esconde Tactio 515 detrás de la pantalla iRU esconde Tactio 515 detrás de la pantalla La empresa rusa iRU ha resuelto el problema de los escritorios siempre desordenados al lanzar un dispositivo que prácticamente pasa desapercibido en la mesa de oficina. Más bien, se fija en la parte trasera del monitor. Tactio 515 es un nettop para aquellos que valoran cada centímetro de superficie de trabajo. La IA ha dominado la legislación procesal. La IA ha dominado la legislación procesal. Durante mucho tiempo se consideró que los litigios eran cosa de personas con rostros de piedra y montones de papeles. Pero la tecnología no se queda atrás. Nuestro viejo conocido, el Neuroabogado, ha pasado por otra actualización y finalmente ha llegado a comprender que no basta con saber quién tiene razón, también hay que saber cómo torturar correctamente al oponente en el tribunal. La última oferta de T-Mobile 5G Home Internet te da hasta $300 de regreso. La última oferta de T-Mobile 5G Home Internet te da hasta $300 de regreso. Si has estado considerando un cambio de la cable tradicional, la nueva promoción de T-Mobile 5G Home Internet puede ser la razón más convincente hasta ahora para hacer el movimiento. El operador está ofreciendo a los nuevos clientes hasta $300 de regreso dependiendo del plan que elijas. Combinado con una configuración simple, datos ilimitados y un enfoque sin contrato, esta oferta por tiempo limitado se destaca como una de las más fáciles y […] Apple está promoviendo las aplicaciones de Microsoft Office para MacBook Neo, y el objetivo es obvio. Apple está promoviendo las aplicaciones de Microsoft Office para MacBook Neo, y el objetivo es obvio. Apple está adoptando un enfoque raro con el material de marketing para su nuevo MacBook Neo, señalando que conquistar a los usuarios de Windows es más importante para la empresa que mantener su jardín amurallado perfectamente sellado. MAIBENBEN reunió un «cubo» para tareas no triviales MAIBENBEN reunió un «cubo» para tareas no triviales La empresa decidió que las personas creativas y aquellas que trabajan con grandes datos necesitan un regalo especial, y presentó la estación de trabajo MAIBENBEN PC95A. Dentro de este cubo monolítico se encuentra un potente procesador AMD Ryzen AI MAX+ 395 con gráficos AMD Radeon 8060S. Según las características, el dispositivo está diseñado para aquellos que "se comunican" localmente con grandes modelos de lenguaje, procesan terabytes de datos o se dedican a renderización 3D compleja. El nuevo producto tiene una garantía de dos años, lo que demuestra que hay confianza en el producto.

Si codificas aplicaciones de Android con IA, el nuevo estándar de Google facilita la elección del modelo adecuado.

Para los desarrolladores de aplicaciones de Android que dependen de la IA para codificar, elegir el modelo adecuado puede ser complicado. No todos los modelos están construidos de la misma manera, y muchos no están específicamente entrenados para los flujos de trabajo de desarrollo de Android. Para abordar esto, Google ha introducido un nuevo estándar para ayudar a los desarrolladores a entender qué tan bien funcionan diferentes modelos de IA en situaciones reales de Android […]