Pramaana Labs recauda $27 millones para hacer que la IA sea verificable

      A medida que las empresas luchan por convertir los pilotos de IA en cosas de las que realmente pueden depender, una nueva startup está apostando a que la solución se parece menos a un mejor chatbot y más a una prueba matemática.

      Pramaana Labs anunció $27 millones en financiamiento inicial el miércoles, liderado por Khosla Ventures, con la participación de Accel, BoldCap, Nexus Venture Partners, Premji Invest y Unbound.

      La empresa está enfocándose en campos de alto riesgo donde una respuesta incorrecta tiene un costo real: derecho, descubrimiento de fármacos y preparación de impuestos.

      Su propuesta es que esos campos no son tan desordenados como parecen. “Los problemas más difíciles del mundo no son irresolubles. Son no formalizados”, dijo el cofundador y director ejecutivo Ranjan Rajagopalan. “Cada dominio donde estar equivocado puede costarle a alguien su salud, dinero o libertad tiene reglas.”

      Un LLM con un verificador de pruebas añadido

      Pramaana aún funciona con un modelo de lenguaje grande convencional, lo que le da la flexibilidad para manejar preguntas en lenguaje natural. La diferencia está en la parte superior.

      Esa capa se basa en la verificación formal, la práctica de probar que un sistema se comporta exactamente como se especifica. Específicamente, Pramaana utiliza LEAN, el lenguaje de código abierto que los matemáticos usan para verificar pruebas, para comprobar el trabajo del modelo y hacer que el razonamiento sea determinista en lugar de probabilístico.

      “Es como matemáticas en el sentido de que tienes muchas reglas que necesitas seguir”, dijo Rajagopalan a TechCrunch, describiendo el código tributario. “Una vez que tienes una versión codificada de esto, el razonamiento sobre ello comienza a volverse determinista.”

      Combinar un LLM con una capa de verificación se está convirtiendo en una forma común de abordar el problema de fiabilidad de la IA. Lo que Pramaana reclama como propio es el uso de herramientas de prueba formal para hacerlo, un enfoque que se sitúa más cerca de la investigación de garantías demostrables que de las habituales barandillas.

      Construyendo el libro de reglas, dominio por dominio

      El inconveniente es que alguien tiene que codificar las reglas primero, y Pramaana lo está haciendo un vertical a la vez, cada uno supervisado por expertos en el dominio.

      Para impuestos, la empresa está trabajando con el excomisionado del IRS Danny Werfel. Profesores de IIT Delhi, IIT Madras y UC Berkeley están supervisando los sistemas de ciberseguridad y descubrimiento de fármacos.

      Hay precedentes para la idea. Rajagopalan señala el proyecto CATALA de Francia, que ha convertido gran parte de la ley tributaria y de beneficios del país en código ejecutable.

      Por ahora, el trabajo aún está por delante del producto. Pramaana tiene el dinero, los patrocinadores y una tesis de que el techo de precisión de la IA es realmente una cuestión de cuánto del mundo nos hemos molestado en escribir. Las reglas solo necesitan ser codificadas, y esa es la parte difícil.

Otros artículos

'FortiBleed': 75,000 inicios de sesión de firewalls Fortinet expuestos Una filtración denominada FortiBleed expuso credenciales en texto plano para aproximadamente 75,000 firewalls de Fortinet en 194 países, incluyendo Samsung, Oracle y Siemens. Así es como.

ByteDance es el mayor cliente de IA de Microsoft. ByteDance está en camino de gastar $1 mil millones al año con Microsoft, principalmente en modelos de OpenAI, en un mercado que OpenAI y Anthropic se niegan a servir directamente.

Waymo emite su sexto retiro después de que los robotaxis ingresaran a zonas de construcción en la carretera 13 veces. Waymo retiró casi 4,000 robotaxis después de 13 incidentes de vehículos que entraron en zonas de construcción de carreteras cerradas. Un pasajero que pensó que iba a morir recibió tres viajes gratis.

MIT construyó un sistema de memoria que permite a los robots recordar dónde dejaste tus llaves. El marco DAAAM del MIT proporciona a los robots memoria espacial a largo plazo al adjuntar descripciones en lenguaje a mapas 3D. Pregunta "¿dónde está mi billetera?" y busca en su memoria.

NeuralTrust recauda $20 millones para asegurar agentes de IA empresarial NeuralTrust de Barcelona recaudó $20 millones en una ronda semilla para controlar la 'expansión de agentes' en las empresas y para vender a bancos y gobiernos europeos una opción de seguridad que no sea americana.

Pramaana Labs recauda $27 millones para hacer que la IA sea verificable

Pramaana Labs recaudó $27 millones liderados por Khosla Ventures para envolver LLMs en verificación formal basada en LEAN para trabajos de alto riesgo en derecho, impuestos y descubrimiento de fármacos.