Chrome está mejorando en entender las pausas y puntuaciones que nunca dices en voz alta.
Google está mejorando silenciosamente la dictación por voz en Chrome para que se sienta mucho más natural. Con la última versión Beta de Chrome 151, la compañía está introduciendo una nueva capacidad que permite al motor de reconocimiento de voz del navegador inferir automáticamente la puntuación según la forma en que las personas hablan, eliminando la necesidad de decir explícitamente comandos como "coma" o "punto final".
La actualización puede parecer menor a primera vista, pero aborda una de las mayores frustraciones con la escritura por voz: hablar de manera natural a menudo produce texto que carece de puntuación a menos que los usuarios dictan conscientemente cada signo de puntuación. Al enseñar a Chrome a entender pausas, ritmo y patrones de habla, Google está dando otro paso hacia hacer que las conversaciones con computadoras se sientan más humanas.
Chrome quiere entender cómo hablas, no solo lo que dices
La nueva función llega a través de la API de Web Speech en Chrome 151 Beta. Google ha agregado un nuevo atributo booleano unspokenPunctuation a la interfaz de SpeechRecognition. Cuando está habilitado, el motor de reconocimiento de voz inserta automáticamente la puntuación basada en pausas, entonación y prosodia en lugar de requerir que los usuarios digan los comandos de puntuación en voz alta.
En términos prácticos, eso significa que los usuarios pueden dictar un correo electrónico, documento o mensaje en un estilo conversacional más natural mientras Chrome determina dónde pertenecen las comas, puntos y otros signos de puntuación.
Simon Hill / Digital Trends
La mejora es particularmente útil para sesiones de dictado más largas donde repetir "coma", "punto" o "signo de interrogación" interrumpe el flujo natural del habla. También podría hacer que las herramientas de transcripción basadas en el navegador, aplicaciones de toma de notas, software de accesibilidad y asistentes de escritura impulsados por IA se sientan significativamente más fluidos.
Los desarrolladores también se beneficiarán
Debido a que la función es parte de la API de Web Speech de Chrome, las aplicaciones web que dependen del reconocimiento de voz pueden implementar la funcionalidad sin tener que construir sus propios modelos de puntuación.
Google dice que la función funciona analizando las pausas del habla y la prosodia en lugar de depender únicamente de las palabras habladas, acercando el reconocimiento de voz basado en el navegador a cómo los humanos se comunican de manera natural.
Digital Trends
La adición también refleja una tendencia más amplia en el ecosistema de software de Google. A medida que Gemini y los modelos de lenguaje impulsados por IA se integran cada vez más en productos como Chrome, Android y Workspace, la compañía está poniendo un mayor énfasis en entender la conversación humana natural en lugar de requerir que los usuarios adapten su habla para las máquinas.
Chrome 151 Beta ya incluye la función para que los desarrolladores la prueben, aunque la disponibilidad más amplia dependerá del calendario de lanzamiento estable del navegador. Al igual que con muchas API experimentales, los desarrolladores determinarán en última instancia cuán ampliamente se adopta en las aplicaciones web.
Si bien la puntuación automática no transformará la escritura por voz de la noche a la mañana, es el tipo de mejora en la calidad de vida que los usuarios probablemente notarán cada vez que dictan un mensaje o transcriben una conversación. A veces, las mayores actualizaciones no son características nuevas y llamativas de IA, sino pequeños cambios que hacen que la tecnología sea mejor para entender cómo las personas ya se comunican.
Other articles
Chrome está mejorando en entender las pausas y puntuaciones que nunca dices en voz alta.
Chrome 151 Beta introduce la puntuación automática para el reconocimiento de voz, permitiendo que el navegador infiera comas y puntos a partir del habla natural sin comandos hablados.
