
MADRID, 16 (Portaltic/EP)
Google ha actualizado sus herramientas de accesibilidad en Android y el navegador Chrome para ampliar sus capacidades de la mano de la inteligencia artificial (IA) y los modelos Gemini, lo que permite preguntar sobre una imagen con TalkBack acceder a subtítulos en tiempo real que van más allá de lo que dicen las personas.
La herramienta TalkBack, diseñada para que personas ciegas o con visión reducida puedan interactuar con el dispositivo, incorporó el año pasado las capacidades de Gemini para ofrecer descripciones de las imágenes.
Este año, Google ha actualizado la integración con su inteligencia artificial para que los usuarios puedan preguntar sobre la imagen descrita y obtener información. Eta forma de interactuar, demás, se extiende a toda la pantalla, por ejemplo, durante el proceso de compra en una página web.
Para las personas con discapacidad auditiva, la IA de Google también impulsa los 'Subtítulos Expresivos', una nueva función que ofrece subtítulos no solo de lo que dice la gente sino también, de cómo lo dice, e incluso incorpora etiquetas para informar de sonidos, como un silbido o un carraspeo, como explica en su blog oficial.
Esta novedad, que actúa en tiempo real y en la mayoría de las aplicaciones, está disponible en inglés en Estados Unidos, Reino Unido, Canadá y Australia para dispositivos con Android 15 y versiones posteriores.
Los equipos Chromebook han incorporado nuevas funciones de accesibilidad dirigidas a los estudiantes con discapacidad, para que puedan navegar por el ordenador con gestos faciales y personalizar la experiencia de lectura.
En lo que respecta al navegador Chrome, que más de 2.000 millones de personas utilizan cada día, , con el reconocimiento óptico de caracteres (OCR) reconoce automáticamente un PDF escaneado, lo que permite resaltar, copiar y buscar texto y usar el lector de pantalla para leerlo.
Zoom de página, por su parte, permite ampliar el tamaño del texto en Chrome para Android, sin que ello afecte al diseño de la página ni a la navegación por la web.
PROYECTO EUPHONIA
Proyecto Euphonia nació en 2019 como una iniciativa destinada a mejorar el reconocimiento de voz en más idiomas y contextos culturales, para que esta tecnología sea más accesible para las personas con un habla no estándar.
Desde entonces, Google ha apoyado a los desarrolladores, a quienes ofrece repositorios de código abierto a través de la página de GitHub, con el fin de mejorar el ecosistema de herramientas a nivel mundial.
A principios de año se creó el Centro para la Inclusión del Lenguaje Digital (CDLI), una iniciativa de Google.org y University College London con la que buscan mejorar la tecnología de reconocimiento de voz en diez idiomas africanos, con conjuntos de datos de código abierto y el desarrollo de nuevos modelos.
|