Tecnología de Voz para la Inclusión Educativa de Niños y Jóvenes con Discapacidad Visual

La integración de personas con discapacidad visual en la sociedad, especialmente en el ámbito educativo, representa un desafío continuo. Sin embargo, la evolución de la tecnología de voz y los sistemas de grabación ha abierto nuevas avenidas para el desarrollo pleno y la autonomía de estudiantes con baja visión o ceguera, proporcionando herramientas que facilitan el acceso al conocimiento y la interacción con el mundo.

Esquema de las diferentes tecnologías de voz asistiva para la discapacidad

La Importancia de la Tecnología de Voz para la Inclusión Educativa

Para muchos estudiantes con discapacidad visual, el acceso a materiales didácticos tradicionales es limitado. La lectura en voz alta por parte de terceros ha sido históricamente una solución, pero este método puede ser lento y su producción es restringida. Es crucial capacitar a los voluntarios en técnicas de estudio y la mejor manera de leer el texto impreso para que los oyentes puedan entenderlo con facilidad. La tecnología emerge como un método particularmente bueno para la educación de personas ciegas o con baja visión, ofreciendo soluciones más eficientes y accesibles.

La Iniciativa Hongdandan y la Biblioteca "Eyes of the Soul"

En China, las oportunidades de empleo para personas ciegas o con problemas de visión han estado muy limitadas durante mucho tiempo, tradicionalmente encontrando trabajo en centros de masajes terapéuticos. Para cambiar esta realidad, la fundadora de Hongdandan, Zheng Xiaojie, creó en 2006 la biblioteca Eyes of the Soul, un proyecto que describe como el “sueño de su vida”.

Al inicio, el centro no contaba con equipo de grabación especializado, utilizando una computadora y micrófonos del programa de sus niños para crear archivos de audio. En la actualidad, esta biblioteca distribuye contenido a través de Microsoft Azure en 105 escuelas de China para estudiantes ciegos o con problemas de visión. Microsoft ha sido socio de Hongdandan durante unos 15 años, apoyando todos los aspectos de la biblioteca, incluyendo el servicio de voz de IA.

Fotografía de Lina Dong en una cabina de grabación

Innovación con la Voz Neural Personalizada de Microsoft Azure

Una de las innovaciones más significativas es el uso de Custom Neural Voice, una nueva capacidad de conversión de texto a voz en Microsoft Azure Cognitive Services. Lina Dong, quien una vez tomó clases en el Centro de Servicios para Personas con Discapacidades Visuales de Beijing Hongdandan y ahora enseña artes del lenguaje, ha ofrecido muestras de su discurso para generar una voz real que se acerca a la de ella. Este proceso es mucho más rápido que la forma estándar en que Hongdandan ha producido audiolibros.

Dong, quien también investiga la creación y el uso de voces sintéticas en la Universidad de Comunicación de China, destaca que Custom Neural Voice de Microsoft simula una voz real mucho mejor que las voces sintéticas más generales. Tanto ella como Zheng Xiaojie comparten el objetivo de ayudar a las personas ciegas o con baja visión a integrarse mejor en la sociedad. Para Dong, una voz de audio ideal, ya sea real o sintética, debe sonar cálida y clara, con un sentido de confianza e incluso un sentimiento de amor y afecto.

El Impacto Transformador de la Voz Sintética

La implementación de estas tecnologías tiene un impacto profundo. La Biblioteca Eyes of the Soul ha sido fundamental para mejorar las perspectivas de educación y empleo de las personas ciegas o con baja visión. Proporciona un canal para adquirir conocimientos y conocer el mundo. La compañía de una voz ha eliminado la distancia entre ellos y el mundo, lo que ha llevado a muchos a ser más positivos y confiados, reduciendo la sensación de aislamiento o miedo.

Otras Tecnologías de Asistencia para la Discapacidad Visual

Además de la creación de audiolibros y voces sintéticas, existen otras herramientas esenciales que apoyan a las personas con discapacidad visual:

  • La calculadora que habla: ideal para ciegos y deficientes visuales, anuncia todas las teclas pulsadas y cálculos matemáticos en una voz femenina clara.
  • JAWS: el lector de pantalla más popular del mundo, distribuido en más de 50 países y traducido a 17 idiomas. Es compatible con una amplia gama de aplicaciones como Lotus Symphony, Microsoft Office Suite, Internet Explorer, Corel Word Perfect y Adobe Acrobat Reader, entre otras.
  • Software OpenBook: considerado el mejor convertidor de texto a voz. Convierte documentos impresos en texto o gráficos a un formato electrónico en la PC, leyéndolos en voz alta con expresión y precisión. Utiliza motores Nuance OmniPage y ABBYY FineReader OCR para el reconocimiento de texto más preciso.
  • DBT (Duxbury Braille Translator): proporciona facilidades de traducción y formato para automatizar la conversión de impresión regular a braille y viceversa, además de permitir el procesamiento de textos directamente en braille.
  • BraiBook: facilita el acceso al braille de manera libre.

Estas herramientas, junto con los avances en la tecnología de voz y grabación, construyen un entorno más inclusivo y accesible para que niños y jóvenes con discapacidad visual puedan desarrollarse plenamente.

tags: #bigbag #grabador #de #voz #para #ninos