jueves, 2 de febrero de 2017

Voz natural vs. Voz Sintética



Un micrófono de sobremesa de color negro en primer plano y detrás una pantalla de ordenador en la web de Ver Sin Limites Accesibilidad
Micro y pantalla de VSL Accesibilidad
¿Cuál es el elemento más importante cuando hablamos de accesibilidad para personas con discapacidad visual? Sin duda, la voz, el sonido, el audio, o como le queramos llamar. También está el tacto pero aún está un poco por detrás en cuanto investigaciones y dispositivos que lo utilicen.


Hoy vamos a hablar sobre los dos tipos de voz que se emplean en el mundo de la tecnología para hacerla más accesible, no solo a las personas con baja visión o ceguera sino a todo el mundo en general porque ¿a quién no le gusta una aplicación o dispositivo que "habla"?





Hace unos meses lanzamos una pequeña encuesta en nuestro perfil de Twitter con la siguiente pregunta: Para la accesibilidad en internet  ¿Qué prefieres: Voz sintética o voz natural?


La verdad es que no participó mucha gente pero lo que sí quedó claro es que la mayoría de la gente que dio su opinión prefiere la voz natural.


Como podéis comprobar en nuestro blog nosotras utilizamos este tipo de voz para poner audio a nuestros artículos porque consideramos que le da un toque más cercano y personal a la narración.


Pero detrás de esa voz hay un proceso mucho más laborioso para nosotras que si optásemos por la voz sintética. No queremos decir con eso que el proceso para conseguir transformar un texto a audio mediante esta técnica sea fácil. Nada más lejos de la realidad teniendo en cuenta las diferentes investigaciones que se han realizado y se realizan al respecto para mejorar el proceso.


Sin embargo existen por la red y los diferentes mercados de apps, opciones para transformar texto a audio simplemente pulsando un botón o con una básica cadena de comandos. Es decir, si quisiésemos poner audio sin más, bastaría usar una web o una aplicación y ponerlo en el blog. Eso nos ahorraría muchas horas de grabación, edición, exportación, etc.


Con todo esto no queremos echarnos flores ni nada parecido. Nosotras optamos por esta opción porque nos gusta pero en otras ocasiones también recurrimos a la voz sintética para leer textos, leer pantallas, etc.


En este punto también debemos decir que en casos de una gran cantidad de contenido la opción de voz natural igual no es muy recomendable ya que sería muy costoso, en cuestión de tiempo utilizado, realizar tal cantidad de grabaciones. Lo mismo ocurre en los dispositivos tecnológicos que ofrecen el audio como accesibilidad o los lectores de pantalla que ayudan a las personas ciegas o con baja visión a saber que es lo que aparece en la pantalla.


Quizá en un futuro consigan una voz sintética parecida a la humana. Eso realmente sería un gran logro aunque algo automatizado carece de la tonalidad, ritmo, calidez, etc. de una voz humana. Creemos que eso es algo muy muy difícil de lograr, por no decir imposible.


Hay un artículo muy interesante en Wikipedia sobre la síntesis de voz o habla, también llamada voz sintética donde se explica cómo se produce, su historia y los diferentes hardware y software que se han empleado y se emplean hoy en día. Os dejamos el enlace al artículo Síntesis de habla que os puede ser muy útil para comprender esta tecnología.


En próximos posts os traeremos algunas opciones para transformar texto a voz e incluso algún vídeo explicativo con alguna de ellas. Pero ahora hablemos de la voz natural.



Para nosotras, Ver Sin Límites - Accesibilidad, la voz natural es como un elemento identificador y a la vez tiene un significado que podríamos calificar de "emotivo".


En mi niñez, y ahora hablo como la niña que pasó unas cuantas temporadas en un hospital con los dos ojos tapados, el sonido y la voz eran todo el acceso a la información que podía tener. La voz de mi madre leyéndome los libros de Los Cinco o las cintas de Cuenta Cuentos de Salvat en mi walkman era lo que alegraba las horas de convalecencia.


Luego, en mi etapa de estudiante, ese mismo walkman, la grabadora y unas cuantas cintas de casete regrabables convirtieron mis libros y apuntes en sonido. Leía en voz alta todo aquello que tenía que estudiar y luego lo escuchaba paseando o a oscuras aunque esto último tenía el inconveniente de quedarse dormida. Recuerdo que por aquel entonces salían los primeros estudios que decían que se aprendía mejor el inglés si se escuchaban los listenings durmiendo. Nunca supe si es verdad o no pero era una buena excusa o automentirijilla piadosa cuando sucumbía al sueño.


Luego vino la universidad y las grabaciones de alguna asignatura aumentaron mucho en longitud y la cosa se puso complicada. Hubo que tirar de grabaciones extras pero se superó.


Para mucha gente, o para la mayoría, escuchar su voz grabada es un poco raro, por no decir, impactante, y a mí también me pasó. Bueno, reconozco que aún me ocurre pero prefiero eso a una máquina.


Hace unos años una complicación en la vista me tuvo unos meses sin poder leer y fue un suplicio. Gracias a la radio conseguí sobrellevar aquellas horas calurosas del verano del 2010. A duras penas logré hacerme con un lector de pdfs que me desquiciaba así que mi objetivo fue, desde aquel día, encontrar material sonoro de calidad y libros narrados con voz natural.


La entonación, el ritmo, el tono, las emociones… mostradas con la voz son muy importantes para mantener la atención del oyente y, por supuesto, para entender mejor el mensaje que se quiere transmitir. De ahí que consideremos la voz natural la mejor opción cuando se trate de hacer contenido accesible. 


Puntualizo aquí también que a veces algunas voces naturales son tan monótonas que llegan a parecer sintéticas. Eso tampoco ayuda mucho.


Nos gustaría saber vuestra opinión sobre las voces. Posiblemente hayáis utilizado “Braille Speak/Hablado” o lectores de pantalla durante algún tiempo y estéis habituados a su sonido e incluso lo prefiráis o por el contrario os resulte insoportable. Animaos y contadnos en los comentarios vuestra experiencia


Por último os dejaremos de nuevo la encuesta en Twitter y Facebook para que podáis opinar y confirméis o no nuestra teoría de que la voz natural es más agradable y mejor valorada en el ámbito de la accesibilidad que la voz sintética.



Más información: