Esta es una pequeña guía que proporciona pautas hacia la creación de la base de datos de habla para obtener una voz propia de RHVoice en español. Si bien no detallamos el proceso de construcción, que requiere de conocimientos técnicos y se puede estudiar en la wiki del repositorio, nosotros proporcionamos el proceso de entrenamiento en base a las grabaciones de futuras voces, así como también ofrecemos el conjunto de textos adecuado.

Cosas a tomar en consideración

  • ¿Cuentas con un equipo profesional? El teléfono o los auriculares con micrófono no son suficientes.
  • ¿Tu espacio es adecuado? Un lugar que no tenga eco o ruido.
  • ¿La voz está en las mejores condiciones? EJ: no hay resfriado, o grabar minutos después de despertar.

Proceso

Primero, Usaremos este documento de texto que contiene una selección de textos a ser leídos. En total, implica un tiempo estimado de 3.5 horas de audio; sin embargo, esto depende del ritmo del hablante.
Es importante que las grabaciones cuenten con las siguientes especificaciones:

  • Las grabaciones deberán estar en formato wav, 16 bits, 44.1 khz, mono.
  • No uses un compresor u otros efectos al grabar. Tanto el procesamiento como la masterización se llevará a cabo en la fase final de preparación de la voz.
  • Si hay más de una oración en la misma línea, léelos juntos para que estén en una sola grabación.
  • No modificar el contenido o las palabras de las oraciones establecidas, léelas tal y como se indican en el texto.
  • Si hay líneas que no terminen con un punto, léelas como si terminaran con un punto de todas formas.
  • Entona e interpreta la puntuación, Especialmente en el punto y la coma, para obtener mayor consistencia al leer un texto con la voz generada. Recuerda que la pausa en la coma debe ser corta, y en el punto más larga.
  • Puedes nombrar las grabaciones mediante enumeración (0001, 0002, 0003) o (1, 2, 3)
    • Como alternativa, puedes enviar un solo archivo de audio con todas las frases, aunque teniendo en cuenta que debe hallarse un silencio de 3 segundos después de cada oración. Además, deben ser las tomas finales, es decir, solamente las frases pronunciadas e interpretadas correctamente.
  • Graba siempre en las mismas condiciones (ambiente / espacio / lugar) para garantizar la mayor calidad posible.
  • Habla normalmente con tu acento: estamos abiertos a tener voces en español de distintas regiones.

¿Listo para grabar?

  • Considera realizar un borrador con las primeras 50 frases del conjunto de textos. Con frases damos por entendido que son las oraciones después de las letras y números, que empieza desde la línea 166 y posterior del archivo de texto.
    • Este borrador nos ayudará a identificar el potencial de la voz, y confirmar si las condiciones son las adecuadas en lo referente a la calidad; de esa forma, vamos a aprobar el procedimiento con el resto de la base de datos sin mayor inconveniente. Si consideras que esas tomas son definitivas, ten en cuenta nombrarlos desde 166 en adelante. Cuando obtengas nuestra aprobación, puedes comenzar grabando las letras y números, así como la continuación de las frases (de 216 en adelante).
  • Escribe al correo electrónico indicando que solicitas la preparación de grabaciones de tu voz para RHVoice; especifica el dialecto o acento de tu voz (útil para nuestras tareas de procesamiento lingüístico), y sube el borrador creado previamente.
  • Después, aprobaremos las grabaciones; posterior a ello, nos pondremos en contacto contigo para estar al tanto de nuevos avances, resolviendo dudas si es necesario y, finalmente, presentar el resultado de la base de datos completa para construir la voz.

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

To respond on your own website, enter the URL of your response which should contain a link to this post's permalink URL. Your response will then appear (possibly after moderation) on this page. Want to update or remove your response? Update or delete your post and re-enter your post's URL again. (Find out more about Webmentions.)