Mozilla Common Voice es un conjunto de datos de código abierto que cualquiera puede usar para crear tecnologías de voz que funcionen mejor para todos. Actualmente, los sistemas de voz, tales como asistentes de voz en los teléfonos inteligentes o servicios automatizados de llamadas en los bancos, admiten menos del 1% de las lenguas del mundo. Las mujeres y los hablantes de lenguas indígenas, por ejemplo, están subrepresentados en los datos y eso significa que es menos probable que el aprendizaje de las máquinas considere sus hablas para que sean entendidas y apoyadas. En general, acceder a los datos de habla para innovar en tecnologías de voz suele ser costoso e impulsado por grandes empresas con fines privados. Esto dificulta que los pequeños proyectos o iniciativas cuenten con datos para crear tecnologías igualmente potentes para muchos hablantes de muchas lenguas. En ese sentido, la iniciativa de Mozilla Common Voice busca incentivar a la gente para que done su voz y contribuya a que las tecnologías sean accesibles y tengan alcances sobre muchos hablantes. El contributón, entonces, es un maratón para ampliar el conjunto de datos en el español de México.
Este evento es una colaboración entre la Fundación Mozilla, el Instituto de Investigaciones Antropológicas, el Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas, Indiana University Gateway México, Mozilla México, Comunidad Elotl y nuestros socios de NVIDIA.