Hackatón sobre tecnologías del habla
29 abril al 3 de mayo de 2022
Universidad Nacional Autónoma de México
Ciudad de México, México.
Audiencia:
Cómo funciona:
El Hackatón se trata de (1) desarrollar aplicaciones para modelos pre-entrenados y (2) de contribuir en la recolección de datos del habla, tanto para el español como para las lenguas indígenas de México.
¡Aprende cómo utilizar los modelos pre-entrenados (español, náhuatl, y más) de Coquí y Hugging Face en los mini-talleres antes de la apertura del Hackatón!
Categorías
Habrán dos categorías y en cada categoría dos posibles temas. La primera categoría será 'software para las lenguas indígenas' y la segunda categoría será 'el español de México'. Los temas serán (1) el uso de modelos pre-entrenados, (2) herramientas para la colección de datos.
- Uso de modelo pre-entrenado, español
- Uso de modelo pre-entrenado, lengua indígena
- Herramienta de colección de datos, español
- Herramienta de colección de datos, lengua indígena
Ejes de evaluación
- Calidad técnica (1-5)
- ¿El modelo y el enfoque del proyectoon son apropiados y están bien motivados?
- Colaboración (1-5)
- ¿El proyecto ha sido desarrollado en colaboración con una comunidad de hablantes o usuarios?
- ¿Resuelve alguna necesidad actual de esa comunidad?
- Inovación (1-5)
- ¿El proyecto aporta algo que no existía (para una lengua)?
- ¿Es inovador?
- Rendimiento (1-5)
- ¿Se puede ejecutar en un dispositivo móvil?
- ¿Utiliza los recursos de una manera eficiente?
Comité de evaluación
El comité de evaluación está integrado por los siguientes colaboradores: Dra. Hilaria Cruz, Lic. Huber Benítez Meili, Mtra. Tajëëw Díaz Robles.
Premios:
El equipo ganador en cada categoría se llevará $20,000 MXN.
Calendario:
Fecha | Día | Hora | Evento |
---|---|---|---|
23 de abril | sábado | 11:00am | Taller sobre los modelos de HuggingFace (en español) |
25 de abril | lunes | — | Taller sobre los modelos de Coqui STT (en inglés) |
29 de abril | viernes | — | Apertura del hackatón |
23 de abril | sábado | 11:00—12:00 | Taller: Los modelos de HuggingFace (en español con Omar Espejel) [Zoom, Grabación] |
25 de abril | lunes | 18:00—19:00 | Taller: Los modelos de Coqui STT (en inglés con Josh Meyer) [Zoom, Grabación] |
29 de abril | viernes | 16:00—17:00 | Inauguración del hackatón (en español) [Zoom, Transparencias, Grabación] |
Inscripción de equipos:
Lista de recursos:
Modelos pre-entrenados
Coqui STT
- Español (es, spa) jaco-assistant/v0.0.1
- Totonaco (tos) bozden/v.1.0.0
- Chatino (ctp) bozden/v.1.0.0
- Mixteco (xty) jemeyer/v.1.0.0
Hugging Face
- Español (es, spa) Lista de modelos para el español
- Náhuatl (azz) tyoc213/wav2vec2-large-xlsr-nahuatl
Documentación y tutoriales
- Building Speech Recognition Models for Global Languages (en inglés)
- Documentación de Coqui STT (en inglés)