Investigadores del IIMAS desarrollan herramientas tecnológicas para crear registros digitales de idiomas originarios en riesgo de extinción debido a la acelerada disminución de hablantes en México.
Especialistas del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS) de la UNAM, liderados por el investigador Iván Vladimir Meza Ruiz, han integrado el uso de inteligencia artificial para preservar las 68 lenguas nacionales y sus 364 variantes lingüísticas. El proyecto surge como una respuesta urgente ante las estadísticas que muestran un declive crítico: de un 15% de hablantes en 1930, la cifra cayó al 6.2% en 2020. El objetivo es mantener estas lenguas «vivas» de manera artificial, especialmente aquellas que ya no cuentan con hablantes activos entre las generaciones jóvenes.
El principal obstáculo identificado por el equipo es la «pobreza de datos masivos» en el entorno digital. Mientras que el náhuatl clásico cuenta con poco más de 4,000 artículos en internet, otras lenguas como el purépecha o el mixe del norte apenas registran una decena de documentos. Meza Ruiz señaló que la estrategia no solo busca la preservación cultural, sino también facilitar el acceso de las comunidades originarias a servicios fundamentales como salud, justicia y educación mediante el procesamiento de lenguaje natural en sus propios idiomas.
El proyecto también enfrenta dilemas éticos y legales, particularmente en lo que respecta a los derechos de autor y la propiedad intelectual de las obras indígenas en el marco de la ciencia abierta. El siguiente paso para la máxima casa de estudios será consolidar un ecosistema de recolección de datos que permita alimentar los modelos de IA, garantizando que la riqueza lingüística de México no desaparezca con sus últimos hablantes.


