Opentrad ofrece a los internautas el primer traductor automático y gratuito de castellano a euskara
02/06/2006
Presentación del programa Opentrad
PUBLICIDAD
Opentrad es un innovador sistema de traducción automática que permite traducir textos, documentos y páginas web del castellano al euskera, catalán y gallego. Ha sido desarrollado por universidades de Euskal Herria, Alicante, Cataluña y Galicia, junto a la empresa vasca Eleka S.L. y la Fundación Elhuyar, e Imaxin Software, de Galicia. La traducción al euskera ha sido la más dificil de desarrollar y por el momento la web sólo presenta un prototipo. El interés despertado por este traductor ha sido tan grande que los primeros días el sistema se ha colapsado debido al alto número de visitas, explica Iñaki Arantzabal desde Eleka Ingenieritza.Ya está en la red el sistema Opentrad, un proyecto largamente acariciado por un equipo lingüistas y expertos informáticos de Euskal Herria, Catalunya, Alicante y Galicia. Opentrad permite realizar traducciones automáticas de textos, documentos y páginas web del castellano al vasco, catalán y gallego; y también desde el catalán y el gallego al castellano. El sistema es completamente gratuito y el usuario puede utilizarlo en la propia red o descargarlo e instalarlo en su ordenador. El sistema ha sido desarrollado por cuatro universidades --Universidad del País Vasco (UPV/EHU), Universidad de Alicante (UA), Universidad Politécnica de Cataluña (UPC) y Universidad de Vigo (UV)-- y tres entidades: Eleka S.L. y la Fundación Elhuyar, de Euskal Herria, e Imaxin Software, de Galicia. La financiación de este proyecto ha corrido a cargo del Ministerio español de Industria, Turismo y Comercio.
La necesidad de crear un sistema así llevaba años rondando a expertos linguísticos e informáticos vascos. En la Universidad del País Vasco el grupo de investigación IXA había llegado a desarrollar un prototipo de traducción automática del inglés al euskera, y llevaban 20 años desarrollando instrumentos básicos necesarios para el proceso de traducción, según cuenta Iñaki Arantzabal, experto de la empresa guipuzcoana Eleka Ingenieritza. Los expertos vascos entraron en contacto con Mikel Forcada, profesor vasco de la Universidad de Alicante, y otros expertos y el proyecto de traducción entre las cuatro lenguas comenzó a tomar forma.
Un prototipo de traductor al euskera
El pasado 30 de mayo el sistema fue presentado en Barcelona y ya puede utilizarse desde la página web de Opentrad. En el caso del euskera el sistema desarrollado es sólo un prototipo ya que los errores que comete no le permite alcanzar todavía la calidad mínima exigida. 'Esto se debe a la diferencia del análisis lingüístico entre el euskera y el castellano. Es más fácil en el caso de las otras tres lenguas, porque todas ellas son románicas', explica Arantzabal. Actualmente el sistema ofrece un margen de error del 24,8%. 'Eso significa que en una traducción el usuario tiene que corregir una media de 24.8 palabras por cada cien. Para que el sistema sea considerado profesional el margen de error tiene que ser inferior al 10%. Estamos trabajando en mejorarlo hasta llegar a un nivel profesional'.
El sistema se basa en dos motores de traducción de alta velocidad: uno de transferencia sintáctica parcial, llamado 'Apertium', para las lenguas románicas, y otro de transferencia sintáctica completa, bautizado como 'Matxin', que es el que utiliza la traducción al euskera. Por el momento sólo se ha trabajado la traducción castellano-euskera y no a la inversa. 'Se decidió hacerlo así para delimitar el área de trabajo en esta fase del proyecto', cuenta Arantzabal. El equipo no descarta desarrollar un sistema de traducción euskera-castellano, siempre que se consiga la financiación para llevarlo a cabo.
Traducir todo un periódico en tres horas
El novedoso traductor ha despertado un gran interés, y durante sus primeras horas en la red el número de visitas ha sido tan alto que la función de traducción al euskera se ha colapsado. 'Un periódico guipuzcoano ha mostrado interés por el programa y la posibilidad de utilizarlo para realizar una edición digital en euskera', comentan desde Eleka. Este sistema ya se utiliza en el caso de las otras lenguas como el gallego o el catalán. El Correo Gallego, que se edita en castellano, ha sacado también una versión en gallego, y La Voz de Galicia traduce su versión electrónica al gallego.
'El Periódico de Catalunya, que se escribe en castellano, utiliza el sistema. En tres horas se traduce todo el periódico al catalán y así pueden editar las dos ediciones en papel', explica Arantzabal. 'No podría hacerse sin este sistema, porque el margen del tiempo es muy escaso para hacerlo con traductores. Al terminar la traducción, en cambio, sí es necesario revisarla con un equipo de traductores, creando así nuevos puestos de trabajo'.