Skip to main content

Un investigador do CiTIUS da USC desenvolve ferramentas para analizar información de textos en galego, portugués e español

Marcos García é licenciado en Filoloxía Portuguesa (Foto: CiTIUS)
Marcos García é licenciado en Filoloxía Portuguesa (Foto: CiTIUS)

Se ben hoxe as técnicas empregadas no ámbito do procesamento de linguaxe natural están moi avanzadas para idiomas como o inglés –é o caso das aplicacións de tradutores automáticos ou a aprendizaxe de idiomas online-, en linguas como o galego ou mesmo o español esta tecnoloxía é aínda limitada. Precisamente para tentar suplir estas carencias, o investigador do CiTIUS da USC Marcos García dedicou a súa tese doutoral a desenvolver ferramentas tecnolóxicas destinadas a mellorar a capacidade de procesamento do galego, o español e o portugués, un traballo enmarcado na liña de investigación mixta na que colaboran o CiTIUS e o Grupo de Gramática do Español da USC. Os sistemas de extracción aberta permiten analizar a web para obter e organizar automaticamente grandes cantidades de información, algo moi útil á hora de discernir ideas ou mensaxes entre a maraña de datos da rede. O sistema presentado polo investigador da USC non só é o primeiro en estar dispoñible para galego, portugués e español, senón que ofrece ademais resultados altamente competitivos cos mellores sistemas en lingua inglesa. Trátase, así, da primeira solución deste tipo dispoñible, un conxunto de ferramentas lingüísticas desenvolvidas baixo unha licenza de software libre, que poden ser descargadas en http://gramatica.usc.es/~marcos/phd.html#cap2. Cilenis Software A liña de investigación que ampara este traballo deu lugar tamén á creación dunha nova empresa especializada en tecnoloxías da linguaxe: a spin-off do CiTIUS Cilenis Software, creada en 2011 e galardoada no mesmo ano co Primeiro Premio ó mellor Proxecto Empresarial Innovador. En 2012, o empresario e analista económico Marc Vidal adquiriu parte de Cilenis Software, a través da compañía IDODI Labs.

The contents of this page were updated on 02.03.2015.