Ir o contido principal

Bota a andar a versión 5.0 de ParlaMint, o corpus de textos multilingüe de sesións parlamentarias europeas

ParlaMint é un proxecto no marco da infraestrutura dixital europea CLARIN
ParlaMint é un proxecto no marco da infraestrutura dixital europea CLARIN
A dispoñibilidade de etiquetas temáticas e de sentimento permite, por exemplo, estudar como se expresan os distintos partidos políticos sobre un mesmo tema
Santiago de Compostela

Acaba de facerse pública a versión 5.0 do corpus ParlaMint, na que, como nas versións anteriores, o Instituto da Lingua Galega da Universidade de Santiago de Compostela e o Proxecto Nós participan coa compilación e anotación dos datos do Parlamento galego (ParlaMint-ES-GA). ParlaMint é un proxecto no marco da infraestrutura dixital europea CLARIN, centrado na creación dun corpus de textos multilingüe, comparable e homologado de sesións parlamentarias europeas. Este recurso compílase e codifícase de forma uniforme en todos os países participantes, incluíndo metadatos detallados sobre os locutores (identificador, nome, xénero, ou partido político, entre outros) e sobre as intervencións (data, rol, ou sesión). 

Os textos están anotados lingüisticamente e na versión 5.0 introdúcense dúas importantes melloras: anotación automática por temas, que permite facer consultas no corpus segundo os temas tratados no debate parlamentario; e anotación automática do sentimento nas intervencións, que indica se a intervención expresa unha valoración positiva, negativa ou neutra.

Estas novidades amplían notablemente as posibilidades de análise do corpus, tanto en estudos lingüísticos coma en investigacións sobre discurso político, polarización ou evolución temática do debate parlamentario ao longo do tempo. A dispoñibilidade de etiquetas temáticas e de sentimento permite, por exemplo, estudar como se expresan os distintos partidos políticos sobre un mesmo tema, ou como cambia o ton das intervencións segundo o contexto político.

A versión que vén de publicarse inclúe os corpus ParlaMint 5.0, os corpus ParlaMint.ana 5.0, enriquecidos con anotación lingüística automática, e os corpus en versión multilingüe con tradución automática ao inglés ParlaMint-en.ana 5.0.

Os contidos desta páxina actualizáronse o 11.08.2025.