Créditos ECTS Créditos ECTS: 5
Horas ECTS Criterios/Memorias Horas de Titorías: 5 Clase Expositiva: 15 Clase Interactiva: 20 Total: 40
Linguas de uso Alemán, Inglés
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Filoloxía Galega, Departamento externo vinculado ás titulacións, Filosofía e Antropoloxía
Áreas: Filoloxías Galega e Portuguesa, Área externa M.U Erasmus Mundus en Lexicografía (2ªed), Lóxica e Filosofía da Ciencia
Centro Facultade de Filoloxía
Convocatoria: Primeiro semestre
Docencia: Con docencia
Matrícula: Matriculable
- Capacitar ao alumnado para traballar con instrumentos informáticos no tratamento de datos lingüísticos.
- Fornecer ao alumnado de habilidades para deseñar e implementar ferramentas básicas de extracción automática de información lexicográfica a partir de texto.
Este curso presentará unha introdución a métodos básicos de programación en linguaxes de scripting (por ex. R, Python, etc), para crear recursos lexicográficos. Máis especificamente, este curso céntrase na busca de extracción automática de colocacións e relacións léxicas.
1. Introdución ao procesamento da linguaxe natural con R
1.1. Tarefas básicas: tokenizacion e separación de oracións
1.2. Identificación de lemas e análise de categorías sintácticas
1.3. Recoñecemento de entidades
2. Lingüística de corpus para a análise do léxico e da gramática
2.1. Introdución á lingüística de corpus
2.2. o estudo de corpus: hipóteses e variables
2.3. Os datos de corpus: recuperación e anotación
2.4. Análise estatística e visualización dos resultados
3. Lexicografía colaborativa
3.1. Tarefas básicas da tarefa colaborativa
3.2. Lexicografía colaborativa con crowdsourcing: o proxecto do Wiktonary
3.3. Ferramentas par a lexicografía colaborativa
Bibliografía básica
Thalken, Rosamond & Jockers, Matthew L. (2020). Text analysis with R: for students of literature, Cham: Springer.
Evert, Stefan (2008). “Corpora and collocations”. In A. Lüdeling and M. Kytö (eds.), Corpus Linguistics. An International Handbook, article 58, pages 1212-1248. Mouton de Gruyter, Berlin.
Stefanowitsch, Anatol (2020). Corpus linguistics: A guide to the methodology. Berlin: Language Science Press. https://doi.org/10.5281/zenodo.3735822
Wu, Winston, / Yarowsky, David (2020). “Wiktionary normalization of translations and morphological information”. In Donia Sot / Nuria Bel / Chengqing Zong, eds., Proceedings of the 28th International Conference on Computational Linguistics , Barcelona: International Committee on Computational Linguistics, pp. 4683-4692.
Bibliografía complementaria
Abel, Andrea & Meyer, Christian M. (2013). “The dynamics outside the paper: user contributions to online dictionaries”, en Iztok Kosem / Jelena Kallas / Polona Gantar / Simon Krek / Margit Langemets / Maria Tuulik, coords., Electronic lexicography in the 21st century: thinking outside the paper: proceedings of the eLex 2013 conference, 17–19 October 2013, Tallinn, Estonia. Liublliana / Tallin: Institute for Applied Slovene Studies / Institute of the Estonian Language, pp. 179–194. Available at: <http://eki.ee/elex2013/ proceedings/eLex2013_13_Abel+Meyer.pdf>
Arnold, T., & Tilton, L. (2015). Humanities Data in R: Exploring Networks, Geospatial Data, Images, and Text (1st ed.). Springer International Publishing AG.
Grefenstette, Gregory (1994). Explorations in Automatic Thesaurus Discovery. Kluwer Academic Publishers, Norwell, MA, USA.
Gries, Stefan Th. (2021). Statistics for linguistics with R: a practical introduction (3.a ed.). Berlin: De Gruyter Mouton. https://doi.org/10.1515/9783110718256
Mel’chuk, Igor (1998). “Collocations and Lexical Functions”. In A.P. Cowie (ed.): Phraseology. Theory, Analysis, and Applications, Oxford: Clarendon Press, 23-53.
Meyer, Christian M. / Gurevych, Iryna (2012a): “Wiktionary: a new rival for expert-build lexicons? Exploring the possibilities of collaborative lexicography”, in Sylviane Granger / Magali Paquot, eds., Electronic Lexicography. Oxford: Oxford University Press, pp. 259–595.
Müller-Spitzer, Carolin / Wolfer, Sasha / Koplenig, Alexander (2015): “Observing online dictionary users: studies using Wiktionary log files”, International Journal of Lexicography, 28/1, pp. 1–26.
Padó, Sebastian & Lapata, Mirella (2007). “Dependency-based construction of semantic space models”. Computational Linguistics. 33 (2): 161–199.
Sahlgren, Magnus (2008). “The Distributional Hypothesis”. Rivista dei Linguistica. 20(1): 33–53.
Sweigart, Ao (2015). Automate the Boring Stuff with Python: Practical Programming for Total Beginners, Non Starch Press.
Wolfer, Sasha / Müller-Spitzer, Carolin (2016). “How Many People Constitute a Crowd and What Do They Do? Quantitative Analyses of Revisions in the English and German Wiktionary Editions”. Lexikos. 26: 347-371.
(Poderán indicarse outras referencias bibliográficas durante o curso)
Coñecemento ou contidos: Con03, Con05, Con06
Habilidades ou destrezas: H/D05, H/D06, H/D07, H/D09
Competencias: Comp02, Comp03, Comp08
- Sesións maxistrais de transmisión de coñecemento aos/ás estudantes e abertas á discusión.
- Sesións prácticas co computador seguindo unha metodoloxía colaborativa.
- As tarefas propostas previamente como traballo individual fóra da aula serán tema de análise e discusión na aula.
1. Primeira oportunidade: Realización e entrega das tarefas no prazo que se indique no Campus Virtual e participación activa na aula: 100%.
2. Segunda oportunidade (Xullo): Para o estudantado que non supere a materia ou que non tivera entregado as tarefas, deberá acordar co profesor correspondente da materia unha nova data de entrega das tarefas para superar a materia na segunda oportunidade.
A asistencia ás clases é preceptiva para superar a materia así como a entrega das tarefas que se determinen durante o curso. Ao rematar clases da materia e antes do exame final publicarase a lista coas cualificacións da materia.
Os alumnos con dispensa de asistencia terán que facer un traballo académico final, que representará o 100% de la nota.
Para os casos de realización fraudulenta (por ex: plaxio) de exercicios ou probas será de aplicación o recollido na “Normativa de avaliación do rendemento académico dos estudantes e de revisión de cualificacións”.
As horas presenciais son 35, ao que cabe sumar o traballo individual do alumnado.
- Recoméndase ter en conta os coñecementos e habilidades adquiridos na materia do primeiro semestre: Introdución á informática e ao procesamento da linguaxe natural.
- Espérase do alumnado preparación – previa e posterior – das horas de clase
- Nesta materia vanse aplicar metodoloxías estudadas en Recursos e ferramentas con aplicación lexicográfica: uso e deseño I.
- Para os casos de realización fraudulenta de exercicios ou probas será de aplicación o recollido na Normativa de avaliación do rendemento académico dos estudantes e de revisión de cualificacións.
- Perspectiva de xénero: Recoméndase facer uso da linguaxe non sexista, tanto no traballo cotiá de aula como nos traballos académicos encomendados, segundo as recomendacións da USC.
- Ferramentas tecnolóxicas institucionais: é obrigado o emprego da conta de correo electrónico rai.usc. Esta conta será necesaria para acceder a calquera dos servizos facilitados pola USC (Campus Virtual, Teams, Secretaría Virtual, etc.). Non se contestará ningunha comunicación realizada dende unha conta de correo electrónico allea á USC.
- Non se poderá empregar o de teléfono móbil, computadora, tablet ou aparello similar, salvo cando se use como instrumento de traballo seguindo as indicacións dadas polo/a docente, responsabilizándose o alumnado das consecuencias legais e académicas que poidan derivarse dun emprego non axeitado.
- Obrigatoriedade do cumprimento da Normativa de protección de datos.
- Os materiais elaborados polo docente están protexidos pola normativa de protección da propiedade intelectual e dereitos de autor de tal xeito que non se poden divulgar ou facer accesibles sen autorización do autor.
- O estudantado con necesidades específicas de apoio educativo e/ou discapacidade deberá poñerse en contacto co Servizo de Participación e Inclusión Universitaria (SEPIU) e enviar a solicitude de adaptacións a través do formulario dispoñible na web do SEPIU ou na secretaría virtual do alumnado. Máis información no email sepiu.santiago [at] usc.gal (sepiu[dot]santiago[at]usc[dot]gal) ou nos teléfonos 881 812 859/ 881 812 858
Carlos Valcarcel Riveiro
- Departamento
- Departamento externo vinculado ás titulacións
- Área
- Área externa M.U Erasmus Mundus Máster Europeo en Lexicografía
- Correo electrónico
- carlos.valcarcel [at] rai.usc.es
- Categoría
- Profesor/a área externa
Martin Pereira Fariña
Coordinador/a- Departamento
- Filosofía e Antropoloxía
- Área
- Lóxica e Filosofía da Ciencia
- Teléfono
- 881812525
- Correo electrónico
- martin.pereira [at] usc.es
- Categoría
- Profesor/a: Profesor Contratado/a Doutor
Vitor Miguez Rego
- Departamento
- Filoloxía Galega
- Área
- Filoloxías Galega e Portuguesa
- Correo electrónico
- vitor.miguez [at] usc.gal
- Categoría
- Profesor/a: Profesor Axudante Doutor LOU
Martes | |||
---|---|---|---|
16:00-18:00 | Grupo /CLE_01 | Inglés | B06 |
22.12.2025 09:30-12:00 | Grupo /CLE_01 | B06 |
22.12.2025 09:30-12:00 | Grupo /CLIS_01 | B06 |
15.01.2026 09:30-12:00 | Grupo /CLIS_01 | B06 |
15.01.2026 09:30-12:00 | Grupo /CLE_01 | B06 |