Créditos ECTS Créditos ECTS: 5
Horas ECTS Criterios/Memorias Traballo do Alumno/a ECTS: 85 Horas de Titorías: 5 Clase Expositiva: 15 Clase Interactiva: 20 Total: 125
Linguas de uso Alemán, Inglés
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Departamento externo vinculado ás titulacións, Filosofía e Antropoloxía
Áreas: Área externa M.U Erasmus Mundus Máster Europeo en Lexicografía, Lóxica e Filosofía da Ciencia
Centro Facultade de Filoloxía
Convocatoria: Primeiro semestre
Docencia: Sen docencia (Extinguida)
Matrícula: Non matriculable
- Capacitar ao alumnado para traballar con instrumentos informáticos no tratamento de datos lingüísticos.
- Fornecer ao alumnado de habilidades para deseñar e implementar ferramentas básicas de extracción automática de información lexicográfica a partir de texto.
Este curso presentará unha introdución a métodos básicos de programación en linguaxes de scripting (por ex. R, Python, etc), para crear recursos lexicográficos. Máis especificamente, este curso céntrase na busca de extracción automática de colocacións e relacións léxicas.
1. Introdución a lexicoloxía computacional con R
2.1. Tarefas básicas no procesamento da linguaxe natural (datos de frecuencias de palabras, análise de distribución de tokens, etc.)
2.2. Medidas de variedade léxica
2.3. Funcións para producir Palabras Chave en Contexto (Keyword in Contet; KWIC)
2. Métodos cuantitativo-empíricos en lexicografía
a. Introdución: Métodos de investigación empíricos
b. Metodoloxías: Vantaxes & Inconvenientes
3. Visualización de datos e análise
3.1. Introdución á visualización en R
3.2. .Estatística Descritiva & Inferencial
3.3. Visualización de datos
4. Lexicografía colaborativa
4.1. Tarefas básicas da tarefa colaborativa
4.2. Lexicografía colaborativa con crowdsourcing: o proxecto do Wiktonary
4.3. Ferramentas par a lexicografía colaborativa
Abel, Andrea & Meyer, Christian M. (2013). “The dynamics outside the paper: user contributions to online dictionaries”, en Iztok Kosem / Jelena Kallas / Polona Gantar / Simon Krek / Margit Langemets / Maria Tuulik, coords., Electronic lexicography in the 21st century: thinking outside the paper: proceedings of the eLex 2013 conference, 17–19 October 2013, Tallinn, Estonia. Liublliana / Tallin: Institute for Applied Slovene Studies / Institute of the Estonian Language, pp. 179–194. Available at: <http://eki.ee/elex2013/ proceedings/eLex2013_13_Abel+Meyer.pdf>
Evert, Stefan (2008). “Corpora and collocations”. In A. Lüdeling and M. Kytö (eds.), Corpus Linguistics. An International Handbook, article 58, pages 1212-1248. Mouton de Gruyter, Berlin.
Grefenstette, Gregory (1994). Explorations in Automatic Thesaurus Discovery. Kluwer Academic Publishers, Norwell, MA, USA.
Thalken, Rosamond & Jockers, Matthew L. (2020). Text analysis with R: for students of literature, Cham: Springer.
Mel’chuk, Igor (1998). “Collocations and Lexical Functions”. In A.P. Cowie (ed.): Phraseology. Theory, Analysis, and Applications, Oxford: Clarendon Press, 23-53.
Meyer, Christian M. / Gurevych, Iryna (2012a): “Wiktionary: a new rival for expert-build lexicons? Exploring the possibilities of collaborative lexicography”, in Sylviane Granger / Magali Paquot, eds., Electronic Lexicography. Oxford: Oxford University Press, pp. 259–595.
Müller-Spitzer, Carolin / Wolfer, Sasha / Koplenig, Alexander (2015): “Observing online dictionary users: studies using Wiktionary log files”, International Journal of Lexicography, 28/1, pp. 1–26.
Padó, Sebastian & Lapata, Mirella (2007). “Dependency-based construction of semantic space models”. Computational Linguistics. 33 (2): 161–199.
Sahlgren, Magnus (2008). “The Distributional Hypothesis”. Rivista dei Linguistica. 20(1): 33–53.
Sweigart, Ao (2015). Automate the Boring Stuff with Python: Practical Programming for Total Beginners, Non Starch Press.
Wolfer, Sasha / Müller-Spitzer, Carolin (2016). “How Many People Constitute a Crowd and What Do They Do? Quantitative Analyses of Revisions in the English and German Wiktionary Editions”. Lexikos. 26: 347-371.
Wu, Winston, / Yarowsky, David (2020). “Wiktionary normalization of translations and morphological information”. In Donia Sot / Nuria Bel / Chengqing Zong, eds., Proceedings of the 28th International Conference on Computational Linguistics , Barcelona: International Committee on Computational Linguistics, pp. 4683-4692.
(Poderán indicarse outras referencias bibliográficas durante o curso)
Os estudantes son capaces de:
- Servirse dos instrumentos teóricos e metodolóxicos con aplicación no campo lexicográfico.
- Usar novas metodoloxías e técnicas no estudo científico.
- Recoñecer a necesidade dun estudo interdisciplinar.
- Expor fenómenos terminolóxicos, tipolóxicos, metodolóxicos, entre outros, baixo un prisma aplicado.
Competencias xerais: CG1
Competencias básicas: CB6, CB7, CB8, CB9, CB10
Competencias transversais: CT2, CT4,
Competencias específicas: CE3, CE4, CE7, CE8, CE9
- Sesións maxistrais de transmisión de coñecemento aos estudantes e abertas á discusión.
- Sesións prácticas co computador seguindo unha metodoloxía colaborativa.
- As tarefas propostas previamente como traballo individual fóra da aula serán tema de análise e discusión na aula.
1. Primeira oportunidade: Realización e entrega das tarefas no prazo convido e activa participación: 100%.
2. Segunda oportunidade (Xullo): Aplicaranse os mesmos criterios que na primeira convocatoria.
Los alumnos con dispensa de asistencia terán que facer un traballo académico final, que representará o 100% de la nota.
Para os casos de realización fraudulenta (por ex: plaxio) de exercicios ou probas será de aplicación o recollido na “Normativa de avaliación do rendemento académico dos estudantes e de revisión de cualificacións”.
As horas presenciais son 35, ao que cabe sumar o traballo individual do alumnado.
- Recoméndase vivamente tomar en conta os coñecementos e habilidades adquiridos na materia do primeiro semestre: Introdución á informática e ao procesamento da linguaxe natural.
- Espérase dos alumnos preparación – previa e posterior – das horas de clase
Carlos Valcarcel Riveiro
- Departamento
- Departamento externo vinculado ás titulacións
- Área
- Área externa M.U Erasmus Mundus Máster Europeo en Lexicografía
- Correo electrónico
- carlos.valcarcel [at] rai.usc.es
- Categoría
- Profesor/a área externa
Martin Pereira Fariña
- Departamento
- Filosofía e Antropoloxía
- Área
- Lóxica e Filosofía da Ciencia
- Teléfono
- 881812525
- Correo electrónico
- martin.pereira [at] usc.es
- Categoría
- Profesor/a: Profesor Contratado/a Doutor
Sascha Wolfer
- Departamento
- Departamento externo vinculado ás titulacións
- Área
- Área externa M.U Erasmus Mundus Máster Europeo en Lexicografía
- Correo electrónico
- sascha.wolfer [at] rai.usc.gal
- Categoría
- Profesor/a área externa
Martes | |||
---|---|---|---|
18:00-20:00 | Grupo /CLE_01 | Alemán, Inglés | B06 |
Mércores | |||
18:00-20:00 | Grupo /CLE_01 | Inglés, Alemán | B06 |
Xoves | |||
18:00-20:00 | Grupo /CLE_01 | Inglés, Alemán | B06 |
20.12.2022 09:30-13:30 | Grupo /CLIS_01 | B05 |
20.12.2022 09:30-13:30 | Grupo /CLE_01 | B05 |
24.01.2023 09:30-13:30 | Grupo /CLIS_01 | B05 |
24.01.2023 09:30-13:30 | Grupo /CLE_01 | B05 |