Créditos ECTS Créditos ECTS: 5
Horas ECTS Criterios/Memorias Trabajo del Alumno/a ECTS: 85 Horas de Tutorías: 5 Clase Expositiva: 15 Clase Interactiva: 20 Total: 125
Lenguas de uso Alemán, Inglés
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Departamento externo vinculado a las titulaciones, Filosofía y Antropología
Áreas: Área externa M.U Erasmus Mundus Máster Europeo en Lexicografía, Lógica y Filosofía de la Ciencia
Centro Facultad de Filología
Convocatoria: Primer semestre
Docencia: Sin docencia (Extinguida)
Matrícula: No matriculable
- Capacitar al alumnado para trabajar con instrumentos informáticos en el tratamiento de datos lingüísticos.
- Proveer al alumnado de habilidades para diseñar e implementar herramientas básicos de extracción automática de información lexicográfica a partir de texto.
Este curso presentará una introducción a métodos básicos de programación en lenguajes de scripting (por ej. R, Python, etc.), con el objetivo de extraer información de textos para crear recursos lexicográficos, concretamente el curso se centra en la búsqueda automática de colocaciones y relaciones léxicas.
1. Introducción a la lexicografía computacional con R
1.1. Tareas básicas en el Procesamiento del lenguaje natural (frecuencia de palabras, análisis de distribución de tokens, etc.)
1.2. Medidas de variedad léxica
1.3. Funciones para producir Palabras Clave en Contexto (Keyword in Context, KWIC)
2. Métodos cuantitativo-empíricos en lexicografía
2.1. Introducción: Métodos empíricos de investigación
2.2. Metodologías: Ventajas & inconvenientes
3. Visualización de datos y análisis
3.1. Introducción a la visualización en R
3.2. Estadística descriptiva e inferencial
3.3. Visualización de datos
4. Lexicografía colaborativa
4.1. Principios básicos del trabajo colaborativo
4.2. Lexicografía colaborativa mediante crowdsourcing: el proyecto del Wikidiccionario
4.3. Herramientas para la lexicografía colaborativa
Abel, Andrea & Meyer, Christian M. (2013). “The dynamics outside the paper: user contributions to online dictionaries”, en Iztok Kosem / Jelena Kallas / Polona Gantar / Simon Krek / Margit Langemets / Maria Tuulik, coords., Electronic lexicography in the 21st century: thinking outside the paper: proceedings of the eLex 2013 conference, 17–19 October 2013, Tallinn, Estonia. Liublliana / Tallin: Institute for Applied Slovene Studies / Institute of the Estonian Language, pp. 179–194. Available at: <http://eki.ee/elex2013/ proceedings/eLex2013_13_Abel+Meyer.pdf>
Evert, Stefan (2008). “Corpora and collocations”. In A. Lüdeling and M. Kytö (eds.), Corpus Linguistics. An International Handbook, article 58, pages 1212-1248. Mouton de Gruyter, Berlin.
Grefenstette, Gregory (1994). Explorations in Automatic Thesaurus Discovery. Kluwer Academic Publishers, Norwell, MA, USA.
Thalken, Rosamond & Jockers, Matthew L. (2020). Text analysis with R: for students of literature, Cham: Springer.
Mel’chuk, Igor (1998). “Collocations and Lexical Functions”. In A.P. Cowie (ed.): Phraseology. Theory, Analysis, and Applications, Oxford: Clarendon Press, 23-53.
Meyer, Christian M. / Gurevych, Iryna (2012a): “Wiktionary: a new rival for expert-build lexicons? Exploring the possibilities of collaborative lexicography”, in Sylviane Granger / Magali Paquot, eds., Electronic Lexicography. Oxford: Oxford University Press, pp. 259–595.
Müller-Spitzer, Carolin / Wolfer, Sasha / Koplenig, Alexander (2015): “Observing online dictionary users: studies using Wiktionary log files”, International Journal of Lexicography, 28/1, pp. 1–26.
Padó, Sebastian & Lapata, Mirella (2007). “Dependency-based construction of semantic space models”. Computational Linguistics. 33 (2): 161–199.
Sahlgren, Magnus (2008). “The Distributional Hypothesis”. Rivista dei Linguistica. 20(1): 33–53.
Sweigart, Ao (2015). Automate the Boring Stuff with Python: Practical Programming for Total Beginners, Non Starch Press.
Wolfer, Sasha / Müller-Spitzer, Carolin (2016). “How Many People Constitute a Crowd and What Do They Do? Quantitative Analyses of Revisions in the English and German Wiktionary Editions”. Lexikos. 26: 347-371.
Wu, Winston, / Yarowsky, David (2020). “Wiktionary normalization of translations and morphological information”. In Donia Sot / Nuria Bel / Chengqing Zong, eds., Proceedings of the 28th International Conference on Computational Linguistics , Barcelona: International Committee on Computational Linguistics, pp. 4683-4692.
(Poderán indicarse outras referencias bibliográficas durante o curso)
Los estudiantes son capaces de:
- Servirse de los instrumentos teóricos y metodológicos con aplicación en el campo lexicográfico.
- Usar nuevas metodologías y técnicas en el estudio científico.
- Reconocer la necesidad de un estudio interdisciplinar.
- Plantearse fenómenos terminológicos, tipológicos, metodológicos, entre otros, bajo un prisma aplicado.
Competencias xerais: CG1
Competencias básicas: CB6, CB7, CB8, CB9, CB10
Competencias transversais: CT2, CT4,
Competencias específicas: CE3, CE4, CE7, CE8, CE9
- Sesiones magistrales de transmisión del conocimiento a los estudiantes y abiertas a la discusión.
- Sesiones prácticas con el ordenador siguiendo una metodología colaborativa.
- Tareas propuestas previamente como trabajo individual fuera del aula serán tema de análisis y discusión en el aula.
1. Primera oportunidad: Realización y entrega de las tareas en el plazo convenido y activa participación: 100%.
2. 2. Segunda oportunidad (Julio): Se aplicarán los mismos criterios que en la primera convocatoria.
Los alumnos con dispensa de asistencia tendrán que hacer un trabajo académico final, que representará el 100% de la nota.
Para los casos de realización fraudulenta (por ej: plagio) de ejercicios o pruebas será de aplicación lo recogido en la Normativa de evaluación del rendimiento académico de los estudiantes y de revisión de calificaciones.
Tiempo de estudio y trabajo personal
Las horas presenciales son 35, a lo que cabe sumar el trabajo individual del alumnado.
- Se recomienda vivamente tomar en cuenta los conocimientos y habilidades adquiridos en la materia del primer semestre: Introducción a la informática y al procesamiento del lenguaje natural.
- • Se espera de los alumnos preparación – previa y posterior – de las horas de clase.
Carlos Valcarcel Riveiro
- Departamento
- Departamento externo vinculado a las titulaciones
- Área
- Área externa M.U Erasmus Mundus Máster Europeo en Lexicografía
- Correo electrónico
- carlos.valcarcel [at] rai.usc.es
- Categoría
- Profesor/a área externa
Martin Pereira Fariña
- Departamento
- Filosofía y Antropología
- Área
- Lógica y Filosofía de la Ciencia
- Teléfono
- 881812525
- Correo electrónico
- martin.pereira [at] usc.es
- Categoría
- Profesor/a: Profesor Contratado/a Doctor
Sascha Wolfer
- Departamento
- Departamento externo vinculado a las titulaciones
- Área
- Área externa M.U Erasmus Mundus Máster Europeo en Lexicografía
- Correo electrónico
- sascha.wolfer [at] rai.usc.gal
- Categoría
- Profesor/a área externa
Martes | |||
---|---|---|---|
18:00-20:00 | Grupo /CLE_01 | Inglés, Alemán | B06 |
Miércoles | |||
18:00-20:00 | Grupo /CLE_01 | Alemán, Inglés | B06 |
Jueves | |||
18:00-20:00 | Grupo /CLE_01 | Inglés, Alemán | B06 |
20.12.2022 09:30-13:30 | Grupo /CLIS_01 | B05 |
20.12.2022 09:30-13:30 | Grupo /CLE_01 | B05 |
24.01.2023 09:30-13:30 | Grupo /CLIS_01 | B05 |
24.01.2023 09:30-13:30 | Grupo /CLE_01 | B05 |