Créditos ECTS Créditos ECTS: 5
Horas ECTS Criterios/Memorias Horas de Tutorías: 5 Clase Expositiva: 15 Clase Interactiva: 20 Total: 40
Lenguas de uso Alemán, Inglés
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Filología Gallega, Departamento externo vinculado a las titulaciones, Filosofía y Antropología
Áreas: Filologías Gallega y Portuguesa, Área externa M.U Erasmus Mundus en Lexicografía (2ªed), Lógica y Filosofía de la Ciencia
Centro Facultad de Filología
Convocatoria: Primer semestre
Docencia: Con docencia
Matrícula: Matriculable
- Capacitar al alumnado para trabajar con instrumentos informáticos en el tratamiento de datos lingüísticos.
- Proveer al alumnado de habilidades para diseñar e implementar herramientas básicos de extracción automática de información lexicográfica a partir de texto.
Este curso presentará una introducción a métodos básicos de programación en lenguajes de scripting (por ej. Python, Perl, Ruby, etc.), con el objetivo de extraer información de textos para crear recursos lexicográficos, concretamente el curso se centra en la búsqueda automática de colocaciones y relaciones léxicas.
1. Introducción al procesamiento del lenguaje natural con R
1.1. Tareas básicas: tokenizacion y separación de oraciones
1.2. Identificación de lemas y análisis de categorías sintácticas
1.3. Reconocimiento de entidades a partir de un texto
2. Lingüística de corpus para el análisis del léxico y de la gramática
2.1. Introducción a la lingüística de corpus
2.2. El estudio de corpus: hipótesis y variables
2.3. Los datos de corpus: recuperación y anotación
2.4. Análisis estadístico y visualización de los resultados
3. Lexicografía colaborativa
3.1. Principios básicos del trabajo colaborativo
3.2. Lexicografía colaborativa mediante crowdsourcing: el proyecto del Wikidiccionario
3.3. Herramientas para la lexicografía colaborativa
Bibliografía básica
Thalken, Rosamond & Jockers, Matthew L. (2020). Text analysis with R: for students of literature, Cham: Springer.
Evert, Stefan (2008). “Corpora and collocations”. In A. Lüdeling and M. Kytö (eds.), Corpus Linguistics. An International Handbook, article 58, pages 1212-1248. Mouton de Gruyter, Berlin.
Stefanowitsch, Anatol (2020). Corpus linguistics: A guide to the methodology. Berlin: Language Science Press. https://doi.org/10.5281/zenodo.3735822-
Wu, Winston, / Yarowsky, David (2020). “Wiktionary normalization of translations and morphological information”. In Donia Sot / Nuria Bel / Chengqing Zong, eds., Proceedings of the 28th International Conference on Computational Linguistics , Barcelona: International Committee on Computational Linguistics, pp. 4683-4692.
Bibliografía complementaria
Abel, Andrea & Meyer, Christian M. (2013). “The dynamics outside the paper: user contributions to online dictionaries”, en Iztok Kosem / Jelena Kallas / Polona Gantar / Simon Krek / Margit Langemets / Maria Tuulik, coords., Electronic lexicography in the 21st century: thinking outside the paper: proceedings of the eLex 2013 conference, 17–19 October 2013, Tallinn, Estonia. Liublliana / Tallin: Institute for Applied Slovene Studies / Institute of the Estonian Language, pp. 179–194. Available at: <http://eki.ee/elex2013/ proceedings/eLex2013_13_Abel+Meyer.pdf>
Arnold, T., & Tilton, L. (2015). Humanities Data in R: Exploring Networks, Geospatial Data, Images, and Text (1st ed.). Springer International Publishing AG.
Grefenstette, Gregory (1994). Explorations in Automatic Thesaurus Discovery. Kluwer Academic Publishers, Norwell, MA, USA.
Gries, Stefan Th. (2021). Statistics for linguistics with R: a practical introduction (3.a ed.). Berlin: De Gruyter Mouton. https://doi.org/10.1515/9783110718256
Mel’chuk, Igor (1998). “Collocations and Lexical Functions”. In A.P. Cowie (ed.): Phraseology. Theory, Analysis, and Applications, Oxford: Clarendon Press, 23-53.
Meyer, Christian M. / Gurevych, Iryna (2012a): “Wiktionary: a new rival for expert-build lexicons? Exploring the possibilities of collaborative lexicography”, in Sylviane Granger / Magali Paquot, eds., Electronic Lexicography. Oxford: Oxford University Press, pp. 259–595.
Müller-Spitzer, Carolin / Wolfer, Sasha / Koplenig, Alexander (2015): “Observing online dictionary users: studies using Wiktionary log files”, International Journal of Lexicography, 28/1, pp. 1–26.
Padó, Sebastian & Lapata, Mirella (2007). “Dependency-based construction of semantic space models”. Computational Linguistics. 33 (2): 161–199.
Sahlgren, Magnus (2008). “The Distributional Hypothesis”. Rivista dei Linguistica. 20(1): 33–53.
Sweigart, Ao (2015). Automate the Boring Stuff with Python: Practical Programming for Total Beginners, Non Starch Press.
Wolfer, Sasha / Müller-Spitzer, Carolin (2016). “How Many People Constitute a Crowd and What Do They Do? Quantitative Analyses of Revisions in the English and German Wiktionary Editions”. Lexikos. 26: 347-371.
(Poderán indicarse outras referencias bibliográficas durante o curso)
Conocimiento o contenidos: Con03, Con05, Con06
Habilidades o destrezas: H/D05, H/D06, H/D07, H/D09
Competencias: Comp02, Comp03, Comp08
- Sesiones magistrales de transmisión del conocimiento a los estudiantes y abiertas a la discusión.
- Sesiones prácticas con el ordenador siguiendo una metodología colaborativa.
- Tareas propuestas previamente como trabajo individual fuera del aula serán tema de análisis y discusión en el aula.
1. Primera oportunidad: Realización y entrega de las tareas en el plazo indicado en el Campus Virtual y participación activa en el aula: 100%.
2. 2. Segunda oportunidad (Julio): El estudiantado que no supere la asignatura o que no haya entregado los trabajos deberá acordar con el profesor correspondiente de la asignatura una nueva fecha de entrega de los trabajos para superar la asignatura en la segunda convocatoria.
La asistencia a clase es obligatoria para superar la asignatura, así como la entrega de los trabajos que se determinen durante el curso. Al finalizar las clases de la asignatura y antes del examen final, se publicará la lista con las calificaciones de la asignatura.
Los alumnos con dispensa de asistencia tendrán que hacer un trabajo académico final, que representará el 100% de la nota.
Para los casos de realización fraudulenta (por ej: plagio) de ejercicios o pruebas será de aplicación lo recogido en la Normativa de evaluación del rendimiento académico de los estudiantes y de revisión de calificaciones.
Las horas presenciales son 35, a lo que cabe sumar el trabajo individual del alumnado.
- Se recomienda tomar en cuenta los conocimientos y habilidades adquiridos en la materia del primer semestre: Introducción a la informática y al procesamiento del lenguaje natural.
- Se espera del alumnado preparación – previa y posterior – de las horas de clase.
- En esta materia se van a aplicar metodologías estudiadas en Recursos y herramientas con aplicación lexicográfica: uso y diseño I.
- En caso de realización fraudulenta de ejercicios o pruebas, se aplicará lo recogido en la Normativa de evaluación del rendimiento académico de los estudiantes y de revisión de calificaciones.
- Perspectiva de género: Se recomienda utilizar un lenguaje no sexista, tanto en el trabajo diario en clase como en los trabajos académicos encargados, según las recomendaciones de la USC.
- Herramientas tecnológicas institucionales: es obligatorio el uso de la cuenta de correo electrónico rai.usc. Esta cuenta será necesaria para acceder a cualquiera de los servicios facilitados por la USC (Campus Virtual, Teams, Secretaría Virtual, etc.). No se responderá a ninguna comunicación realizada desde una cuenta de correo electrónico ajena a la USC.
- No se podrá utilizar el teléfono móvil, ordenador, tableta o dispositivo similar, salvo cuando se utilice como instrumento de trabajo siguiendo las indicaciones dadas por el/la profesor/a, siendo los alumnos responsables de las consecuencias legales y académicas que puedan derivarse de un uso inadecuado.
- Obligatoriedad del cumplimiento de la Normativa de protección de datos.
- Los materiales elaborados por el profesor están protegidos por la normativa de protección de la propiedad intelectual y los derechos de autor, por lo que no pueden divulgarse ni hacerse accesibles sin la autorización del autor.
- Los estudiantes con necesidades específicas de apoyo educativo y/o discapacidad deberán ponerse en contacto con el Servicio de Participación e Inclusión Universitaria (SEPIU) y enviar la solicitud de adaptaciones a través del formulario disponible en la web del SEPIU o en la secretaría virtual del alumnado. Más información en el correo electrónico sepiu.santiago [at] usc.gal (sepiu[dot]santiago[at]usc[dot]gal) o en los teléfonos 881 812 859/ 881 812 858.
Carlos Valcarcel Riveiro
- Departamento
- Departamento externo vinculado a las titulaciones
- Área
- Área externa M.U Erasmus Mundus Máster Europeo en Lexicografía
- Correo electrónico
- carlos.valcarcel [at] rai.usc.es
- Categoría
- Profesor/a área externa
Martin Pereira Fariña
Coordinador/a- Departamento
- Filosofía y Antropología
- Área
- Lógica y Filosofía de la Ciencia
- Teléfono
- 881812525
- Correo electrónico
- martin.pereira [at] usc.es
- Categoría
- Profesor/a: Profesor Contratado/a Doctor
Vitor Miguez Rego
- Departamento
- Filología Gallega
- Área
- Filologías Gallega y Portuguesa
- Correo electrónico
- vitor.miguez [at] usc.gal
- Categoría
- Profesor/a: Profesor Ayudante Doctor LOU
Martes | |||
---|---|---|---|
16:00-18:00 | Grupo /CLE_01 | Inglés | B06 |
22.12.2025 09:30-12:00 | Grupo /CLE_01 | B06 |
22.12.2025 09:30-12:00 | Grupo /CLIS_01 | B06 |
15.01.2026 09:30-12:00 | Grupo /CLIS_01 | B06 |
15.01.2026 09:30-12:00 | Grupo /CLE_01 | B06 |