Créditos ECTS Créditos ECTS: 6
Horas ECTS Criterios/Memorias Horas de Titorías: 1 Clase Expositiva: 30 Clase Interactiva: 20 Total: 51
Linguas de uso Castelán, Galego
Tipo: Materia Ordinaria Grao RD 1393/2007 - 822/2021
Departamentos: Electrónica e Computación
Áreas: Ciencia da Computación e Intelixencia Artificial
Centro Escola Técnica Superior de Enxeñaría
Convocatoria: Primeiro semestre
Docencia: Con docencia
Matrícula: Matriculable
Esta materia persegue que o alumnado coñeza a evolución do Procesamento da Linguaxe Natural (PLN) e os seus principios básicos, así como a utilización e implementación de modelos estado da arte. Para iso, defínense os seguintes obxectivos:
O1.- Entender a evolución do campo do Procesamento da Linguaxe Natural (PLN).
O2.- Coñecer e saber utilizar representacións vectoriais clásicas (one-hot encoding e tf-idf), así como embeddings neuronais.
O3.- Entender a arquitectura dos Transformers e o mecanismo de atención aplicados ao PLN.
O4.- Saber aplicar modelos a diferentes casos de uso de minería de texto e busca.
O5.- Saber adestrar (axuste fino) modelos de linguaxe preadestrados para diferentes subtarefas.
A parte teórica da materia estrutúrase en 3 bloques principais cos seus respectivos temas:
Bloque 1.- Fundamentos de Modelos de Linguaxe:
Tema 0 - Introdución ao Procesamento da Linguaxe Natural (PLN): Presentarase unha breve contextualización histórica desta rama da IA, así como as dificultades e retos desta tarefa.
Tema 1 - Introdución aos modelos de linguaxe: Explicación do funcionamento de modelos clásicos (one-hot encoding e representacións tf-idf), así como de modelos máis avanzados baseados en embeddings.
Tema 2 - Transformers e mecanismo de atención: Explicación detallada do funcionamento dos Transformers para o caso de uso en PLN.
Bloque 2.- Utilización de Modelos Pre-adestrados:
Tema 3 - Aplicacións de minería de textos: Uso de modelos de linguaxe pre-adestrados para diferentes tarefas de minería de textos: clasificación, clustering, prompt engineering, etc.
Tema 4 - Busca semántica e Retrieval Augmented Generation (RAG): Modelos xerativos pre-adestrados xunto con tarefas de busca.
Bloque 3.- Axuste Fino de Modelos de Linguaxe:
Tema 5 - Fine-tuning de Modelos de Linguaxe: Estratexias de adestramento (axuste fino) de modelos de linguaxe para diferentes subtarefas.
En canto á parte práctica, consistirá nos seguintes entregables:
Entregable 1: Práctica de clasificación. Aproximadamente 2 sesións de prácticas.
Entregable 2: Implementación de Transformers con Pytorch. Aproximadamente 1 sesión.
Entregable 3: Práctica de busca. Aproximadamente 2 sesións.
Entregable 4: Shared-task por equipos. Aproximadamente 4 sesións + 1 sesión para a presentación das solucións.
Básica: Alammar, J., & Grootendorst, M. (2024). Hands-on large language models: language understanding and generation. " O'Reilly Media, Inc.".
Complementaria: Tunstall, L., Von Werra, L., & Wolf, T. (2022). Natural language processing with transformers. " O'Reilly Media, Inc.".
Complementaria: Lin, J., Nogueira, R., & Yates, A. (2022). Pretrained transformers for text ranking: Bert and beyond. Springer Nature.
Complementaria: Rao, D., & McMahan, B. (2019). Natural Language Processing with PyTorch: Building Intelligent Language Applications Using Deep Learning. "O'Reilly Media, Inc.".
Da memoria do título, despréndese que ao rematar esta materia o alumnado cubriría as seguintes competencias:
CG4 – Capacidade para seleccionar e xustificar os métodos e técnicas axeitadas para resolver un problema concreto, ou para desenvolver e propoñer novos métodos baseados en intelixencia artificial.
CB1 – Que o estudantado demostre posuír e comprender coñecementos nunha área de estudo que parte da base da educación secundaria xeral, e que adoita atoparse nun nivel que, aínda que se apoia en libros de texto avanzados, inclúe tamén aspectos que implican coñecementos procedentes da vangarda do seu campo de estudo.
CB4 – Que o estudantado poida transmitir información, ideas, problemas e solucións a un público tanto especializado como non especializado.
Clases expositivas:
Realizaranse na aula de teoría e nelas o profesorado proporcionará ao alumnado as directrices necesarias para a resolución das prácticas propostas na materia. Para iso, empregarase apoio en diapositivas que fomenten a discusión grupal.
Clases interactivas:
Desenvolveranse nas aulas de informática e laboratorio. As prácticas serán tanto individuais como grupais. Valorarase o grao de creatividade nas solucións presentadas polo alumnado.
Titorías:
Ademais, nas titorías atenderase ao alumnado para discutir, comentar, aclarar ou resolver cuestións concretas en relación coas súas tarefas dentro da materia. Estas titorías poderán ser tanto presenciais como virtuais a través da plataforma Ms Teams. Por último, cómpre mencionar que esta materia disporá dun curso virtual no Campus Virtual da USC, empregando tamén a ferramenta colaborativa Ms Teams.
Primeira oportunidade e non presentado
Os pesos para a avaliación da nota final repártense do seguinte xeito:
Exame final: 40% da nota final da materia. É necesario obter un 5 sobre 10 como mínimo para superar a materia.
Prácticas: 50% da nota final da materia. É necesario obter un 5 sobre 10 como mínimo para superar esta parte. A avaliación dos entregables distribúese do seguinte modo:
Entregables 1 e 3: 2 puntos cada un.
Entregable 2: 1 punto.
Entregable 4: 5 puntos.
Ningún dos entregables é obrigatorio, pero como se indicou anteriormente, o alumnado debe acadar 5 puntos para superar a parte práctica.
Traballos: 10% da nota final da materia. Nesta parte non se require unha nota mínima. A avaliación corresponderase cunha presentación asociada á solución presentada no entregable 4.
A asistencia ás prácticas é obrigatoria e, por cada falta non xustificada debidamente, descontaranse 0,5 puntos na nota final da parte práctica. Para obter un "non presentado", o/a estudante non poderá presentar ningún elemento avaliable da materia.
No caso de non superar a materia, a nota en acta corresponderase coa parte non superada.
Segunda oportunidade e repetidores/as
O alumnado que acuda á segunda oportunidade e teña algunha das partes aprobadas na primeira convocatoria conservará esa cualificación, e só terá que recuperar o que teña pendente. Se a parte pendente son as prácticas, proporase unha práctica de recuperación. A cualificación correspondente ao traballo non é recuperable na segunda oportunidade.
No caso de repetidores/as, non se conservará ningunha nota.
Normativa de copia
Nos casos de realización fraudulenta de exercicios ou probas aplicarase o disposto na Normativa de avaliación do rendemento académico do estudantado e de revisión de cualificacións.
Esta materia consta de 6 créditos ECTS, correspondentes a unha carga total de traballo de 150 horas. Este tempo distribúese nos seguintes apartados:
TRABALLO PRESENCIAL NA AULA:
Clases maxistrais: 30 horas
Sesións prácticas en grupos reducidos: 20 horas
Titorías en grupos reducidos: 1 hora
Actividades de avaliación: 4 horas
Total horas de traballo presencial na aula: 55 horas
TRABALLO PERSOAL DO ALUMNADO:
Estudo autónomo: 21 horas
Resolución de casos prácticos/exercicios, lecturas ou outros traballos: 55 horas
Preparación de traballos: 3 horas
Preparación de exames: 20 horas
Total horas de traballo persoal: 99 horas
Recoméndase ter cursado as materias de Aprendizaxe Automática Supervisada, Aprendizaxe Automática non Supervisada, Redes Neuronais e Aprendizaxe Profunda, Psicoloxía Cognitiva, Neurofisioloxía, Neurociencia Cognitiva e Afectiva.
A materia impartirase fundamentalmente en castelán. Todos os avisos oficiais comunicaránse a través do Campus Virtual.
Marcos Fernandez Pichel
Coordinador/a- Departamento
- Electrónica e Computación
- Área
- Ciencia da Computación e Intelixencia Artificial
- Correo electrónico
- marcosfernandez.pichel [at] usc.es
- Categoría
- Profesor/a: Axudante Doutor LOSU
Juan Luis Filgueiras Rilo
- Departamento
- Electrónica e Computación
- Área
- Ciencia da Computación e Intelixencia Artificial
- Correo electrónico
- juanluis.filgueiras [at] rai.usc.gal
- Categoría
- Predoutoral Xunta
Martes | |||
---|---|---|---|
15:30-16:30 | Grupo /CLE_01 | Castelán | IA.01 |
Mércores | |||
09:00-11:00 | Grupo /CLIL_01 | Castelán | IA.14 |
11:00-13:00 | Grupo /CLIL_02 | Castelán | IA.14 |
Xoves | |||
19:00-20:00 | Grupo /CLE_01 | Castelán | IA.01 |
19.01.2026 16:00-20:00 | Grupo /CLIL_02 | IA.01 |
19.01.2026 16:00-20:00 | Grupo /CLIL_01 | IA.01 |
19.01.2026 16:00-20:00 | Grupo /CLE_01 | IA.01 |
19.06.2026 09:30-14:00 | Grupo /CLE_01 | IA.11 |
19.06.2026 09:30-14:00 | Grupo /CLIL_02 | IA.11 |
19.06.2026 09:30-14:00 | Grupo /CLIL_01 | IA.11 |