Minería de datos y aprendizaje automático

Código Asignatura:
1416
Nº Créditos ECTS:
6
Duración:
Semestral
Idioma:
Castellano
Plan de estudios:
Profesor(es):
Año académico:
2022-23

La información sobre los datos de contacto y el horario de tutorías se encuentra publicada en el aula virtual de la asignatura.

Descripción

Minería de Datos y Aprendizaje Automático es una asignatura optativa que consta de 6 créditos y que dotará al estudiante de conceptos relacionados con la Minería de Datos (más conocido como Data Mining, su nombre en inglés) y el Proceso de Descubrimiento de Conocimiento en Bases de Datos (más conocido por sus siglas KDD, de su nombre en inglés Knowledge Discovery in Databases).

La asignatura comienza con un tema que tiene como objetivo introducir los conceptos básicos de Data Mining. A continuación se presenta el proceso de KDD y sus diferentes fases. Tras esta primera parte introductoria se describen las etapas iniciales del proceso de KDD. En la parte central de la asignatura se presentan las técnicas y algoritmos de Data Mining más utilizados. Finalmente, se analizará la forma de ejecutar un proyecto real de Data Mining.

No existe ningún prerrequisito formal de matrícula para cursar la asignatura de Minería de Datos y Aprendizaje Automático, aunque es recomendable contar con los conocimientos adquiridos en las asignaturas de Bases de Datos y Bases de Datos Avanzadas, que facilitarán la comprensión de las técnicas estudiadas.

Antes de matricular la asignatura, verifique los posibles requisitos que pueda tener dentro de su plan. Esta información la encontrará en la pestaña "Plan de estudios" del plan correspondiente.

Competencias generales

El objetivo de la asignatura es dotar al estudiante de los conceptos sobre los que se fundamenta la minería de datos. La asimilación de estos conceptos permitirá al estudiante comprender la utilidad y funcionalidad de estas técnicas. Con esta asignatura se pretende que el estudiante llegue a:

  • Conocer los fundamentos de la Minería de Datos.
  • Conocer el proceso de KDD.
  • Conocer las fases iniciales del proceso de KDD.
  • Conocer las técnicas y algoritmos de Data Mining.
  • Conocer el proceso de implantación de un proyecto de Data Mining.
  • Conocer los aspectos sociales y éticos de Data Mining, y las tendencias futuras en este área.

Competencias específicas

  • Conocer la Minería de Datos y sus fases.
  • Conocer las diferentes técnicas de Data Mining: Clustering, Decision, Clasificación y Regresión.

Metodología

La metodología adoptada para el aprendizaje y evaluación de los contenidos de esta asignatura se encuentra adaptada a la modalidad de enseñanza a distancia de UDIMA.

Además del estudio del material proporcionado para el estudio de la asignatura, se encuentran programadas una serie de actividades de aprendizaje y de evaluación continua para que el estudiante consolide los conocimientos adquiridos. Dichas actividades se encuentran planificadas en el "Cronograma de Actividades Didácticas", y definidas en el "sistema de evaluación", apartados ambos que figuran en la guía docente de la asignatura.

Las dudas que puedan surgir tras el estudio razonado de las unidades didácticas y del material complementario deben plantearse en los foros de tutorías activados en el Aula Virtual.

Dedicación requerida

Se estima que la lectura y comprensión de los contenidos teóricos abarcados en las diversas unidades didácticas ocupará aproximadamente unas 60 horas, mientras la realización de las Actividades de Evaluación Continua (AECs), las Actividades de Aprendizaje y la realización de los Controles, llevará unas 75 horas aproximadamente. También se puede considerar que, con el empleo de unas 15 horas por parte del alumno de cara a preparar el examen final presencial, será suficiente para consolidar los conocimientos y habilidades adquiridas durante el trascurso de la asignatura.

Tutorías

El profesor aporta un seguimiento individualizado de la actividad del estudiante para asegurar las mejores condiciones de aprendizaje mediante la tutorización a través de las herramientas de la plataforma educativa y/o de las tutorías telefónicas. En estas tutorías los estudiantes pueden consultar a los profesores las dudas acerca de la materia estudiada.

Materiales didácticos

Para el desarrollo del aprendizaje sobre el que versará el examen final se han seleccionado materiales didácticos y/o manuales, a partir de los cuales se estudiarán las unidades didácticas que se corresponden con la descripción de los contenidos de la asignatura:

Manual de la asignatura:
Lara Torralbo, J. A. "Manual de Minería de Datos", Ed: UDIMA (2013).

Finalmente, el profesor podrá poner a disposición del estudiante cualquier otro material complementario voluntario al hilo de las unidades didácticas o en una carpeta de material complementario.

Contenidos y programación

Unidad 1. Introducción a la Minería de Datos.
Unidad 2. El proceso de KDD.
Unidad 3. Modelos de Data Mining.
Unidad 4. Clasificación: Árboles de decisión y redes de neuronas artificiales.
Unidad 5. Clasificación: Técnicas bayesianas y técnicas basadas en casos.
Unidad 6. Clustering: Técnicas particionales.
Unidad 7. Clustering: Técnicas jerárquicas y técnicas basadas en densidad.
Unidad 8. Asociación, Regresión y Detección de atípicos.
Unidad 9. Minería de Datos no convencionales.
Unidad 10. Caso de Estudio: aplicación de la Minería de Datos en el dominio de la medicina.

(*) Las fechas concretas se pueden consultar en el aula virtual de la asignatura y en la pestaña de “Precios, Calendario y Matriculación” de la titulación.

Sistema de evaluación

Durante el estudio de esta asignatura, el proceso de evaluación del aprendizaje es continuo y contempla la realización de:

Para aprobar la asignatura, es necesario obtener una calificación mínima de 5 en el examen final, así como en la calificación total del curso, una vez realizado el cómputo ponderado de las calificaciones obtenidas en las actividades didácticas y en el examen final.

Si un estudiante no aprueba la asignatura en la convocatoria ordinaria podrá examinarse en la convocatoria de septiembre. El estudiante que no se presente a la convocatoria de febrero y/o de julio ni a la de septiembre, perderá automáticamente todos los trabajos realizados a lo largo del curso. Deberá en este caso matricularse de nuevo en la asignatura.

Las fechas previstas para la realización de todas las actividades se indican en el aula virtual de la asignatura.

Originalidad de los trabajos académicos

Según la Real Academia Española, “plagiar” significa copiar en lo sustancial obras ajenas dándolas como propias. Dicho de otro modo, plagiar implica expresar las ideas de otra persona como si fuesen propias, sin citar la autoría de las mismas. Igualmente, la apropiación de contenido puede ser debida a una inclusión excesiva de información procedente de una misma fuente, pese a que esta haya sido citada adecuadamente. Teniendo en cuenta lo anterior, el estudiante deberá desarrollar sus conocimientos con sus propias palabras y expresiones. En ningún caso se aceptarán copias literales de párrafos, imágenes, gráficos, tablas, etc. de los materiales consultados. En caso de ser necesaria su reproducción, esta deberá contemplar las normas adecuadas para la citación académica.

Los documentos que sean presentados en las actividades académicas podrán ser sometidos a diferentes mecanismos de comprobación de la originalidad (herramientas antiplagios que detectan coincidencias de texto con otras fuentes, comparación con trabajos de otros estudiantes, comparación con información publicada en Internet, etc). El profesor valorará si el trabajo presentado cuenta con los criterios de originalidad exigidos o, en su caso, se atribuye adecuadamente la información no propia a las fuentes correspondientes. La adjudicación como propia de información que corresponde a otros autores podrá suponer el suspenso de la actividad.

Los documentos presentados en las actividades académicas podrán ser almacenados en formato papel o electrónico y servir de comparación con otros trabajos de terceros, a fin de proteger la originalidad de la fuente y evitar la apropiación indebida de todo o parte del trabajo del estudiante. Por tanto, podrán ser utilizados y almacenados por la universidad, a través del sistema que estime, con el único fin de servir como fuente de comparación de cualquier otro trabajo que se presente.

Sistema de calificaciones

El sistema de calificación de todas las actividades didácticas es numérico del 0 a 10 con expresión de un decimal, al que se añade su correspondiente calificación cualitativa:

0 – 4.9: Suspenso (SU)
5.0 – 6.9: Aprobado (AP)
7.0 – 8.9: Notable (NT)
9.0 – 10: Sobresaliente (SB)
Matrícula de honor (MH)

(RD 1125/2003, de 5 de septiembre, por lo que se establece el sistema europeo de créditos y el sistema de calificaciones en las titulaciones universitarias de carácter oficial y con validez en todo el territorio nacional).

La matrícula de honor se concede cuando el profesor lo considere oportuno en función de la excelencia de las actividades realizadas por el estudiante y las calificaciones obtenidas por el resto del grupo. No obstante, los criterios académicos de su concesión corresponden al departamento responsable de cada grado.