Solicitud de información

Minería de Datos

Código Asignatura:
1779
Nº Créditos ECTS:
6
Tipo:
Optativa
Duración:
Semestral
Idioma:
Castellano
Plan de estudios:
Profesor(es):
Año académico:
2024-25

La información sobre los datos de contacto y el horario de tutorías se encuentra publicada en el aula virtual de la asignatura.

Descripción

Minería de Datos es una asignatura que consta de 6 créditos y que dotará al estudiante de conceptos relacionados con la Minería de Datos (más conocido como Data Mining, su nombre en inglés) y el Proceso de Descubrimiento de Conocimiento en Bases de Datos (más conocido por sus siglas KDD, de su nombre en inglés Knowledge Discovery in Databases).

La asignatura comienza con un tema que tiene como objetivo introducir los conceptos básicos de Data Mining. A continuación se presenta el proceso de KDD y sus diferentes fases. Tras esta primera parte introductoria se describen las etapas iniciales del proceso de KDD. En la parte central de la asignatura se presentan las técnicas y algoritmos de Data Mining más utilizados. Finalmente, se analizará la forma de ejecutar un proyecto real de Data Mining.

Antes de matricular la asignatura, verifique los posibles requisitos que pueda tener dentro de su plan. Esta información la encontrará en la pestaña "Plan de estudios" del plan correspondiente.

Competencias generales

  • Capacidad para trabajar en situaciones carentes de información y bajo presión, teniendo nuevas ideas, que permiten la resolución de la situación con el uso de la informática.
  • Capacidad para integrarse en la empresa de modo autónomo demostrando conocimientos básicos de la informática, comprensión de la responsabilidad ética y profesional, y motivación por y la mejora continua y la calidad del producto.
  • Capacidad para el uso profesional de la tecnología de la información y la comunicación.
  • Tener capacidad para realizar la formalización y especificación de problemas reales cuya solución requiere el uso de la informática.

Competencias específicas

  • Capacidad para abordar proyectos de extración de conocimiento y para aplicar técnicas de Minería de Datos para la resolución de problemas específicos mediante el uso de los algoritmos existentes para cada tipo de problema.

Competencias transversales

  • Capacidad de análisis y síntesis.
  • Capacidad de organización y planificación.
  • Capacidad de gestión de la información.
  • Toma de decisiones.

Resultados del aprendizaje

  • Comprender el concepto de minería de datos y sus fases.
  • Conocer y saber aplicar las principales técnicas de extracción de conocimiento en bases de datos.
  • Saber manejar herramientas para la aplicación de técnicas de extracción de conocimiento en bases de datos.

Metodología

La metodología adoptada en esta asignatura para el aprendizaje y evaluación de sus contenidos se encuentra adaptada al modelo de formación continuada y a distancia de la UDIMA. Los conocimientos de la asignatura se adquieren a través del estudio razonado de todas las unidades didácticas, así como del material didáctico complementario que se ponga a disposición de los estudiantes en el aula virtual. Además, se complementa con la acción tutorial, que incluye asesoramiento personalizado, intercambio de impresiones en los debates habilitados en foros y demás recursos y medios que ofrecen las nuevas tecnologías de la información y la comunicación. Por otra parte, el aprendizaje también se apoya en la realización de las actividades previstas en el aula virtual, que son de tres tipos (de evaluación continua, de aprendizaje y controles), y que vienen recogidas en el apartado “Contenidos y programación”.

Para ampliar esta información, se recomienda consultar la pestaña “Metodología y exámenes” de la titulación.

Dedicación requerida

La dedicación requerida para esta asignatura de 6 créditos ECTS es de 150 horas, que se encuentran distribuidas de la siguiente manera:

  • Estudio de las Unidades Didácticas: 30%
  • Material complementario. Lectura de artículos/Visionado de vídeos en web: 5%
  • Supuestos, casos prácticos: 35%
  • Búsqueda de información: 15%
  • Redacción o realización de informes: 5%
  • Acción tutorial: 5%
  • Evaluación: 5%

Tutorías

El profesor aporta un seguimiento individualizado de la actividad del estudiante para asegurar las mejores condiciones de aprendizaje mediante la tutorización a través de las herramientas de la plataforma educativa y/o de las tutorías telefónicas. En estas tutorías los estudiantes pueden consultar a los profesores las dudas acerca de la materia estudiada.

Materiales didácticos

Para el desarrollo del aprendizaje sobre el que versará el examen final se han seleccionado materiales didácticos y/o manuales, a partir de los cuales se estudiarán las unidades didácticas que se corresponden con la descripción de los contenidos de la asignatura:

Manual de la asignatura:
Lara Torralbo, J. A. "Manual de Minería de Datos", Ed: UDIMA (2013)

Además, se recomienda la siguiente bibliografía de consulta voluntaria:

  • Hernández, J., Ramírez, M. J. y Ferri, C. (2004). Introducción a la Minería de Datos. Ed. Pearson.
  • Pérez, C. y Santín, D. (2007). Minería de Datos. Técnicas y Herramientas. Ed. Thomson.
  • Pierson, L. (2017). Data Science for Dummies. Ed. John Wiley & Sons.

Finalmente, el profesor podrá poner a disposición del estudiante cualquier otro material complementario voluntario al hilo de las unidades didácticas o en una carpeta de material complementario.

Contenidos y programación

SEMANAS (*) UNIDADES DIDÁCTICAS ACTIVIDADES DIDÁCTICAS
Semana 1 Tema 1. Introducción a la minería de datos
1.1. Origen y motivación
1.2. El proceso de descubrimiento de conocimiento en bases de datos
1.3. Tipos de datos
1.4. Relación con otras áreas
1.5. Utilidad de la minería de datos
1.6. Aplicaciones
1.7. Repercusión, desafíos y tendencias en minería de datos
  • Estudio de la unidad
  • Actividad de Aprendizaje 1
Semana 2 Tema 2. El proceso de KDD
2.1. Introducción
2.2. Recopilación de datos
2.3. Selección, limpieza y transformación de datos
2.4. Data mining
2.5. Interpretación y evaluación
2.6. Visión de conjunto
  • Estudio de la unidad
Semana 3 Tema 3. Modelos de data mining
3.1. Introducción
3.2. Clasificación
3.3. Regresión
3.4. Clustering
3.5. Asociación
3.6. Detección de atípicos
3.7. Tareas y técnicas
3.8. Técnicas y modelos
3.9. Herramientas de data mining
  • Estudio de la unidad
  • Control 1
Semana 4 Tema 4. Clasificación: árboles de decisión
4.1. Introducción
4.2. Árboles y reglas de decisión
  • Estudio de la unidad
  • Actividad de Evaluación Continua 1
Semanas 5 y 6 Tema 5. Clasificación: técnicas bayesianas y técnicas basadas en casos
5.1. Introducción
5.2. Técnicas bayesianas
5.3. Técnicas basadas en casos
5.4. Evaluación de clasificadores
  • Estudio de la unidad
  • Actividad de Aprendizaje 2
  • Actividad de Aprendizaje 3
  • Control 2
Semana 7 Tema 6. Clustering: técnicas particionales
6.1. Introducción
6.2. Medidas de distancia
6.3. Clustering particional
  • Estudio de la unidad
Semanas 8 y 9 Tema 7. Clustering: técnicas jerárquicas y técnicas basadas en densidad
7.1. Introducción
7.2. Clustering jerárquico
7.3. Clustering basado en densidad
7.4. Clustering basado en grid
7.5. Evaluación de modelos de clustering
7.6. Evaluación de modelos de clustering
  • Estudio de la unidad
  • Actividad de Evaluación Continua 2
  • Control 3
Semanas 10 y 11 Tema 8. Asociación, regresión y detección de atípicos
8.1. Introducción
8.2. Asociación
8.3. Regresión
8.4. Detección de atípicos
  • Estudio de la unidad
  • Actividad de Evaluación Continua 3
  • Actividad de Aprendizaje 4
Semanas 12 y 13 Tema 9. Minería de datos no convencionales
Introducción
9.1. Análisis de series temporales
9.2. Web mining
9.3. Text mining
9.4. Data mining espacial
9.5. Minería de datos multimedia
  • Estudio de la unidad
  • Control 4
Semanas 14 y 15 Tema 10. Caso de estudio: aplicación de la minería de datos en el dominio de la medicina
10.1. Introducción
10.2. Dominio médico de aplicación: estabilometría Marco para el descubrimiento 10.3. de conocimiento en el entorno médico
  • Estudio de la unidad
Resto de semanas hasta finalización del semestre Estudio y preparación para el examen final, celebración del examen final y cierre de actas

(*) Las fechas concretas se pueden consultar en el aula virtual de la asignatura y en la pestaña de “Precios, Calendario y Matriculación” de la titulación.

Sistema de evaluación

Durante el estudio de esta asignatura, el proceso de evaluación del aprendizaje es continuo y contempla la realización de:

- Una evaluación continua a lo largo del curso a través de acciones didácticas que supone el 50% de la nota final. Incluye la realización de los diferentes tipos de actividades de evaluación, de aprendizaje y controles.

  • Actividades de aprendizaje (AA): actividades que permiten evaluar el desarrollo de las competencias al hilo del desarrollo de las unidades didácticas. Pueden adoptar el formato de foro, cuestionario, glosario u otros.
  • Controles: actividades que permiten evaluar la adquisición de aspectos conceptuales y prácticos de la asignatura. Toman la forma de cuestionarios.
  • Actividades de evaluación continua (AEC): actividades que permitan evaluar el alcance de ciertos hitos académicos a lo largo del cuatrimestre. Pueden adoptar el formato de informes, cuestionarios, casos prácticos, comentarios de texto, etc.

- Un examen final presencial que supone el 50% de la nota final. Está dirigido a la valoración de las competencias y conocimientos adquiridos por el estudiante. El examen se evaluará de 0 a 10, tendrá una duración estimada de 90 minutos y será de tipo mixto, con una parte tipo test con 10 preguntas de opción múltiple (2 puntos) y una parte de desarrollo teórico-práctica con cuatro ejercicios (8 puntos). Dentro de la parte tipo test, los errores penalizan con el objetivo de corregir las respuestas acertadas por azar. 

Para poder presentarse al examen final presencial, en cualquiera de las convocatorias, es imprescindible haber obtenido, al menos, el 50% de la nota correspondiente al conjunto total de actividades del aula asociadas a la asignatura (actividades de aprendizaje, controles y actividades de evaluación continua).

El estudiante que se presenta al examen sin cumplir los requisitos para ello, será calificado con un cero en el examen final presencial y consumirá convocatoria.

Cuadro resumen del sistema de evaluación

Tipo de actividad Número de actividades planificadas Peso calificación
Actividades de aprendizaje
4
10%
Actividades de Evaluación Continua (AEC)
3
30%
Controles
4
10%
Examen final
Si
50%
TOTAL 100%

Para aprobar la asignatura, es necesario obtener una calificación mínima de 5 en el examen final, así como en la calificación total del curso, una vez realizado el cómputo ponderado de las calificaciones obtenidas en las actividades didácticas y en el examen final.

Si un estudiante no aprueba la asignatura en la convocatoria ordinaria podrá examinarse en la convocatoria de septiembre. El estudiante que no se presente a la convocatoria de febrero y/o de julio ni a la de septiembre, perderá automáticamente todos los trabajos realizados a lo largo del curso. Deberá en este caso matricularse de nuevo en la asignatura.

Las fechas previstas para la realización de todas las actividades se indican en el aula virtual de la asignatura.

Originalidad de los trabajos académicos

Según la Real Academia Española, “plagiar” significa copiar en lo sustancial obras ajenas dándolas como propias. Dicho de otro modo, plagiar implica expresar las ideas de otra persona como si fuesen propias, sin citar la autoría de las mismas. Igualmente, la apropiación de contenido puede ser debida a una inclusión excesiva de información procedente de una misma fuente, pese a que esta haya sido citada adecuadamente. Teniendo en cuenta lo anterior, el estudiante deberá desarrollar sus conocimientos con sus propias palabras y expresiones. En ningún caso se aceptarán copias literales de párrafos, imágenes, gráficos, tablas, etc. de los materiales consultados. En caso de ser necesaria su reproducción, esta deberá contemplar las normas adecuadas para la citación académica.

Los documentos que sean presentados en las actividades académicas podrán ser sometidos a diferentes mecanismos de comprobación de la originalidad (herramientas antiplagios que detectan coincidencias de texto con otras fuentes, comparación con trabajos de otros estudiantes, comparación con información publicada en Internet, etc). El profesor valorará si el trabajo presentado cuenta con los criterios de originalidad exigidos o, en su caso, se atribuye adecuadamente la información no propia a las fuentes correspondientes. La adjudicación como propia de información que corresponde a otros autores podrá suponer el suspenso de la actividad.

Los documentos presentados en las actividades académicas podrán ser almacenados en formato papel o electrónico y servir de comparación con otros trabajos de terceros, a fin de proteger la originalidad de la fuente y evitar la apropiación indebida de todo o parte del trabajo del estudiante. Por tanto, podrán ser utilizados y almacenados por la universidad, a través del sistema que estime, con el único fin de servir como fuente de comparación de cualquier otro trabajo que se presente.

Sistema de calificaciones

El sistema de calificación de todas las actividades didácticas es numérico del 0 a 10 con expresión de un decimal, al que se añade su correspondiente calificación cualitativa:

0 – 4.9: Suspenso (SU)
5.0 – 6.9: Aprobado (AP)
7.0 – 8.9: Notable (NT)
9.0 – 10: Sobresaliente (SB)
Matrícula de honor (MH)

(RD 1125/2003, de 5 de septiembre, por lo que se establece el sistema europeo de créditos y el sistema de calificaciones en las titulaciones universitarias de carácter oficial y con validez en todo el territorio nacional).

La matrícula de honor se concede cuando el profesor lo considere oportuno en función de la excelencia de las actividades realizadas por el estudiante y las calificaciones obtenidas por el resto del grupo. No obstante, los criterios académicos de su concesión corresponden al departamento responsable de cada grado.