Módulos/Asignaturas del Curso

Módulo/Asignatura 1. Diseño y Gestión de Proyectos en Data Science y Big Data I

Número de créditos: 3,00 ECTS

Modalidad de impartición: Presencial

Fechas de inicio-fin: 24/04/2016 - 25/05/2016

Horario: Miércoles. En horario de tarde

Contenido:

Introducción a la Ciencia del Dato

Experimentación e Investigación: Reproducibilidad y documentación
Proyectos básicos de aplicación de técnicas de Ciencia del Dato
Big data

Etapas de un proyecto

Exploración de datos
Técnicas de educción
Modelización: tipos de datos
Computación
Aplicación
Gestión de versiones
Elaboración y redacción de informes finales

Cuestiones éticas y legales asociadas a cada etapa de un proyecto

Legislación de protección de datos que afectan al proyecto en Data Science

Módulo/Asignatura 2. Introducción a la Programación en Python y a los Paradigmas para Datos

Número de créditos: 4,00 ECTS

Modalidad de impartición: Presencial

Fechas de inicio-fin: 28/01/2016 - 18/03/2016

Horario: Jueves, Viernes. En horario de tarde

Contenido:

Fundamentos de Python
Tipos de datos: números, cadenas, tuplas, listas, diccionarios, conjuntos
Definiciones por comprensión, estructuras de control, etc.
Definición de funciones
Gestión de errores
Arquitecturas y paradigmas para los datos (Introducción)
Tipos de datos: Estructurados y esestructurados
Optención de datos
Almacenamiento y consulta
Biblioteca estándar Python:
Otras bibliotecas:

Módulo/Asignatura 3. Fundamentos de Estadística y Programación en R

Número de créditos: 4,00 ECTS

Modalidad de impartición: Presencial

Fechas de inicio-fin: 28/01/2016 - 18/03/2016

Horario: Jueves, Viernes. En horario de tarde

Contenido:

Fundamentos de Estadística
* Probabilidad e inferencia estadística
* Análisis Exploratorio de Datos
* Modelo de Regresión Lineal Múltiple
Entorno de programación estadística R
* Tipos de objetos.
* Elementos de Programación
* Gestión de datos
* Análisis exploratorio de datos: visualización.

Módulo/Asignatura 4. Aprendizaje Estadístico y Modelización

Número de créditos: 6,00 ECTS

Modalidad de impartición: Presencial

Fechas de inicio-fin: 31/03/2016 - 03/06/2016

Horario: Jueves, Viernes. En horario de tarde

Contenido:

* Concepto básicos en Aprendizaje estadístico
* Modelo lineal generalizado.
* Modelos de Regresión no lineales
* Modelos de Regresión no paramétricos
* Regresión y clasificación mediante KNN

Módulo/Asignatura 5. Arquitecturas y Paradigmas para Ciencia del Dato

Número de créditos: 4,00 ECTS

Modalidad de impartición: Presencial

Fechas de inicio-fin: 31/03/2016 - 03/06/2016

Horario: Jueves, Viernes. En horario de tarde

Contenido:

* Introducción a los datos (estructurados y desestructurados)
* Introducción y repaso sobre obtención de datos (APIs, RDF, logs, transacciones, textos, etc.)
* Tratamiento y limpieza de datos: Expresiones regulares, Herramientas ETL
* Almacenamiento BD relacionales versus BD Nosql: Column Stores, BD Documentos, Clave-Valor, BD en grafo, etc.
* Procesamiento en paralelo y escalabilidad (multiprocesamiento a nivel de datos VS a nivel funcional)
* Casos de uso y diseño de soluciones
* Entornos integrados. Ejemplo: RapidMiner

Módulo/Asignatura 6. Machine Learning I

Número de créditos: 5,00 ECTS

Modalidad de impartición: Presencial

Fechas de inicio-fin: 08/06/2016 - 15/07/2016

Horario: Miércoles, Jueves, Viernes. En horario de tarde

Contenido:

* Técnicas de Reducción de la dimensionalidad
* Análisis de Conglomerados
* Técnicas de clasificación probabilística
* Support Vector Machines (SVM)
* Árboles de clasificación y regresión

Módulo/Asignatura 7. Inteligencia Colectiva, Big Data y Sistemas de Recomendación

Número de créditos: 3,00 ECTS

Modalidad de impartición: Presencial

Fechas de inicio-fin: 19/05/2016 - 17/06/2016

Horario: Jueves, Viernes. En horario de tarde

Contenido:

* Inteligencia Colectiva y flujos de datos
** Web Social
** Social Media
** Metodologías ''crowd''
* Redes: Conceptos, topología y comportamiento extremal
** Propagación
** Resiliencia en redes
** Computación bajo reputación y confianza
* Análisis de la semántica emergente: Análisis de opinión y sentimientos
* Sistemas de recomendación (Item based, User Based)
* Aplicaciones

Módulo/Asignatura 8. Procesamiento del Lenguaje Natural para la Ciencia del Dato I

Número de créditos: 2,00 ECTS

Modalidad de impartición: Presencial

Fechas de inicio-fin: 23/06/2016 - 08/07/2016

Horario: Jueves, Viernes. En horario de tarde

Contenido:

Módulo I: Fundamentos del Procesamiento del Lenguaje Natural

Introducción: de la Lingüística Computacional a la Ingeniería del Lenguaje Natural
Niveles y técnicas para el estudio y tratamiento automático de los lenguajes naturales
Nociones y técnicas básicas: Expresiones regulares, Autómatas y Gramáticas
Recursos lingüísticos

Módulo II: Lenguaje natural, datos y conocimiento

Reconocimiento automático de la voz: Redes neuronales y otras tecnologías aplicadas al nivel acústico. Análisis del entrenamiento, adaptación y evaluación.
Análisis léxico-morfológico: corpus lingüísticos y técnicas relacionadas con la ciencia del dato. Corrección ortográfica, lematización, tokenización.
Análisis gramatical: sintaxis y semántica. Modelos basados en conocimiento y modelos estadísticos.
Gestión del diálogo: Autómatas. Sistemas basados en agentes. El enfoque basado en el estado de información. Las técnicas POMDP (procesos de decisión de Markov parcialmente observables) como soporte al aprendizaje automático en gestión del diálogo.
Traducción automática: Técnicas y enfoques. Paradigmas basados en reglas, basados en corpus y enfoques híbridos.
Aplicaciones comerciales e industriales: Speech Analytics, Content Analytics, Text Mining, Information Retrieval and Extraction, Question Answering, Sentiment Analysis, Entity Names Recognition, etc.

Módulo/Asignatura 9. Visualización de la Información

Número de créditos: 2,00 ECTS

Modalidad de impartición: Presencial

Fechas de inicio-fin: 08/06/2016 - 15/07/2016

Horario: Miércoles, Jueves, Viernes. En horario de tarde

Contenido:

Arquitectura de la visualización de la Información
Estructura visual: diseño e implementación
Infografías y economía visual
Presentación de informes y Reports