Data Science para
Geociencias
Introducción a la ciencia de datos como herramienta para resolver desafíos de las áreas de ciencias de la tierra, ciencias ambientales, etc. Curso creado en colaboración con Bere Martínez.
Contenido
1. Introducción a la ciencia de datos
- Conceptos de ML, DL, Big Data y DS.
- Aprendizaje supervisado y no supervisado
- Problemas de clasificación y regresión.
- Flujo de trabajo en proyectos de data science.
- Frameworks de trabajo.
2. Preparación de los datos
- Manejo de outliers, normalización y transformación.
- Visualización y análisis exploratorio de los datos.
3. Técnicas de validación
- Hold-Out validation
- K-fold cross validation
4. Ingeniería de características
- Eliminación de variables dummy.
- Reducción de dimensionalidad PCA
- Feature selection
5. Rendimiento de los modelos
- Métricas de rendimiento.
6. Métodos de Machine Learning
- Regresión lineal.
- Series de tiempo.
- Regresión logística.
- Árboles de decisión.
- Naive Bayes.
- Clusterización.
- K-Vecinos cercanos.
- Máquinas de soporte vectorial.
7. Modelos de Ensamble
- Boosting.
- Bagging
8. Elementos de redes neuronales
- Modelo perceptrón y función de activación.
- Descenso de gradiente y MLP.
- Creación de una base de datos con web scrapping.
9. Deep Learning
- Artificial Neural Networks (ANNs).
- Convolutional Neural Networks (CNNs).
- Arquitecturas del estado del arte y transfer learning.
- Autoencoders (AEs).
- Generative Adversary Networks (GANs).
- Recurrent Neural Networks y series de tiempo (RNNs).
Actividades a realizar
- Clasificación de cultivos con características de imágenes satelitales
- Predicción de temperatura a partir de registros de calidad de aire.
- Predicción si lloverá al siguiente día con datos de clima.
- Predicción de esfuerzo en concreto.
- Clasificación de cobertura de suelos mediante imágenes satelitales.
- Clustering de sismos históricos.
- Detección de fracturas en imágenes de concreto.
- Detección de sargazo.
- Clasificación de asteroides.