Objetivo

Este proyecto se centra en la exploración de datos de telefonía móvil con el objetivo de estudiar la movilidad turística en la ciudad de Madrid durante la Semana Santa de 2022. Para lograr este propósito, se llevó a cabo una meticulosa labor de limpieza de datos, abordando desafíos como la escasez de registros de turistas y problemas relacionados con el etiquetado y duplicación de datos de antenas de telefonía móvil.

Una vez preparados los datos, se procedió a realizar un análisis exhaustivo para comprender su composición y estructura, generando un nuevo conjunto de datos en formato log. A través de la aplicación de técnicas de minería de procesos, se lograron identificar las principales rutas turísticas realizadas por los visitantes en Madrid. Para facilitar el filtrado de la información y la construcción de mapas de procesos, se utilizó la herramienta Disco.

No obstante, se observó que la extracción de información valiosa, como los patrones de movimiento de los turistas según su lugar de alojamiento y nacionalidad, requería un enfoque más manual y el conocimiento experto del analista. Esta limitación motivó la propuesta de aplicar técnicas de aprendizaje automático (machine learning) con el fin de automatizar la detección de patrones de movimiento y la extracción de información relevante.

Con base en esta premisa, se planteó una arquitectura centrada en un autoencoder que comprime la información de movilidad de un día de un turista en un vector de tres dimensiones. Posteriormente, se aplicaron algoritmos de clustering, como k-means, DBSCAN y jerárquico, utilizando estos vectores para identificar grupos de turistas con perfiles de movimiento similares. Se validó la metodología utilizando datos sintéticos y se construyeron modelos de redes de neuronas basados en autoencoder convolucional y UNET.

Los resultados revelaron que, si bien ambos diseños demostraron ser efectivos, el aprendizaje de la estructura de los datos y la construcción del espacio latente fue más óptimo en la red convolucional. Esto se atribuye al hecho de que las «skip connections» en la arquitectura UNET facilitaron la reconstrucción de los datos, en detrimento de un aprendizaje más preciso. Mediante el clustering, se identificaron entre 4 y 6 grupos de turistas, y se analizaron las diferencias en términos de perfil horario, espacial y nacionalidad entre estos grupos.

En conclusión, este proyecto ha aportado valor al campo de la movilidad turística mediante la aplicación de técnicas de minería de procesos y aprendizaje automático. Sin embargo, se sugiere la aplicación de métodos similares a conjuntos de datos más precisos y menos agregados en futuras investigaciones. Este enfoque ha sentado las bases para un análisis más profundo y específico de la movilidad turística en Madrid, con potencial para mejorar la comprensión de los patrones de movimiento de los visitantes y ofrecer información relevante para el sector turístico.

TRABAJO FIN DE GRADO DE:

RICARDO GRANDE CROS

Experiencia Académica

Doble Grado en Ingeniería Informática y Administración de Empresas, Universidad Carlos III de Madrid
(septiembre 2017 – junio 2023)

ERASMUS+ en Karl Franzens Universität, Austria (2019 – 2020)

 

Experiencia Laboral

Backend developer – Grupo MasMóvil (agosto 2023 – actualidad)

Machine Learning Researcher –  Universidad Carlos III de Madrid en colaboración con Grupo MasMóvil (septiembre 2022 – mayo 2023)

Devops Developer Trainee – CBRE (enero 2023 – julio 2023)

Software Development Intern – Tecnatom (junio 2021 – agosto 2021)

Profesor Particular (matemáticas, física y programación, 2018 – 2020)

Premios y Certificaciones

Beca de Excelencia de la Comunidad de Madrid 2022/23

Beca de Excelencia de la Comunidad de Madrid 2021/22

Beca de Excelencia de la Comunidad de Madrid 2020/21

Best Creative Idea in Digital Transformation in the field of Occupational Health and Safety (2022)

Azure AI Fundamentals (AI – 900)


Habilidades técnicas

Lenguajes de programación: Python, Java, C/C++, SQL, HTML/CSS/JS

Librerías de desarrollo: Pandas (y geopandas), NumPy, TensorFlow, Keras, Ploty y Scikit-Learn

Plataformas Cloud: Amazon Web Services, Microsoft Azure, Google Cloud.

Otras tecnologías y frameworks: Git, Jenkins, Terraform, Angular

Página Personal
LinkedIn