Objetivo
En este trabajo de investigación, se ha realizado el estudio del Análisis de Supervivencia aplicado al abandono de clientes de una Telco. Para ello, se han analizado diferentes técnicas comparando las características, aplicaciones y resultados de cada una. Las técnicas escogidas han sido estadísticas, como el modelo Kaplan-Meier y el modelo de Riesgos Proporcionales de Cox, y técnicas de Machine Learning, como los modelos de Árbol de Supervivencia, Random Survival Forest y Gradient Boosting.
Este tipo de análisis permite obtener la probabilidad a lo largo del tiempo de que suceda un evento. En este caso, el evento seleccionado ha sido el abandono de la empresa por parte de los clientes.
El conjunto de datos utilizado está compuesto por datos reales de una empresa de telecomunicaciones en España, utilizando solo aquellos clientes particulares.
El análisis se ha centrado en, tres aplicaciones principalmente:
Por un lado, se han realizado comparaciones de las curvas de supervivencia de diferentes grupos de clientes en función de variables, lo que permite detectar cuáles afectan positivamente en la permanencia de los clientes y cuáles aumentan el riesgo de abandono.
Por otro lado, se ha obtenido la importancia de las diferentes características en la tasa de abandono, permitiendo detectar qué aspectos afectan en mayor medida a los consumidores a la hora de continuar contratando servicios.
Por último, se han realizado con las diferentes técnicas, modelos de predicción de consumidores concretos, calculando la curva de supervivencia de un cliente con unas características determinadas. Para determinar la capacidad predictiva de los modelos se han utilizado dos métricas, el Índice de Concordancia de Harrell y la Pérdida Integrada de Brier. El primero de ellos, determina si el modelo ordena adecuadamente los datos de test, y el segundo, la diferencia entre la curva predicha y la real.
Los resultados obtenidos son más altos en los modelos de Machine Learning, especialmente en el modelo de Gradient Boosting, que utiliza como estimadores base árboles de supervivencia y optimiza la funciónnde riegos proporcionales de Cox.
En conclusión, en este trabajo de investigación se han utilizado técnicas de aprendizaje automático utilizadas principalmente en la medicina, para predecir el abandono de clientes de una empresa, y obtener información acerca de su comportamiento en función de sus características. Permitiendo, en base a los resultados obtenidos, la tona de decisiones para la retención de estos clientes.
TRABAJO FIN DE GRADO DE:
SANTIAGO JUSTE VALVERDE
Experiencia Académica
- Doble Grado en Ingeniería Informática y Administración de Empresas, Universidad Carlos III de Madrid (septiembre 2018 – septiembre 2024)
- ERASMUS+ en Technische Universität Graz. Austria (2021 – 2022)
Experiencia Laboral
- Product Analyst – MasOrange (septiembre 2024 – actualidad)
- Machine Learning Researcher – Universidad Carlos III de Madrid en colaboración con Grupo MásMóvil (septiembre 2023 — mayo 2024)
Habilidades técnicas
- Lenguajes de programación: Python, Java, C/C++, SQL, HTML/CSS/JS.
- Librerías de desarrollo: Pandas, Numpy, Tensorflow, Keras, Sci-kit Learn.
- Plataformas Cloud: Google Cloud.
- Frameworks: Git.