Objetivo
En este trabajo de investigación, se ha utilizado aprendizaje automático para predecir y entender el abandono de clientes en una compañía de telecomunicaciones. Para ello, se han empleado diversas técnicas, como la regresión logística, random forest, XGBoost y redes de neuronas, que son algoritmos de aprendizaje supervisado, y KMeans, KModes, KPrototypes y DBSCAN, que son algoritmos de aprendizaje no supervisado basados en clustering.
A lo largo del estudio, se separó el conjunto de datos en dos partes. La primera parte son datos de clientes que han abandonado la compañía durante un periodo concreto donde no hubo un cúmulo repentino de churn. Por otro lado, la segunda parte del conjunto de datos está compuesta por clientes que se han salido de la marca en periodos donde ha habido un pico de frecuencia de abandono.
El objetivo principal del estudio ha sido analizar las variables que más influyen en la decisión de los clientes de abandonar la compañía y desarrollar un modelo predictivo que pueda identificar a los clientes que están en riesgo de abandonar la compañía. Para ello, se han utilizado diversas técnicas de aprendizaje automático y se ha evaluado su capacidad para predecir el abandono de clientes con una amplia variedad de métricas de evaluación sobre los dos subconjuntos de datos mencionados anteriormente.
De entre todos los algoritmos, los más capacitados para realizar predicciones con precisión fueron el Random Forest, XGBoost y el Perceptón Multicapa. Finalmente se escogió Random Forest por ofrecer mayor interpretabilidad y menor complejidad que la red de neuronas.
Cabe destacar que las métricas de evaluación ofrecieron mejores resultados para el segundo conjunto de datos.
Además de la creación de modelos predictivos previos, se ha llevado a cabo un análisis no supervisado basado en clustering para agrupar a los clientes que abandonan la compañía en diferentes segmentos. Esto permite comprender mejor las características comunes de estos clientes y explorar posibles factores subyacentes que contribuyen al churn. Para esto se han utilizado algoritmos como KMeans, KModes, KPrototypes y DBSCAN.
Para poder profundizar el entendimiento sobre los datos proporcionados para el análisis de los clientes que abandonan la compañía, se ha realizado un Análisis de Correspondencias Múltiple. Con esto se han podido capturar asociaciones fuertes y significativas entre atributos.
En conclusión, este trabajo de investigación ha utilizado técnicas avanzadas de aprendizaje automático para predecir y entender el abandono de clientes en una compañía de telecomunicaciones. Los resultados obtenidos pueden ser de gran utilidad para la toma de decisiones empresariales y la implementación de estrategias de retención de clientes en la industria de las telecomunicaciones.
TRABAJO FIN DE GRADO DE:
RICARDO PRIETO ÁLVAREZ
ACADEMIC BACKGROUND
Bachelor in Computer Science and Engineering – University Carlos III in Madrid (UC3M)
Bachelor in Business Administration and Management – University Carlos III in Madrid (UC3M)
TECHNICAL SKILLS
Python Java SQL PDDL CLIPS HTML CSS
ML & DL PROGRAMMING LIBRARIES
Pandas Keras TensorFlow Numpy Matplotlib Scikit-Learn
CAREER BACKGROUND
Specialist qualified as Machine Learning research assistant in MásMóvil
Novartis Internship (Novartis Campus (Basel, Suiza))
ChatBot development for answering intelligently FAQ’s from Medical groups about certein drugs by using tools such as Microsoft Azure and Amazon Web Services.
COURSES & CREDENTIALS
Deep Learning Especialitation, DeepLearning.AI
– Neural Networks and Deep Learning
– Improving Deep Neural Networks
– Structuring Machine Learning Projects
– Convolutional Neural Networks
– Sequence Models
– Akademia_Inteligencia Artificial de la Fundación Innovación Bankinter, Campus Puerta de Toledo – UC3M