Objetivo
Este proyecto surge a partir de una necesidad muy concreta de la empresa MasOrange. Existen casos en los que los proveedores envían la portada y el título segmentado por separado. Sin embargo, en la mayoría de casos, solo se recibe la carátula. Esto supone un problema a la hora de adaptar el contenido para la interfaz, como por ejemplo la web de Orange TV. Las portadas ocupan mucho espacio y pueden no encajar bien con el estilo de la interfaz. En cambio, disponer del título segmentado, al ocupar menos, permite adaptarlo mejor al diseño e integrarlo mejor, facilitando la personalización del contenido.
Entre los segmentadores de texto existentes, ninguno está entrenado ni especializado en segmentar texto artístico como el que aparece en este tipo de portadas. La principal dificultad es que el título puede presentarse con estilos muy diversos: letras finas, contornos 3D, bajo contraste con el fondo, elementos superpuestos o incluso estar inclinado. Esto hace que desarrollar un sistema automático que funcione bien en todos estos casos sea realmente complicado.
El objetivo principal de este proyecto es desarrollar un sistema automático capaz de segmentar el título de estas carátulas. La idea es que no dependa de un estilo en concreto, sino que sea capaz de generalizar. Además, en caso de que la segmentación automática no sea adecuada, se ofrece una alternativa manual para asegurar que siempre haya una solución.
Para resolver este problema, se ha desarrollado un pipeline compuesto por varios módulos. Se han utilizado modelos de detección de texto para localizar el texto en la imagen. Se aplican técnicas de procesamiento para mejorar la calidad de esas regiones y generar prompts a partir de ellas. Estos prompts se usan como entrada en modelos de segmentación que generan la máscara de segmentación del título. Por último, se aplica LoRA para adaptar SAM a la segmentación de texto en portadas.
En un conjunto de 250 portadas, los resultados obtenidos han sido muy positivos, con un IoU de 0.86. El sistema ha logrado segmentaciones muy parecidas a las del ground truth, demostrando buena capacidad de generalización.

TRABAJO FIN DE GRADO DE:
ANA ORTEGA MATEO
Experiencia Académica
- Grado en Ingeniería Informática, Universidad Carlos III de Madrid (septiembre 2021 – septiembre 2025)
- Máster en Ciberseguridad, Universidad Europea (octubre 2025 – actualidad)
Experiencia Laboral
- Machine Learning Researcher – Universidad Carlos III de Madrid en colaboración con Grupo MasOrange (septiembre 2024 — junio 2025)
- Cybersecurity Specialist, Mas Orange (septiembre 2025 – actualidad)
- Azafata de eventos – Nargy (septiembre 2023 — junio 2025)
- Monitor de ocio y tiempo libre (verano junio 2023 — verano junio 2024)
Habilidades técnicas
- Lenguajes de programación: Python, C/C++, SQL, HTML/CSS, JavaScript.
- Librerías de desarrollo: Pandas, OpenCV, Numpy, PyTorch, Keras, Sci-kit Learn.
- Plataformas Cloud: Google Cloud.
- Frameworks: GitHub, GitLab.