7. RESULTADOS
-
Proceso de modelización de las previsiones
En el capítulo anterior se han presentado ejemplos gráficos y visuales del comportamiento de las métricas explicando en ejemplos distintos casos de uso, con una explicación de su causalidad y de las deducciones derivadas. En este apartado se exponen los resultados finales para contrastarlos con el modelo actual de presupuestación que utiliza el equipo de FM de FerMar SL comparable. Los resultados cuantifican el rendimiento del modelo final de la Estrategia 3 (versión con conciliación P10/P11), evaluado frente al baseline SNaive12 utilizando como verdad-terreno el año 2024.
- Modelos predominantes previos al ensemble (estrategia 3)
Dada la elevada cantidad de intermitencia en las series, se pusieron en competencia:
- para las series intermitentes: Croston, TSB, ADIDA/MAPA,
- para las series generales: ETS, ARIMA_auto, Theta y Holt/Holt_damped,
Siempre comparados contra los baselines: Naive1, SNaive12 y Mediana Estacional.
A continuación, se exponen de manera gráfica los mejores modelos del Top-1 y del Top-2, es decir, aquellos cuyo rendimiento (MASE12) superó a los baselines tras recorrer las distintas ventanas temporales de validación rolling origin:

Se observa que SNaive12 (con 865 series) y TSB (con 552 series) son los modelos más frecuentes en Top-1, seguidos por Naive1 (con 387 series).
Esto nos confirma que la mayoría de series, especialmente las intermitentes, se resuelven con variantes naive o Croston/TSB, porque los modelos avanzados (ETS, ARIMA, Theta) no consiguen superar al baseline en validación rolling origin.
En Top-2, aparece ADIDA/MAPA (con 552 series), otra técnica especializada en demanda intermitente, junto con SNaive12, Naive1 (fallback cuando no hay ganador) y modelos clásicos.
Esto refleja que los naive y sus variantes dominan en número de series, porque fueron más robustos aplicando el criterio de gobernanza robusto.
Contrastamos para valorar el impacto que tiene cada modelo Top-1 y Top-2 en el coste predicho.

Aunque Naive1 vimos que solo fue Top-1 en 387 series, esas series concentran mucho gasto OPEX, lo que hace que represente casi la mitad del coste total predicho (48,1%) en 2024.
Por el contrario, SNaive12 y TSB, que aparecen en más series, concentran menos peso en coste, porque gran parte de esas series corresponden a edificios o cuentas con menor volumen de gasto.
En Top-2, el reparto se estabiliza más: Naive1 baja a 17,1% del coste, SNaive12 sube a 50%, y entran en juego Holt_damped y Theta, lo que genera un equilibrio mayor entre modelos.
Esto significa que el gráfico de coste presenta un sesgo por el peso económico de unos pocos edificios grandes, mientras que el gráfico de número de series refleja la robustez de los naive y Croston/TSB en la mayoría de casos.
- Gobernanza y consolidación (Paso 6 - estrategia 3)
Como se puede observar en los dos gráficos siguientes:

-
A nivel cobertura: el 78.07% de las series modeladas (excluyendo solo test y cero estructural) superaron el criterio de MASE12 frente al baseline de SNaive12.
-
A nivel reemplazos: se realizaron 660 reemplazos de modelos avanzados por el baseline en series donde la complejidad no aportaba valor, demostrando la operatividad de la regla de gobernanza.
- Casos especiales: 104 parejas fueron clasificadas como cero estructural (36 meses consecutivos sin gasto) y se gestionaron con pronóstico fijo = 0.
En el gráfico siguiente se representan los boxplots de MASE12 por tipo de coste y segmento (GENERAL vs INTERMITENTE): en él se muestran cómo los reemplazos fueron más frecuentes en categorías con dispersión alta y errores por encima de 1, especialmente en Servicios Ctto. y Servicios Extra.

- Rendimiento global del portfolio final modelado (Paso 9 / Control F - estrategia 3)
La evaluación a nivel de portfolio (WAPE micro anual) demostró un valor añadido evidente:
-
WAPE del modelo final: 0.358801
- WAPE del baseline SNaive12: 0.392322
En el gráfico siguiente, se muestra cómo el error evoluciona desde el baseline hasta el modelo gobernado (P12_ACTIVE). Se observa que mientras variantes intermedias como P12_STD introducen inestabilidad, la aplicación del Control F corrige el error global, aunque no consigue ir por debajo del baseline.

- Resultados de diagnóstico estructural (Estrategia 2)
Se confirmó que solo entre un 15% y un 18% de las series eran aptas para predicción estadística estable. El universo de modelado se segmentó en un 57.5% de series intermitentes y un 42.5% de series generales, evidenciando la complejidad del problema.

En el siguiente scatter plot SMAPE vs MASE12 observamos la heterogeneidad del portfolio: las series generales tienden a concentrarse en zonas de menor error, mientras que las intermitentes se dispersan en regiones de error muy elevado.

- Comparativa por país y tipo de coste
Además de los resultados globales, se analizó la evolución de las métricas a nivel de país:
-
Algunos países, como México o Costa Rica, presentaron picos extremos en categorías específicas (Licencias y Suministros, respectivamente).
-
España y Perú mostraron errores diversificados en varias categorías, lo que refuerza la necesidad de políticas diferenciadas según contexto.
En el siguiente gráfico de líneas del WAPE% por país a lo largo de las variantes se evidencia cómo P12_STD generó un empeoramiento generalizado, corregido posteriormente con P12_ACTIVE.

En el siguiente mapa de calor del WAPE% por país y tipo de coste se muestra dónde se concentran los errores más altos en 2024, reforzando la necesidad de enfoques diferenciados.

Y finalmente, el diagrama de Pareto del WAPE% por coste nos permite identificar que un pequeño número de categorías explica la mayor parte del error global, guiando así prioridades de mejora.

-
Aplicación del servicio en web
Estos resultados van a estar disponibles en la memoria indexada en la aplicación web con dominio https://fmpredict.com , adicionalmente, y como se puede comprobar en la demo que hemos colgado online (siempre que se disponga de un acceso a internet), cualquier usuario del equipo de FM va a poder consultar las previsiones según el último modelo desarrollado por inmueble.

Les animamos a que accedan a la web de https://fmpredict.com para validar el proyecto.
-
Resumen operativo resultados del proyecto para el equipo FM
A continuación se presenta un conjunto de gráficos operativos del OPEX FM (2024 vs. Previsiones).
- Mapa de calor con la diferencia porcentual entre previsiones y gasto real por país y tipo de coste (2024)

Se observa una alta heterogeneidad en el rendimiento del modelo según país y tipo de gasto:
-
Costa Rica y República Dominicana presentan desviaciones extremas (ej. +2419% en Suministros y +114% en Servicios Extra), lo que refleja problemas de estabilidad en series con pocos datos o consumos atípicos.
-
En contraste, España y México muestran un comportamiento más equilibrado, aunque con sobreestimaciones relevantes en categorías como Licencias (+54%) y Eficiencia Energética (+17%).
-
Colombia y Perú concentran infraestimaciones notables, especialmente en Eficiencia Energética (-77% en Colombia).
El agregado global (columna TOTAL) indica que, pese a estas desviaciones locales, el modelo mantiene un error controlado, con diferencias promedio que oscilan en torno al ±5% en varias categorías. Esto evidencia que la gobernanza corrige el error agregado, pero persisten focos específicos de mejora en determinados países y costes.
- Diagrama de barras entre previsiones y gasto real por país y tipo de coste (2024)

Se concluye que:
-
México y España concentran el mayor volumen absoluto de gasto, con previsiones cercanas a los valores reales, lo que muestra un buen ajuste en mercados de gran escala.
-
Panamá también mantiene una predicción muy próxima al gasto real, lo que refuerza la capacidad del modelo en escenarios de tamaño medio.
-
En cambio, Colombia y Perú presentan desviaciones más acusadas, con infraestimación del gasto en Colombia y sobreestimación en Perú.
- Los países con menor volumen (República Dominicana y Costa Rica) muestran diferencias relativas más grandes, reflejando la dificultad del modelo para capturar la dinámica en contextos de datos más reducidos o volátiles.
En conjunto, el modelo logra capturar adecuadamente los patrones globales de gasto, aunque sigue siendo necesario refinar el ajuste en países de menor tamaño y en categorías donde persisten desviaciones estructurales.
-
Listado de entregables
Se realizará la entrega de un fichero comprimido:
Entrega_Global_Project_Grupo_13_Neith.zip que contiene la siguiente documentación:
- Carpeta 000_PRIMER_ENTREGABLE
Es una carpeta que contiene las subcarpetas y que se ha generado durante la ejecución del notebook con el contenido documental y de datos necesarios para validar el modelo, reproducirlo en cualquier entorno y, en consecuencia, trasladarlo en parte al entorno web como versión beta. Es el resultado del paso 13 de la estrategia 3 con el modelo final que sirve de previsión del 2024 dado un inmueble o ID_BUILDING.
- Memoria del Proyecto Neith - 001_Memoria_Proyecto_Neith.pdf
Contiene la Memoria del proyecto para entregar a FerMar SL
- Notebook 1 - 002_Modelado_Neith_Version_Beta.ipynb (también en versión .html)
Contiene el detalle desglosado de cada uno de los sprints o estrategias que se han abordado en el proyecto con las decisiones que se han tomado durante las fases de modelización, incluye el código de modelización y de análisis con sus interpretaciones. Es ejecutable de arriba a abajo pero también se han ido seleccionando artefactos en distintos formatos (csv, json, xlsx, html) que permiten su ejecución desde determinados puntos de control y etapas del notebook.
- Notebook 2 (draft) - 003_Fuentes_graficas_para_memoria_proyecto.ipynb
Es un notebook operativo para la memoria, no contiene más que el código que permite visualizar los gráficos tal como se han reportado en la memoria. No tiene comentarios.
- Presentación Proyecto Neith - 004_Presentacion_Neith_Completa.pdf
Presentación guía resumen del proyecto que ha servido para la grabación del video.
- Video Presentación Proyecto Neith - 005_Video_Presentacion_Neith.mov
- Enlace 1 a 006_fmpredict.html que te dirige a la página web FerMar - versión demo.
- Enlace 2 a 007_Video_Presentacion_YouTube.html que te dirige al canal de YouTube donde hemos publicado los videos de presentación.