3. ESTADO DEL ARTE
En este apartado se describe la literatura relevante que justifica tanto la problemática central del proyecto (la inestabilidad e intermitencia de las series de gasto OPEX FM) como la solución metodológica híbrida finalmente adoptada (Estrategia 3).
El reto central del proyecto de FerMar S.L. reside en la predicción de un gran número de series temporales de demanda intermitente y esporádica. Las series de gasto OPEX a nivel granular (pareja ID_BUILDING y FM_COST_TYPE) exhiben una alta proporción de ceros y picos irregulares.
-
Metodologías de Predicción de Gasto Operativo (OPEX)
Proyectos similares a gran escala en contextos de planificación financiera, como el pronóstico de OpEx para empresas farmacéuticas o en el sector de transporte ferroviario, han demostrado que la automatización y el uso de modelos univariantes clásicos (como SARIMA, ETS, Holt-Winters) suelen emplearse como baselines iniciales. Sin embargo, la integración de variables operativas y el preprocesado riguroso son cruciales para mejorar la precisión.
La necesidad de ir más allá de los modelos simples quedó confirmada en la Estrategia 1 del proyecto, donde el modelo piloto (Holt-Winters) fracasó debido a la intermitencia extrema, que hacía que el MAPE se disparara.
- Fundamentación de la Estrategia 1 y 2: Diagnóstico por KPIs y Demanda Intermitente
Para responder al fallo del piloto y a la dispersión de las series, el proyecto se centró en un diagnóstico exhaustivo de las series mediante la definición de KPIs específicos, una práctica estándar que requiere justificación en la literatura (en el notebook Modelado_Neith_Version_Beta.ipynb se han dejado explicitadas en cada apartado cada una de las referencias usadas para la definición de los kpis de este proyecto). En la siguiente tabla se mencionan los más relevantes y sus referencias.
Decisión del Proyecto / Bloque |
Referencia Bibliográfica Relevante |
Justificación de la Decisión Técnica |
KPIs de Intermitencia (Estrategia 1) |
S. A. Syntetos y J. Boylan, “The Accuracy of Intermittent Demand Estimates”, 2005. |
La literatura especializada respalda el uso de ADI (Average Demand Interval) y CV² (Coefficient of Variation squared) como criterios esenciales para distinguir entre demanda suave e intermitente. Estos KPIs permitieron la clasificación inicial y la asignación preliminar de modelos especializados como Croston/SBA. |
KPIs de Tendencia y Estacionalidad |
Hyndman & Athanasopoulos; estudios sobre descomposición STL. |
Se usaron la pendiente de la serie y la fuerza estacional (acf12) para decidir si incluir un componente de drift o tendencia en modelos. Esto es práctica estándar para modelos como Holt o ARIMA-con-drift. |
Limpieza de Abonos/Negativos |
Prácticas en contabilidad de costes y gestión financiera de OPEX/FMs. |
Aunque no existe un artículo específico para este punto, se tuvo la necesidad de ajustar y limpiar abonos/negativos como paso previo al modelado en la estrategia 2. |
- Fundamentación de la Estrategia 2 y 3: Gobernanza, Inestabilidad Estructural y Jerarquías
Tras el diagnóstico inicial (Estrategia 1), se descubrió que solo un pequeño porcentaje (15%-18%) de las series eran estructuralmente estables en el tiempo. Esta baja estabilidad hizo que la selección estricta de modelos por KPI fuera insuficiente, forzando la creación de la Estrategia 3.
Decisión del Proyecto / Bloque |
Referencia Bibliográfica Relevante |
Justificación de la Decisión Técnica |
Modelado de Series Escasas/Inestables (Estrategia 3) |
Hyndman et al., Chapter: Hierarchical or grouped time series forecasting. |
La literatura sugiere que series con pocos datos o alta intermitencia se modelan mejor mediante modelos agregados o jerárquicos, o se usa reconciliación. Esto justifica el uso de Pooling (modelos agregados) como un camino de escape de modelaje individual y, críticamente, la adopción de MinT shrink. |
Estrategia Champion–Challenger (Estrategia 3) |
Estudios recientes sobre ensembles y métodos combinados de pronóstico. |
La decisión de implementar un flujo pragmático “champion–challenger” y la combinación de modelos (ensembles) está justificada porque los métodos combinados y los modelos que se evalúan rigurosamente contra baselines tienden a funcionar mejor en entornos con datos ruidosos o inestables. |
Conclusiones sobre el Carácter Innovador
El carácter innovador de este Global Project reside en la adopción de un proceso iterativo de gobernanza de modelos que supera la aplicación de métodos estadísticos aislados, adicionalmente a que no se imparten clases específicas para el modelado de series temporales. La Estrategia 2 (análisis de cambio estructural) y la Estrategia 3 (flujo de 13 pasos) se diseñaron como respuesta directa a los hallazgos de inestabilidad, combinando así la validación puramente estadística con el pragmatismo operativo.
-
El proyecto innova
- Prioriza el Fallback Estratégico: Se aplica una regla estricta de gobernanza (Paso 6) que fuerza el uso del baseline SNaive12 en 660 series donde ningún candidato avanzado demostró batir la referencia estacional.
- Segmenta por Estabilidad: Se segmenta el universo en INTERMITENTE (57.5%) y GENERAL (42.5%), lo que permite utilizar modelos especializados (Croston/SBA/TSB) únicamente donde son apropiados, en línea con la literatura de demanda esporádica.
- Integra la Conciliación Jerárquica: El uso de MinT shrink en los Pasos 10 a 12 no solo asegura la consistencia de los agregados, sino que también utiliza el conocimiento de negocio (Real 2023 escalado por IPC) como ancla de producción.
Esta combinación de diagnóstico de estabilidad, modelado dual especializado y gobernanza de modelos por rendimiento relativo (MASE12) establece un marco robusto y superior a la aplicación directa de modelos clásicos, justificando la relevancia e innovación de la solución planteada.