Wednesday 15 November 2017

Coeficiente Promedio Móvil Exponencial


Exponential Smoothing Explicación. Copia Copyright. El contenido de InventoryOps está protegido por derechos de autor y no está disponible para su publicación. Cuando las personas encuentran por primera vez el término Exponential Smoothing pueden pensar que suena como un infierno de un montón de suavizado. Sea cual sea el suavizado. A continuación, comienzan a prever un cálculo matemático complicado que probablemente requiere un grado en matemáticas para entender, y espero que haya una función incorporada de Excel disponible si alguna vez necesitan hacerlo. La realidad del suavizado exponencial es mucho menos dramática y mucho menos traumática. La verdad es que el suavizado exponencial es un cálculo muy simple que logra una tarea bastante simple. Simplemente tiene un nombre complicado porque lo que técnicamente sucede como resultado de este simple cálculo es realmente un poco complicado. Para entender el suavizado exponencial, ayuda a comenzar con el concepto general de suavizado y un par de otros métodos comunes utilizados para lograr el alisamiento. ¿Qué es el suavizado? El suavizado es un proceso estadístico muy común. De hecho, regularmente encontramos datos suavizados en varias formas en nuestras vidas cotidianas. Cada vez que usa un promedio para describir algo, está usando un número suavizado. Si piensa en por qué utiliza un promedio para describir algo, rápidamente entenderá el concepto de suavizado. Por ejemplo, acabamos de experimentar el invierno más cálido registrado. ¿Cómo podemos cuantificar este pozo? Comenzamos con conjuntos de datos de las temperaturas altas y bajas diarias para el período que llamamos Invierno para cada año en la historia registrada. Pero eso nos deja con un montón de números que saltar un poco (no es como cada día de este invierno fue más caliente que los días correspondientes de todos los años anteriores). Necesitamos un número que elimine todo esto saltando de los datos para que podamos comparar más fácilmente un invierno con el siguiente. La eliminación de los saltos en los datos se denomina suavizado, y en este caso sólo podemos usar un promedio simple para lograr el suavizado. En la predicción de la demanda, usamos suavizado para eliminar la variación aleatoria (ruido) de nuestra demanda histórica. Esto nos permite identificar mejor los patrones de demanda (principalmente la tendencia y la estacionalidad) y los niveles de demanda que pueden usarse para estimar la demanda futura. El ruido de la demanda es el mismo concepto que el saltar diariamente de los datos de temperatura. No es sorprendente que la forma más común de eliminar el ruido de la historia de la demanda sea usar un promedio simple o más específico, un promedio móvil. Un promedio móvil sólo utiliza un número predefinido de períodos para calcular el promedio, y esos períodos se mueven con el paso del tiempo. Por ejemplo, si estoy usando una media móvil de 4 meses, y hoy es el 1 de mayo, estoy usando un promedio de demanda que ocurrió en enero, febrero, marzo y abril. El 1 de junio, estaré utilizando la demanda de febrero, marzo, abril y mayo. Promedio móvil ponderado. Cuando usamos un promedio, estamos aplicando la misma importancia (peso) a cada valor en el conjunto de datos. En la media móvil de 4 meses, cada mes representaba 25 de la media móvil. Cuando se utiliza la historia de la demanda para proyectar la demanda futura (y especialmente la tendencia futura), es lógico llegar a la conclusión de que desea que la historia más reciente tenga un mayor impacto en su pronóstico. Podemos adaptar nuestro cálculo del promedio móvil para aplicar varios pesos a cada período para obtener los resultados deseados. Expresamos estos pesos como porcentajes, y el total de todos los pesos para todos los períodos debe sumar 100. Por lo tanto, si decidimos que queremos aplicar 35 como el peso para el período más cercano en nuestra media móvil ponderada de 4 meses, podemos Restar 35 de 100 para encontrar que tenemos 65 restantes para dividir en los otros 3 períodos. Por ejemplo, podemos terminar con una ponderación de 15, 20, 30 y 35 respectivamente para los 4 meses (15 20 30 35 100). Desvanecimiento exponencial. Si volvemos al concepto de aplicar un peso al período más reciente (tal como 35 en el ejemplo anterior) y extendiendo el peso restante (calculado restando el peso del período más reciente de 35 de 100 a 65), tenemos Los elementos básicos para nuestro cálculo exponencial de suavizado. La entrada de control del cálculo de suavizado exponencial se conoce como el factor de suavizado (también denominado constante de suavizado). Representa esencialmente la ponderación aplicada a los períodos más recientes de demanda. Por lo tanto, donde usamos 35 como la ponderación para el período más reciente en el cálculo del promedio móvil ponderado, también podríamos elegir usar 35 como factor de suavizado en nuestro cálculo de suavizado exponencial para obtener un efecto similar. La diferencia con el cálculo de suavizado exponencial es que en lugar de tener que calcular también cuánto peso aplicar a cada período anterior, el factor de suavizado se utiliza para hacer eso automáticamente. Así que aquí viene la parte exponencial. Si se utiliza 35 como factor de suavizado, la ponderación de los períodos más recientes de demanda será de 35. La ponderación de la demanda de períodos más recientes (el período anterior al más reciente) será de 65 de 35 (65 viene de restar 35 de 100). Esto equivale a 22.75 ponderación para ese período si usted hace la matemáticas. La demanda de los períodos más recientes será 65 de 65 de 35, lo que equivale a 14,79. El período anterior será ponderado como 65 de 65 de 65 de 35, lo que equivale a 9,61, y así sucesivamente. Y esto se remonta a través de todos sus períodos anteriores todo el camino de regreso al principio del tiempo (o el punto en el que comenzó a utilizar suavizado exponencial para ese elemento en particular). Probablemente estás pensando que eso parece un montón de matemáticas. Pero la belleza del cálculo de suavizado exponencial es que en lugar de tener que volver a calcular cada período anterior cada vez que obtenga una nueva demanda de períodos, simplemente utilice la salida del cálculo de suavizado exponencial del período anterior para representar todos los períodos anteriores. ¿Está usted confundido aún? Esto tendrá más sentido cuando nos fijamos en el cálculo real Normalmente nos referimos a la salida del cálculo de suavizado exponencial como el próximo período previsto. En realidad, el pronóstico final necesita un poco más de trabajo, pero para los propósitos de este cálculo específico, nos referiremos a él como el pronóstico. El cálculo de suavizado exponencial es el siguiente: Los períodos de demanda más recientes multiplicados por el factor de suavizado. PLUS Los períodos más recientes pronosticados multiplicados por (uno menos el factor de suavizado). D los periodos más recientes exigen S el factor de suavizado representado en forma decimal (por lo que 35 sería representado como 0,35). F los períodos más recientes previstos (la salida del cálculo de suavizado del período anterior). OR (suponiendo un factor de suavizado de 0.35) (D 0.35) (F 0.65) No es mucho más simple que eso. Como puede ver, todo lo que necesitamos para las entradas de datos aquí son los períodos más recientes de demanda y los períodos más recientes previstos. Aplicamos el factor de suavizado (ponderación) a los períodos más recientes de la demanda de la misma manera que lo haría en el cálculo de la media móvil ponderada. A continuación, aplicamos la ponderación restante (1 menos el factor de suavizado) a los períodos más recientes previstos. Dado que los pronósticos de períodos más recientes se crearon en función de la demanda de períodos anteriores y de los períodos previos previstos, que se basó en la demanda del período anterior y en la previsión del período anterior, basada en la demanda del período anterior Eso y la previsión para el período anterior, que se basó en el período anterior. Así, usted puede ver cómo todos los períodos anteriores demanda se representan en el cálculo sin volver realmente a volver y recalcular cualquier cosa. Y eso es lo que impulsó la popularidad inicial de suavizado exponencial. No era porque hizo un mejor trabajo de suavizar que el promedio móvil ponderado, era porque era más fácil de calcular en un programa informático. Y, porque no necesita pensar en qué ponderación dar períodos anteriores o cuántos períodos anteriores para utilizar, como lo haría en el promedio móvil ponderado. Y, porque sonaba más fresco que el promedio móvil ponderado. De hecho, se podría argumentar que el promedio móvil ponderado proporciona una mayor flexibilidad ya que usted tiene más control sobre la ponderación de períodos anteriores. La realidad es que cualquiera de estos puede proporcionar resultados respetables, así que ¿por qué no ir con sonido más fácil y más fresco. Suavizado exponencial en Excel Permite ver cómo esto realmente se vería en una hoja de cálculo con datos reales. Copia Copyright. El contenido de InventoryOps está protegido por derechos de autor y no está disponible para su publicación. En la figura 1A, tenemos una hoja de cálculo Excel con 11 semanas de demanda, y un pronóstico suavizado exponencialmente calculado a partir de esa demanda. He utilizado un factor de suavizado de 25 (0,25 en la celda C1). La celda activa actual es Cell M4 que contiene el pronóstico para la semana 12. Puede ver en la barra de fórmulas, la fórmula es (L3C1) (L4 (1-C1)). Así, las únicas entradas directas a este cálculo son la demanda de períodos anteriores (celda L3), los períodos previos previstos (celda L4) y el factor de suavizado (celda C1, mostrada como referencia de celda absoluta C1). Cuando comenzamos un cálculo de suavizado exponencial, necesitamos conectar manualmente el valor de la primera previsión. Por lo tanto, en la celda B4, en lugar de una fórmula, acabamos de escribir la demanda de ese mismo período que el pronóstico. En la Célula C4 tenemos nuestro primer cálculo exponencial de suavizado (B3C1) (B4 (1-C1)). Entonces podemos copiar Cell C4 y pegarlo en Cells D4 a M4 para llenar el resto de nuestras celdas de pronóstico. Ahora puede hacer doble clic en cualquier celda de pronóstico para ver que se basa en la celda de pronósticos de períodos anteriores y en la celda de demanda de períodos anteriores. Así, cada cálculo subsiguiente de suavizado exponencial hereda la salida del cálculo de suavizado exponencial anterior. Así es como cada demanda de períodos anteriores se representa en el cálculo de los períodos más recientes, aunque ese cálculo no hace referencia directa a esos períodos anteriores. Si usted desea conseguir la suposición, usted puede utilizar Excels traza la función de precedentes. Para ello, haga clic en Celda M4, luego en la barra de herramientas de la cinta de opciones (Excel 2007 o 2010), haga clic en la pestaña Fórmulas y, a continuación, haga clic en Rastrear precedentes. Dibujará líneas de conector al primer nivel de precedentes, pero si sigue haciendo clic en Trace Precedents, dibujará líneas de conector a todos los períodos anteriores para mostrarle las relaciones heredadas. Ahora vamos a ver lo que el suavizado exponencial hizo por nosotros. La Figura 1B muestra un gráfico de líneas de nuestra demanda y pronóstico. En su caso ver cómo el pronóstico suavizado exponencialmente elimina la mayor parte de la irregularidad (el salto alrededor) de la demanda semanal, pero todavía logra seguir lo que parece ser una tendencia al alza en la demanda. También notará que la línea de pronóstico suavizada tiende a ser menor que la línea de demanda. Esto se conoce como retraso de tendencias y es un efecto secundario del proceso de suavizado. Cada vez que utilice el suavizado cuando se presente una tendencia, su pronóstico se quedará atrás de la tendencia. Esto es cierto para cualquier técnica de suavizado. De hecho, si continuáramos con esta hoja de cálculo y comenzáramos a ingresar números de demanda más bajos (haciendo una tendencia a la baja) veríamos bajar la línea de demanda y la línea de tendencia se movería por encima antes de comenzar a seguir la tendencia a la baja. Es por eso que he mencionado anteriormente la salida del cálculo de suavizado exponencial que llamamos una previsión, todavía necesita un poco más de trabajo. Hay mucho más que pronosticar que simplemente suavizar los golpes de la demanda. Necesitamos hacer ajustes adicionales para cosas como el retraso de tendencias, la estacionalidad, eventos conocidos que pueden afectar la demanda, etc. Pero todo eso está más allá del alcance de este artículo. Es probable que también se ejecutan en términos como suavizado de doble exponencial y suavizado triple exponencial. Estos términos son un poco engañosos ya que no están re-suavizar la demanda varias veces (podría si lo desea, pero eso no es el punto aquí). Estos términos representan el uso de suavizado exponencial en elementos adicionales de la previsión. Así que con el suavizado exponencial simple, usted está suavizando la demanda base, pero con el suavizado exponencial doble está alisando la demanda base más la tendencia, y con el suavizado triple exponencial está suavizando la demanda base más la tendencia más la estacionalidad. La otra pregunta más frecuente sobre el suavizado exponencial es donde puedo obtener mi factor de suavizado No hay ninguna respuesta mágica aquí, es necesario probar diversos factores de suavizado con sus datos de demanda para ver qué obtiene los mejores resultados. Hay cálculos que pueden establecer automáticamente (y cambiar) el factor de suavizado. Estos caen bajo el término de suavizado adaptativo, pero hay que tener cuidado con ellos. Simplemente no hay una respuesta perfecta y no debe aplicar ciegamente ningún cálculo sin pruebas exhaustivas y desarrollar una comprensión completa de lo que hace ese cálculo. También debe ejecutar escenarios hipotéticos para ver cómo reaccionan estos cálculos a los cambios de demanda que pueden no existir actualmente en los datos de demanda que está utilizando para las pruebas. El ejemplo de datos que usé anteriormente es un muy buen ejemplo de una situación en la que realmente necesita probar otros escenarios. Ese ejemplo particular de datos muestra una tendencia al alza bastante consistente. Muchas grandes empresas con software de pronóstico muy caro se metió en grandes problemas en el pasado no tan lejano cuando su configuración de software que se ajustó para una economía en crecimiento no reaccionó bien cuando la economía comenzó a estancarse o encogerse. Cosas como esta suceden cuando usted no entiende lo que sus cálculos (software) realmente está haciendo. Si entendieran su sistema de previsión, habrían sabido que necesitaban saltar y cambiar algo cuando había cambios repentinos y dramáticos en su negocio. Así que ahí lo tienen los fundamentos de suavizado exponencial explicado. ¿Quieres saber más sobre el uso de suavizado exponencial en un pronóstico real, echa un vistazo a mi libro de gestión de inventario explicado. Copia Copyright. El contenido de InventoryOps está protegido por derechos de autor y no está disponible para su publicación. Dave Piasecki. Es propietario / operador de Inventory Operations Consulting LLC. Una firma de consultoría que ofrece servicios relacionados con la gestión de inventario, manejo de materiales y operaciones de almacén. Tiene más de 25 años de experiencia en gestión de operaciones y puede ser contactado a través de su sitio web (inventoryops), donde mantiene información relevante adicional. Este esquema de suavizado comienza colocando (S2) a (y1), donde (Si) significa observación suavizada o EWMA, y (y) representa la observación original. Los subíndices se refieren a los períodos de tiempo, (1,, 2,, ldots,, n). Para el tercer período, (S3 alfa y2 (1-alfa) S2) y así sucesivamente. No hay (S1) la serie suavizada comienza con la versión suavizada de la segunda observación. Para cualquier periodo de tiempo (t), el valor suavizado (St) se obtiene calculando St alpha y (1-alfa) S ,,,,,, 0 0 Ecuación expandida para (S5) Por ejemplo, la ecuación expandida para la suavizada (S5) es: S5 alfa izquierda (1-alfa) 0 y (1-alfa) 1 y (1-alfa) 2 y derecha (1-alfa) 3 S2. Ilustra el comportamiento exponencial Esto ilustra el comportamiento exponencial. Los pesos (alfa (alfa) t) disminuyen geométricamente, y su suma es la unidad como se muestra a continuación, usando una propiedad de series geométricas: alfa suma (1-alfa) i alfa izquierda frac derecha 1 - (1-alfa) T De la última fórmula podemos ver que el término de sumación muestra que la contribución al valor suavizado (St) se hace menos en cada período de tiempo consecutivo. Ejemplo para (alfa 0,3) Let (alfa 0,3). Observe que los pesos (alfa (1-alfa) t) disminuyen exponencialmente (geométricamente) con el tiempo. La suma de los errores al cuadrado (SSE) 208.94. La media de los errores al cuadrado (MSE) es la SSE / 11 19.0. Calcular para diferentes valores de (alfa) El MSE se calculó de nuevo para (alfa 0,5) y resultó ser 16,29, por lo que en este caso preferiríamos un (alfa) de 0,5. Podemos hacerlo mejor Podríamos aplicar el probado método de prueba y error. Este es un procedimiento iterativo que comienza con un rango de (alfa) entre 0.1 y 0.9. Determinamos la mejor opción inicial para (alfa) y luego buscamos entre (alfa - Delta) y (alfa Delta). Podríamos repetir esto quizás una vez más para encontrar el mejor (alfa) a 3 lugares decimales. Los optimizadores no lineales se pueden utilizar Pero hay mejores métodos de búsqueda, como el procedimiento de Marquardt. Este es un optimizador no lineal que minimiza la suma de los cuadrados de los residuos. En general, la mayoría de los programas de software estadístico bien diseñados deben ser capaces de encontrar el valor de (alfa) que minimiza el MSE. Plan de muestra que muestra datos suavizados para 2 valores de (alfa) Modelos de media móvil y de suavización exponencial Como primer paso para superar los modelos de media, aleatoria y lineal, los patrones no estacionales y las tendencias pueden extrapolarse usando una media móvil o Modelo de suavizado. La suposición básica detrás de los modelos de promedio y suavizado es que la serie temporal es localmente estacionaria con una media que varía lentamente. Por lo tanto, tomamos un promedio móvil (local) para estimar el valor actual de la media y luego usarlo como pronóstico para el futuro cercano. Esto puede considerarse como un compromiso entre el modelo medio y el modelo aleatorio-paseo-sin-deriva. La misma estrategia se puede utilizar para estimar y extrapolar una tendencia local. Una media móvil se denomina a menudo una versión quotomoldeada de la serie original porque el promedio de corto plazo tiene el efecto de suavizar los golpes en la serie original. Al ajustar el grado de suavizado (el ancho de la media móvil), podemos esperar encontrar algún tipo de equilibrio óptimo entre el rendimiento de la media y los modelos de caminata aleatoria. El tipo más simple de modelo de promediación es el. Promedio móvil simple (igualmente ponderado): El pronóstico para el valor de Y en el tiempo t1 que se hace en el tiempo t es igual al promedio simple de las observaciones m más recientes: (Aquí y en otro lugar usaré el símbolo 8220Y-hat8221 para permanecer Para un pronóstico de la serie de tiempo Y hecho a la fecha más temprana posible posible por un modelo dado). Este promedio se centra en el período t (m1) / 2, lo que implica que la estimación de la media local tiende a quedar rezagada detrás del Valor real de la media local de aproximadamente (m1) / 2 periodos. Por lo tanto, decimos que la edad media de los datos en el promedio móvil simple es (m1) / 2 en relación con el período para el cual se calcula el pronóstico: es la cantidad de tiempo que las previsiones tienden a rezagarse detrás de los puntos de inflexión en el datos. Por ejemplo, si está promediando los últimos 5 valores, las previsiones serán de aproximadamente 3 períodos tarde en la respuesta a los puntos de inflexión. Tenga en cuenta que si m1, el modelo de media móvil simple (SMA) es equivalente al modelo de caminata aleatoria (sin crecimiento). Si m es muy grande (comparable a la longitud del período de estimación), el modelo SMA es equivalente al modelo medio. Como con cualquier parámetro de un modelo de pronóstico, es habitual ajustar el valor de k para obtener el mejor valor de los datos, es decir, los errores de predicción más pequeños en promedio. He aquí un ejemplo de una serie que parece presentar fluctuaciones aleatorias alrededor de una media de variación lenta. En primer lugar, vamos a tratar de encajar con un modelo de caminata al azar, que es equivalente a una media móvil simple de un término: El modelo de caminata aleatoria responde muy rápidamente a los cambios en la serie, pero al hacerlo, recoge gran parte del quotnoisequot en el Los datos (las fluctuaciones aleatorias), así como el quotsignalquot (la media local). Si en lugar de eso intentamos una media móvil simple de 5 términos, obtendremos un conjunto de previsiones más suaves: El promedio móvil simple a 5 terminos produce errores significativamente menores que el modelo de caminata aleatoria en este caso. La edad promedio de los datos de esta previsión es de 3 ((51) / 2), de manera que tiende a quedar a la zaga de los puntos de inflexión en aproximadamente tres períodos. (Por ejemplo, parece haber ocurrido una recesión en el período 21, pero las previsiones no giran hasta varios periodos más tarde). Obsérvese que los pronósticos a largo plazo del modelo SMA son una línea recta horizontal, al igual que en la caminata aleatoria modelo. Por lo tanto, el modelo SMA asume que no hay tendencia en los datos. Sin embargo, mientras que las previsiones del modelo de caminata aleatoria son simplemente iguales al último valor observado, las previsiones del modelo SMA son iguales a un promedio ponderado de valores recientes. Los límites de confianza calculados por Statgraphics para los pronósticos a largo plazo de la media móvil simple no se amplían a medida que aumenta el horizonte de pronóstico. Esto obviamente no es correcto Desafortunadamente, no hay una teoría estadística subyacente que nos diga cómo los intervalos de confianza deberían ampliarse para este modelo. Sin embargo, no es demasiado difícil calcular estimaciones empíricas de los límites de confianza para las previsiones a más largo plazo. Por ejemplo, podría configurar una hoja de cálculo en la que el modelo SMA se utilizaría para pronosticar dos pasos adelante, tres pasos adelante, etc. dentro de la muestra de datos históricos. A continuación, podría calcular las desviaciones estándar de los errores en cada horizonte de pronóstico y, a continuación, construir intervalos de confianza para pronósticos a más largo plazo sumando y restando múltiplos de la desviación estándar apropiada. Si intentamos una media móvil sencilla de 9 términos, obtendremos pronósticos aún más suaves y más de un efecto rezagado: La edad promedio es ahora de 5 períodos ((91) / 2). Si tomamos una media móvil de 19 términos, la edad promedio aumenta a 10: Obsérvese que, de hecho, las previsiones están ahora rezagadas detrás de los puntos de inflexión en aproximadamente 10 períodos. Qué cantidad de suavizado es la mejor para esta serie Aquí hay una tabla que compara sus estadísticas de error, incluyendo también un promedio de 3 términos: El modelo C, la media móvil de 5 términos, produce el valor más bajo de RMSE por un pequeño margen sobre los 3 A término y 9 promedios, y sus otras estadísticas son casi idénticas. Por lo tanto, entre los modelos con estadísticas de error muy similares, podemos elegir si preferiríamos un poco más de capacidad de respuesta o un poco más de suavidad en las previsiones. El modelo de media móvil simple descrito anteriormente tiene la propiedad indeseable de que trata las últimas k observaciones por igual e ignora por completo todas las observaciones precedentes. (Volver al principio de la página.) Browns Simple Exponential Smoothing Intuitivamente, los datos pasados ​​deben ser descontados de una manera más gradual - por ejemplo, la observación más reciente debería tener un poco más de peso que la segunda más reciente, y la segunda más reciente debería tener un poco más de peso que la tercera más reciente, y pronto. El modelo de suavizado exponencial simple (SES) lo logra. Sea 945 una constante quotsmoothingquot (un número entre 0 y 1). Una forma de escribir el modelo es definir una serie L que represente el nivel actual (es decir, el valor medio local) de la serie, tal como se estimó a partir de los datos hasta el presente. El valor de L en el tiempo t se calcula recursivamente a partir de su propio valor anterior como este: Así, el valor suavizado actual es una interpolación entre el valor suavizado anterior y la observación actual, donde 945 controla la proximidad del valor interpolado al valor más reciente observación. El pronóstico para el siguiente período es simplemente el valor suavizado actual: Equivalentemente, podemos expresar el próximo pronóstico directamente en términos de previsiones anteriores y observaciones previas, en cualquiera de las siguientes versiones equivalentes. En la primera versión, la previsión es una interpolación entre la previsión anterior y la observación anterior: En la segunda versión, la siguiente previsión se obtiene ajustando la previsión anterior en la dirección del error anterior por una cantidad fraccionada de 945. es el error hecho en Tiempo t En la tercera versión, el pronóstico es una media móvil exponencialmente ponderada (es decir, descontada) con factor de descuento 1-945: La versión de interpolación de la fórmula de pronóstico es la más simple de usar si está implementando el modelo en una hoja de cálculo: se ajusta en un Célula única y contiene referencias de celdas que apuntan a la previsión anterior, la observación anterior y la celda donde se almacena el valor de 945. Tenga en cuenta que si 945 1, el modelo SES es equivalente a un modelo de caminata aleatoria (sin crecimiento). Si 945 0, el modelo SES es equivalente al modelo medio, asumiendo que el primer valor suavizado se establece igual a la media. La edad promedio de los datos en el pronóstico de suavización exponencial simple es de 1/945 en relación con el período para el cual se calcula la predicción. (Esto no se supone que sea obvio, pero se puede demostrar fácilmente mediante la evaluación de una serie infinita.) Por lo tanto, el pronóstico promedio móvil simple tiende a quedar rezagado detrás de puntos de inflexión en aproximadamente 1/945 períodos. Por ejemplo, cuando 945 0.5 el retraso es 2 períodos cuando 945 0.2 el retraso es 5 períodos cuando 945 0.1 el retraso es 10 períodos, y así sucesivamente. Para una edad media dada (es decir, la cantidad de retraso), el simple suavizado exponencial (SES) pronosticado es algo superior al pronóstico de la media móvil simple (SMA) porque coloca relativamente más peso en la observación más reciente - i. e. Es un poco más sensible a los cambios ocurridos en el pasado reciente. Por ejemplo, un modelo SMA con 9 términos y un modelo SES con 945 0.2 tienen una edad promedio de 5 para los datos de sus pronósticos, pero el modelo SES pone más peso en los 3 últimos valores que el modelo SMA y en el modelo SMA. Otra ventaja importante del modelo SES sobre el modelo SMA es que el modelo SES utiliza un parámetro de suavizado que es variable continuamente, por lo que puede optimizarse fácilmente Utilizando un algoritmo quotsolverquot para minimizar el error cuadrático medio. El valor óptimo de 945 en el modelo SES para esta serie resulta ser 0.2961, como se muestra aquí: La edad promedio de los datos de esta previsión es de 1 / 0.2961 3.4 períodos, que es similar a la de un 6-término de movimiento simple promedio. Los pronósticos a largo plazo del modelo SES son una línea recta horizontal. Como en el modelo SMA y el modelo de caminata aleatoria sin crecimiento. Sin embargo, tenga en cuenta que los intervalos de confianza calculados por Statgraphics ahora divergen de manera razonable y que son sustancialmente más estrechos que los intervalos de confianza para el modelo de caminata aleatoria. El modelo SES asume que la serie es algo más predecible que el modelo de caminata aleatoria. Un modelo SES es en realidad un caso especial de un modelo ARIMA. Por lo que la teoría estadística de los modelos ARIMA proporciona una base sólida para el cálculo de los intervalos de confianza para el modelo SES. En particular, un modelo SES es un modelo ARIMA con una diferencia no estacional, un término MA (1) y ningún término constante. Conocido también como modelo quotARIMA (0,1,1) sin constantequot. El coeficiente MA (1) en el modelo ARIMA corresponde a la cantidad 1-945 en el modelo SES. Por ejemplo, si se ajusta un modelo ARIMA (0,1,1) sin constante a la serie analizada aquí, el coeficiente MA estimado (1) resulta ser 0.7029, que es casi exactamente un menos 0.2961. Es posible añadir la suposición de una tendencia lineal constante no nula a un modelo SES. Para ello, basta con especificar un modelo ARIMA con una diferencia no estacional y un término MA (1) con una constante, es decir, un modelo ARIMA (0,1,1) con constante. Las previsiones a largo plazo tendrán entonces una tendencia que es igual a la tendencia media observada durante todo el período de estimación. No puede hacerlo junto con el ajuste estacional, ya que las opciones de ajuste estacional están deshabilitadas cuando el tipo de modelo está ajustado a ARIMA. Sin embargo, puede agregar una tendencia exponencial a largo plazo constante a un modelo de suavización exponencial simple (con o sin ajuste estacional) utilizando la opción de ajuste de inflación en el procedimiento de previsión. La tasa apropiada de inflación (crecimiento porcentual) por período puede estimarse como el coeficiente de pendiente en un modelo de tendencia lineal ajustado a los datos en conjunción con una transformación de logaritmo natural o puede basarse en otra información independiente sobre las perspectivas de crecimiento a largo plazo . (Regreso al inicio de la página.) Browns Linear (es decir, doble) Suavizado exponencial Los modelos SMA y SES suponen que no hay ninguna tendencia de ningún tipo en los datos (que normalmente está bien o al menos no es demasiado malo para 1- Avance anticipado cuando los datos son relativamente ruidosos), y se pueden modificar para incorporar una tendencia lineal constante como se muestra arriba. ¿Qué pasa con las tendencias a corto plazo? Si una serie muestra una tasa de crecimiento variable o un patrón cíclico que se destaca claramente contra el ruido, y si hay una necesidad de pronosticar más de un período, la estimación de una tendencia local también podría ser un problema. El modelo de suavizado exponencial simple puede ser generalizado para obtener un modelo lineal de suavizado exponencial (LES) que calcula las estimaciones locales de nivel y tendencia. El modelo de tendencia más simple que varía en función del tiempo es el modelo lineal de suavizado exponencial de Browns, que utiliza dos series suavizadas diferentes centradas en diferentes momentos del tiempo. La fórmula de predicción se basa en una extrapolación de una línea a través de los dos centros. (Una versión más sofisticada de este modelo, Holt8217s, se discute a continuación). La forma algebraica del modelo de suavizado exponencial lineal de Brown8217s, como la del modelo de suavizado exponencial simple, puede expresarse en un número de formas diferentes pero equivalentes. La forma estándar de este modelo se expresa usualmente de la siguiente manera: Sea S la serie de suavizado simple obtenida aplicando el suavizado exponencial simple a la serie Y. Es decir, el valor de S en el periodo t está dado por: (Recuérdese que, Exponencial, esto sería la previsión para Y en el período t1). Entonces, vamos a Squot denotar la serie doblemente suavizada obtenida aplicando el suavizado exponencial simple (usando el mismo 945) a la serie S: Finalmente, la previsión para Y tk. Para cualquier kgt1, viene dado por: Esto produce e 1 0 (es decir, trucar un poco y dejar que el primer pronóstico sea igual a la primera observación real), y e 2 Y 2 8211 Y 1. Después de lo cual las previsiones se generan usando la ecuación anterior. Esto produce los mismos valores ajustados que la fórmula basada en S y S si estos últimos se iniciaron usando S 1 S 1 Y 1. Esta versión del modelo se utiliza en la página siguiente que ilustra una combinación de suavizado exponencial con ajuste estacional. Holt8217s Linear Exponential Smoothing Brown8217s El modelo LES calcula las estimaciones locales de nivel y tendencia al suavizar los datos recientes, pero el hecho de que lo haga con un solo parámetro de suavizado impone una restricción en los patrones de datos que puede encajar: el nivel y la tendencia No se les permite variar a tasas independientes. El modelo LES de Holt8217s aborda esta cuestión incluyendo dos constantes de suavizado, una para el nivel y otra para la tendencia. En cualquier momento t, como en el modelo Brown8217s, existe una estimación L t del nivel local y una estimación T t de la tendencia local. Aquí se calculan recursivamente a partir del valor de Y observado en el instante t y de las estimaciones previas del nivel y de la tendencia por dos ecuaciones que les aplican el suavizado exponencial separadamente. Si el nivel estimado y la tendencia en el tiempo t-1 son L t82091 y T t-1. Respectivamente, entonces la previsión de Y tshy que habría sido hecha en el tiempo t-1 es igual a L t-1 T t-1. Cuando se observa el valor real, la estimación actualizada del nivel se calcula recursivamente interpolando entre Y tshy y su pronóstico, L t-1 T t-1, utilizando pesos de 945 y 1-945. El cambio en el nivel estimado, Es decir L t 8209 L t82091. Puede interpretarse como una medición ruidosa de la tendencia en el tiempo t. La estimación actualizada de la tendencia se calcula recursivamente mediante la interpolación entre L t 8209 L t82091 y la estimación anterior de la tendencia, T t-1. Utilizando los pesos de 946 y 1-946: La interpretación de la constante de suavizado de tendencia 946 es análoga a la de la constante de suavizado de nivel 945. Los modelos con valores pequeños de 946 asumen que la tendencia cambia muy lentamente con el tiempo, mientras que los modelos con 946 más grandes suponen que está cambiando más rápidamente. Un modelo con una gran 946 cree que el futuro lejano es muy incierto, porque los errores en la estimación de la tendencia son muy importantes cuando se pronostica más de un período por delante. Las constantes de suavizado 945 y 946 se pueden estimar de la manera habitual minimizando el error cuadrático medio de los pronósticos de 1 paso adelante. Cuando esto se hace en Statgraphics, las estimaciones resultan ser 945 0,3048 y 946 0,008. El valor muy pequeño de 946 significa que el modelo supone muy poco cambio en la tendencia de un período al siguiente, por lo que básicamente este modelo está tratando de estimar una tendencia a largo plazo. Por analogía con la noción de la edad media de los datos que se utilizan para estimar el nivel local de la serie, la edad media de los datos que se utilizan para estimar la tendencia local es proporcional a 1/946, aunque no exactamente igual a eso. En este caso, resulta ser 1 / 0.006 125. Esto no es un número muy preciso en la medida en que la precisión de la estimación de 946 es realmente de 3 decimales, pero es del mismo orden general de magnitud que el tamaño de la muestra de 100 , Por lo que este modelo está promediando bastante historia en la estimación de la tendencia. La gráfica de pronóstico siguiente muestra que el modelo LES calcula una tendencia local ligeramente mayor al final de la serie que la tendencia constante estimada en el modelo SEStrend. Además, el valor estimado de 945 es casi idéntico al obtenido ajustando el modelo SES con o sin tendencia, por lo que este es casi el mismo modelo. Ahora, ¿se ven como pronósticos razonables para un modelo que se supone que está estimando una tendencia local? Si observas esta gráfica, parece que la tendencia local se ha vuelto hacia abajo al final de la serie. Lo que ha sucedido Los parámetros de este modelo Se han estimado minimizando el error al cuadrado de las previsiones de un paso adelante, y no las previsiones a largo plazo, en cuyo caso la tendencia no hace mucha diferencia. Si todo lo que usted está mirando son errores de un paso adelante, no está viendo la imagen más grande de las tendencias sobre (digamos) 10 o 20 períodos. Con el fin de obtener este modelo más en sintonía con la extrapolación de nuestro ojo de los datos, podemos ajustar manualmente la tendencia de suavizado constante de modo que utiliza una base más corta para la estimación de tendencia. Por ejemplo, si elegimos establecer 946 0.1, la edad promedio de los datos utilizados para estimar la tendencia local es de 10 períodos, lo que significa que estamos promediando la tendencia en los últimos 20 períodos aproximadamente. Here8217s lo que el pronóstico gráfico parece si fijamos 946 0.1 mientras que mantener 945 0.3. Esto parece intuitivamente razonable para esta serie, aunque probablemente sea peligroso extrapolar esta tendencia en más de 10 periodos en el futuro. ¿Qué pasa con las estadísticas de errores? Aquí hay una comparación de modelos para los dos modelos mostrados arriba, así como tres modelos SES. El valor óptimo de 945 para el modelo SES es de aproximadamente 0,3, pero se obtienen resultados similares (con un poco más o menos de capacidad de respuesta, respectivamente) con 0,5 y 0,2. (A) Holts lineal exp. Alisamiento con alfa 0.3048 y beta 0.008 (B) Holts linear exp. Alisamiento con alfa 0.3 y beta 0.1 (C) Suavizado exponencial simple con alfa 0.5 (D) Alisamiento exponencial simple con alfa 0.3 (E) Suavizado exponencial simple con alfa 0.2 Sus estadísticas son casi idénticas, por lo que realmente no podemos hacer la elección sobre la base De errores de pronóstico de un paso adelante en la muestra de datos. Tenemos que recurrir a otras consideraciones. Si creemos firmemente que tiene sentido basar la estimación de tendencia actual en lo que ha ocurrido durante los últimos 20 períodos, podemos hacer un caso para el modelo LES con 945 0.3 y 946 0.1. Si queremos ser agnósticos acerca de si hay una tendencia local, entonces uno de los modelos SES podría ser más fácil de explicar y también daría más pronósticos intermedios para los próximos 5 o 10 períodos. (Volver al principio de la página.) Qué tipo de tendencia-extrapolación es la mejor: horizontal o lineal La evidencia empírica sugiere que, si los datos ya han sido ajustados (si es necesario) para la inflación, puede ser imprudente extrapolar lineal a corto plazo Tendencias en el futuro. Las tendencias evidentes hoy en día pueden desacelerarse en el futuro debido a diversas causas, como la obsolescencia de los productos, el aumento de la competencia y las caídas o repuntes cíclicos en una industria. Por esta razón, el suavizado exponencial simple a menudo realiza mejor fuera de la muestra de lo que de otra manera podría esperarse, a pesar de su extrapolación horizontal de tendencia horizontal. Las modificaciones de la tendencia amortiguada del modelo de suavizado exponencial lineal también se usan a menudo en la práctica para introducir una nota de conservadurismo en sus proyecciones de tendencia. El modelo LES con tendencia amortiguada se puede implementar como un caso especial de un modelo ARIMA, en particular, un modelo ARIMA (1,1,2). Es posible calcular intervalos de confianza en torno a los pronósticos a largo plazo producidos por modelos de suavizado exponencial, al considerarlos como casos especiales de modelos ARIMA. El ancho de los intervalos de confianza depende de (i) el error RMS del modelo, (ii) el tipo de suavizado (simple o lineal) (iii) el valor (S) de la (s) constante (s) de suavizado y (iv) el número de periodos por delante que está pronosticando. En general, los intervalos se extienden más rápido a medida que 945 se hace más grande en el modelo SES y se extienden mucho más rápido cuando se usa lineal en lugar de simple suavizado. Este tema se discute más adelante en la sección de modelos de ARIMA de las notas. (Volver al inicio de la página.)

No comments:

Post a Comment