Moving Average. This exemplo ensina como calcular a média móvel de uma série temporal em Excel Uma média móvel é usado para suavizar irregularidades picos e vales para reconhecer facilmente trends.1 Primeiro, vamos dar uma olhada em nossa série de tempo. Na guia Dados, clique em Análise de dados. Nota não pode encontrar o botão Análise de dados Clique aqui para carregar o complemento Analysis ToolPak.3 Selecione Média móvel e clique em OK.4 Clique na caixa Intervalo de entrada e selecione o intervalo B2 M2. 5 Clique na caixa Intervalo e digite 6.6 Clique na caixa Output Range e selecione a célula B3.8 Trace um gráfico desses valores. Explicação porque definimos o intervalo como 6, a média móvel é a média dos 5 pontos de dados anteriores e O ponto de dados atual Como resultado, os picos e os vales são suavizados O gráfico mostra uma tendência crescente O Excel não pode calcular a média móvel para os primeiros 5 pontos de dados porque não há pontos de dados anteriores suficientes.9 Repita os passos 2 a 8 para o intervalo 2 E intervalo 4.Conclusão O la Quanto mais pequeno o intervalo, mais próximas as médias móveis são para os pontos de dados reais. Média de movimento. A média móvel é um método para alisar séries temporais por média com ou sem pesos a Número fixo de termos consecutivos A média se move ao longo do tempo, na medida em que cada ponto de dados da série é incluído sequencialmente na média, enquanto o ponto de dados mais antigo na extensão da média é removido. Em geral, quanto maior o intervalo da média, A mais suave é a série resultante As médias móveis são usadas para suavizar as flutuações em séries temporais ou para identificar componentes de séries temporais, tais como a tendência, o ciclo, o sazonal, etc. Uma média móvel substitui cada valor de uma série temporal por uma média ponderada de P valores precedentes, o valor dado, ef valores seguintes de uma série Se pf a média móvel é dito ser média móvel é dito ser simétrico se é centrado, e se para cada k 1, 2, pf o peso de O k - ésimo valor precedente é igual ao peso do k - ésimo seguinte A média móvel não é definida para o primeiro p eo último f valores de série temporal Para calcular a média móvel para esses valores, a série deve ser Backcast e previsões. Força-tarefa sobre dados e apresentação de metadados para o Grupo de Trabalho de Estatísticas Económicas de Curto Prazo da OCDE STESWP, Paris, 2004.Concepto de estacionariedade. Hipoteticamente, a observação atual pode depender de todas as observações passadas Esse modelo autorregressivo é impossível estimar Como ele contém muitos parâmetros No entanto, se xt como uma função linear de todos os atrasos passados, pode ser mostrado que o modelo autorregressivo é equivalente a xt como uma função linear de apenas alguns choques passados Em um modelo de média móvel o valor atual de xt É descrito como uma função linear de erro de choque concomitante e erros de choques passados. Os resultados de ajuste sazonal são considerados estáveis se forem relativamente resistentes à remoção ou adição de pontos de dados a Qualquer um dos extremos da série A estabilidade é uma das principais propriedades dos resultados da AE Se a adição ou o atraso de algumas observações alterarem substancialmente a série ajustada sazonalmente ou o ciclo tendencial estimado, a interpretação da série ajustada sazonalmente seria incerta. Quais são os rácios SI. Os índices SI são valores de componente SI sazonal-irregular, calculado como a relação da série original com a tendência estimada. Em outras palavras, as proporções SI são estimativas da série SI detrended Os gráficos SI são úteis para investigar se os movimentos de curto prazo são causados Por flutuações sazonais ou irregulares Este gráfico é uma ferramenta de diagnóstico utilizada para analisar o comportamento sazonal, padrões de férias em movimento, outliers e identificar as quebras sazonais na série. Software de ajuste sazonal normalmente exibe as seguintes informações sobre o modelo RegARIMA. São medidas da bondade relativa de ajuste de um modelo estatístico Em ajuste sazonal São utilizados para selecionar a ordem ótima do modelo RegARMIA. Para os critérios de informação fornecidos, o modelo preferido é aquele com o valor mínimo de critérios de informação. Na iteração B, Tabela B7, iteração C Tabela C7 e iteração D Tabela D7 e Tabela D12, o componente de ciclo de tendência é extraído de uma estimativa da série ajustada sazonalmente usando as médias móveis de Henderson. O comprimento do filtro de Henderson é escolhido automaticamente por X-12-ARIMA em um procedimento de duas etapas. É fácil de executar o ajuste sazonal e ajustar modelos de suavização exponencial usando Excel As imagens de tela e gráficos abaixo são tiradas de uma planilha que foi configurado para ilustrar ajuste sazonal multiplicativo e suavização exponencial linear nos seguintes dados de vendas trimestrais de Outboard Marine. Para obter uma cópia do próprio arquivo de planilha, clique aqui A versão do exponencial linear L suavização que será usado aqui para fins de demonstração é a versão de Brown, simplesmente porque ele pode ser implementado com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar Normalmente é melhor usar a versão de Holt que tem suavização separada Constantes para o nível e tendência. O processo de previsão segue como segue i primeiro os dados são ajustados sazonalmente ii então as previsões são geradas para os dados ajustados sazonalmente via suavização exponencial linear e iii finalmente as previsões ajustadas sazonalmente são reseasonalized para obter previsões para a série original The O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é computar uma média móvel centrada realizada aqui na coluna D Isso pode ser feito tomando a média de duas médias anuais que são compensadas por Um período em relação ao outro É necessária uma combinação de duas médias de compensação em vez de uma única média para fins de centralização Quando o número de estações é mesmo O próximo passo é calcular a razão para a média móvel --e os dados originais divididos pela média móvel em cada período - que é realizado aqui na coluna E Isso também é chamado de componente de ciclo de tendência Do padrão, na medida em que os efeitos da tendência e do ciclo de negócios podem ser considerados como sendo tudo o que resta após a média de um ano inteiro de dados. É claro que as mudanças mensais que não são devidas à sazonalidade podem ser determinadas por muitos Outros fatores, mas a média de 12 meses suaviza-os em grande medida. O índice sazonal estimado para cada estação é calculado pela primeira média de todas as razões para essa estação particular, que é feita nas células G3-G6 usando uma fórmula AVERAGEIF. As razões são então redimensionadas de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400 neste caso, o que é feito nas células H3-H6 Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o índice de índice sazonal apropriado Em eac H da tabela de dados, de acordo com o trimestre do ano que representa A média móvel centrada e os dados ajustados sazonalmente acabam parecidos com isso. Observe que a média móvel normalmente se parece com uma versão mais lisa da série com ajuste sazonal, e É mais curta em ambas as extremidades. Outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de suavização exponencial linear aos dados ajustados sazonalmente, começando no valor da coluna GA para a constante alisante alpha é inserido acima da coluna de previsão aqui, na célula H9 e Por conveniência é atribuído o nome do intervalo Alfa O nome é atribuído usando o comando Inserir Nome Criar O modelo LES é inicializado por definir as duas primeiras previsões igual ao primeiro valor real da série ajustada sazonalmente A fórmula usada aqui para a previsão LES é A forma recursiva de equação única do modelo de Brown s. Esta fórmula é inserida na célula correspondente ao terceiro período aqui, célula H15 e copiada para baixo de Lá Observe que a previsão do LES para o período atual refere-se às duas observações precedentes e aos dois erros de previsão anteriores, bem como ao valor de alfa Assim, a fórmula de previsão na linha 15 refere-se apenas aos dados disponíveis na linha 14 e Mais cedo, se desejássemos usar o alisamento exponencial linear simples, em vez disso, poderíamos substituir a fórmula SES. Poderíamos também usar Holt s em vez do modelo LES de Brown, o que exigiria mais duas colunas de fórmulas para calcular o nível e Tendência que são utilizados na previsão. Os erros são calculados na próxima coluna aqui, coluna J, subtraindo as previsões dos valores reais O erro quadrático médio é calculado como a raiz quadrada da variância dos erros mais o quadrado da Mean Isto decorre da identidade matemática MSE VARIANCE erros MÉDIO erros 2 No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo d Oes não realmente começar a previsão até o terceiro período linha 15 na planilha O valor ideal de alfa pode ser encontrado por meio de alfa mudando manualmente até que o mínimo RMSE é encontrado, ou então você pode usar o Solver para realizar uma minimização exata O valor de alfa Que o Solver encontrado é mostrado aqui alfa 0 471.Em geral é uma boa idéia traçar os erros do modelo em unidades transformadas e também para calcular e traçar suas autocorrelações em defasagens de até uma temporada Aqui está um gráfico de série de tempo do Corrigidos sazonalmente. As autocorrelações de erro são calculadas usando a função CORREL para calcular as correlações dos erros com eles mesmos retardados por um ou mais períodos - detalhes são mostrados no modelo de planilha Aqui está um gráfico das autocorrelações dos erros na As primeiras cinco lag. As autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas o pico no intervalo 4 cujo valor é 0 35 é ligeiramente problemático - sugere que o processo de ajuste sazonal tem Não foi completamente bem sucedida No entanto, é realmente apenas marginalmente significativa 95 bandas de significância para testar se autocorrelações são significativamente diferentes de zero são aproximadamente mais-ou-menos 2 SQRT nk, onde n é o tamanho da amostra e k é o atraso Aqui n é 38 E k varia de 1 a 5, então a raiz quadrada de - n-menos-k é de cerca de 6 para todos eles, e, portanto, os limites para testar a significância estatística dos desvios de zero são aproximadamente mais ou menos 2 6 ou 0 33 Se você variar o valor de alfa manualmente neste modelo do Excel, você pode observar o efeito nas parcelas de séries temporais e de autocorrelação dos erros, bem como no erro raiz-médio-quadrado, que será Ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é bootstrapped no futuro, simplesmente substituindo as previsões de valores reais no ponto onde os dados reais se esgota - ou seja, onde o futuro começa Em outras palavras, em cada célula onde um Futuro valor de dados ocorreria, uma célula r Eferência é inserido que aponta para a previsão feita para esse período Todas as outras fórmulas são simplesmente copiadas para baixo de cima. Observe que os erros para as previsões do futuro são todos calculados para ser zero Isso não significa que os erros reais serão zero, mas Em vez disso, apenas reflete o fato de que, para fins de previsão, estamos assumindo que os dados futuros serão iguais às previsões em média As previsões LES resultante para os dados ajustados sazonalmente aparência desta. Com este valor especial de alfa, que é ideal para um - A tendência projetada é ligeiramente para cima, refletindo a tendência local que foi observada ao longo dos últimos 2 anos ou assim Para outros valores de alfa, uma projeção de tendência muito diferente poderia ser obtida É geralmente uma boa idéia para ver o que acontece Para a projeção de tendência de longo prazo quando alfa é variada, porque o valor que é melhor para previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante Para Por exemplo, aqui está o resultado que é obtido se o valor de alfa é manualmente definido como 0 25.A tendência de longo prazo projetada é agora negativa em vez de positiva Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em Sua estimativa do nível atual e tendência e suas previsões de longo prazo refletem a tendência de queda observada nos últimos 5 anos, em vez de a tendência de aumento mais recente Este gráfico também ilustra claramente como o modelo com um menor valor de alfa é mais lento para responder A pontos de viragem nos dados e, portanto, tende a fazer um erro do mesmo sinal para muitos períodos em uma linha Seus erros de previsão de 1 passo são maiores em média do que aqueles obtidos antes RMSE de 34 4 em vez de 27 4 e fortemente positiva Autocorrelated A autocorrelação lag-1 de 0 56 excede em muito o valor de 0 33 calculado acima para um desvio estatisticamente significativo de zero Como uma alternativa para cranking para baixo o valor de alfa, a fim de introduzir mais conservar Às previsões de longo prazo, um fator de amortecimento da tendência às vezes é adicionado ao modelo para fazer com que a tendência projetada se estabilize após alguns períodos. A etapa final na construção do modelo de previsão é racionalizar as previsões de LES, multiplicando-as pelo modelo Índices sazonais apropriados Assim, as previsões reseasonalized na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões LES desestacionalizadas na coluna H. É relativamente fácil calcular intervalos de confiança para as previsões de um passo à frente feitas por este Model primeiro calcular o RMSE raiz-médio quadrado erro, que é apenas a raiz quadrada do MSE e, em seguida, calcular um intervalo de confiança para a previsão ajustada sazonalmente, adicionando e subtraindo duas vezes o RMSE Em geral, um intervalo de confiança de 95 para um um - A previsão de período antecipado é aproximadamente igual à previsão de ponto mais ou menos duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição de erro é de aproximadamente Aqui, o RMSE em vez do desvio padrão da amostra dos erros é a melhor estimativa do desvio padrão dos futuros erros de previsão, pois leva o viés e as variações aleatórias em conta Os limites de confiança para a previsão ajustada sazonalmente são então reseasonalized juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Neste caso, o RMSE é igual a 27 4 ea previsão ajustada sazonalmente para o primeiro período futuro Dec-93 é 273 2 De modo que o intervalo de confiança ajustado sazonalmente é de 273 2-2 27 4 218 4 a 273 2 2 27 4 328 0 Multiplicando esses limites pelo índice sazonal de dezembro de 68 61 obtemos limites de confiança inferior e superior de 149 8 e 225 0 ao redor A previsão do ponto Dec-93 de 187 4. Os limites de confiabilidade para as previsões com mais de um período de antecedência ampliar-se-ão geralmente à medida que o horizonte de previsão aumentar, devido à incerteza quanto ao nível e à tendência, bem como à s Mas é difícil de computá-los em geral pelos métodos analíticos. A maneira apropriada de calcular os limites de confiança para a previsão LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão. Se você quer um intervalo de confiança realista para Uma previsão mais de um período à frente, tendo todas as fontes de erro em conta, a sua melhor aposta é usar métodos empíricos, por exemplo, para obter um intervalo de confiança para uma previsão de duas etapas à frente, você poderia criar outra coluna na planilha para calcular Uma previsão de duas etapas para cada período, iniciando a previsão de um passo em frente Em seguida, calcular o RMSE dos erros de previsão em duas etapas e usar isso como a base para um intervalo de confiança de 2 passos à frente.
No comments:
Post a Comment