Saturday 8 July 2017

Autoregressive Moving Average Model Excel


ARMA Unplugged Esta é a primeira entrada da nossa série de tutoriais Unplugged, nos quais investigamos os detalhes de cada um dos modelos de séries temporais com os quais você já está familiarizado, destacando os pressupostos subjacentes e dirigindo para casa as intuições por trás deles. Nesta edição, nós abordamos o modelo ARMA uma pedra angular na modelagem de séries temporais. Ao contrário de questões de análise anteriores, vamos começar aqui com a definição do processo ARMA, o estado das entradas, saídas, parâmetros, restrições de estabilidade, suposições e, finalmente, desenhar algumas orientações para o processo de modelagem. Por definição, a média móvel auto-regressiva (ARMA) é um processo estacionário estacionário composto por somas de Excel auto-regressivo e componentes de média móvel. Alternativamente, em uma formulação simples: Suposições Vamos olhar mais de perto a formulação. O processo ARMA é simplesmente uma soma ponderada das observações de saída anteriores e choques, com poucas suposições fundamentais: O que significam estas suposições? Um processo estocástico é uma contrapartida de um processo determinista que descreve a evolução de uma variável aleatória ao longo do tempo. Em nosso caso, a variável aleatória é O processo ARMA captura apenas a correlação serial (ou seja, auto-correlação) entre as observações. Em palavras simples, o processo ARMA resume os valores de observações passadas, não seus valores quadrados ou seus logaritmos, etc. Dependência de ordem superior exige um processo diferente (por exemplo, ARCHGARCH, modelos não-lineares, etc.). Existem inúmeros exemplos de um processo estocástico em que valores passados ​​afetam os atuais. Por exemplo, em um escritório de vendas que recebe RFQs em uma base contínua, alguns são percebidos como vendas-ganhou, alguns como vendas perdidas, e alguns derramou em cima para o próximo mês. Como resultado, em qualquer mês, alguns dos casos de vendas ganhos originam-se como solicitações de cotação ou são vendas repetidas dos meses anteriores. Quais são os choques, inovações ou termos de erro Esta questão é difícil, ea resposta não é menos confusa. Ainda assim, vamos tentar: Em palavras simples, o termo de erro em um determinado modelo é um catch-all bucket para todas as variações que o modelo não explica. Ainda perdido Vamos usar um exemplo. Para um processo de preço de ações, há possivelmente centenas de fatores que levam o nível de preço atualizado, incluindo: Dividendos e anúncios divididos Relatórios de ganhos trimestrais Atividades de fusão e aquisição (MampA) Eventos jurídicos, p. A ameaça de ações coletivas. Outros Um modelo, por design, é uma simplificação de uma realidade complexa, então qualquer coisa que deixemos fora do modelo é automaticamente empacotada no termo de erro. O processo ARMA assume que o efeito coletivo de todos esses fatores age mais ou menos como ruído gaussiano. Por que nos preocupamos com os choques passados ​​Ao contrário de um modelo de regressão, a ocorrência de um estímulo (por exemplo, choque) pode ter um efeito no nível atual e, possivelmente, nos níveis futuros. Por exemplo, um evento corporativo (por exemplo, a atividade da MampA) afeta o preço das ações da empresa subjacente, mas a mudança pode levar algum tempo para ter seu impacto total, já que os participantes do mercado absorvem as informações disponíveis e reagem de acordo. Isto implora a pergunta: não os valores passados ​​da saída já têm os choques informações passadas SIM, o histórico de choques já está contabilizado nos níveis de saída passados. Um modelo ARMA pode ser representado apenas como um modelo auto-regressivo puro (RA), mas o requisito de armazenamento de tal sistema em infinito. Esta é a única razão para incluir o componente MA: para economizar em armazenamento e simplificar a formulação. Novamente, o processo ARMA deve ser estacionário para que a variância marginal (incondicional) exista. Nota: Na minha discussão acima, não estou fazendo uma distinção entre meramente a ausência de uma raiz unitária na equação característica e a estacionaridade do processo. Eles estão relacionados, mas a ausência de uma raiz unitária não é uma garantia de estacionaridade. Ainda assim, a raiz unitária deve estar dentro do círculo da unidade para ser exata. Conclusão Vamos recapitular o que fizemos até agora. Primeiro examinamos um processo ARMA estacionário, juntamente com sua formulação, insumos, suposições e requisitos de armazenamento. Em seguida, mostrou que um processo ARMA incorpora seus valores de saída (auto-correlação) e choques que experimentou anteriormente na saída atual. Finalmente, mostramos que o processo ARMA estacionário produz uma série temporal com uma média e uma variância estáveis ​​a longo prazo. Em nossa análise de dados, antes de propormos um modelo ARMA, devemos verificar a suposição de estacionaridade e os requisitos de memória finita. No caso de a série de dados exibir uma tendência determinística, precisamos remover (des-tendência) em primeiro lugar e, em seguida, usar os resíduos para ARMA. No caso de o conjunto de dados exibir uma tendência estocástica (por exemplo, caminhada aleatória) ou sazonalidade, precisamos para entreter ARIMASARIMA. Finalmente, o correlograma (isto é, ACFPACF) pode ser usado para medir a necessidade de memória do modelo, devemos esperar que ACF ou PACF se decomponham rapidamente após alguns desfasamentos. Se não, isso pode ser um sinal de não-estacionaridade ou um padrão de longo prazo (por exemplo, ARFIMA). ARIMA Previsão com Excel e R Olá Hoje eu vou guiá-lo através de uma introdução ao modelo ARIMA e seus componentes, bem como Como uma breve explicação do método Box-Jenkins de como os modelos ARIMA são especificados. Por fim, eu criei uma implementação do Excel usando R, que I8217ll mostrar-lhe como configurar e usar. Modelos de média móvel auto-regressiva (ARMA) O modelo de média móvel auto-regressiva é utilizado para modelar e prever processos estáticos estacionários de séries temporais. É a combinação de duas técnicas estatísticas previamente desenvolvidas, os modelos Autoregressive (AR) e Moving Average (MA) e foi originalmente descrito por Peter Whittle em 1951. George E. P. Box e Gwilym Jenkins popularizaram o modelo em 1971, especificando etapas discretas para modelar a identificação, estimativa e verificação. Este processo será descrito posteriormente como referência. Iniciamos com a introdução do modelo ARMA pelos seus vários componentes, os modelos AR e MA e apresentamos uma generalização popular do modelo ARMA, ARIMA (Média Movente Integrada Autoregressiva) e previsão e etapas de especificação do modelo. Por último, vou explicar uma implementação do Excel que eu criei e como usá-lo para fazer suas previsões de séries de tempo. Modelos Autoregressivos O modelo Autoregressivo é usado para descrever processos aleatórios e processos que variam no tempo e especifica que a variável de saída depende linearmente de seus valores anteriores. O modelo é descrito como: Xt c soma varphii, Xt-i varepsilont Onde varphi1, ldots, varphivarphi são os parâmetros do modelo, C é constante, e varepsilont é um termo de ruído branco. Essencialmente, o que o modelo descreve é ​​para qualquer valor dado X (t). Ele pode ser explicado por funções de seu valor anterior. Para um modelo com um parâmetro, varphi 1. X (t) é explicado por seu valor passado X (t-1) e erro aleatório varepsilont. Para um modelo com mais de um parâmetro, por exemplo varphi 2. X (t) é dado por X (t-1). X (t-2) e varepsilont de erro aleatório. Modelo de Média Móvel O modelo de Média Móvel (MA) é usado freqüentemente para modelar séries temporais univariadas e é definido como: Xt mu varepsilont theta1, varepsilon ldots thetaq, varepsilon mu é a média das séries temporais. Theta1, ldots, thetaq são os parâmetros do modelo. Varepsilont, varepsilon, ldots são os termos de erro de ruído branco. Q é a ordem do modelo de média móvel. O modelo de Média Móvel é uma regressão linear do valor atual da série em comparação com termos varepsilont no período anterior, t. Varepsilon. Por exemplo, um modelo de MA de q 1. X (t) é explicado pelo erro atual varepsilont no mesmo período eo valor do erro passado, varepsilon. Para um modelo de ordem 2 (q 2), X (t) é explicado pelos dois últimos valores de erro, varepsilon e varepsilon. Os termos AR (p) e MA (q) são usados ​​no modelo ARMA, que será agora introduzido. Modelos de média móvel auto-regressivos Modelos de média móvel auto-regressivos utilizam dois polinómios, AR (p) e MA (q) e descrevem um processo estocástico estacionário. Um processo estacionário não muda quando deslocado no tempo ou no espaço, portanto, um processo estacionário tem média e variância constantes. O modelo ARMA é freqüentemente referido em termos de seus polinômios, ARMA (p, q). A notação do modelo é escrita: Xt c varepsilont soma varphi1 X soma thetai varepsilon Selecionar, estimar e verificar o modelo é descrito pelo processo Box-Jenkins. Método Box-Jenkins para Identificação de Modelo O abaixo é mais um esboço do método Box-Jenkins, como o processo real de encontrar esses valores pode ser bastante esmagadora sem um pacote estatístico. A folha Excel incluída nesta página determina automaticamente o modelo mais adequado. O primeiro passo do método Box-Jenkins é a identificação do modelo. O passo inclui a identificação de sazonalidade, diferenciando se necessário e determinando a ordem de p e q traçando as funções de autocorrelação e autocorrelação parcial. Depois que o modelo é identificado, o próximo passo é estimar os parâmetros. A estimação de parâmetros usa pacotes estatísticos e algoritmos de computação para encontrar os melhores parâmetros de ajuste. Uma vez que os parâmetros são escolhidos, o último passo é verificar o modelo. A verificação do modelo é feita testando para ver se o modelo está em conformidade com uma série de tempo univariada estacionária. Deve-se também confirmar que os resíduos são independentes um do outro e exibem média e variância constantes ao longo do tempo, o que pode ser feito executando um teste de Ljung-Box ou novamente traçando a autocorrelação e a autocorrelação parcial dos resíduos. Observe que a primeira etapa envolve verificar a sazonalidade. Se os dados com os quais você está trabalhando contiverem tendências sazonais, você terá de desviar 8222 para tornar os dados estacionários. Este passo diferenciação generaliza o modelo ARMA em um modelo ARIMA, ou Autoregressive Integrated Moving Average, onde 8216Integrated8217 corresponde ao passo de diferenciação. Modelos de Média Móvel Integrados Autoregressivos O modelo ARIMA tem três parâmetros, p, d, q. Para definir o modelo ARMA para incluir o termo de diferenciação, começamos rearranjando o modelo ARMA padrão para separar X (t) látex e látex varepsilont da soma. (1 - soma alfa Li) Xt (1 suma thetai Li) varepsilont Onde L é o operador de latência e alphai. Thetai. Varepsilont são parâmetros auto-regressivos e de média móvel, e os termos de erro, respectivamente. Nós agora fazemos a suposição do primeiro polinômio da função, (1 - sum alphai Li) tem uma raiz unitária da multiplicidade d. Podemos então reescrevê-lo para o seguinte: O modelo ARIMA expressa a factorização polinomial com pp-d e nos dá: (1 - sum phii Li) (1 - L) d Xt (1 suma thetai Li) varepsilont Por fim, generalizamos a Adicionando um termo de deriva, que define o modelo ARIMA como ARIMA (p, d, q) com fratura de deriva. Com o modelo agora definido, podemos ver o modelo ARIMA como duas partes separadas, uma não-estacionária e a outra, estacionária, de sentido amplo (1-soma phii Li) (A distribuição de probabilidade conjunta não muda quando deslocada no tempo ou no espaço). O modelo não-estacionário: O modelo estacionário de sentido amplo: (1-sum phii Li) Yt (1 suma thetai Li) varepsilont As previsões podem agora ser feitas em Yt usando um método de previsão autorregressivo generalizado. Agora que discutimos os modelos ARMA e ARIMA, agora vamos voltar para a forma como podemos usá-los em aplicações práticas para fornecer previsão. Ive construiu uma implementação com o Excel usando R para fazer previsões ARIMA, bem como uma opção para executar Monte Carlo simulação no modelo para determinar a probabilidade das previsões. Implementação do Excel e como usar Antes de usar a folha, você deve baixar R e RExcel do site Statconn. Se você já tem R instalado, você pode apenas baixar RExcel. Se você não tem R instalado, você pode baixar RAndFriends que contém a versão mais recente do R e RExcel. Observe, RExcel só funciona em 32 bits Excel para sua licença não-comercial. Se você tem 64bit Excel instalado, você terá que obter uma licença comercial de Statconn. Recomenda-se fazer o download do RAndFriends, uma vez que facilita a instalação mais rápida e fácil. No entanto, se você já tiver R e quiser instalá-lo manualmente, siga estas etapas. Instalando manualmente o RExcel Para instalar o RExcel e outros pacotes para tornar o R ​​funcionando no Excel, abra R como Administrador clicando com o botão direito do mouse no arquivo. exe. No console R, instale o RExcel digitando as seguintes instruções: Os comandos acima instalam o RExcel em sua máquina. O próximo passo é instalar o rcom, que é outro pacote do Statconn para o pacote RExcel. Para instalar isso, digite os seguintes comandos, que também instalará automaticamente o rscproxy a partir da versão R 2.8.0. Com esses pacotes instalados, você pode passar para a configuração da conexão entre R e Excel. Embora não seja necessário para a instalação, um pacote acessível para download é Rcmdr, desenvolvido por John Fox. Rcmdr cria R menus que podem se tornar menus no Excel. Esse recurso vem por padrão com a instalação do RAndFriends e disponibiliza vários comandos R no Excel. Digite os seguintes comandos em R para instalar Rcmdr. Podemos criar o link para R e Excel. Observação nas versões recentes do RExcel esta conexão é feita com um simples clique duplo do arquivo. bat fornecido ActivateRExcel2010, portanto, você só precisará seguir estas etapas se você instalou R e RExcel manualmente ou se por algum motivo a conexão isnt feita durante A instalação do RAndFriends. Criar a conexão entre R e Excel Abra um novo livro no Excel e navegue até a tela de opções. Clique em Opções e em Add-Ins. Você deve ver uma lista de todos os suplementos ativos e inativos que você tem atualmente. Clique no botão Ir na parte inferior. Na caixa de diálogo Add-Ins, você verá todas as referências de suplemento que você fez. Clique em Procurar. Navegue até a pasta RExcel, geralmente localizada em C: Program FilesRExcelxls ou algo semelhante. Localize o suplemento RExcel. xla e clique nele. O próximo passo é criar uma referência para que macros usando R para funcionar corretamente. Em seu documento Excel, digite Alt F11. Isso abrirá Excels VBA editor. Vá para Tools - gt References e encontre a referência RExcel, RExcelVBAlib. O RExcel agora deve estar pronto para usar Usando a Planilha de Excel Agora que R e RExcel estão devidamente configurados, é hora de fazer alguma previsão Abra a planilha de previsão e clique em Carregar Servidor. Isto é para iniciar o servidor RCom e também carregar as funções necessárias para fazer a previsão. Uma caixa de diálogo será aberta. Selecione o arquivo itall. R incluído com a folha. Este arquivo contém as funções que a ferramenta de previsão usa. A maioria das funções contidas foram desenvolvidas pelo professor Stoffer na Universidade de Pittsburgh. Estendem as capacidades de R e nos fornecem alguns gráficos de diagnóstico úteis junto com nossa saída de previsão. Há também uma função para determinar automaticamente os melhores parâmetros de ajuste do modelo ARIMA. Depois que o servidor for carregado, insira seus dados na coluna Dados. Selecione o intervalo de dados, clique com o botão direito do mouse e selecione Intervalo de nomes. Nomeie o intervalo como Dados. Em seguida, defina a freqüência de seus dados na célula C6. Freqüência refere-se aos períodos de tempo de seus dados. Se for semanal, a freqüência seria 7. Mensal seria 12, enquanto que trimestral seria 4, e assim por diante. Insira os períodos futuros para previsão. Observe que os modelos ARIMA se tornam bastante imprecisos após várias previsões de freqüência sucessivas. Uma boa regra é não exceder 30 passos como qualquer coisa que poderia ser passado não confiável. Isso depende do tamanho de seu conjunto de dados também. Se você tiver dados limitados disponíveis, recomenda-se escolher um número menor de passos à frente. Depois de inserir seus dados, nomeá-los e definir a freqüência desejada e os passos adiante na previsão, clique em Executar. Pode levar algum tempo para a previsão processar. Uma vez concluído, você obterá os valores previstos para o número especificado, o erro padrão dos resultados e dois gráficos. A esquerda apresenta os valores previstos com os dados, enquanto a direita contém diagnósticos úteis com resíduos padronizados, a autocorrelação dos resíduos, um gráfico gg dos resíduos e um gráfico estatístico de Ljung-Box para determinar se o modelo está bem ajustado. Eu não vou entrar em muito detalhes sobre como você olha para um modelo bem equipado, mas no gráfico ACF você não quer qualquer (ou muito) dos pontos de lag cruzamento sobre a linha pontilhada azul. No gráfico gg, quanto mais círculos passam pela linha, mais normalizado e melhor ajustado é o modelo. Para conjuntos de dados maiores isso pode atravessar muitos círculos. Por fim, o teste de Ljung-Box é um artigo em si, porém, quanto mais círculos estiverem acima da linha pontilhada, melhor será o modelo. Se o resultado do diagnóstico não parecer bom, você pode tentar adicionar mais dados ou começar em um ponto diferente mais próximo do intervalo que você deseja prever. Você pode limpar facilmente os resultados gerados clicando nos botões Limpar valores previstos. E isso é ele Atualmente, a coluna da data não faz qualquer outra coisa senão para sua referência, mas não é necessário para a ferramenta. Se eu encontrar tempo, vou voltar e adicionar isso para que o gráfico exibido mostra a hora correta. Você também pode receber um erro ao executar a previsão. Isso geralmente é devido à função que encontra os melhores parâmetros é incapaz de determinar a ordem adequada. Você pode seguir os passos acima para tentar organizar seus dados melhor para que a função funcione. Espero que você obtenha o uso fora da ferramenta Seu me salvou bastante tempo no trabalho, como agora tudo o que tenho a fazer é inserir os dados, carregar o servidor e executá-lo. Espero também que isso mostre como R awesome pode ser, especialmente quando usado com um front-end, como o Excel. Modelos ARIMA (p, d, q): Os modelos ARIMA são, em teoria, a classe mais geral de modelos para a previsão de uma série de tempo que (Se necessário), talvez em conjunção com transformações não-lineares como, por exemplo, o logging ou o deflacionamento (se necessário). Uma variável aleatória que é uma série de tempo é estacionária se suas propriedades estatísticas são todas constantes ao longo do tempo. Uma série estacionária não tem tendência, suas variações em torno de sua média têm uma amplitude constante, e ele se move de forma consistente. Isto é, os seus padrões de tempo aleatório a curto prazo têm sempre o mesmo aspecto num sentido estatístico. Esta última condição significa que suas autocorrelações (correlações com seus próprios desvios prévios em relação à média) permanecem constantes ao longo do tempo, ou de forma equivalente, que seu espectro de poder permanece constante ao longo do tempo. Uma variável aleatória desta forma pode ser vista (como de costume) como uma combinação de sinal e ruído, eo sinal (se for aparente) poderia ser um padrão de reversão média rápida ou lenta, ou oscilação sinusoidal, ou rápida alternância no sinal , E poderia também ter uma componente sazonal. Um modelo ARIMA pode ser visto como um 8220filter8221 que tenta separar o sinal do ruído, e o sinal é então extrapolado para o futuro para obter previsões. A equação de previsão de ARIMA para uma série de tempo estacionária é uma equação linear (isto é, tipo de regressão) na qual os preditores consistem em atrasos da variável dependente e / ou atrasos dos erros de previsão. Ou seja: Valor previsto de Y uma constante e / ou uma soma ponderada de um ou mais valores recentes de Y e / ou uma soma ponderada de um ou mais valores recentes dos erros. Se os preditores consistem apenas em valores defasados ​​de Y., é um modelo autoregressivo puro (8220 auto-regressado8221), que é apenas um caso especial de um modelo de regressão e que poderia ser equipado com software de regressão padrão. Por exemplo, um modelo autoregressivo de primeira ordem (8220AR (1) 8221) para Y é um modelo de regressão simples no qual a variável independente é apenas Y retardada por um período (LAG (Y, 1) em Statgraphics ou YLAG1 em RegressIt). Se alguns dos preditores são defasagens dos erros, um modelo ARIMA não é um modelo de regressão linear, porque não há maneira de especificar o erro 8222 como uma variável independente: os erros devem ser calculados em base período a período Quando o modelo é ajustado aos dados. Do ponto de vista técnico, o problema com o uso de erros defasados ​​como preditores é que as previsões do modelo não são funções lineares dos coeficientes. Mesmo que sejam funções lineares dos dados passados. Portanto, os coeficientes em modelos ARIMA que incluem erros retardados devem ser estimados por métodos de otimização não-lineares (8220hill-climbing8221) ao invés de apenas resolver um sistema de equações. O acrônimo ARIMA significa Auto-Regressive Integrated Moving Average. Lags das séries estacionalizadas na equação de previsão são chamados de termos quotautorregressivos, os atrasos dos erros de previsão são chamados de quotmoving termos médios e uma série de tempo que precisa ser diferenciada para ser estacionária é dito ser uma versão quotintegrada de uma série estacionária. Modelos de Random-walk e tendência aleatória, modelos autorregressivos e modelos de suavização exponencial são casos especiais de modelos ARIMA. Um modelo ARIMA não sazonal é classificado como um modelo quotARIMA (p, d, q) quot, onde: p é o número de termos autorregressivos, d é o número de diferenças não sazonais necessárias para a estacionaridade e q é o número de erros de previsão defasados ​​em A equação de predição. A equação de previsão é construída como se segue. Em primeiro lugar, vamos dizer a d diferença de Y. o que significa: Note que a segunda diferença de Y (o caso d2) não é a diferença de 2 períodos atrás. Pelo contrário, é a primeira diferença de primeira diferença. Que é o análogo discreto de uma segunda derivada, isto é, a aceleração local da série em vez da sua tendência local. Em termos de y. A equação de previsão geral é: Aqui os parâmetros da média móvel (9528217s) são definidos de modo que seus sinais sejam negativos na equação, seguindo a convenção introduzida por Box e Jenkins. Alguns autores e software (incluindo a linguagem de programação R) definem-los para que eles tenham mais sinais em vez disso. Quando números reais são conectados à equação, não há ambigüidade, mas é importante saber qual convenção seu software usa quando está lendo a saída. Muitas vezes os parâmetros são indicados por AR (1), AR (2), 8230 e MA (1), MA (2), 8230, etc. Para identificar o modelo ARIMA apropriado para Y. você começa por determinar a ordem de diferenciação (D) a necessidade de estacionarizar a série e remover as características brutas da sazonalidade, talvez em conjunto com uma transformação estabilizadora de variância, como a extração madeireira ou a deflação. Se você parar neste ponto e prever que a série diferenciada é constante, você tem apenas montado uma caminhada aleatória ou modelo de tendência aleatória. No entanto, a série estacionária pode ainda ter erros autocorrelacionados, sugerindo que algum número de termos AR (p 8805 1) e / ou alguns termos MA (q 8805 1) também são necessários na equação de previsão. O processo de determinar os valores de p, d e q que são melhores para uma dada série temporal será discutido em seções posteriores das notas (cujos links estão no topo desta página), mas uma prévia de alguns dos tipos De modelos não-sazonais ARIMA que são comumente encontrados é dada abaixo. ARIMA (1,0,0) modelo autoregressivo de primeira ordem: se a série é estacionária e autocorrelacionada, talvez possa ser predita como um múltiplo de seu próprio valor anterior, mais uma constante. A equação de previsão neste caso é 8230, que é regressão Y sobre si mesma retardada por um período. Este é um modelo 8220ARIMA (1,0,0) constant8221. Se a média de Y for zero, então o termo constante não seria incluído. Se o coeficiente de inclinação 981 1 for positivo e menor que 1 em magnitude (ele deve ser menor que 1 em magnitude se Y estiver parado), o modelo descreve o comportamento de reversão de média no qual o valor do próximo período deve ser 981 vezes 1 Longe da média como valor deste período. Se 981 1 for negativo, ele prevê o comportamento de reversão de média com alternância de sinais, isto é, também prevê que Y estará abaixo do próximo período médio se estiver acima da média neste período. Em um modelo autorregressivo de segunda ordem (ARIMA (2,0,0)), haveria um termo Y t-2 à direita também, e assim por diante. Dependendo dos sinais e magnitudes dos coeficientes, um modelo ARIMA (2,0,0) poderia descrever um sistema cuja reversão média ocorre de forma sinusoidal oscilante, como o movimento de uma massa sobre uma mola submetida a choques aleatórios . Se a série Y não for estacionária, o modelo mais simples possível para ela é um modelo randômico randômico, que pode ser considerado como um caso limitante de um modelo AR (1) em que o modelo autorregressivo Coeficiente é igual a 1, ou seja, uma série com reversão média infinitamente lenta. A equação de predição para este modelo pode ser escrita como: onde o termo constante é a variação média período-período (ou seja, a deriva a longo prazo) em Y. Este modelo poderia ser montado como um modelo de regressão sem interceptação em que o A primeira diferença de Y é a variável dependente. Uma vez que inclui (apenas) uma diferença não sazonal e um termo constante, é classificada como um modelo de ARIMA (0,1,0) com constante. quot O modelo randômico-sem-desvio seria um ARIMA (0,1, 0) sem constante ARIMA (1,1,0) modelo autoregressivo de primeira ordem diferenciado: Se os erros de um modelo de caminhada aleatória são autocorrelacionados, talvez o problema possa ser corrigido adicionando um lag da variável dependente à equação de predição - Eu Pela regressão da primeira diferença de Y sobre si mesma retardada por um período. Isto resultaria na seguinte equação de predição: que pode ser rearranjada para Este é um modelo autorregressivo de primeira ordem com uma ordem de diferenciação não sazonal e um termo constante - isto é. Um modelo ARIMA (1,1,0). ARIMA (0,1,1) sem suavização exponencial simples constante: Uma outra estratégia para corrigir erros autocorrelacionados em um modelo de caminhada aleatória é sugerida pelo modelo de suavização exponencial simples. Lembre-se que para algumas séries temporais não-estacionárias (por exemplo, as que exibem flutuações barulhentas em torno de uma média de variação lenta), o modelo de caminhada aleatória não funciona tão bem quanto uma média móvel de valores passados. Em outras palavras, ao invés de tomar a observação mais recente como a previsão da próxima observação, é melhor usar uma média das últimas observações para filtrar o ruído e estimar com mais precisão a média local. O modelo de suavização exponencial simples usa uma média móvel exponencialmente ponderada de valores passados ​​para conseguir esse efeito. A equação de predição para o modelo de suavização exponencial simples pode ser escrita em um número de formas matematicamente equivalentes. Uma das quais é a chamada 8220error correction8221, na qual a previsão anterior é ajustada na direção do erro que ela fez: Como e t-1 Y t-1 - 374 t-1 por definição, isso pode ser reescrito como : Que é uma equação de previsão ARIMA (0,1,1) sem constante com 952 1 1 - 945. Isso significa que você pode ajustar uma suavização exponencial simples especificando-a como um modelo ARIMA (0,1,1) sem Constante, eo coeficiente MA (1) estimado corresponde a 1-menos-alfa na fórmula SES. Lembre-se que no modelo SES, a idade média dos dados nas previsões de 1 período antecipado é de 1 945, o que significa que tendem a ficar aquém das tendências ou pontos de viragem em cerca de 1 945 períodos. Segue-se que a média de idade dos dados nas previsões de 1 período de um modelo ARIMA (0,1,1) sem constante é de 1 (1 - 952 1). Assim, por exemplo, se 952 1 0,8, a idade média é 5. Quando 952 1 aproxima-se de 1, o modelo ARIMA (0,1,1) sem constante torna-se uma média móvel de muito longo prazo e como 952 1 Aproxima-se 0 torna-se um modelo randômico-caminhada-sem-deriva. Nos dois modelos anteriores discutidos acima, o problema dos erros autocorrelacionados em um modelo de caminhada aleatória foi fixado de duas maneiras diferentes: adicionando um valor defasado da série diferenciada Para a equação ou adicionando um valor defasado do erro de previsão. Qual abordagem é a melhor Uma regra para esta situação, que será discutida em mais detalhes mais adiante, é que a autocorrelação positiva é geralmente melhor tratada pela adição de um termo AR para o modelo e autocorrelação negativa é geralmente melhor tratada pela adição de um MA termo. Nas séries econômicas e de negócios, a autocorrelação negativa muitas vezes surge como um artefato de diferenciação. Portanto, o modelo ARIMA (0,1,1), no qual a diferenciação é acompanhada por um termo de MA, é mais freqüentemente usado do que um modelo de auto-correlação positiva. Modelo ARIMA (1,1,0). ARIMA (0,1,1) com suavização exponencial simples constante com crescimento: Ao implementar o modelo SES como um modelo ARIMA, você realmente ganha alguma flexibilidade. Em primeiro lugar, o coeficiente MA (1) estimado pode ser negativo. Isto corresponde a um factor de suavização maior do que 1 num modelo SES, o que normalmente não é permitido pelo procedimento de ajustamento do modelo SES. Em segundo lugar, você tem a opção de incluir um termo constante no modelo ARIMA, se desejar, para estimar uma tendência média não-zero. O modelo ARIMA (0,1,1) com constante tem a equação de predição: As previsões de um período de adiantamento deste modelo são qualitativamente semelhantes às do modelo SES, exceto que a trajetória das previsões de longo prazo é tipicamente uma Inclinada (cuja inclinação é igual a mu) em vez de uma linha horizontal. ARIMA (0,2,1) ou (0,2,2) sem suavização exponencial linear constante: Os modelos lineares de suavização exponencial são modelos ARIMA que utilizam duas diferenças não sazonais em conjunto com os termos MA. A segunda diferença de uma série Y não é simplesmente a diferença entre Y e ela mesma retardada por dois períodos, mas sim é a primeira diferença da primeira diferença - i. e. A mudança na mudança de Y no período t. Assim, a segunda diferença de Y no período t é igual a (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. Uma segunda diferença de uma função discreta é análoga a uma segunda derivada de uma função contínua: ela mede a quotaccelerationquot ou quotcurvaturequot na função em um dado ponto no tempo. O modelo ARIMA (0,2,2) sem constante prevê que a segunda diferença da série é igual a uma função linear dos dois últimos erros de previsão: que pode ser rearranjada como: onde 952 1 e 952 2 são MA (1) e MA (2) coeficientes. Este é um modelo de suavização exponencial linear geral. Essencialmente o mesmo que Holt8217s modelo, e Brown8217s modelo é um caso especial. Ele usa médias móveis exponencialmente ponderadas para estimar um nível local e uma tendência local na série. As previsões a longo prazo deste modelo convergem para uma linha recta cujo declive depende da tendência média observada no final da série. ARIMA (1,1,2) sem suavização exponencial linear de tendência amortecida constante. Este modelo é ilustrado nos slides acompanhantes nos modelos ARIMA. Ele extrapola a tendência local no final da série, mas aplana-lo em horizontes de previsão mais longos para introduzir uma nota de conservadorismo, uma prática que tem apoio empírico. Veja o artigo sobre "Por que a tendência de amortecimento" trabalha por Gardner e McKenzie e o artigo de "Rule of Gold" de Armstrong et al. para detalhes. É geralmente aconselhável aderir a modelos nos quais pelo menos um de p e q não é maior do que 1, ou seja, não tente encaixar um modelo como ARIMA (2,1,2), uma vez que isto é susceptível de conduzir a sobre-adaptação E quotcommon-factorquot questões que são discutidas em mais detalhes nas notas sobre a estrutura matemática dos modelos ARIMA. Implementação de planilhas: modelos ARIMA como os descritos acima são fáceis de implementar em uma planilha. A equação de predição é simplesmente uma equação linear que se refere a valores passados ​​de séries temporais originais e valores passados ​​dos erros. Assim, você pode configurar uma planilha de previsão ARIMA armazenando os dados na coluna A, a fórmula de previsão na coluna B e os erros (dados menos previsões) na coluna C. A fórmula de previsão em uma célula típica na coluna B seria simplesmente Uma expressão linear que se refere a valores nas linhas precedentes das colunas A e C, multiplicada pelos coeficientes AR ou MA apropriados armazenados em células noutro local da folha de cálculo.

No comments:

Post a Comment