Os modelos ARIMA são, em teoria, a classe mais geral de modelos para prever uma série de tempo que pode ser feita para ser estacionária por diferenciação se necessário, talvez em conjunto com transformações não-lineares Tais como registrar ou desinflar, se necessário Uma variável aleatória que é uma série temporal é estacionária se suas propriedades estatísticas são todas constantes ao longo do tempo Uma série estacionária não tem tendência, suas variações em torno de sua média têm uma amplitude constante, e ele se move de forma consistente Ou seja, seus padrões de tempo aleatórios de curto prazo sempre se parecem em um sentido estatístico. A última condição significa que suas correlações de autocorrelações com seus próprios desvios anteriores da média permanecem constantes ao longo do tempo ou, de forma equivalente, que seu espectro de poder permanece constante ao longo do tempo. Variável desta forma pode ser vista como usual como uma combinação de sinal e ruído, eo sinal se um é aparente poderia ser um patt De reversão média rápida ou lenta, ou oscilação sinusoidal, ou alternância rápida no sinal, e também poderia ter uma componente sazonal Um modelo ARIMA pode ser visto como um filtro que tenta separar o sinal do ruído, eo sinal é então Extrapolada para o futuro para obter previsões. A equação de previsão de ARIMA para uma série de tempo estacionária é uma equação de tipo linear de regressão linear, na qual os preditores consistem em atrasos da variável dependente e / ou atrasos dos erros de previsão Isso é. Valor predito de Y Uma soma constante e ou ponderada de um ou mais valores recentes de Y e / ou uma soma ponderada de um ou mais valores recentes dos erros. Se os preditores consistem apenas em valores defasados de Y é um modelo autoregressivo auto-regredido puro, Que é apenas um caso especial de um modelo de regressão e que poderia ser equipado com software de regressão padrão. Por exemplo, um modelo AR 1 auto-regressivo de primeira ordem para Y é um modelo de regressão simples no qual a variável independente i Se apenas alguns dos preditores são defasagens dos erros, um modelo ARIMA não é um modelo de regressão linear, porque não há como especificar o erro do último período s Como uma variável independente, os erros devem ser calculados periodicamente quando o modelo é ajustado aos dados. Do ponto de vista técnico, o problema com o uso de erros retardados como preditores é que as previsões do modelo não são funções lineares do Assim, os coeficientes em modelos ARIMA que incluem erros retardados devem ser estimados por métodos de otimização não-linear escalada em vez de simplesmente resolver um sistema de equações. A sigla ARIMA significa Auto-Regressive Integrated Média Móvel As baixas das séries estacionalizadas na equação de previsão são chamadas de termos autorregressivos, os atrasos dos erros de previsão são chamados de termos de média móvel e uma série de tempo que precisa ser Ser diferenciado para ser feito estacionário é dito ser uma versão integrada de uma série estacionária Random-pé e modelos de tendência aleatória, modelos autorregressivos e modelos de suavização exponencial são todos os casos especiais de modelos ARIMA. Um modelo ARIMA não sazonal é classificado como um ARIMA P, d, q modelo, where. p é o número de termos autorregressivos. d é o número de diferenças não sazonais necessárias para a estacionariedade, e. q é o número de erros de previsão defasados na equação de previsão. A equação de previsão é construída da seguinte forma Notemos que a segunda diferença de Y o caso d 2 não é a diferença de dois períodos atrás. Em vez disso, é a diferença de primeira diferença da primeira diferença que é O análogo discreto de uma segunda derivada, ou seja, a aceleração local da série em vez de sua tendência local. Em termos de y, a equação de previsão geral é. Aqui os parâmetros de média móvel s são definidos de modo que seus sinais sejam negativos na equação Seguindo a convenção introduzida por Box e Jenkins Alguns autores e softwares, incluindo a linguagem de programação R, definem-nos de modo que eles tenham mais sinais ao invés. Quando os números reais são conectados à equação, não há ambigüidade, mas é importante saber qual convenção O software usa quando você está lendo a saída Muitas vezes os parâmetros são indicados por AR 1, AR 2,, e MA 1, MA 2, etc Para identificar o modelo ARIMA apropriado para Y você começa por determinar a ordem de diferenciação d que necessitam Para estacionarizar a série e remover as características brutas da sazonalidade, talvez em conjunto com uma transformação de estabilização de variância, como logging ou deflação Se você parar neste ponto e prever que a série diferenciada é constante, você apenas montou uma caminhada aleatória ou aleatória No entanto, a série estacionária pode ainda ter erros autocorrelacionados, sugerindo que algum número de termos AR p 1 e ou algum número de termos MA q 1 também são necessários Na equação de previsão. O processo de determinar os valores de p, d e q que são melhores para uma dada série de tempo será discutido em seções posteriores das notas cujos links estão no topo desta página, mas uma prévia de alguns Dos tipos de modelos não-temporais ARIMA que são comumente encontrados é dado abaixo. ARIMA 1,0,0 modelo auto-regressivo de primeira ordem se a série é estacionária e autocorrelacionada, talvez ele pode ser previsto como um múltiplo de seu próprio valor anterior, mais um Constante A equação de previsão neste caso é a que é Y regressa sobre si mesma retardada por um período. Este é um modelo de constante ARIMA 1,0,0 Se a média de Y for zero, então o termo constante não seria incluído. Se a inclinação O coeficiente 1 é positivo e menor que 1 em magnitude deve ser menor que 1 em magnitude se Y estiver parado, o modelo descreve o comportamento de reversão de média no qual o valor do próximo período deve ser predito como sendo 1 vezes mais distante da média como Valor do período s Se 1 for negativo, Prediz comportamento de reversão de média com alternância de sinais, ou seja, também prevê que Y estará abaixo do próximo período médio se estiver acima da média desse período. Em um modelo autorregressivo de segunda ordem ARIMA 2,0,0, haveria um Y t-2 termo à direita também, e assim por diante Dependendo dos sinais e magnitudes dos coeficientes, um modelo ARIMA 2,0,0 poderia descrever um sistema cuja reversão média ocorre de forma sinusoidal oscilante, como o movimento De uma massa em uma mola que é sujeita a choques aleatórios. ARIMA 0,1,0 passeio aleatório Se a série Y não é estacionário, o modelo mais simples possível para ele é um modelo de caminhada aleatória, que pode ser considerado como um caso limitativo de Um modelo AR 1 em que o coeficiente autorregressivo é igual a 1, ie uma série com reversão média infinitamente lenta. A equação de predição para este modelo pode ser escrita como. qual o termo constante é a variação média período-período, isto é, a longo prazo Este modelo pode ser montado como uma interceptação sem Em que a primeira diferença de Y é a variável dependente Uma vez que inclui apenas uma diferença não sazonal e um termo constante, é classificada como modelo ARIMA 0,1,0 com constante O modelo randômico-sem-desvio seria Um modelo ARIMA 0,1,0 sem constante. ARIMA 1,1,0 modelo auto-regressivo de primeira ordem diferenciado Se os erros de um modelo randômico randômico são autocorrelacionados, talvez o problema possa ser corrigido adicionando um atraso da variável dependente ao Isto é, regressando a primeira diferença de Y sobre si mesma retardada por um período Isto resultaria na seguinte equação de previsão que pode ser rearranjada para. Este é um modelo autorregressivo de primeira ordem com uma ordem de diferenciamento não sazonal e um termo constante --em um modelo ARIMA 1,1,0.ARIMA 0,1,1 sem alisamento exponencial simples constante Outra estratégia para corrigir erros autocorrelacionados em um modelo de caminhada aleatória é sugerida pelo modelo de suavização exponencial simples. Por exemplo, aqueles que exibem flutuações barulhentas em torno de uma média de variação lenta, o modelo de caminhada aleatória não funciona tão bem quanto uma média móvel de valores passados. Em outras palavras, ao invés de tomar a observação mais recente como a previsão da próxima observação , É melhor usar uma média das últimas observações para filtrar o ruído e estimar com mais precisão a média local O modelo de suavização exponencial simples usa uma média móvel exponencialmente ponderada de valores passados para alcançar esse efeito A equação de previsão para a O modelo de suavização exponencial simples pode ser escrito em um número de formas matematicamente equivalentes, uma das quais é a chamada forma de correção de erro, na qual a previsão anterior é ajustada na direção do erro que ela cometeu. Porque e t-1 Y t - 1 - t-1 por definição, isso pode ser reescrito como. que é uma equação de previsão ARIMA 0,1,1-sem-constante com 1 1 - Isso significa que você pode ajustar um smoo exponencial simples Coisa, especificando-o como um modelo ARIMA 0,1,1 sem constante, eo coeficiente MA 1 estimado corresponde a 1-menos-alfa na fórmula SES Lembre-se que no modelo SES, a idade média dos dados no 1- As previsões de período antecipado é de 1, o que significa que tenderão a ficar para trás em relação a tendências ou pontos de viragem em cerca de 1 períodos. Consequentemente, a idade média dos dados nas previsões de um período de 1 período de um ARIMA 0,1,1 - 1 1 - 1 Assim, por exemplo, se 1 0 8, a idade média é 5 Como 1 se aproxima de 1, o modelo ARIMA 0,1,1-sem constante se torna uma média móvel de muito longo prazo e Quando 1 se aproxima de 0, torna-se um modelo randômico-sem-deriva. Qual é a melhor maneira de corrigir a autocorrelação adicionando termos AR ou adicionando termos MA Nos dois modelos anteriores discutidos acima, o problema de erros autocorrelacionados em um modelo de caminhada aleatória Foi fixado de duas maneiras diferentes adicionando um valor defasado da série diferenciada à equação ou adicionando um valor defasado do foreca St erro Qual abordagem é a melhor Uma regra para esta situação, que será discutida em mais detalhes mais adiante, é que a autocorrelação positiva geralmente é melhor tratada pela adição de um termo AR para o modelo e autocorrelação negativa é geralmente melhor tratada por Adicionando um termo MA Na série econômica e de negócios, a autocorrelação negativa geralmente surge como um artefato de diferenciação. Em geral, a diferenciação reduz a autocorrelação positiva e pode até causar uma mudança de autocorrelação positiva para negativa. Assim, o modelo ARIMA 0,1,1, em Cuja diferenciação é acompanhada por um termo MA, é mais freqüentemente usado do que um modelo ARIMA 1,1,0. ARIMA 0,1,1 com suavização exponencial simples constante com crescimento Ao implementar o modelo SES como um modelo ARIMA, você realmente ganha alguns Flexibilidade Em primeiro lugar, permite-se que o coeficiente de MA 1 estimado seja negativo, o que corresponde a um factor de alisamento superior a 1 num modelo SES, o que normalmente não é permitido pelo procedimento de ajustamento do modelo SES Sec Você tem a opção de incluir um termo constante no modelo ARIMA se desejar, para estimar uma tendência média não-zero. O modelo ARIMA 0,1,1 com constante tem a equação de previsão. As previsões deste modelo são qualitativamente semelhantes às do modelo SES, exceto que a trajetória das previsões de longo prazo é tipicamente uma linha inclinada cuja inclinação é igual a mu ao invés de uma linha horizontal. ARIMA 0,2,1 ou 0, 2,2 sem suavização exponencial linear constante Modelos lineares de suavização exponencial são modelos ARIMA que usam duas diferenças não sazonais em conjunção com os termos MA A segunda diferença de uma série Y não é simplesmente a diferença entre Y e ela mesma retardada por dois períodos, mas sim A primeira diferença da primeira diferença - ou seja, a mudança na mudança de Y no período t Assim, a segunda diferença de Y no período t é igual a Y t - Y t-1 - Y t-1 - Y T-2 Y t-2Y t-1 Y t-2 Uma segunda diferença de uma função discreta é analogou S para uma segunda derivada de uma função contínua mede a aceleração ou curvatura na função em um determinado ponto no tempo. O modelo ARIMA 0,2,2 sem constante prevê que a segunda diferença da série é igual a uma função linear da última Dois erros de previsão. que podem ser rearranjados como. quando 1 e 2 são os coeficientes MA 1 e MA 2 Este é um modelo de alisamento exponencial linear geral essencialmente o mesmo que o modelo de Holt s eo modelo de Brown s um caso especial Ele usa ponderação exponencial Médias móveis para estimar um nível local e uma tendência local na série As previsões de longo prazo deste modelo convergem para uma linha reta cuja inclinação depende da tendência média observada no final da série. ARIMA 1,1,2 sem Este modelo é ilustrado nos slides acompanhantes em modelos ARIMA extrapola a tendência local no final da série, mas aplaina-lo em horizontes de previsão mais longos para introduzir um Ote do conservadorismo, uma prática que tem suporte empírico Veja o artigo sobre Por que a Tendência de Damped trabalha por Gardner e McKenzie eo artigo da regra de ouro por Armstrong et al para detalhes. É geralmente aconselhável ficar com modelos em que pelo menos um de p E q não é maior do que 1, ou seja, não tente encaixar um modelo como o ARIMA 2,1,2, uma vez que isso é susceptível de levar a problemas de overfitting e de fatores comuns que são discutidos com mais detalhes nas notas sobre a matemática Estrutura de modelos ARIMA. Implementação de folha de cálculo Modelos ARIMA como os descritos acima são fáceis de implementar em uma planilha A equação de predição é simplesmente uma equação linear que se refere a valores passados de séries de tempo originais e valores passados dos erros Assim, você pode configurar Uma planilha de previsões ARIMA armazenando os dados na coluna A, a fórmula de previsão na coluna B e os dados de erros menos previsões na coluna C A fórmula de previsão em uma célula típica na coluna B seria simplesmente um expressio linear N referindo-se a valores nas linhas precedentes das colunas A e C, multiplicados pelos coeficientes AR ou MA apropriados armazenados em células em outra parte da folha de cálculo. Exemplo 7 2 Modelo Sazonal para a Série de Linha Aérea. O dado de passageiros da linha aérea, dado como Série G na Caixa E Jenkins 1976, têm sido usados na literatura de análise de séries temporais como um exemplo de uma série temporal não estacionária Este exemplo usa PROC ARIMA para ajustar o modelo de linha aérea ARIMA 0,1,1 0,1,1 para Box e Jenkins Série G As seguintes declarações lêem os dados e log-transformam a série. A seguinte etapa PROC PROCEDIMENTOS traça a série, como mostrado na Saída 7 2 1.Output 7 2 1 Linha de Série de Tempo da Série de Passageiros da Linha Aérea As seguintes declarações especificam um ARIMA 0 , 1,1 0,1,1 modelo sem um termo médio para os logaritmos da série de passageiros da linha aérea, xlog O modelo é previsão e os resultados são armazenados no conjunto de dados B. A saída da instrução IDENTIFY é mostrada em Output 7 2 2 As parcelas de autocorrelação mostradas são f Ou a série duas vezes diferenciada Observe que as funções de autocorrelação têm a característica de padrão de um processo de média móvel de primeira ordem combinado com um processo sazonal de média móvel com atraso 12.Output 7 2 2 IDENTIFY Statement Output. International Airline Passengers. Introduction to SAS Proc Arima. Analysis de dados de séries temporais no domínio do tempo é feito com este procedimento Box-Jenkins metodologia a montagem de modelos ARIMA para dados de séries temporais e também modelos de tipo de entrada de função de transferência pode ser usado Análise de domínio de freqüência de séries de tempo pode ser feito usando Proc. A estrutura para a análise é que a série de tempo observada X t é estacionária e satisfaz uma equação ARMA da forma. Onde Z t é um processo de ruído branco As constantes phi 1 phi p são chamadas de coeficientes autorregressivos eo número p É chamada a ordem do componente autorregressivo As constantes theta 1 theta q são chamadas de coeficientes de média móvel e o número q é chamado a ordem do m Oving componente médio É possível para p ou q ser zero. Use de proc arima para ajustar ARMA modelos consiste em 3 etapas O primeiro passo é identificação do modelo, em que a série observada é transformada para ser estacionário A única transformação disponível dentro de proc Arima is differencing O segundo passo é a estimativa do modelo, na qual as ordens p e q são selecionadas e os parâmetros correspondentes são estimados. A terceira etapa é a previsão, na qual o modelo estimado é usado para prever valores futuros da série de tempo observável. Por exemplo, será analisado o arquivo de dados contendo dados sobre a produção de leite da Cryer. Aqui estão os comandos que podem ser usados para cada uma das 3 etapas. OPÇÕES PARA A DECLARAÇÃO DE IDENTIFICAÇÃO A instrução var é necessária e especifica a variável s nos dados Conjunto a ser analisado Os números opcionais entre parênteses especificam o LAG no qual as diferenças devem ser computadas Uma instrução var leite analisaria a série de leite sem qualquer diferença v Ar 1 irá analisar a primeira diferença de leite leite var 1,1 a segunda diferença de leite. A instrução var produz 3 parcelas para a variável especificada a função de autocorrelação da amostra, a função de autocorrelação inversa da amostra e a função de autocorrelação parcial da amostra. Parcelas e tabelas de seus valores são impressos na janela de saída Parcelas de qualidade superior podem ser produzidas através da utilização de outras opções detalhadas abaixo e proc gplot. A opção nlag faz com que os 3 gráficos imprimam valores até atraso 30 Se não for especificado, É nlag 24 ou 25 do número de observações, o que for menor. A opção de centro subtrai a média da série especificada pela instrução var A média é adicionada de volta automaticamente durante a etapa de previsão. A opção outcov coloca os valores da amostra Correlação em um conjunto de dados SAS Esses valores podem ser usados para produzir gráficos de alta qualidade dessas funções usando proc gplot As variáveis de saída são LAG VAR name Da variável especificada na opção var, nome CROSSVAR da variável especificada na opção crosscorr, N número de observações utilizadas para computar o valor atual da covariância ou crosscovariância, valor COV das covariâncias cruzadas, valor CORR da função de autocorrelação da amostra , Erro padrão STDERR das autocorrelações, valores INVCORR da função de autocorrelação inversa da amostra e valores PARTCORR da função de autocorrelação parcial da amostra. A opção noprint suprime a saída dos gráficos de baixa qualidade normalmente criados pela instrução var Esta opção é usada principalmente com A opção de outcov. OPÇÕES PARA A DECLARAÇÃO ESTIMATIVA. As opções p 1 q 3 especificam as ordens de auto-regressão e média móvel a serem ajustadas Outras formas destas especificações são q 3 para especificar que SOMENTE o parâmetro theta 3 pode ser não - Zero p 12 3 para um modelo sazonal 1-phi 12 B 12 1-phi 3 B 3 onde B é o operador backshift p 3,12 para um modelo em que apenas phi 3 e ph I 12 podem ser não-zero. A opção nodf usa o tamanho da amostra em vez dos graus de liberdade como divisor ao estimar a variância do ruído branco. A opção do método seleciona o método de estimativa para os parâmetros As escolhas são ml para Gaussiano máximo Estimativa de probabilidade, uls para mínimos quadrados incondicionais e cls para mínimos quadrados condicionais. A opção plot produz as mesmas 3 parcelas que na declaração de identificação para os RESIDUAIS depois que os parâmetros do modelo são estimados Esta é outra verificação útil sobre a brancura dos resíduos. PARA A DECLARAÇÃO DE PREVISÃO. A opção de chumbo especifica o número de intervalos de tempo no futuro para os quais as previsões devem ser feitas. Usando as opções out e printall na declaração de previsão, um conjunto de dados SAS será criado que conterá os valores do Série original e os valores previstos da série usando o modelo em todos os tempos Isso pode ser útil para uma análise do desempenho passado do modelo. Em prática, seve As instruções de estimativas diferentes são tentadas seqüencialmente para ver qual modelo se adapta melhor aos dados. Proc arima é interativo, no sentido de que essas tentativas seqüenciais podem ser feitas sem reiniciar o procedimento. Simplesmente envie as instruções de estimativa sucessivas a declaração de identidade original será retida. Pode ser ajustado usando a opção crosscorr da instrução de identificação ea opção de entrada da instrução de estimativa A mecânica deste procedimento é ilustrada para um conjunto de dados falso que contém duas séries de tempo que estão relacionadas por um modelo de função de transferência Neste caso, Y depende Em X Em primeiro lugar, o processo X é modelado usando as declarações de identificação e estimativa Então Y é identificado ea correlação cruzada entre os processos prewhitened X e Y é estimado O programa pode ser semelhante a this. From a informação de correlação cruzada, os atrasos em que O processo de entrada X influencia Y pode ser tentativamente identificado Note que somente modelos causais são permitidos não-zero cr As correlações dos oss em lags negativos não podem ser modeladas em proc arima Para ilustração, digamos os retornos não-zero são 2 e 4 O processo Y pode ser estimado da seguinte maneira. A entrada é da forma cB 2 dB 4 B 2 c dB 2 É Esta última forma que dá a forma da instrução input. Note que a instrução de estimativa sempre se refere à declaração de identificação mais recente para decidir quais variáveis s devem ser incluídas no modelo. Assim, diferenciação e centralização são tratadas automaticamente se usadas, EXCEPTO que a diferenciação deve Ser explicitamente especificado na declaração crosscorr. Para mais detalhes consulte a ajuda on-line em SAS SAS SYSTEM HELP - MODELING ANALYSIS TOOLS - ECONOMETRICS TIME SERIES - ARIMA ou o SAS ETS Guide. Copyright 2017 Jerry Alan Veeh Todos os direitos reservados.
No comments:
Post a Comment