Correlação Em Série Média Em Movimento


Teoria econométrica Correlação social Há tempos, especialmente em dados de séries temporais, que a hipótese de CLR de c o r r (t. T 1) 0, epsilon) 0 está quebrada. Isso é conhecido em econometria como Correlação Serial ou Autocorrelação. Isso significa que c o r r (t. T 1) 0, epsilon) neq 0 e há um padrão nos termos de erro. Os termos de erro não são distribuídos de forma independente nas observações e não são estritamente aleatórios. Exemplos de Autocorrelação Edit Quando o termo de erro está relacionado ao termo de erro anterior, ele pode ser escrito em uma equação algébrica. T t 1 u rho epsilon u onde é o coeficiente de autocorrelação entre os dois termos de perturbação e u é o termo de perturbação para a autocorrelação. Isso é conhecido como Processo Autoregressivo. 1 lt c o r r (t. T 1) lt 1, epsilon) lt1 O u é necessário dentro da equação porque, embora o termo de erro seja menos aleatório, ele ainda tem um leve efeito aleatório. Correlação serial do N ° Ordem Edit Modelo autoregressivo Editar Processo Autoregressivo de primeira ordem, AR (1). T t 1 u rho epsilon u Isto é conhecido como autoregressão de primeira ordem, devido ao termo de erro somente dependendo do termo de erro anterior. N. ° Processo Autoregressivo, AR (n). T 1 t 1 2 t 2 ntnut rho epsilon rho epsilon cdots rho epsilon u Modelo de média móvel Edit A notação MA (q) refere-se ao modelo de média móvel da ordem q: X tti 1 qiti mu varepsilon sum theta varepsilon, onde o 1 . Q são os parâmetros do modelo, é a expectativa de X t (muitas vezes assumido como igual a 0), e o t. T 1. São novamente, termos de erro de ruído branco. O modelo de média móvel é essencialmente um filtro de resposta de impulso finito com alguma interpretação adicional colocada sobre ele. Modelo de Autoregressivemoving-average Edit A notação ARMA (pág. Q) refere-se ao modelo com p termos autorregressivos e q termos de média móvel. Este modelo contém os modelos AR (p) e MA (q), X t c t i 1 p i X t i i 1 q i t i. Cvarepsilon sum varphi X sum theta varepsilon., Causas de autocorrelação Edit c o r r (t. T 1) 0, epsilon) neq 0 Autocorrelação espacial ocorre quando os dois erros são especialmente ou geograficamente relacionados. Em termos mais simples, eles estão ao lado de cada um. Exemplos: a cidade de St. Paul tem um pico de crime e, portanto, eles contratam polícia adicional. No ano seguinte, descobriram que a taxa de criminalidade diminuiu significativamente. Surpreendentemente, a cidade de Minneapolis, que não ajustou sua força policial, descobre que eles têm um aumento na taxa de criminalidade no mesmo período. Nota: esse tipo de autocorrelação ocorre em amostras de seção transversal. InertiaTime para ajustar Isso geralmente ocorre na macro, dados de séries temporais. A taxa de juros dos EUA aumenta inesperadamente e, portanto, há uma mudança associada nas taxas de câmbio com outros países. Alcançar um novo equilíbrio pode demorar algum tempo. Influências prolongadas Este é novamente um problema macro, série temporal, que lida com choques econômicos. Agora espera-se que a taxa de juros dos EUA aumente. As taxas de câmbio associadas serão ajustadas lentamente até o anúncio da Reserva Federal e podem superar o equilíbrio. Data SmoothingManipulation O uso de funções para suavizar dados trará autocorrelação nos termos de perturbação. Misspecification Uma regressão geralmente mostrará sinais de autocorrelação quando houver variáveis ​​omitidas. Como a variável independente que faltava agora existe no termo de perturbação, obtemos um termo de perturbação que se parece com: t 2 X 2 ut beta X u quando a especificação correta é Y t 0 1 X 1 2 X 2 ut beta beta X beta X u Consequências da Autocorrelação Edit O principal problema com a autocorrelação é que ele pode fazer um modelo melhor do que realmente é. Lista de conseqüências Editar Coeficientes ainda são impares E (t) 0. c o v (X t. U t) 0) 0, cov (X, u) 0 A variância verdadeira é aumentada, pela presença de autocorrelações. A variação estimada é menor devido à autocorrelação (inclinada para baixo). Uma diminuição em s e ()) e um aumento das estatísticas t, o resultado é que o estimador parece mais preciso do que realmente é. R se infla. Todos esses problemas resultam em testes de hipóteses que se tornam inválidos. Autocorrelação em dados. 2 corridas, mas o OLS real, que nunca teríamos encontrado, está em algum lugar no meio. Teste de Autocorrelação Edit Embora não seja conclusivo, pode-se obter uma impressão ao visualizar um gráfico da variável dependente contra o termo de erro (ou seja, um gráfico de dispersão residual). Teste de Durbin-Watson: Assuma Tt 1 ut epsilon rho u Teste H (0): 0 (sem AC) contra H (1): gt 0 (teste de uma unha) Estatística de teste DW (tt 1) ​​2 2 2 2 - epsilon ) 2-2rho Qualquer valor em D (L) (na tabela DW) rejeita a hipótese nula e AC existe. Qualquer valor entre D (L) e D (W) nos deixa sem conclusão de AC. Qualquer valor maior que D (W) aceita a hipótese nula e AC não existe. Observe, este é um teste de cauda. Para obter a outra cauda. Use 4 - DW como a estatística do teste em vez disso. Média de Mudança Integrada Sustentada Modelos de ARIMA (p, d, q) para Análise da Série de Tempo No conjunto anterior de artigos (Partes 1. 2 e 3) nós entramos em detalhes significativos sobre o AR ( P), MA (q) e ARMA (p, q) modelos de séries temporais lineares. Utilizamos esses modelos para gerar conjuntos de dados simulados, modelos ajustados para recuperar parâmetros e, em seguida, aplicamos esses modelos em dados de ações financeiras. Neste artigo, vamos discutir uma extensão do modelo ARMA, ou seja, o modelo de Mínima Integrada Autoregressiva, ou o modelo ARIMA (p, d, q). Veremos que é necessário considerar o modelo ARIMA quando temos séries não estacionárias. Tais séries ocorrem na presença de tendências estocásticas. Recapitulação Rápida e Próximas Etapas Até o momento, consideramos os seguintes modelos (os links o levarão aos artigos apropriados): Constantemente construímos nossa compreensão de séries temporais com conceitos como correlação serial, estacionária, linearidade, resíduos, correlogramas, Simulando, montagem, sazonalidade, heterocedasticidade condicional e teste de hipóteses. Até o momento, não realizamos nenhuma previsão ou previsão de nossos modelos e, portanto, não tivemos nenhum mecanismo para produzir um sistema de negociação ou uma curva de equivalência patrimonial. Uma vez que estudamos o ARIMA (neste artigo), ARCH e GARCH (nos próximos artigos), estaremos em condições de construir uma estratégia básica de negociação de longo prazo com base na previsão de retorno do índice de mercado de ações. Apesar do fato de ter abordado muitos detalhes sobre os modelos que sabemos, em última análise, não terão ótimos resultados (AR, MA, ARMA), estamos agora bem versados ​​no processo de modelagem de séries temporais. Isso significa que quando chegarmos a estudar modelos mais recentes (e mesmo aqueles que estão atualmente na literatura de pesquisa), teremos uma base de conhecimento significativa para desenhar, para efetivamente avaliar esses modelos, em vez de tratá-los como uma chave de turno Prescrição ou caixa preta. Mais importante ainda, isso nos proporcionará a confiança para ampliá-los e modificá-los por conta própria e entender o que estamos fazendo quando o fazemos. Gostaria de agradecer por ser paciente até agora, pois pode parecer que esses artigos estão longe de A ação real da negociação real. No entanto, a pesquisa de pesquisa quantitativa verdadeira é cuidadosa, medida e leva tempo significativo para obter direito. Não existe uma solução rápida nem um esquema rico no comércio de quant. Estávamos quase prontos a considerar o nosso primeiro modelo comercial, que será uma mistura de ARIMA e GARCH, por isso é imperativo que passemos algum tempo a entender o modelo ARIMA bem. Uma vez que construímos o nosso primeiro modelo comercial, vamos considerar mais Modelos avançados, como modelos de memória longa, modelos de espaço de estado (ou seja, o modelo de filtro de Kalman) e modelos de vetor autoregressivo (VAR), o que nos levará a outras estratégias comerciais mais sofisticadas. Média de Mudança Integrada Autoregressiva (ARIMA) Modelos de ordem p, d, q Os modelos ARIMA são usados ​​porque podem reduzir uma série não estacionária para uma série estacionária usando uma seqüência de etapas de diferenciação. Podemos lembrar do artigo sobre o ruído branco e as caminhadas aleatórias que, se aplicarmos o operador da diferença a uma série de caminhada aleatória (uma série não estacionária), ficamos com ruído branco (uma série estacionária): comece nabla xt xt - x wt Fim de ARIMA essencialmente executa essa função, mas faz isso repetidamente, d vezes, para reduzir uma série não estacionária para uma estacionária. A fim de lidar com outras formas de não-estacionaridade além das tendências estocásticas, podem ser usados ​​modelos adicionais. Os efeitos da sazonalidade (como os que ocorrem nos preços das commodities) podem ser abordados com o modelo Seasonal ARIMA (SARIMA), no entanto, não discutiremos muito SARIMA nesta série. Os efeitos condicionais heteroscedásticos (como com a integração de volatilidade em índices de ações) podem ser abordados com ARCHGARCH. Neste artigo, estaremos considerando séries não estacionárias com tendências estocásticas e caber modelos ARIMA a essas séries. Nós também produziremos previsões para a nossa série financeira. Definições Antes de definir os processos do ARIMA precisamos discutir o conceito de uma série integrada: Série de ordem integrada d Uma série de tempo está integrada na ordem d. I (d), se: começar nablad xt wt end Isso é, se diferenciamos a série d vezes, recebemos uma série discreta de ruído branco. Alternativamente, usando o Backward Shift Operator, uma condição equivalente é: Agora que definimos uma série integrada, podemos definir o próprio processo ARIMA: Modelo Motivo Integrado Autoregressivo de ordem p, d, q Uma série de tempo é um modelo de média móvel integrada autoregressivo Da ordem p, d, q. ARIMA (p, d, q). Se nablad xt é uma média móvel autorregressiva da ordem p, q, ARMA (p, q). Ou seja, se a série é diferenciada d vezes, e então segue um processo ARMA (p, q), então é uma série ARIMA (p, d, q). Se usarmos a notação polinomial da Parte 1 e Parte 2 da série ARMA, então um processo ARIMA (p, d, q) pode ser escrito em termos do Operador de Deslocamento para trás. : Onde wt é uma série discreta de ruído branco. Há alguns pontos a serem observados sobre essas definições. Uma vez que a caminhada aleatória é dada por xt x wt, pode-se ver que I (1) é outra representação, desde nabla1 xt wt. Se suspeitarmos de uma tendência não linear, então poderemos usar diferenças repetidas (ou seja, d gt 1) para reduzir uma série para o ruído branco estacionário. Em R podemos usar o comando diff com parâmetros adicionais, e. Diff (x, d3) para realizar diferenças repetidas. Simulação, Correlograma e Ajuste do Modelo Uma vez que já utilizamos o comando arima. sim para simular um processo ARMA (p, q), o procedimento a seguir será semelhante ao realizado na Parte 3 da série ARMA. A principal diferença é que agora vamos definir d1, ou seja, produziremos uma série temporal não estacionária com um componente estocástico de tendências. Como antes, vamos ajustar um modelo ARIMA aos nossos dados simulados, tentar recuperar os parâmetros, criar intervalos de confiança para esses parâmetros, produzir um correlograma dos resíduos do modelo ajustado e, finalmente, realizar um teste Ljung-Box para determinar se nós temos um bom ajuste. Vamos simular um modelo ARIMA (1,1,1), com o coeficiente auto - gressivo alfa0,6 e o ​​coeficiente médio móvel beta-0,5. Aqui está o código R para simular e traçar uma série dessas: Agora que temos nossa série simulada, vamos tentar combinar um modelo ARIMA (1,1,1). Uma vez que conhecemos a ordem, simplesmente a especificamos no ajuste: os intervalos de confiança são calculados de acordo com: As estimativas dos dois parâmetros estão dentro dos intervalos de confiança e estão próximas dos valores dos parâmetros verdadeiros da série ARIMA simulada. Portanto, não devemos nos surpreender ao ver os resíduos como uma realização de ruído branco discreto. Finalmente, podemos executar um teste de Ljung-Box para fornecer evidências estatísticas de um bom ajuste: podemos ver que o valor de p é significativamente maior do que 0,05 e, como tal, podemos afirmar que existem fortes evidências de que o ruído branco discreto seja um bom ajuste para os resíduos. Assim, o modelo ARIMA (1,1,1) é um bom ajuste, como esperado. Dados Financeiros e Previsão Nesta seção, vamos encaixar os modelos da ARIMA para a Amazon, Inc. (AMZN) e o Índice de Patrimônio dos EUA SampP500 (GPSC, no Yahoo Finance). Utilizaremos a biblioteca de previsão, escrita por Rob J Hyndman. Vamos prosseguir e instalar a biblioteca em R: Agora, podemos usar o quantmod para baixar a série diária de preços da Amazon desde o início de 2013. Como já teremos tomado as primeiras diferenças de série da série, o ajuste ARIMA realizado em breve irá Não requer d gt 0 para o componente integrado: como na Parte 3 da série ARMA, agora vamos percorrer as combinações de p, d e q, para encontrar o modelo ideal ARIMA (p, d, q). Pelo ideal, queremos dizer a combinação de pedidos que minimiza o Critério de Informação Akaike (AIC): podemos ver que uma ordem de p4, d0, q4 foi selecionada. Notavelmente d0, como já tomamos as diferenças de primeira ordem acima: se traçamos o correlograma dos resíduos, podemos ver se temos evidências de uma série discreta de ruído branco: existem dois picos significativos, a saber, em k15 e k21, embora devêssemos Espera ver picos estatisticamente significativos simplesmente devido à variação de amostragem 5 do tempo. Realize um teste de Ljung-Box (veja o artigo anterior) e veja se temos provas para um bom ajuste: como podemos ver, o valor p é maior que 0,05 e, portanto, temos evidências de um bom ajuste no nível 95. Agora podemos usar o comando de previsão da biblioteca de previsão para prever 25 dias para a série de retornos da Amazônia: podemos ver as previsões de pontos para os próximos 25 dias com 95 (azul escuro) e 99 (azul claro) bandas de erro . Usaremos essas previsões em nossa primeira estratégia de negociação de séries temporais quando combinarmos ARIMA e GARCH. Vamos realizar o mesmo procedimento para o SampP500. Em primeiro lugar, obtemos os dados do quantmod e o convertem em um fluxo de retorno de log diário: encaixamos um modelo ARIMA ao fazer um loop sobre os valores de p, d e q: A AIC nos diz que o melhor modelo é o ARIMA (2,0, 1) modelo. Observe mais uma vez que d0, como já tomamos as diferenças de primeira ordem da série: podemos traçar os resíduos do modelo ajustado para ver se temos evidências de ruído branco discreto: o correlograma parece promissor, então o próximo passo é correr O teste de Ljung-Box e confirmar que temos um bom ajuste de modelo: uma vez que o valor de p é maior do que 0,05, temos evidência de um bom ajuste de modelo. Por que, no artigo anterior, o nosso teste Ljung-Box para o SampP500 mostrou que o ARMA (3,3) era um ajuste ruim para os retornos de registro diários. Observe que eu deliberadamente trituei os dados SampP500 para começar a partir de 2013 nesse artigo , O que exclui convenientemente os períodos voláteis em torno de 2007-2008. Por isso, excluímos uma grande parcela do SampP500 onde tínhamos aglomeração de volatilidade excessiva. Isso afeta a correlação em série da série e, portanto, tem o efeito de tornar a série mais estacionária do que no passado. Este é um ponto muito importante. Ao analisar as séries temporais, precisamos ser extremamente cuidadosos das séries condicionalmente heterossecuásticas, como os índices do mercado de ações. Em finanças quantitativas, a tentativa de determinar períodos de volatilidade diferente é freqüentemente conhecida como detecção de regime. É uma das tarefas mais difíceis de alcançar. Bem, discuta este ponto no próximo artigo quando considerarmos os modelos ARCH e GARCH. Vamos agora traçar uma previsão para os próximos 25 dias dos retornos diários do SampP500. Agora, temos a capacidade de ajustar e prever modelos como o ARIMA, que foram muito próximos de serem capazes de criar indicadores de estratégia para negociação. Próximas etapas No próximo artigo, vamos examinar o modelo de Heteroscedilidade condicional autorregressiva generalizada (GARCH) e usá-lo para explicar mais a correlação serial em certas séries de ações e índice de ações. Uma vez que discutimos o GARCH, estaremos em condições de combiná-lo com o modelo ARIMA e criar indicadores de sinal e, portanto, uma estratégia básica de negociação quantitativa. Clique abaixo para aprender mais sobre. A informação contida neste site é a opinião dos autores individuais com base em sua observação pessoal, pesquisa e anos de experiência. A editora e seus autores não são conselheiros de investimento registrados, advogados, CPAs ou outros profissionais de serviços financeiros e não prestam assessoria jurídica, fiscal, contábil, de investimento ou outros serviços profissionais. A informação oferecida por este site é apenas de educação geral. Como cada situação factual de indivíduos é diferente, o leitor deve procurar seu próprio conselheiro pessoal. Nem o autor nem o editor assumem qualquer responsabilidade ou responsabilidade por quaisquer erros ou omissões e não devem ter responsabilidade nem responsabilidade para qualquer pessoa ou entidade em relação a danos causados ​​ou alegadamente causados ​​direta ou indiretamente pelas informações contidas neste site. Use por sua conta e risco. Além disso, este site pode receber compensações financeiras das empresas mencionadas através de publicidade, programas afiliados ou de outra forma. Taxas e ofertas de anunciantes exibidos neste site mudam com freqüência, às vezes sem aviso prévio. Enquanto nos esforçamos para manter informações precisas e oportunas, os detalhes da oferta podem estar desactualizados. Os visitantes devem assim verificar os termos de tais ofertas antes de participar delas. O autor e sua editora não se responsabilizam por atualizar a informação e negar a responsabilidade pelo conteúdo, produtos e serviços de terceiros, inclusive quando acessados ​​através de hiperlinks ou propagandas neste site. AR modelo: um modo de autorregressão é uma regressão da variável contra si mesma (passado Valores da variável de previsão). Um modelo autoregressivo de ordem p, AR (p) pode ser escrito como y t c 1 y t 1 2 y t 2 p y t p e t. Onde c é uma constante e e t é ruído branco. Modelo MA: Em contraste com o modelo AR, um modelo de média móvel usa erros de previsão passados ​​em um modelo similar a regressão. Um modelo de média móvel da ordem q, MA (q) pode ser escrito como y t c e t 1 e t 1 2 e t 2 q e t q. Onde e t é ruído branco. Em ambos os casos, o termo de erro é ruído branco. E da fórmula acima, podemos ver claramente como os termos de erro são modelados de forma diferente nos dois modelos. Em um modelo AR, os valores atrasados ​​de y t são preditores. E o termo de erro e t no modelo é como o termo de erro em uma regressão linear múltipla. Em um modelo de MA, os erros de previsão do passado são preditores. Uma coisa a notar é que é possível escrever qualquer modelo de AR (p) estacionário como um modelo de MA infinito e um (MA) (inversível) pode ser escrito como AR infinito. FYI, você pode encontrar algumas descrições de conceitos detalhadas em www2.sasproceedingssugi28252-28.pdf e a relação entre modelo AR estacionário e modelo MA em otexts. orgfpp84.

Comments

Popular Posts