Uma maneira realmente boa de encontrar periodicidade em qualquer série regular de dados é inspecionar seu espectro de potência depois de remover qualquer tendência geral. (Isso se presta bem ao rastreamento automatizado quando a energia total é normalizada para um valor padrão, como a unidade.) A remoção de tendência preliminar (e a diferenciação opcional para remover a correlação serial) é essencial para evitar períodos de confusão com outros comportamentos. O espectro de potência é a transformada de Fourier discreta da função de autocovariância de uma versão apropriadamente atenuada da série original. Se você pensar na série temporal como amostragem de uma forma de onda física, é possível estimar quanto da potência total das ondas é transportada dentro de cada frequência. O espectro de energia (ou periodograma) representa a potência versus frequência. Cíclico (isto é, padrões repetitivos ou sazonais) aparecerá como grandes picos localizados em suas freqüências. Como exemplo, considere esta série temporal (simulada) de resíduos de uma medição diária feita por um ano (365 valores). Os valores flutuam em torno de 0 sem nenhuma tendência evidente, mostrando que todas as tendências importantes foram removidas. A flutuação parece aleatória: nenhuma periodicidade é aparente. Heres outro enredo dos mesmos dados, desenhado para nos ajudar a ver possíveis padrões periódicos. Se você parecer muito difícil, poderá discernir um padrão ruidoso, mas repetitivo, que ocorre de 11 a 12 vezes. As sequências mais longas dos valores acima de zero e abaixo de zero, pelo menos, sugerem alguma autocorrelação positiva, mostrando que essa série não é completamente aleatória. Heres o periodograma, mostrado para frequências até 91 (um quarto do comprimento total da série). Foi construído com uma janela Welch e normalizado para a área da unidade (para todo o periodograma, não apenas a parte mostrada aqui). O poder parece com ruído branco (pequenas flutuações aleatórias) mais dois picos proeminentes. Eles são difíceis de perder, mas o maior ocorre em um período de 12 e o menor em um período de 52. Esse método detectou um ciclo mensal e um ciclo semanal nesses dados. Isso é realmente tudo que existe para isso. Para automatizar a detecção de ciclos (sazonalidade), basta verificar o periodograma (que é uma lista de valores) para máximos locais relativamente grandes. É hora de revelar como esses dados foram criados. Os valores são gerados a partir de uma soma de duas ondas senoidais, uma com frequência 12 (de amplitude quadrada 3/4) e outra com frequência 52 (de amplitude quadrada 1/4). Estes são o que os picos no periodograma detectaram. Sua soma é mostrada como a curva preta grossa. O ruído normal de variação 2 foi então adicionado, como mostrado pelas barras cinza claro que se estendem da curva preta aos pontos vermelhos. Esse ruído introduziu as oscilações de baixo nível na parte inferior do periodograma, que de outra forma seria apenas um plano 0. Totalmente dois terços da variação total nos valores é não-periódico e aleatório, o que é muito barulhento: é por isso que É tão difícil distinguir a periodicidade apenas olhando para os pontos. No entanto (em parte porque existem muitos dados) encontrar as frequências com o periodograma é fácil e o resultado é claro. Instruções e bons conselhos para o cálculo de periodogramas aparecem no site Receitas Numéricas: procure a seção sobre estimativa de espectro de energia usando a FFT. R tem código para estimativa de periodograma. Essas ilustrações foram criadas no Mathematica 8 e o periodograma foi computado com a função de Fourier. O problema é que depois de eliminar qualquer tendência geral, o calcanhar de Aquiles pode ter muitas tendências temporais, muitas mudanças de nível, todas elas excluídas em seu exemplo. A idéia de que as séries de insumos são de natureza determinista voa na escala de Aquiles. face à possível presença da estrutura ARIMA sazonal e regular. Os valores únicos não-usuais não-distorcidos distorcerão qualquer esquema de identificação baseado em periodograma devido a um viés de baixa para as estimativas do periodograma, gerando não-significância. Se os efeitos semanais e / ou mensais mudaram em algum momento no passado, o procedimento baseado em periodograma falharia ndash IrishStat Sep 29 11 at 0:06 Irish Eu acho que seu comentário pode exagerar um pouco. É mais elementar procurar e tratar "Unusual One-Time Valuesquot" (ou seja, outliers), portanto, é importante mencionar que alguns estimadores de séries temporais podem ser sensíveis a outliers. "Natureza determinista na natureza" representa erroneamente as idéias básicas: ninguém supõe que haja determinismo (como evidenciado pela enorme quantidade de ruído na simulação). A simulação incorpora um sinal periódico definido como modelo - sempre aproximado na realidade - apenas para ilustrar a conexão entre o periodograma e a sazonalidade. (Continua.) Ndash whuber 9830 Set 29 11 at 16:41 Sim, mudanças na sazonalidade podem obscurecer o periodograma (e o acf, etc.), especialmente mudanças na frequência (improvável) ou fase (possível). As referências no meu post dão uma solução para lidar com isso: elas recomendam o uso de uma janela móvel para estimativa do periodograma. Há uma arte para isso, e claramente há armadilhas, de modo que muitas análises de séries temporais serão beneficiadas por um tratamento especializado, como você defende. Mas a questão pergunta se existem outros métodos para detectar sazonalidade e, inegavelmente, o periodograma é uma opção estatisticamente poderosa, computacionalmente eficiente e prontamente interpretável. ndash whuber 9830 Sep 29 11 at 16:46 No meu mundo usando senos / cossenos são efeitos "determinísticos" muito parecidos com os indicadores do mês do ano. A montagem de qualquer modelo pré-especificado restringe os valores ajustados a um padrão especificado pelo usuário, muitas vezes abaixo do padrão. Os dados devem ser "listados" para ajudar o analista / software de computador avançado a discernir efetivamente entre entradas fixas e estocásticas n. b. Refiro-me às estruturas de defasagem ARIMA como distribuidores estocásticos ou adaptativos, já que os valores ajustados se ajustam / se adaptam às mudanças no histórico da série. Na minha opinião, a utilização do periodograma é uma simples modelagem estatística, que pode não ser útil. Repetir a mesma coisa pode não ser útil. No entanto, pode ser bom também fixar o parágrafo abaixo do periodograma para dizer que os picos estão localizados em uma frequência de 12 e 52 vezes por ano, e não de um período de tempo. Consertar o enredo também para dizer "frequência" em vez de "período" pode ser bom também, se você acha que não é muito chato. ndash Celelibi Oct 11 em 15:29 A sazonalidade pode e muda frequentemente ao longo do tempo, portanto, as medidas sumárias podem ser bastante inadequadas para detectar a estrutura. É preciso testar a transitoriedade nos coeficientes ARIMA e, com frequência, alterar os manequins sazonais. Por exemplo, em um horizonte de 10 anos pode ter havido efeito de junho para os primeiros k anos, mas os últimos 10-k anos há evidências de um efeito de junho. Um efeito composto simples de junho pode não ser significativo, uma vez que o efeito não foi constante ao longo do tempo. De maneira semelhante, um componente ARIMA sazonal também pode ter mudado. Deve-se tomar cuidado para incluir mudanças no nível local e / ou tendências do tempo local, garantindo que a variação dos erros permaneça constante ao longo do tempo. Não se deve avaliar transformações como GLS / weighted least Squares ou transformações de poder como logs / raízes quadradas, etc. nos dados originais, mas nos erros de um modelo tentativa. As suposições gaussianas não têm nada a ver com os dados observados, mas sim com os erros do modelo. Isto é devido aos fundamentos dos testes estatísticos que usam a razão de uma variável não central do qui-quadrado para uma variável central do qui-quadrado. Se você quisesse publicar uma série de exemplos do seu mundo, eu ficaria feliz em fornecer a você e à lista uma análise completa, levando à detecção da estrutura sazonal. respondido 27 set 11 at 18:36 Charlies responder é bom, e é onde eu começo. Se você não quiser usar gráficos ACF, você pode criar variáveis dummy k-1 para os períodos de tempo k presentes. Então você pode ver se as variáveis dummy são significativas em uma regressão com as variáveis dummy (e provavelmente um termo de tendência). Se os seus dados forem trimestrais: dummy Q2 é 1 se este for o segundo trimestre, mais 0 dummy Q3 é 1 se este for o terceiro trimestre, mais 0 dummy Q4 é 1 se for o quarto trimestre, senão 0 Note que trimestre 1 é o Caso base (todos os 3 dummies zero) Você pode querer também verificar a decomposição de séries temporais no Minitab - muitas vezes chamada de decomposição clássica. No final, você pode querer usar algo mais moderno, mas este é um lugar simples para começar. Eu sou um pouco novo para R eu, mas o meu entendimento da função ACF é que, se a linha vertical vai acima da linha tracejada superior ou abaixo da linha tracejada inferior, há alguma auto-regressão (incluindo a sazonalidade) . Tente criar um vetor de seno respondido setembro 27 11 at 15:47 Encaixe sines / cosines etc pode ser útil para alguma série temporal física / elétrica, mas você deve estar ciente de MSB. Tendência de Especificação de Modelo. ndash IrishStat Sep 28 11 at 14:31 Autoregression não implica sazonalidade. ndash Jens Nov 22 13 at 12:32 Sua Resposta 2016 Stack Exchange, IncMetaTrader 4 - Sistemas de Negociação Econometria EURUSD One-Step-Ahead Forecast Introdução O artigo foca na previsão de um passo para o EURUSD usando o software EViews e uma avaliação adicional da previsão resultados por meio do programa em EViews e um Expert Advisor desenvolvido em MQL4. É construído no artigo Analisando os Parâmetros Estatísticos dos Indicadores cujas proposições serão usadas sem quaisquer esclarecimentos adicionais. 1. Construindo um Modelo O artigo anterior terminou com a análise da seguinte equação de regressão: EURUSD C (1) EURUSDHP (1) C (2) D (EURUSDHP (1)) C (3) D (EURUSDHP (2)) A equação foi resultado da implementação da decomposição gradual das cotações de fechamento iniciais. A idéia por trás disso é baseada na separação de um componente determinístico das cotas iniciais e em uma análise adicional do residual resultante. Vamos começar a construir um modelo para o EURUSD H1 nas barras durante um período de uma semana, de 12 de setembro de 2011 a 17 de setembro de 2011. 1.1. Análise das cotações iniciais do EURUSD Começamos com a análise da série inicial EURUSD para planejar o próximo passo. Primeiro, vamos criar um arquivo contendo cotações para análise posterior no EViews. Para isso, uso um indicador sobreposto em um gráfico relevante para gerar um arquivo obrigatório com aspas. O script do indicador é mostrado abaixo e na minha opinião não precisa de comentários. Tendo definido as datas especificadas acima, obtive o arquivo de citações que consiste em 119 linhas, a última linha sendo Previsão, 0 é onde a previsão futura será. Tenha em mente que estou usando preços em aberto. Observe também que as citações no arquivo são organizadas na ordem oposta à do MQL 4, ou seja, como nas linguagens de programação. O indicador obviamente gera o arquivo quotes. txt nos arquivos expert da pasta de terminal. O Expert Advisor que será analisado a seguir tomará o arquivo de aspas da pasta especificada quando estiver operando nos modos DEMO ou REAL, no entanto, quando usado no modo de teste, este arquivo deve estar localizado na pasta testerfiles, então estou colocando aspas. txt manualmente na pasta testerfiles do terminal. Aqui está o gráfico: Figura 1. Gráfico de cotações EURUSD H1 Podemos observar uma ou várias tendências, mas nosso objetivo é prever a estabilidade futura do sistema de negociação. Portanto, vamos realizar uma análise para estacionaridade das cotações iniciais do EURUSD H1. Vamos calcular as estatísticas descritivas: Fig. 2. Estatística descritiva As estatísticas descritivas sugerem que: Existe uma inclinação para a direita (deve ser 0 enquanto temos 0,244950) A probabilidade de nossas cotações iniciais serem distribuídas normalmente é de 9,64. Visualmente, o histograma certamente não tem nada a ver com a distribuição normal, mas a probabilidade de 9,64 dá origem a certas ilusões. Vamos demonstrá-lo em comparação com a teoria: Fig. 3. Histograma EURUSD em relação à curva de distribuição normal teórica Podemos verificar visualmente se as cotas EURUSD 1 estão longe de serem distribuídas normalmente. No entanto, ainda é cedo para tirar uma conclusão, como podemos ver a tendência sugerindo a presença de um componente determinístico nas citações, enquanto a presença de tal componente pode distorcer completamente as características estatísticas da variável aleatória (cotações). Vamos calcular a função de autocorrelação das cotas. Aparece da seguinte forma: Fig. 4. Função de autocorrelação das cotas EURUSDH1 Ao traçar o gráfico, obtivemos uma probabilidade de falta de correlação entre os lags - é diferente de zero para os primeiros 16 lags. O gráfico e a probabilidade sugerem claramente que existe correlação entre as defasagens em EURUSDH1, ou seja, as cotações em consideração contêm um componente determinístico. Se o componente determinístico é subtraído das cotações iniciais, que características estatísticas o residual terá Para esse propósito, aplicaremos um teste de raiz unitária para ver se é mais prospectivo trabalhar com a primeira diferença (residual) das cotações iniciais. Tabela 1. Teste de raiz unitária O teste acima mostra que: A probabilidade de as cotas iniciais terem uma raiz unitária (a primeira diferença é normalmente distribuída) é 41 A estatística DW (Durbin-Watson) está um pouco acima de 2.2, o que também sugere que o primeiro diferença é normalmente distribuída. Conclusão: seria razoável prejudicar a série de preços e, posteriormente, analisar o residual em detrimento. O filtro Hodrick-Prescott será usado para separar o componente determinístico das cotas do EURUSD, por analogia com o artigo anterior. O número 10 nos nomes das séries denota o parâmetro lambda no filtro Hodrick-Prescott. Com base na teoria por trás dessa ferramenta, o valor de lambda é de grande importância para o resultado que parece ser o seguinte: Fig. 5. O resultado da suavização usando o filtro de Hodrick-Prescott Usaremos a equação do artigo anterior que, no As notações EViews aparecem da seguinte forma: citações C (1) HP (-1) C (2) D (HP (-1)) C (3) D (HP (-2)), ou seja, nesta equação, levamos em conta a componente determinista e ruído pelo qual entendemos a diferença entre as cotas iniciais e seu componente determinístico. Após a análise do modelo atual das cotações iniciais, obtemos os seguintes parâmetros da equação de regressão: Tabela 2. Estimativa da equação de regressão A probabilidade de 39 do coeficiente ser zero se 1D (-1) é certamente extremamente desagradável. Vamos deixar tudo como está, pois o exemplo que vamos fornecer é para fins de demonstração. Tendo obtido as estimativas das equações de regressão (estimativa dos coeficientes das equações), podemos avançar para a previsão de um passo à frente. O resultado é o seguinte: Fig. 6. Previsão de um passo à frente do EURUSD (às 12 horas de segunda-feira) 1.3. Estimando resíduos da equação de regressão Vamos realizar uma análise limitada do resíduo a partir da equação de regressão. Este residual foi obtido subtraindo os valores calculados usando a equação de regressão das cotas iniciais do EURUSD. Deixe-me lembrá-lo de que as características desse resíduo nos ajudarão a estimar a estabilidade futura do sistema de negociação. Primeiro, executaremos um teste para a análise das correlações entre as defasagens no residual: Fig. 7. Função de autocorrelação do resíduo Infelizmente, as correlações entre as defasagens ainda estão presentes e sua presença lança dúvidas sobre a análise estatística. O próximo teste que vamos realizar é o teste de normalidade do residual. O resultado aparece da seguinte forma: Fig. 8. Histograma do resíduo da equação de regressão A probabilidade de o resíduo ser normalmente distribuído é de 25,57, o que é uma figura bastante grande. Vamos realizar testes para heteroscedasticidade do residual. Os resultados são os seguintes: A probabilidade de que a heterocedasticidade do tipo GARCH esteja ausente é 16.08 A probabilidade de que a heterocedasticidade geral dos brancos esteja ausente é 0.0066 Conclusões: após a diferenciação, obtivemos um resíduo com 25 probabilidade de ser normalmente distribuído e um próximo probabilidade zero de estar livre de correlações e podemos rejeitar estritamente a hipótese de que a heterocedasticidade geral dos brancos esteja ausente. Isto implica que o nosso modelo é bastante cru e requer que nós eliminemos as correlações entre as defasagens para serem testadas novamente para a heterocedasticidade mais uma vez e modelemos tal heterocedasticidade no caso de estar presente. Como meu objetivo é demonstrar o desenvolvimento do sistema de negociação com base na previsão, continuarei os cálculos para obter as características que interessam aos comerciantes - lucro ou prejuízo. 2. Estimando os resultados da previsão Ao negociar, estamos interessados no lucro, e não no erro de previsão, que deve ser tomado como uma ferramenta de análise auxiliar para comparação de modelos diferentes, mas não mais do que isso. Para estimar os resultados da previsão, foi escrito um programa na linguagem EViews. Compara os movimentos incrementais reais das cotas do EURUSD com os previstos. Se esses acréscimos coincidirem, haverá lucro, se não houver, haverá perda. Além disso, calculamos o lucro que representa a soma de todos os incrementos coincidentes com os incrementos previstos e a respectiva perda. A relação lucro a prejuízo é designada como um fator de lucro. Em seguida, calculamos a proporção entre incrementos lucrativos e não lucrativos (relação lucro / prejuízo). O número de negociações de perdas consecutivas e a razão de perda em negociações de perdas consecutivas para lucro (fator de recuperação) também são calculadas. O programa na linguagem EViews para estimar os resultados da modelagem em termos de sistema de negociação consiste no programa principal e em duas sub-rotinas. O programa principal (head) é o seguinte: Assume-se que o número dos programas principais é igual ao número de sub-rotinas contendo modelos (veja abaixo), isto é feito para simplificação do trabalho. A mudança no modelo requer uma mudança em duas linhas do programa principal relacionadas à mudança no nome da sub-rotina para o modelo. A sub-rotina contendo o modelo (equação de regressão): O número de sub-rotinas deve ser igual ao número de modelos. Para outro modelo, o nome da sub-rotina e, naturalmente, os nomes no programa principal devem ser alterados. Sub-rotina que calcula parâmetros de lucro / perda para o modelo: Os resultados dos programas simples acima em EViews para nossa equação são os seguintes: Tabela 3. Resultados de estimativa de lucratividade em EViews O resultado é lamentável: a perda é três vezes maior do que lucro. E isso é apesar do valor de erro de previsão otimista de 19 pips. O modelo precisa de melhorias, mas não vou fazê-lo aqui no artigo. Vou continuar trabalhando nele no fórum junto com todos aqueles que desejam participar do desenvolvimento de um modelo lucrativo. Até agora, as cotações do EURUSDH1 foram analisadas usando as ferramentas do EViews. No entanto, parece ser muito tentador aplicar os resultados da previsão em um Expert Advisor do terminal MetaTrader 4. Vamos agora considerar a troca de dados entre o EViews e o MetaTrader 4 e depois analisar novamente os resultados usando um Expert Advisor no MetaTrader 4. 3. Intercâmbio de dados entre o EViews e o MetaTrader 4 A troca de dados entre o EViews e o MetaTrader 4 neste artigo é implementada usando arquivos. txt. O algoritmo de troca parece ser o seguinte: Expert Advisor MetaTrader 4: Inicia a operação em resposta a um comando do Expert Advisor Executa um programa de cálculo de previsão para o arquivo de cotações quote. txt obtido do Expert Advisor Salva os resultados da previsão no EViewsForecast. arquivo txt. Conselheiro Especialista MetaTrader 4: Após a conclusão da geração dos resultados no EViews. lê o arquivo de previsão Decide entrar ou sair de uma posição. Algumas palavras sobre a localização dos arquivos. Os arquivos do terminal MetaTrader 4 são colocados em suas pastas padrão: um Expert Advisor na pasta de especialistas e um indicador (que não é necessário para teste) na pasta expertindicators. Todos esses estão localizados no diretório do terminal. O Expert Advisor é instalado junto com outros Expert Advisors. Os arquivos para troca entre o Expert Advisor e o EViews estão localizados em arquivos especializados durante a operação do Expert Advisor e na pasta testerfiles ao testar o Expert Advisor. O arquivo enviado pelo Expert Advisor para o EViews é chamado de cotações. txt independentemente do símbolo selecionado e do período de tempo. Portanto, o Expert Advisor pode ser anexado a qualquer símbolo, enquanto a etapa de previsão deve ser especificada nos parâmetros do Expert Advisor em seu início. O EViews retorna o arquivo chamado EVIEWSFORECAST. txt. O arquivo de trabalho do EViews, worf. wf1, é colocado no diretório do terminal. Os diretórios especificados nos programas do EViews anexados ao artigo provavelmente não corresponderão aos diretórios disponíveis em seus computadores. Eu instalei esses programas na pasta raiz do disco. No EViews, você terá que obter um identificador no diretório padrão ou especificar seus próprios diretórios (eu não usei os diretórios padrão utilizados pelo próprio EViews). 4. Expert Advisor MQL4 O algoritmo de operação Expert Advisor é simplificado ao máximo: O Expert Advisor é anexado ao intervalo de tempo M1 de qualquer símbolo. Uma etapa de previsão em minutos é especificada nos parâmetros do Expert Advisor. A etapa de previsão padrão é de 60 minutos (1). Ao anexar o Expert Advisor ao M1, você terá a oportunidade de visualizar melhor os resultados do teste, pois o gráfico de teste pode ser compactado ao alternar para um período de tempo mais longo. Para fins de previsão no EViews. o Expert Advisor gera o arquivo. txt com o número de barras (observações), conforme especificado nos parâmetros do Expert Advisor. Se a previsão for maior que o preço atual, uma posição longa será aberta. Se a previsão for menor que o preço atual, uma posição curta é aberta O Expert Advisor não abre mais de uma posição (sem adicionar a uma posição) Independentemente da previsão, ela fecha a posição anterior e abre a nova. O algoritmo para a abertura de posições coincide com o algoritmo para calcular o lucro / perda no programa em EViews. O volume da posição a ser aberta é de 0,1 lote Stop loss e take profit orders não são usados (eles são definidos em 100 pips embora o O Expert Advisor possui um código para colocar stops nos intervalos de erro de previsão. Um gráfico é desenhado mostrando o valor da previsão e duas linhas em um intervalo de erro de previsão padrão. Ao visualizar o gráfico do testador em períodos de tempo mais curtos do que aquele ao qual o Expert Advisor foi anexado, lembre-se de que a linha de previsão é deslocada de volta, ou seja, a previsão desenhada é a previsão na qual o preço atual deve chegar no final do período. O Expert Advisor é anexado ao período M1 enquanto no testador, o gráfico é melhor visualizado no M5. O código-fonte do Expert Advisor MQL4 para negociação do EURUSD não é fornecido neste artigo devido ao seu volume (cerca de 600 linhas). Pode ser encontrado em EvewsMT4.mq4 no arquivo EViewsMetaTrader4.zip anexado ao artigo. 5. Resultados do teste do Expert Advisor Execute o Expert Advisor no testador no período M1. Os parâmetros de entrada são mostrados abaixo. Fig. 9. Parâmetros de entrada do Expert Advisor Um fragmento do gráfico de teste é demonstrado abaixo: Fig. 10. Teste do Expert Advisor no modo de visualização Os resultados do teste do Expert Advisor que usa previsões de uma hora (passo) à frente são mostrados abaixo. Relatório do Avaliador da Estratégia Fig. 11. Resultados do Teste do Expert Advisor Os resultados são melhores do que aqueles obtidos no EViews. Observe que o cálculo dos resultados no EViews e no testador é diferente em termos de dados de entrada. O EViews usa 118 barras e calcula a previsão a partir da barra 3 à esquerda, à medida que a previsão de um passo à frente está gradualmente se aproximando do final do período de tempo, aumentando o número de barras usadas na estimativa da equação de regressão. O Expert Advisor desloca a janela de 118 barras e calcula a previsão na barra 119, ou seja, a equação de regressão é sempre estimada em 118 barras, pois o EViews expande a janela na amostra e o Expert Advisor desloca a janela de largura fixa. O Expert Advisor nos ajuda a produzir uma tabela de estimativa de modelo estendida. Enquanto a tabela acima consistia em uma única linha, ela agora contém 117 linhas - para cada data para a qual a previsão foi produzida. A tabela é a seguinte: Início da amostra Fim da amostra Lucro da amostra Perda da amostra Quantidade de perdas P / F nas observações Tabela 4. Resultados do teste no EViews A tabela sugere que nosso modelo (tão primitivo e inacabado) é praticamente sem esperança. Precisa de melhorias. Vamos plotar os gráficos das duas colunas: P / F em pips e P / F em observações. Fig. 12. Gráficos de fator de lucro do modelo na amostra de 118 barras Este gráfico representa a dependência dos fatores de lucro no número de barras na análise. Existe uma tendência de subida óbvia. Vamos verificar os resultados na amostra de 238 barras. O gráfico desenhado é o seguinte: Fig. 13. Gráficos do fator de lucro do modelo na amostra de 236 barras O fato de os gráficos do fator de lucro diferirem sugere que o modelo é instável. Conclusão O artigo tratou do uso de previsões de um passo à frente produzidas pelo EViews para o desenvolvimento do Expert Advisor no MetaTrader 4. O resultado negativo que obtivemos indica que construir um modelo no EViews é uma tarefa bastante complicada que, no entanto, parece ser mais potencialmente produtivo do que o desenvolvimento intuitivo de Consultores Especialistas. Análise de Regressão O objetivo da análise de regressão é descrever a relação entre duas variáveis com base em dados observados e predizer o valor da variável dependente com base no valor da variável independente. Mesmo que possamos fazer tais previsões, isso não implica que podemos reivindicar qualquer relação causal entre as variáveis independentes e dependentes. Definição 1. Se y é uma variável dependente e x é uma variável independente, o modelo de regressão linear fornece uma previsão de y de x da forma em que x é a parte determinística do modelo e é o erro aleatório. Além disso, assumimos que, para qualquer valor dado de x, o erro aleatório é distribuído normalmente e independentemente com a média zero. Observação. Na prática, construiremos o modelo de regressão linear a partir dos dados da amostra usando o método dos mínimos quadrados. Assim, buscamos os coeficientes aeb tais que, para os dados em nossa amostra, teremos onde i é o valor de y predito pelo modelo em x i. Assim, o termo de erro para o modelo é dado pelo Exemplo 1. Para cada valor de x nos dados de amostra do Exemplo 1 do Teste de Hipótese de Amostra para Correlação. encontre o valor previsto correspondente a x. isto é, o valor de y na linha de regressão correspondente a x. Também encontrar a expectativa de vida prevista de homens que fumam 4, 24 e 44 cigarros com base no modelo de regressão. Figura 1 Obtendo valores previstos para dados no Exemplo 1 Os valores previstos podem ser obtidos usando o fato de que para qualquer i. o ponto (x i. i) está na linha de regressão e, portanto, eu bx i. Por exemplo. A célula K5 na Figura 1 contém a fórmula I5E4E5, onde I5 contém o primeiro valor x 5, E4 contém a inclinação b e E5 contém a intercepção y (referindo-se à planilha na Figura 1 do Método dos Mínimos Quadrados). Como alternativa, esse valor pode ser obtido usando a fórmula FORECAST (I5, J5: J19, I5: I19). De fato, os valores previstos de y podem ser obtidos, como uma única unidade, usando a fórmula de matriz TREND. Isso é feito destacando o intervalo K5: K19 e inserindo a fórmula de matriz TREND (J5: J19, I5: I19) seguida pressionando Ctrl-Shft-Enter. Os valores previstos para x 4, 24 e 44 podem ser obtidos de maneira similar usando qualquer um dos três métodos definidos acima. A segunda forma da fórmula TREND pode ser usada. Por exemplo. para obter os valores previstos de 4, 24 e 44 (armazenados em N19: N21), realce o intervalo O19: O21, insira a fórmula de matriz TREND (N19: N21, J5: J19, I5: I19) e pressione Ctrl-Shft - Entrar. Observe que essas abordagens produzem valores previstos mesmo para valores de x que não estão na amostra (como 24 e 44). A expectativa de vida prevista para homens que fumam 4, 24 e 44 cigarros é de 83,2, 70,6 e 58,1 anos, respectivamente. Definição 2. Usamos a seguinte terminologia: O residual é o termo de erro da definição 1. Também definimos os graus de liberdade df T. df Reg. df Res. a soma dos quadrados SS T. Reg. SS SS Res e os quadrados médios MS T. MS Reg. MS Re da seguinte forma: Observação. SS T é a variabilidade total de y (por exemplo, a variabilidade da esperança de vida no Exemplo 1 do Teste de Hipótese para uma Amostra para Correlação). SS Reg representa a variabilidade de y que pode ser explicada pelo modelo de regressão (isto é, a variabilidade na expectativa de vida que pode ser explicada pelo número de cigarros fumados), e assim pela Propriedade 1, SS Res expressa a variabilidade de y que não pode ser explicado pelo modelo de regressão. Assim SS Reg / SS T representa a porcentagem da variabilidade de y que pode ser explicada pelo modelo de regressão. Acontece que isso é igual ao coeficiente de determinação. Observação: Observe que, para um tamanho de amostra de 100, um coeficiente de correlação tão baixo quanto 0,197 resultará na hipótese nula de que o coeficiente de correlação populacional é 0 rejeitado (segundo o Teorema 1 do Teste de Hipóteses de uma Amostra para Correlação). Mas quando o coeficiente de correlação r .197, então r 2 .039, o que significa que a variância do modelo SS Reg é inferior a 4 da variância total SS T, que é de fato uma associação muito pequena. Considerando que este efeito é significativo, certamente não é muito grande. Observação. Da propriedade 2, vemos que o coeficiente de determinação r 2 é uma medida da precisão da predicação do modelo de regressão linear. r 2 tem um valor entre 0 e 1, com 1 indicando um ajuste perfeito entre o modelo de regressão linear e os dados. Definição 3. O erro padrão da estimativa é definido como Observação. A segunda asserção na Propriedade 4 pode ser re-configurada como Para grandes amostras 1 e assim Note que se r .5, então que indica que o erro padrão da estimativa ainda é 86.6 do erro padrão que não considera nenhuma informação sobre x ie informações sobre x apenas reduzem o erro em 13,4. Mesmo se r .9, então s y. x .436s y. que indica que a informação sobre x reduz o erro padrão (sem informações sobre x) por apenas um pouco acima de 50. a) As somas dos valores y são iguais à soma dos valores ie b) A média dos valores y e os valores são iguais ie a média do ic) As somas dos termos de erro são 0 ie 0 e) O coeficiente de correlação de y com é o valor absoluto do coeficiente de correlação de x com y ie f) O coeficiente de determinação de y com é o mesmo que o coeficiente de correlação de x com y, ou seja, Observação. Clique aqui para as provas das várias propriedades descritas acima. Amanda Steele diz: Eu apreciaria algumas orientações - estou ajudando com um estudo projetado para avaliar se uma pontuação pré-operatória em uma determinada escala (escores contínuos de 1-100) pode prever resultados pós-operatórios (também pontuados em escalas contínuas de 1-100) . Isto parece ser uma situação de regressão bastante direta para mim, mas usando o pacote realstats parece que estou correndo em problemas desde que eu tenho 1 variável independente (pontuação pré-op) e várias variáveis dependentes (pontuações pós-op). Você pode sugerir uma estratégia de análise Amanda, Você pode regressões múltiplas, uma para cada variável dependente. Isso deve ser suficiente se houver pouca correlação entre as variáveis dependentes. Como alternativa, você pode usar a regressão linear múltipla multivariada. A saída inicial é idêntica à das regressões múltiplas separadas, mas análises adicionais são realizadas. O Real Statistics Resource Pack não suporta essa segunda etapa ainda. Charles Caro Charles, tenho uma amostra de 30 para medir os fatores que limitam a adoção da tecnologia. Estou pensando em executar a análise de regressão para a taxa de adoção (se for mais do que 50 considerado como 1 e menor que 50 é 0 tomando 50% de adoção como limite). para medir os fatores limitantes. Eu usei a escala likert de 5 pontos. (altamente significativo a menos significativo) e já extraiu variáveis importantes usando a análise de componentes principais. Agora, que tipo de análise de regressão devo usar para medir a importância relativa de cada fator? Linear ou múltiplo. Quando você diz 8220multiple8221, presumo que você signifique 8220m regressão linear múltipla8221, o que significa apenas que você tem mais de uma variável independente. Quando você tem apenas uma variável independente, muitas vezes o termo 8220 linear regressão 8221 ou 8220 simples regressão linear 8221 é usado. Já que você diz que tem múltiplos fatores, muitas vezes você usaria a regressão linear múltipla. Como seu resultado (variável dependente) pode ser visto como dicotômico (0 ou 1), você pode descobrir que a regressão logística fornece um melhor ajuste para os dados. Você pode comparar os valores da AIC para isso.
Comments
Post a Comment