Sunday 17 September 2017

Média Móvel Centralizada Youtube


Ao calcular uma média móvel em execução, colocar a média no período de tempo médio faz sentido No exemplo anterior, calculamos a média dos primeiros 3 períodos de tempo e colocamos ao lado do período 3. Poderíamos ter colocado a média no meio do Intervalo de tempo de três períodos, isto é, ao lado do período 2. Isso funciona bem com períodos de tempo estranhos, mas não tão bons para períodos de tempo iguais. Então, onde colocamos a primeira média móvel quando M 4 Tecnicamente, a Média Móvel cairá em t 2,5, 3,5. Para evitar este problema, suavizamos as MAs usando M 2. Assim, suavizamos os valores suavizados. Se medimos um número par de termos, precisamos suavizar os valores suavizados. A tabela a seguir mostra os resultados usando M 4.David, Yes, MapReduce é Destinado a operar em uma grande quantidade de dados. E a idéia é que, em geral, o mapa e reduzir as funções não devem se preocupar com quantos mapeadores ou quantos redutores existem, isso é apenas otimização. Se você pensa cuidadosamente sobre o algoritmo que postei, você pode ver que não importa qual mapeador recebe as partes dos dados. Cada registro de entrada estará disponível para cada operação de redução que o necessite. Ndash Joe K 18 de setembro 12 às 22:30 Na melhor das minhas compreensões, a média móvel não é bem mapas para o paradigma MapReduce, uma vez que seu cálculo é basicamente uma janela deslizante sobre dados classificados, enquanto o MR é o processamento de intervalos não interceptados de dados classificados. A solução que vejo é a seguinte: a) Implementar partição personalizada para poder fazer duas partições diferentes em duas execuções. Em cada execução, seus redutores obterão diferentes faixas de dados e calcularão a média móvel quando apropriado vou tentar ilustrar: Em dados da primeira execução para os redutores devem ser: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . Aqui você irá calcular a média móvel para alguns Qs. Na próxima execução, seus redutores devem ter dados como: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 E caclule o resto das médias móveis. Então você precisará agregar resultados. Idéia de compartilhamento personalizado que terá dois modos de operação - cada vez que se divide em intervalos iguais, mas com alguma mudança. Em um pseudocódigo, será assim. Partição (keySHIFT) (MAXKEYnumOfPartitions) onde: SHIFT será retirado da configuração. MAXKEY valor máximo da chave. Eu assumo por simplicidade que eles começam com zero. RecordReader, IMHO não é uma solução, uma vez que está limitado a divisão específica e não pode deslizar sobre o limite das divisões. Outra solução seria implementar a lógica personalizada de dados de entrada de divisão (faz parte do InputFormat). Pode ser feito para fazer 2 slides diferentes, semelhante ao particionamento. Respondido 17 de setembro 12 em 8: 59 Médias móveis e médias movidas centradas Alguns pontos sobre a sazonalidade em uma série de tempo repetem, mesmo que pareçam óbvias. Um é que o termo 8220season8221 não se refere necessariamente às quatro estações do ano que resultam da inclinação do eixo Earth8217s. Na análise preditiva, 8220season8221 muitas vezes significa precisamente isso, porque muitos dos fenômenos que estudamos variam de acordo com a progressão da primavera até o inverno: vendas de artes de inverno ou de verão, incidência de certas doenças generalizadas, eventos climáticos causados ​​pela localização da Fluxo de jato e mudanças na temperatura da água no oceano Pacífico oriental, e assim por diante. Igualmente, os eventos que ocorrem regularmente podem atuar como estações meteorológicas, mesmo que tenham apenas uma conexão tênue com os solstícios e equinócios. Mudanças de oito horas em hospitais e fábricas muitas vezes se expressam na incidência de ingestas e gastos de energia lá, uma temporada é de oito horas e as estações circulam todos os dias e não todos os anos. As datas de vencimento dos impostos sinalizam o início de uma inundação de dólares em tesouros municipais, estaduais e federais, a estação pode ser de um ano (impostos sobre o rendimento das pessoas físicas), seis meses (impostos sobre a propriedade em muitos estados), trimestralmente (muitos impostos corporativos ), e assim por diante. É um pouco estranho que tenhamos a palavra 8220season8221 para se referir geralmente ao período de tempo regularmente recorrente, mas nenhum termo geral para o período de tempo durante o qual ocorre uma volta completa das estações. 8220Cycle8221 é possível, mas na análise e previsão de que o termo geralmente é usado como um período de duração indeterminada, como um ciclo comercial. Na ausência de um termo melhor, I8217ve usado 8220encompatibilidade período8221 neste e subseqüentes capítulos. Isso não é apenas uma reflexão terminológica. As formas em que identificamos as estações e o período de tempo durante o qual as estações passam têm implicações reais, mesmo que menores, para a forma como medimos os efeitos. As seções a seguir descrevem como alguns analistas variam da forma como calculam as médias móveis de acordo com o número de estações é ímpar ou par. Usando médias móveis em vez de médias simples Suponha que uma grande cidade esteja considerando a reafectação de sua polícia de trânsito para melhor abordar a incidência de condução enquanto está prejudicada, o que a cidade acredita ter aumentado. Há quatro semanas, entrou em vigor uma nova legislação, legalizando a posse e o uso recreativo da maconha. Desde então, o número diário de detenções de trânsito para a DWI parece estar a tendência. Complicar questões é o fato de que o número de paradas parece aumentar nas sextas e sábados. Para ajudar a planejar os requisitos de mão-de-obra no futuro, you8217d gostaria de prever qualquer tendência subjacente que se estabelecesse8217s. You8217d também gosta de tempo a implantação de seus recursos para levar em consideração qualquer temporada sazonal que 8217s ocorrem. A Figura 5.9 possui os dados relevantes com os quais você deve trabalhar. Figura 5.9 Com este conjunto de dados, cada dia da semana constitui uma estação. Mesmo apenas observando o gráfico na Figura 5.9. Você pode dizer que a tendência do número de prisões diárias está em alta. Você deve planejar expandir o número de agentes de trânsito e esperar que a tendência diminua em breve. Além disso, os dados confirmam a noção de que mais detenções ocorrem rotineiramente nas sextas e sábados, de modo que sua alocação de recursos precisa abordar essas espinhas. Mas você precisa quantificar a tendência subjacente, para determinar a quantidade de policiais adicionais que você precisa trazer. Você também precisa quantificar o tamanho esperado dos picos de fim de semana, para determinar quantos policiais adicionais você precisa prestar atenção a motoristas erráticos naqueles dias. O problema é que, até o momento, você não sabe o quanto do aumento diário é devido à tendência e quanto é devido ao efeito desse fim de semana. Você pode começar diminuindo as séries temporais. Anteriormente, neste capítulo, em 8220Simple Seasonal Medias, 8221 você viu um exemplo de como detrender uma série de tempo para isolar os efeitos sazonais usando o método de médias simples. Nesta seção, você verá como fazê-lo, usando as médias móveis, muito provável, a abordagem das médias móveis é usada com mais freqüência na análise preditiva do que a abordagem das médias simples. Existem várias razões para a maior popularidade das médias móveis, entre elas, que a abordagem de médias móveis não pede que você colapse seus dados no processo de quantificação de uma tendência. Lembre-se de que o exemplo anterior tornou necessário o colapso das médias trimestrais para as médias anuais, calcular uma tendência anual e, em seguida, distribuir um quarto da tendência anual em cada trimestre do ano. Esse passo era necessário para remover a tendência dos efeitos sazonais. Em contrapartida, a abordagem de médias móveis permite que você desmonte a série temporal sem recorrer a esse tipo de maquinação. A Figura 5.10 mostra como a abordagem de médias móveis funciona no presente exemplo. Figura 5.10 A média móvel no segundo gráfico esclarece a tendência subjacente. A Figura 5.10 adiciona uma coluna de média móvel e uma coluna para estações sazonais específicas. Para o conjunto de dados na Figura 5.9. Ambas as adições requerem alguma discussão. As picos nas prisões que ocorrem nos fins de semana oferecem motivos para acreditar que você trabalha com estações que repetem uma vez por semana. Portanto, comece obtendo a média para o período abrangente8212, isto é, as sete primeiras estações, de segunda a domingo. A fórmula para a média na célula D5, a primeira média móvel disponível, é a seguinte: Essa fórmula é copiada e colada através da célula D29, então você tem 25 médias móveis com base em 25 corridas de sete dias consecutivos. Observe que, para mostrar tanto as primeiras quanto as últimas observações na série temporal, esconderi as linhas 10 a 17. Você pode exibi-las, se quiser, neste livro do capítulo8217s, disponível no site do publisher8217s. Faça uma seleção múltipla de linhas visíveis 9 e 18, clique com o botão direito do mouse em um de seus cabeçalhos de linha e escolha Desligar no menu de atalho. Quando você esconde as linhas da planilha 8217s, como I8217ve feito na Figura 5.10. Qualquer informação traçada nas linhas ocultas também está escondida no gráfico. Os rótulos dos eixos x identificam apenas os pontos de dados que aparecem no gráfico. Como cada média móvel na Figura 5.10 abrange sete dias, nenhuma média móvel é emparelhada com as três primeiras ou últimas três observações reais. Copiar e colar a fórmula na célula D5 até um dia para a célula D4 corre para fora das observações8212. Não há observação registrada na célula C1. Da mesma forma, não existe uma média móvel registrada abaixo da célula D29. Copiar e colar a fórmula em D29 em D30 exigiria uma observação na célula C33, e nenhuma observação está disponível para o dia em que a célula representaria. Seria possível, é claro, encurtar o comprimento da média móvel para, digamos, cinco em vez de sete. Assim, significaria que as fórmulas de média móvel na Figura 5.10 poderiam começar na célula D4 em vez de D5. No entanto, nesse tipo de análise, você quer que o comprimento da média móvel seja igual ao número de estações: sete dias por semana para eventos que se repetem semanalmente implicam uma média móvel de comprimento sete e quatro trimestres por ano para eventos que Repetir anualmente implica uma média móvel de comprimento quatro. Ao longo de linhas semelhantes, geralmente quantificamos os efeitos sazonais de tal forma que eles totalizam para zero dentro do período de tempo abrangente. Como você viu na primeira seção deste capítulo8217s, em médias simples, isso é feito calculando a média de (digamos) os quatro trimestres em um ano e subtraindo a média do ano de cada figura trimestral. Assim, garante que o total dos efeitos sazonais seja zero. Por sua vez, isso é util porque ele coloca os efeitos sazonais em um efeito comum de verão de 8212a é tão distante da média como um efeito de inverno de 821111. Se você quiser uma média de cinco temporadas em vez de sete para obter sua média móvel, você é melhor Descobrindo um fenômeno que se repete a cada cinco temporadas em vez de cada sete. No entanto, quando você tira a média dos efeitos sazonais mais tarde no processo, é improvável que essas médias somem a zero. É necessário nesse ponto recalibrar ou normalizar. As médias de modo que sua soma seja zero. Quando isso ocorreu, as médias sazonais médias expressam o efeito em um período de tempo de pertença a uma determinada estação. Uma vez normalizadas, as médias sazonais são denominadas os índices sazonais que este capítulo já mencionou várias vezes. Você verá como funciona mais adiante neste capítulo, em 8220Detrending the Series with Moving Moys.8221 Compreendendo Sazonais Específicos A Figura 5.10 também mostra o que são chamados de sazonais específicos na coluna E. Eles são o que resta disso depois de subtrair a média móvel da observação real. Para ter uma idéia do que os sazonais específicos representam, considere a média móvel na célula D5. É a média das observações em C2: C8. Os desvios de cada observação a partir da média móvel (por exemplo, C2 8211 D5) são garantidos para somar zero8212 a 8217s uma característica de uma média. Portanto, cada desvio expressa o efeito de estar associado a esse dia particular naquela semana em particular. It8217s é específico específico de temporada e então, porque o desvio se aplica a determinada segunda-feira ou terça-feira e assim por diante e sazonal, porque neste exemplo, estamos tratando cada dia como se fosse uma estação no período abrangente de uma semana. Como cada medida sazonal específica o efeito de estar naquela época vis-224-vis a média móvel para esse grupo de (aqui) sete temporadas, você pode, posteriormente, calcular os períodos de temporada específicos para uma determinada temporada (por exemplo, todas as sextas na sua Séries temporais) para estimar que o efeito geral, em vez de específico, da estação8217s. Essa média não é confundida por uma tendência subjacente na série temporal, porque cada estação específica expressa um desvio de sua própria média móvel particular. Alinhando as médias móveis There8217s também a questão de alinhar as médias móveis com o conjunto de dados original. Na Figura 5.10. Tenho alinhado cada média móvel com o ponto médio da gama de observações que inclui. Assim, por exemplo, a fórmula na célula D5 é a média das observações em C2: C8, e alinhei com a quarta observação, o ponto médio do intervalo médio, colocando-a na linha 5. Esse arranjo é denominado média móvel centrada . E muitos analistas preferem alinhar cada média móvel com o ponto médio das observações que mede. Tenha em mente que, neste contexto, 8220midpoint8221 se refere ao meio de um período de tempo: quinta-feira é o ponto médio de segunda a domingo. Não se refere à mediana dos valores observados, embora, claro, isso possa funcionar dessa maneira na prática. Outra abordagem é a média móvel final. Nesse caso, cada média móvel está alinhada com a observação final de que ela é média8212 e, portanto, fica atrás de seus argumentos. Este é frequentemente o arranjo preferido se você deseja usar uma média móvel como uma previsão, como é feito com suavização exponencial, porque sua média móvel final ocorre coincidente com a observação final disponível. Médias móveis centradas com números pares de estações Nós costumamos adotar um procedimento especial quando o número de estações é mesmo em vez de estranho. Esse é o estado típico das coisas: tende a ter um número uniforme de estações no período abrangente para as estações típicas, como meses, trimestres e períodos quadriênicos (para eleições). A dificuldade com um número par de temporadas é que não há ponto médio. Dois não são o ponto médio de um intervalo que começa em 1 e termina em 4, e nenhum deles é 3 se se pode dizer ter um, seu ponto médio é 2,5. Seis não é o ponto médio de 1 a 12, e nem 7 é o ponto médio puramente teórico é de 6,5. Para agir como se um ponto médio exista, você precisa adicionar uma camada de média acima das médias móveis. Veja a Figura 5.11. Figura 5.11 O Excel oferece várias maneiras de calcular uma média móvel centrada. A idéia por trás dessa abordagem de obter uma média móvel que o 8217 se centrou em um ponto médio existente, quando há um número par de temporadas, é puxar esse ponto médio para a frente em meia temporada. Você calcula uma média móvel que seria centrada em, digamos, o terceiro ponto no tempo, se cinco estações em vez de quatro constituíram uma volta total do calendário. Isso foi feito tomando duas médias móveis consecutivas e as médias delas. Assim, na Figura 5.11. Uma média móvel na célula E6 que mede os valores em D3: D9. Porque há quatro valores sazonais em D3: D9, a média móvel em E6 é pensada como centrada na estação imaginária 2,5, meio ponto abaixo da primeira temporada candidata disponível, 3. (Estações 1 e 2 não estão disponíveis como pontos médios para Falta de dados para a média antes da temporada 1.) Note, no entanto, que a média móvel na célula E8 é a média dos valores em D5: D11, o segundo ao quinto na série temporal. Essa média é centrada no ponto (imaginário) 3.5, um período completo antes da média centrada em 2.5. Ao calcular a média das duas médias móveis, então, o pensamento corre, você pode puxar o ponto central da primeira média móvel para a frente em meio ponto, de 2,5 para 3. Que essas são as médias na coluna F da Figura 5.11. A célula F7 fornece a média das médias móveis em E6 e E8. E a média em F7 está alinhada com o terceiro ponto de dados na série temporal original, na célula D7, para enfatizar que a média está centrada nessa estação. Se você expandir a fórmula na célula F7, bem como as médias móveis nas células E6 e E8, você verificou que se trata de uma média ponderada dos primeiros cinco valores na série temporal, com o primeiro e o quinto valor dados um peso De 1 e o segundo ao quarto valor, dado um peso de 2. Isso nos leva a uma maneira mais rápida e simples de calcular uma média móvel centrada com um número par de temporadas. Ainda na Figura 5.11. Os pesos são armazenados no intervalo H3: H11. Esta fórmula retorna a primeira média móvel centrada, na célula I7: Essa fórmula retorna 13.75. Que é idêntico ao valor calculado pela fórmula de média dupla na célula F7. Fazendo a referência aos pesos absolutos, por meio dos sinais de dólar em H3: H11. Você pode copiar a fórmula e colá-la, na medida do necessário, para obter o resto das médias móveis centradas. Detrendendo a série com médias móveis Quando você subtraiu as médias móveis das observações originais para obter os sazonais específicos, você removeu a tendência subjacente da série. O que é deixado nos temporários específicos é normalmente uma série horizontal estacionária com dois efeitos que fazem com que os sazonais específicos partem de uma linha absolutamente reta: os efeitos sazonais e o erro aleatório nas observações originais. A Figura 5.12 mostra os resultados para este exemplo. Figura 5.12 Os efeitos sazonais específicos para sexta-feira e sábado permanecem claros na série detrada. O gráfico superior da Figura 5.12 mostra as observações diárias originais. Tanto a tendência geral como os picos sazonais de fim de semana são claros. O gráfico inferior mostra os sazonais específicos: o resultado da destruição da série original com um filtro de média móvel, conforme descrito anteriormente em 8220Understanding Seasonals específicos.8221 Você pode ver que a série detrended agora é praticamente horizontal (uma linha de tendência linear para os seasonals específicos Tem uma leve deriva para baixo), mas os picos sazonais de sexta-feira e sábado ainda estão no lugar. O próximo passo é avançar para além dos sazonais específicos para os índices sazonais. Veja a Figura 5.13. Figura 5.13 Os efeitos sazonais específicos são inicialmente calculados em média e depois normalizados para atingir os índices sazonais. Na Figura 5.13. Os sazonais específicos na coluna E são rearranjados na forma tabular mostrada na faixa H4: N7. O objetivo é simplesmente facilitar o cálculo das médias sazonais. Essas médias são mostradas em H11: N11. No entanto, os números em H11: N11 são médias, não desvios de uma média, e, portanto, não podemos esperar que somem a zero. Nós ainda precisamos ajustá-los para que eles expressem desvios de um grande meio. Essa grande média aparece na célula N13, e é a média das médias sazonais. Podemos chegar aos índices sazonais, subtraindo a média principal em N13 de cada uma das médias sazonais. O resultado está na faixa H17: N17. Esses índices sazonais não são mais específicos para uma média móvel em particular, como é o caso dos sazonais específicos na coluna E. Como eles são baseados em uma média de cada instância de uma determinada estação, eles expressam o efeito médio de uma determinada estação ao longo da Quatro semanas na série temporal. Além disso, eles são medidas de uma estação, depois de um apito8217s8212, um dia, um efeito de 8212s em prisões de trânsito em relação à média de um período de sete dias. Agora podemos usar esses índices sazonais para dessazonalizar a série. Utilizamos a série dessazonalizada para obter previsões por meio de regressão linear ou método Holt8217s de série tendencial de suavização (discutido no Capítulo 4). Então, simplesmente adicionamos os índices sazonais de volta às previsões para redimensioná-los. Tudo isso aparece na Figura 5.14. Figura 5.14 Depois de ter os índices sazonais, os toques finais aplicados aqui são os mesmos que no método das médias simples. As etapas ilustradas na Figura 5.14 são em grande parte as mesmas das Figuras 5.6 e 5.7. Discutido nas seções a seguir. Desalentando as Observações Subtrair os índices sazonais das observações originais para desestatizar os dados. Você pode fazer isso como mostrado na Figura 5.14. Em que as observações originais e os índices sazonais são organizados como duas listas que começam na mesma linha, as colunas C e F. Este arranjo torna um pouco mais fácil estruturar os cálculos. Você também pode fazer a subtração, como mostrado na Figura 5.6. Em que as observações trimestrais originais (C12: F16), os índices trimestrais (C8: F8) e os resultados dessazonalizados (C20: F24) são mostrados em um formato tabular. Esse arranjo torna um pouco mais fácil se concentrar nos índices sazonais e nos trimestres dessazonados. Previsão das Observações Deseasonalized na Figura 5.14. As observações dessazonalizadas estão na coluna H e na Figura 5.7 são na coluna C. Independentemente de querer usar uma abordagem de regressão ou uma abordagem de suavização para a previsão, é o melhor para organizar as observações dessazonalizadas em uma lista de uma única coluna. Na Figura 5.14. As previsões estão na coluna J. A seguinte fórmula de matriz é inserida no intervalo J2: J32. No início deste capítulo, apontou que, se você omitir o argumento x-values ​​dos argumentos TREND () function8217s, o Excel fornece os valores padrão 1. 2. N. Onde n é o número de valores y. Na fórmula dada, H2: H32 contém 31 valores de y. Como o argumento que normalmente contém os valores x está faltando, o Excel fornece os valores padrão 1. 2. 31. Esses são os valores que gostaríamos de usar de qualquer maneira, na coluna B, então a fórmula como dada é equivalente a TREND (H2: H32, B2: B32). E que a estrutura utilizada em D5: D24 da Figura 5.7: Fazendo a previsão de um passo a frente Até agora você organizou as previsões das séries temporais dessazonalizadas de t 1 a t 31 na Figura 5.14. E de t 1 a t 20 na Figura 5.7. Estas previsões constituem informações úteis para vários fins, incluindo a avaliação da precisão das previsões por meio de uma análise RMSE. Mas seu objetivo principal é prever pelo menos o próximo período de tempo, ainda não observado. Para obter isso, você poderia primeiro prever da função TREND () ou LINEST () se you8217re usando regressão ou da fórmula de suavização exponencial se you8217re usando o método Holt8217s. Então você pode adicionar o índice sazonal associado à previsão de regressão ou suavização, para obter uma previsão que inclua tanto a tendência como o efeito sazonal. Na Figura 5.14. Você obtém a previsão de regressão na célula J33 com esta fórmula: Nesta fórmula, os valores y em H2: H32 são os mesmos nas demais fórmulas TREND () na coluna J. Assim, os valores x (padrão) de 1 Através de 32. Agora, no entanto, você fornece um novo valor x como o terceiro argumento do function8217s, que você diz TREND () para procurar na célula B33. It8217s 32. O próximo valor de t. E o Excel retorna o valor 156.3 na célula J33. A função TREND () na célula J33 está dizendo ao Excel, de fato, 8220Calcular a equação de regressão para os valores em H2: H32 regredido nos valores t de 1 a 31. Aplica essa equação de regressão ao novo valor x de 32 e retorna o resultado.8221 You8217ll encontra a mesma abordagem tomada na célula D25 da Figura 5.7. Onde a fórmula para obter a previsão one-step-ahead é esta: Adicionando os índices sazonais de volta. O último passo é redimensionar as previsões adicionando os índices sazonais às previsões de tendências, revendo o que você fez quatro passos atrás quando você subtraiu a Índices das observações originais. Isso é feito na coluna F na Figura 5.7 e na coluna K na Figura 5.14. Don8217t esqueça de adicionar o índice sazonal apropriado para a previsão one-step-ahead, com os resultados mostrados na célula F25 na Figura 5.7 e na célula K33 na Figura 5.14. (I8217ve sombreou as células de um passo à frente, tanto na Figura 5.7 como na Figura 5.14 para destacar as previsões). Você pode encontrar gráficos de três representações dos dados de trânsito na Figura 5.15. A série dessazonalizada, a previsão linear dos dados dessazonalizados e as previsões reserizadas. Observe que as previsões incorporam tanto a tendência geral quanto os dados originais e os pontos de sexta-feira. Figura 5.15 Traçando as previsões.

No comments:

Post a Comment