Stata: análise de dados e software estatístico Nicholas J. Cox, Universidade de Durham, Reino Unido Christopher Baum, Boston College egen, ma () e suas limitações Statarsquos comando mais óbvio para o cálculo de médias móveis é a função ma () de egen. Dada uma expressão, ela cria uma média móvel daquela expressão. Por padrão, é tomado como 3. deve ser estranho. No entanto, como a entrada manual indica, egen, ma () não podem ser combinados com varlist:. E, por esse motivo, não é aplicável aos dados do painel. Em qualquer caso, fica fora do conjunto de comandos especificamente escritos para séries temporais veja séries temporais para detalhes. Abordagens alternativas Para calcular as médias móveis para os dados do painel, existem pelo menos duas opções. Ambos dependem do conjunto de dados ter sido o tsset de antemão. Isto vale muito a pena fazer: não só você pode economizar várias vezes especificando a variável do painel e a variável de tempo, mas o Stata se comporta de forma inteligente com quaisquer lacunas nos dados. 1. Escreva sua própria definição usando gerar Usando operadores de séries temporais, como L. e F.. Dê a definição da média móvel como o argumento para uma declaração de geração. Se você fizer isso, você, naturalmente, não está limitado às médias móveis ponderadas (não ponderadas), calculadas por egen, ma (). Por exemplo, as médias móveis de três períodos, igualmente ponderadas, seriam dadas e alguns pesos podem ser facilmente especificados: você pode, é claro, especificar uma expressão como log (myvar) em vez de um nome de variável como myvar. Uma grande vantagem desta abordagem é que a Stata faz automaticamente o que é certo para os dados do painel: os valores avançados e atrasados são elaborados dentro dos painéis, assim como a lógica dita que deveria ser. A desvantagem mais notável é que a linha de comando pode ficar bastante longa se a média móvel envolver vários termos. Outro exemplo é uma média móvel unilateral baseada apenas em valores anteriores. Isso pode ser útil para gerar uma expectativa adaptativa sobre o que uma variável será baseada puramente em informações até à data: o que alguém poderia prever para o período atual com base nos quatro últimos valores, usando um esquema de ponderação fixa (um atraso de 4 períodos pode ser Especialmente comumente usado com timeseries trimestrais.) 2. Use egen, filter () de SSC Use o filtro de função egen () do usuário do pacote egenmore em SSC. No Stata 7 (atualizado após 14 de novembro de 2001), você pode instalar este pacote depois do qual ajuda, além disso, aponta para detalhes no filtro (). Os dois exemplos acima serão renderizados (Nesta comparação, a abordagem de geração é talvez mais transparente, mas veremos um exemplo do oposto em um momento.) Os atrasos são um número. Leva a desvios negativos: neste caso -11 se expande para -1 0 1 ou liderar 1, lag 0, lag 1. Os coeficientes, outro número, multiplicam os itens atrasados ou atrasados correspondentes: neste caso, esses itens são F1.myvar . Myvar e L1.myvar. O efeito da opção de normalização é escalar cada coeficiente pela soma dos coeficientes de modo que o coeficiente de coeficiente (1 1 1) seja equivalente aos coeficientes de 13 13 13 e a normalização de coef (1 2 1) seja equivalente aos coeficientes de 14 12 14 . Você deve especificar não apenas os atrasos, mas também os coeficientes. Como egen, ma () fornece o caso igualmente ponderado, a lógica principal para egen, filter () é suportar o caso pontualmente ponderado, para o qual você deve especificar coeficientes. Também pode-se dizer que obrigar os usuários a especificar coeficientes é uma pressão pequena sobre eles para pensar sobre os coeficientes que eles querem. A principal justificativa para os pesos iguais é, contudo, a simplicidade, mas pesos iguais têm propriedades de domínio de freqüência péssimas, para mencionar apenas uma consideração. O terceiro exemplo acima poderia ser qualquer um dos quais é tão complicado quanto a abordagem de geração. Há casos em que egen, filter () dá uma formulação mais simples do que gerar. Se você quer um filtro binomial de nove séculos, que os climatologistas acham útil, então parece talvez menos horrível do que, e mais fácil de conseguir, do mesmo modo, assim como com a abordagem de geração, egen, filter () funciona corretamente com os dados do painel. Na verdade, como afirmado acima, depende do conjunto de dados ter sido tsset de antemão. Uma dica gráfica Depois de calcular suas médias móveis, você provavelmente vai querer olhar para um gráfico. O comando do usuário com tsgraph é inteligente sobre conjuntos de dados tsset. Instale-o em um stata 7 atualizado por ssc inst tsgraph. E quanto a subconjunto com se nenhum dos exemplos acima faz uso de restrições if. Na verdade egen, ma () não permitirá se for especificado. Ocasionalmente, as pessoas querem usar se ao calcular médias móveis, mas seu uso é um pouco mais complicado do que normalmente. O que você esperaria de uma média móvel calculada com if. Vamos identificar duas possibilidades: interpretação fraca: não quero ver nenhum resultado para as observações excluídas. Interpretação forte: eu nem quero que você use os valores para as observações excluídas. Aqui está um exemplo concreto. Suponha que, como consequência de alguma condição, as observações 1-42 estão incluídas, mas não as observações 43. Mas a média móvel para 42 dependerá, entre outras coisas, do valor para a observação 43, se a média se estender para trás e para frente e for pelo menos de 3, e dependerá de algumas das observações 44 em algumas circunstâncias. Nosso palpite é que a maioria das pessoas iria para a interpretação fraca, mas se isso é correto, egen, filter () não é compatível se também. Você sempre pode ignorar o que você não quer ou mesmo definir valores indesejados a perder depois, usando a substituição. Uma nota sobre resultados faltantes nas extremidades da série Como as médias móveis são funções de atrasos e ligações, egen, ma () produz ausente onde os atrasos e as derivações não existem, no início e no final da série. Uma opção de nomiss força o cálculo de médias móveis mais curtas e não centradas para as caudas. Em contraste, nem gerar nem egen, filter () faz, ou permite, qualquer coisa especial para evitar resultados perdidos. Se algum dos valores necessários para o cálculo estiver faltando, esse resultado está faltando. Cabe aos usuários decidir se e qual cirurgia corretiva é necessária para essas observações, presumivelmente depois de olhar para o conjunto de dados e considerando qualquer ciência subjacente que possa ser trazida. Guia de cientistas e engenheiros para processamento de sinal digital Por Steven W. Smith , Ph. D. Filtros analógicos para conversão de dados A Figura 3-7 mostra um diagrama de blocos de um sistema DSP, conforme o teorema de amostragem determina. Antes de encontrar o conversor analógico-digital, o sinal de entrada é processado com um filtro passa-baixa eletrônico para remover todas as freqüências acima da freqüência Nyquist (metade da taxa de amostragem). Isso é feito para evitar alias durante a amostragem, e é correspondentemente chamado de filtro antialias. Na outra extremidade, o sinal digitalizado passa por um conversor digital para analógico e outro filtro passa-baixa configurado para a freqüência Nyquist. Este filtro de saída é chamado de filtro de reconstrução. E pode incluir o aumento de frequência anteriormente descrito. Infelizmente, há um problema sério com este modelo simples: as limitações dos filtros eletrônicos podem ser tão ruins quanto os problemas que estão tentando evitar. Se o seu principal interesse é no software, provavelmente você pensa que não precisa ler esta seção. Errado. Mesmo se você prometeu nunca tocar em um osciloscópio, a compreensão das propriedades dos filtros analógicos é importante para o sucesso do DSP. Primeiro, as características de cada sinal digitalizado que você encontrará dependerão do tipo de filtro antialias usado quando foi adquirido. Se você não entende a natureza do filtro antialias, não pode entender a natureza do sinal digital. Em segundo lugar, o futuro do DSP é substituir o hardware por software. Por exemplo, as técnicas de multirate apresentadas posteriormente neste capítulo reduzem a necessidade de antialias e filtros de reconstrução por truques sofisticados de software. Se você não entender o hardware, você não pode projetar o software para substituí-lo. Terceiro, muito da DSP está relacionado ao design do filtro digital. Uma estratégia comum é começar com um filtro analógico equivalente. E convertê-lo em software. Capítulos posteriores assumem que você possui um conhecimento básico das técnicas de filtro analógico. Três tipos de filtros analógicos são comumente usados: Chebyshev. Butterworth. E Bessel (também chamado de filtro Thompson). Cada um deles é projetado para otimizar um parâmetro de desempenho diferente. A complexidade de cada filtro pode ser ajustada selecionando o número de pólos. Um termo matemático que será discutido em capítulos posteriores. Quanto mais pólos em um filtro, mais eletronics ele requer, e melhor ele executa. Cada um desses nomes descreve o que o filtro faz. Não é uma disposição particular de resistências e capacitores. Por exemplo, um filtro Bessel de seis pólos pode ser implementado por muitos tipos diferentes de circuitos, todos com as mesmas características gerais. Para fins DSP, as características desses filtros são mais importantes do que a forma como são construídas. No entanto, vamos começar com um curto segmento no design eletrônico desses filtros para fornecer uma estrutura geral. A Figura 3-8 mostra um bloco de construção comum para o design do filtro analógico, o circuito Sallen-Key modificado. Isto é nomeado após os autores de um artigo dos anos 50 descrevendo a técnica. O circuito mostrado é um filtro passa-baixa de dois pólos que pode ser configurado como qualquer um dos três tipos básicos. A Tabela 3-1 fornece as informações necessárias para selecionar os resistores e condensadores apropriados. Por exemplo, para projetar um filtro Butterworth de 1 kHz, 2 pólos, a Tabela 3-1 fornece os parâmetros: k 1 0.1592 e k 2 0.586. Selecionando arbitrariamente R 1 10K e C 0.01uF (valores comuns para circuitos de amplificador operacional), R e R f podem ser calculados como 15.95K e 5.86K, respectivamente. Arredondando estes dois últimos valores para os resistores padrão 1 mais próximos, resulta em R 15.8K e R f 5.90K. Todos os componentes devem ser de 1 precisão ou melhor. O uso particular do amplificador operacional não é crítico, desde que a freqüência de ganho unitário seja superior a 30 a 100 vezes maior do que a freqüência de corte dos filtros. Este é um requisito fácil, desde que a frequência de corte dos filtros seja inferior a cerca de 100 kHz. Os filtros de quatro, seis e oito pólos são formados pela cascata 2,3, e 4 destes circuitos, respectivamente. Por exemplo, a Fig. 3-9 mostra o esquema de um filtro Bessel de 6 pólos criado por três etapas em cascata. Cada estágio tem valores diferentes para k 1 e k 2 conforme previsto na Tabela 3-1, resultando em diferentes resistências e capacitores sendo usados. Precisa de um filtro passa-alto Simplesmente troque os componentes R e C nos circuitos (deixando R f e R 1 sozinhos). Este tipo de circuito é muito comum para a fabricação de pequenas quantidades e aplicações RampD, no entanto, a produção séria exige que o filtro seja feito como um circuito integrado. O problema é que é difícil fazer resistores diretamente em silício. A resposta é o filtro do capacitor comutado. A Figura 3-10 ilustra sua operação comparando-a a uma rede RC simples. Se uma função de etapa é alimentada em um filtro passa-baixa RC, a saída aumenta exponencialmente até corresponder à entrada. A tensão no capacitor não muda instantaneamente, porque o resistor restringe o fluxo de carga elétrica. O filtro de capacitores comutados opera substituindo a rede básica de resistor-capacitor por dois capacitores e um interruptor eletrônico. O condensador recém-adicionado é muito menor em valor do que o capacitor já existente, por exemplo, 1 de seu valor. O interruptor liga alternadamente o capacitor pequeno entre a entrada e a saída em uma freqüência muito alta, tipicamente 100 vezes mais rápido do que a freqüência de corte do filtro. Quando o interruptor está conectado à entrada, o capacitor pequeno carrega-se rapidamente para qualquer tensão que esteja na entrada. Quando o interruptor está conectado à saída, a carga no capacitor pequeno é transferida para o capacitor grande. Em um resistor, a taxa de transferência de carga é determinada pela sua resistência. Em um circuito capacitor comutado, a taxa de transferência de carga é determinada pelo valor do capacitor pequeno e pela freqüência de comutação. Isso resulta em uma característica muito útil dos filtros de capacitores comutados: a freqüência de corte do filtro é diretamente proporcional à freqüência de clock usada para conduzir os interruptores. Isso torna o filtro de capacitores comutados ideal para sistemas de aquisição de dados que operam com mais de uma taxa de amostragem. Estes são dispositivos fáceis de usar pagam dez dólares e têm o desempenho de um filtro de oito pólos dentro de um único IC de 8 pinos. Agora, para a parte importante: as características dos três tipos de filtros clássicos. O primeiro parâmetro de desempenho que queremos explorar é a nitidez da frequência de corte. Um filtro de passagem baixa é projetado para bloquear todas as freqüências acima da freqüência de corte (a banda de parada), enquanto passa todas as freqüências abaixo (a banda de passagem). A Figura 3-11 mostra a resposta de freqüência desses três filtros em uma escala logarítmica (dB). Estes gráficos são mostrados para filtros com uma frequência de corte hertz, mas eles podem ser ajustados diretamente para qualquer freqüência de corte que você precisa usar. Como é que esses filtros classificam O Chebyshev é claramente o melhor, o Butterworth é pior, e o Bessel é absolutamente horrível. Como você provavelmente supôs, é isso que o Chebyshev foi projetado para fazer, roll-off (gota de amplitude) o mais rápido possível . Infelizmente, mesmo um Chebyshev de 8 pólos não é tão bom quanto você gostaria de um filtro antialias. Por exemplo, imagine uma amostragem de sistema de 12 bits em 10.000 amostras por segundo. O teorema de amostragem determina que qualquer freqüência acima de 5 kHz será alias, algo que você deseja evitar. Com um pouco de trabalho de adivinhação, você decide que todas as freqüências acima de 5 kHz devem ser reduzidas em amplitude por um fator de 100, garantindo que qualquer freqüência aliada tenha uma amplitude inferior a um por cento. Olhando para a Fig. 3-11c, você acha que um filtro Chebyshev de 8 pólos, com uma freqüência de corte de 1 hertz, não atinge uma atenuação (redução do sinal) de 100 até cerca de 1,35 hertz. Ao escalar isso para o exemplo, a freqüência de corte dos filtros deve ser definida para 3,7 kHz para que tudo acima de 5 kHz tenha a atenuação necessária. Isso faz com que a banda de freqüência entre 3,7 kHz e 5 kHz seja desperdiçada no roll-off inadequado do filtro analógico. Um ponto sutil: o fator de atenuação de 100 neste exemplo é provavelmente suficiente, embora haja 4096 etapas em 12 bits. Da Fig. 3-4, 5100 hertz alias para 4900 hertz, 6000 hertz irão para 4000 hertz, etc. Você não se importa com as amplitudes dos sinais entre 5000 e 6300 hertz, pois alias na região inutilizável entre 3700 hertz e 5000 Hertz. Para uma frequência para alias na banda de passagem dos filtros (0 a 3,7 kHz), deve ser maior que 6300 hertz, ou 1,7 vezes a freqüência de corte dos filtros de 3700 hertz. Conforme mostrado na Fig. 3-11c, a atenuação fornecida por um filtro Chebyshev de 8 pólos em 1,7 vezes a freqüência de corte é de cerca de 1300, muito mais adequada do que os 100, iniciamos a análise com. A moral para esta história: na maioria dos sistemas, a faixa de freqüência entre cerca de 0,4 e 0,5 da freqüência de amostragem é uma área deserta inutilizável de sinais de deslocamento de filtro e alias. Este é um resultado direto das limitações dos filtros analógicos. A resposta de freqüência do filtro passa-baixa perfeito é plana em toda a banda passante. Todos os filtros ficam ótimos a este respeito na Fig. 3-11, mas apenas porque o eixo vertical é exibido em uma escala logarítmica. Outra história é contada quando os gráficos são convertidos em uma escala vertical linear, como é mostrado na Fig. 3-12. A onda passband pode agora ser vista no filtro Chebyshev (variações onduladas na amplitude das frequências passadas). Na verdade, o filtro Chebyshev obtém o seu excelente roll-off, permitindo essa ondulação de banda passante. Quando é permitida uma maior ondulação de banda passante em um filtro, pode ser conseguido um roll-off mais rápido. Todos os filtros Chebyshev projetados usando a Tabela 3-1 têm uma ondulação de banda passante de cerca de 6 (0,5 dB), um bom compromisso e uma escolha comum. Um design semelhante, o filtro elíptico. Permite ondulação tanto na banda passante como na banda de parada. Embora seja mais difícil de projetar, os filtros elípticos podem conseguir uma compensação ainda melhor entre roll-off e ondulação de banda passante. Em comparação, o filtro Butterworth é otimizado para fornecer o melhor desdobramento possível sem permitir ondulação na banda passante. É comumente chamado de filtro máximo. E é idêntico a um Chebyshev projetado para ondulação de banda passada zero. O filtro Bessel não tem ondulação na banda passante, mas o roll-off muito pior do que o Butterworth. O último parâmetro a avaliar é a resposta passo a passo. Como o filtro responde quando a entrada muda rapidamente de um valor para outro. A Figura 3-13 mostra a resposta de passo de cada um dos três filtros. O eixo horizontal é mostrado para filtros com uma frequência de corte de 1 hertz, mas pode ser escalado (inversamente) para frequências de corte mais altas. Por exemplo, uma freqüência de corte de 1000 hertz mostraria uma resposta gradual em milissegundos. Em vez de segundos. Os filtros Butterworth e Chebyshev ultrapassam e mostram o toque (oscilações que lentamente diminuem em amplitude). Em comparação, o filtro Bessel não possui nenhum desses problemas desagradáveis. A Figura 3-14 ilustra ainda esta característica muito favorável do filtro Bessel. A figura (a) mostra uma forma de onda de pulso, que pode ser vista como um passo ascendente seguido de um passo caindo. As figuras (b) e (c) mostram como esta forma de onda apareceria após os filtros Bessel e Chebyshev, respectivamente. Se este fosse um sinal de vídeo, por exemplo, a distorção introduzida pelo filtro Chebyshev seria devastadora. O excesso alteraria o brilho das bordas dos objetos em comparação com seus centros. Pior ainda, o lado esquerdo dos objetos ficaria brilhante, enquanto o lado direito dos objetos ficaria escuro. Muitas aplicações não podem tolerar um desempenho fraco na resposta passo a passo. Este é o lugar onde o filtro Bessel não suporta overshoot e bordas simétricas.
No comments:
Post a Comment