Sunday 14 January 2018

Como inserir dados da série temporal em stata forex


AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital, ajudando o Grupo de Consultoria Estatal, dando um presente. Módulo de Aprendizagem Stata Inserindo seus dados no Stata. Este módulo irá mostrar como inserir seus dados no Stata. Isso abrange a entrada de dados com delimitados por vírgulas, delimitados por tabelas, delimitados em espaço e dados de coluna fixa. Nota . Todos os arquivos de entrada de amostra para esta página foram criados por nós e não estão incluídos no Stata. Você pode criá-los você mesmo para experimentar este código copiando e colando os dados em um arquivo de texto. 1. Digitando dados no editor Stata Um dos métodos mais fáceis para obter dados no Stata está usando o editor de dados Stata, que se assemelha a uma planilha do Excel. É útil quando seus dados estão em papel e precisam ser digitados, ou se seus dados já foram digitados em uma planilha do Excel. Para saber mais sobre o editor de dados Stata, veja o módulo de edição. 2. Arquivo separado de Commatab com nomes de variáveis ​​na linha 1 Dois formatos comuns de arquivo para dados brutos são arquivos separados por vírgulas e arquivos separados por separações. Esses arquivos geralmente são feitos a partir de programas de planilhas como o Excel. Considere o arquivo delimitado por vírgulas mostrado abaixo. Este arquivo tem duas características: - A primeira linha possui os nomes das variáveis ​​separadas por vírgulas, - As seguintes linhas possuem os valores das variáveis, também separados por vírgulas. Esse tipo de arquivo pode ser lido usando o comando da planilha, conforme mostrado abaixo. Podemos verificar se o dado veio diretamente usando o comando da lista. Como você provavelmente terá mais observações, você pode usar para listar apenas um subconjunto de observações. Abaixo, listamos as observações 1 a 3. Agora que o arquivo foi lido no Stata, você pode salvá-lo com o comando save (ignoraremos esse passo). O comando exato da planilha poderia ser usado para ler um arquivo delimitado por tabulação. O comando da planilha é inteligente porque pode descobrir se você possui um arquivo delimitado por vírgulas ou delimitado por tabulações e depois lê-lo. (No entanto, a planilha não pode lidar com um arquivo que usa uma mistura de vírgulas e guias como delimitadores.) Antes de iniciar a próxima seção, limpe os dados existentes na memória. 3. Arquivo separado do Commatab (sem nomes de variáveis ​​no arquivo) Considere um arquivo idêntico ao que examinamos na seção anterior, mas não possui os nomes das variáveis ​​na linha 1. Este arquivo pode ser lido usando o comando da planilha, como mostrado abaixo. Mas, onde a Stata obteve os nomes das variáveis ​​Se a Stata não possui nomes para as variáveis, elas as nomeam v1. V2. V3 etc., como você pode ver abaixo. Limpe os dados na memória e tente ler os dados novamente. Agora, vamos tentar ler os dados e dizer ao Stata os nomes das variáveis ​​no comando da planilha. Como o comando da lista mostra, o Stata usou os nomes das variáveis ​​fornecidos no comando da planilha. O comando da planilha funciona igualmente bem nos arquivos que usam guias como separadores. Stata examina o arquivo e determina se vírgulas ou abas estão sendo usadas como separadores e lê o arquivo adequadamente. Agora que o arquivo foi lido no Stata, você pode salvá-lo com o comando save (ignoraremos esse passo). Limpe os dados na memória antes de ir para a próxima seção. 4. Arquivo separado por espaço Considere um arquivo onde as variáveis ​​são separadas por espaços como o mostrado abaixo. Observe que a marca do carro está contida entre aspas. Isso é necessário porque os nomes contêm espaços dentro deles. Sem as citações, Stata pensaria que a AMC é a marca e a Concord é o mpg. Se a marca não tivesse espaços incorporados dentro delas, aspas não seriam necessárias. Este arquivo pode ser lido com o comando infile como mostrado abaixo. Você pode estar perguntando a si mesmo, de onde veio o str13. Uma vez que a marca é uma variável de personagem, precisamos dizer à Stata que é uma variável de personagem, e quanto tempo ela pode ser. O str13 diz a Stata que é uma variável stritch e que pode ter até 13 caracteres de largura. O comando da lista confirma que os dados foram lidos corretamente. Agora que o arquivo foi lido no Stata, você pode salvá-lo com o comando save (ignoraremos esse passo). Limpe os dados na memória antes de passar para a próxima seção. 5. Arquivo de formato fixo Considere um arquivo usando dados de coluna fixa como o mostrado abaixo. Observe que as variáveis ​​são claramente definidas por qual coluna (s) elas estão localizadas. Além disso, note que a marca do carro não está contida entre aspas. As citações não são necessárias porque as colunas definem onde a marca começa e termina, e os espaços incorporados não geram confusão. Este arquivo pode ser lido com o comando infix como mostrado abaixo. Aqui novamente, precisamos dizer a Stata que faz é uma variável de strings, fazendo antes com str. Não precisamos indicar o comprimento, uma vez que a Stata pode inferir que a marca pode ter até 13 caracteres de largura com base nas localizações das colunas. O comando da lista confirma que os dados foram lidos corretamente. Agora que o arquivo foi lido no Stata, você pode salvá-lo com o comando save (ignoraremos esse passo). Limpe os dados na memória antes de passar para a próxima seção. 6. Outros métodos de obtenção de dados no Stata Isso não abrange todos os métodos possíveis para obter dados brutos no Stata, mas cobre muitas situações comuns. Consulte o Guia do Usuário do Stata para obter informações mais abrangentes sobre a leitura de dados brutos no Stata. Outro método que deve ser mencionado é o uso de programas de conversão de dados. Esses programas podem converter dados de um formato de arquivo para outro formato de arquivo. Por exemplo, eles poderiam criar diretamente um arquivo Stata de uma planilha do Excel, uma planilha do Lotus, um banco de dados Access, um banco de dados Dbase, um arquivo de dados SAS, um arquivo do sistema SPSS, etc. Dois desses exemplos são Stat Transfer e DBMS Copy. Ambos os produtos estão disponíveis em PCs SSC e a cópia DBMS está disponível no Nicco e Aristóteles. Finalmente, se você estiver usando Nicco, Aristotle ou o RS6000 Cluster, há um comando especificamente para converter dados do SAS em Stata chamado sas2stata. Se você possui dados SAS que deseja converter para o Stata, esta pode ser uma maneira útil de obter seus dados SAS no Stata. 7. Resumo Traga o editor de dados Stata para digitar dados. Leia no arquivo delimitado por vírgulas ou tabulações chamado auto2.raw, levando os nomes das variáveis ​​da primeira linha de dados. Leia no arquivo delimitado por vírgulas ou tabulações chamado auto3.raw nomeando as variáveis ​​mpg peso e preço. Leia no arquivo separado do espaço chamado auto4.raw. A variável make é cercada por aspas porque tem espaços embutidos embutidos. Leia no arquivo de formato fixo chamado auto5.raw. Outros métodos DBMSCopy, Stat Transfer, sas2stata e Stata Guia do Usuário. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia. Para perguntas rápidas, envie um email para dataprinceton. edu. Não há appts. Necessário durante as horas de caminhada. Nota: o laboratório DSS está aberto enquanto o Firestone estiver aberto, sem compromissos necessários para usar os computadores do laboratório para sua própria análise. Dados da série temporal nos dados da série Stata e tsset Para usar as funções e análises da série temporária Statas, você deve primeiro certificar-se de que seus dados são, de fato, séries temporais. Primeiro, você deve ter uma variável de data que esteja no formato da data Stata. Em segundo lugar, você deve certificar-se de que seus dados são classificados por esta variável de data. Se você tiver dados de painel, seus dados devem ser classificados pela variável de data dentro da variável que identifica o painel. Finalmente, você deve usar o comando tsset para dizer à Stata que seus dados são séries temporais: o primeiro exemplo diz a Stata que você possui dados simples da série temporal e o segundo diz ao Stata que você possui dados do painel. Stata Date Format Stata armazena as datas como o número de dias decorridos desde 01 de janeiro de 1960. Existem diferentes maneiras de criar datas Stata decorrentes que dependem de como as datas são representadas em seus dados. Se o seu conjunto de dados original já contém uma única variável de data, use a função date () ou um dos outros comandos da data da string. Se você tiver variáveis ​​separadas armazenando diferentes partes da data (mês, dia e ano e ano e trimestre, etc.), você precisará usar as funções da variável de data parcial. Funções de data para uma única variável de data de string Às vezes, seus dados terão as datas em formato de string. (Uma variável de string é simplesmente uma variável que contém qualquer coisa que não seja apenas números.) A Stata fornece uma maneira de convertê-las em datas de séries temporais. A primeira coisa que você precisa saber é que a string deve ser facilmente separada em seus componentes. Em outras palavras, cordas como 01feb1990 1 de fevereiro de 1990 020190 são aceitáveis, mas 020190 não é. Por exemplo, digamos que você possui um sdate de variável de string com valores como 01feb1990 e você precisa convertê-lo para uma data da série de tempo diária: Observe que nesta função, como com as outras funções para converter strings em datas de séries temporais, A parte DMY indica a ordem do dia, mês e ano na variável. Se os valores fossem codificados como 1 de fevereiro de 1990, teríamos usado MDY em vez disso. E se a data original tiver apenas dois dígitos para o ano, então, usaríamos: sempre que você tiver dois anos de dígito, basta colocar o século antes do Y. Se você tiver os dois últimos dois anos, como 1298 e 1200, use: Onde 2020 é o maior ano que você tem em seu conjunto de dados. Aqui estão as outras funções: semanal (stringvar, wy) mensal (stringvar, my) trimestral (stringvar, qy) meio ano (stringvar, hy) anual (stringvar, y) Nota: Stata 10 usa letras maiúsculas como DMY enquanto versão anterior de Stata usa minúsculas, dmy. Funções de data para variáveis ​​de data parcial Muitas vezes, você terá variáveis ​​separadas para os vários componentes da data em que você precisa juntá-los antes de designá-los como datas de série temporal adequadas. A Stata fornece uma maneira fácil de fazer isso com variáveis ​​numéricas. Se você tiver variáveis ​​separadas por mês, dia e ano, use a função mdy () para criar uma variável de data decorrida. Depois de criar uma variável de data decorrida, você provavelmente irá formatá-la, conforme descrito abaixo. Use a função mdy () para criar uma variável de data Stata decorrida quando seus dados originais contêm variáveis ​​separadas por mês, dia e ano. As variáveis ​​mês, dia e ano devem ser numéricas. Por exemplo, suponha que você esteja trabalhando com esses dados: Convertendo uma variável de data armazenada como um único número Se você tiver uma variável de data onde a data é armazenada como um único número do formulário yyyymmdd (por exemplo, 20041231 para 31 de dezembro de 2004) O seguinte conjunto de funções irá convertê-lo em uma data decorrida Stata. Gen year int (date10000) gen month int ((data-ano10000) 100) gen day int ((data-ano10000-month100)) gen mydate mdy (mês, dia, ano) formato mydate d Formatos de data da série de tempo Use o comando de formato Para exibir datas Stata decorridas como datas de calendário. No exemplo dado acima, a variável de data decorrida, mydate, tem os seguintes valores, que representam o número de dias antes ou depois de 1 de janeiro de 1960. Para obter mais informações, consulte o Guia do Usuário do Stata, capítulo 27. Especificando datas Muitas vezes, precisamos Construe uma análise específica apenas em observações que se enquadram em uma determinada data. Para fazer isso, precisamos usar algo chamado de literal de data. Um literal de data é simplesmente uma maneira de inserir uma data em palavras e ter Stata automaticamente convertê-la em uma data decorrida. Tal como acontece com o literal d () para especificar uma data regular, existem os literais w (), m (), q (), h () e y () para inserção semanal, mensal, trimestral, semestral e Datas anuais, respectivamente. Aqui estão alguns exemplos: se você quiser especificar um intervalo de datas, você pode usar as funções tin () e twithin (): a diferença entre tin () e twithin () é que estaminha () inclui as datas de início e fim, Enquanto twithin () os exclui. Digite sempre a data de início e escreva-os como faria para qualquer das funções d (), w (), etc. Listas de variáveis ​​de séries temporais Muitas vezes, em análises de séries temporais, precisamos atrasar ou liderar os valores de uma variável de uma observação para a próxima. Se temos muitas variáveis, isso pode ser complicado, especialmente se precisarmos atrasar uma variável mais de uma vez. Em Stata, podemos especificar quais variáveis ​​devem ser atrasadas e quantas vezes sem ter que criar novas variáveis, economizando assim espaço de disco e memória. Você deve notar que o comando tsset deve ter sido emitido antes de qualquer um dos truques nesta seção funcionar. Além disso, se você definiu seus dados como dados de painel, a Stata reiniciará automaticamente os cálculos à medida que ele chega ao início de um painel para que não precise se preocupar com os valores de um painel sendo transferido para o próximo. L. varname e F. varname Se você precisa atrasar ou liderar uma variável para uma análise, você pode fazê-lo usando L. varname (to lag) e F. varname (para liderar). Ambos funcionam da mesma maneira, tão bem, apenas mostre alguns exemplos com L. varname. Digamos que você deseja regredir o lucro deste ano na renda dos últimos anos: conseguiria isso. O L. diz a Stata que atrasa a renda por um período de tempo. Se você quisesse atrasar a renda em mais de um período de tempo, você simplesmente mudaria o L. para algo como L2. Ou L3. Para atrasá-lo em 2 e 3 períodos, respectivamente. Os dois comandos a seguir produzirão os mesmos resultados: Outro atalho útil é D. varname, que leva a diferença de renda no tempo 1 e renda no tempo 2. Por exemplo, digamos que uma pessoa ganhou 20 ontem e 30 hoje.

No comments:

Post a Comment