MP-Execucao-Orcamentaria

Investigação da Execução Orçamentária e dados de despesas pelo Estado e Município.

View the Project on GitHub dan-reznik/MP-Execucao-Orcamentaria

Empenho: Preparo dos Dados, 2014-8

Inclusão de pacotes

library(tidyverse)
library(fs)
source("preparo_util.R")

Comprime todos os arquivos .csv (retira espaços extra)

fnames <- dir_ls("data",regexp="despesa\\d{4}\\.csv")
fnames %>% walk(squish_file)
fnames_squished <- dir_ls("data",regexp="despesa\\d{4}_squished\\.zip") %>%
  as.character
fnames_squished
#> [1] "data/despesa2018_squished.zip"

Extrai ano de cada nome de arqiuvo

anos <- map_chr(fnames_squished,str_extract,"\\d{4}")
anos
#> [1] "2018"

Lê todos os arquivos (sem descomprimir .zip), adiciona coluna “ano”, e concatena num só data frame

df_all <- fnames_squished %>%
  map2_dfr(anos,~{read_delim(.x,delim=";",quote="^")%>%
      mutate(ano=.y)%>%
      select(ano,everything())}) %>%
  mutate_if(is.character,as.factor) # taking long...
nrow(df_all)

Escreve num arquivo do r (formato RDS)

df_all %>% write_rds("data/df_all.rds",compress="bz2")

Apaga da memória

rm(df_all)