Juntar Data Set's e Consultar Arquivos que Estão na Pasta com Python os.walk

Na postagem anterior, Como Unir Data Set's no Jupyter Notebook Com as Funções Python pd.merge e pd.concat, demostrei como unir bases de dados manualmente no Python para montar um único data frame.

Agora vou apresentar uma maneira mais otimizada e evoluída que você pode implementar na sua rotina.

Com este código, basta você informar a pasta que contém os arquivos do excel e a pasta de saída com as bases já unidas:


def juntarDataSets():
   
    #Pasta de data sets a unir
    caminhoEntrada = 'C:\\Users\Tcode\\teste\\'
    #Pasta com os arquivos unidos
    caminhoSaida = 'C:\\Users\Tcode\\testeSaidas\\'
   
    #Contador
    a = 0
           
    #Comando para ler na pasta quais arquivos ela contém   
    for _, _, listaArquivos in os.walk(caminhoEntrada):
       
        #Mostra os arquivos
        print(listaArquivos)
       
        #Carrega o primeiro arquivo que ele encontrou na memória
        arqUnidos = pd.read_excel(caminhoEntrada + listaArquivos[0])       
       
        #Faz um for para adicionar os próximos arquivos da pasta
        for arq in listaArquivos:
           
        #O Contador impede que ele adicione o primeiro arquivo 2 vezes
            if a > 0:
        #Carrega o próximo arquivo na variável arqAtual
        #Depois adiciona o arqAtual no arquivo completo
                arqAtual = pd.read_excel(caminhoEntrada + arq)
                arqUnidos = pd.DataFrame.append(arqUnidos, arqAtual)
       
        #Incrementa o contador
            a = a + 1   
   
    #Gera um arquivo de saída com as bases unidas em formato .xlsx
    arqUnidos.to_excel(caminhoSaida + 'AgoraFoi.xlsx', encoding='utf-8', index=False)
    print('Feito com sucesso!')


Veja o resultado, todos os arquivos que estão na pasta são listados:


Deixe seu comentário :-)
Abraço!
Tutoriais [Code]

Comentários

Postagens mais visitadas