Juntar Data Set's e Consultar Arquivos que Estão na Pasta com Python os.walk
Na postagem anterior, Como Unir Data Set's no Jupyter Notebook Com as Funções Python pd.merge e pd.concat, demostrei como unir bases de dados manualmente no Python para montar um único data frame.
Agora vou apresentar uma maneira mais otimizada e evoluída que você pode implementar na sua rotina.
Agora vou apresentar uma maneira mais otimizada e evoluída que você pode implementar na sua rotina.
Com este código, basta você informar a pasta que contém os arquivos do excel e a pasta de saída com as bases já unidas:
def juntarDataSets():
#Pasta de data sets a unir
caminhoEntrada = 'C:\\Users\Tcode\\teste\\'
#Pasta com os arquivos unidos
caminhoSaida = 'C:\\Users\Tcode\\testeSaidas\\'
#Contador
a = 0
#Comando para ler na pasta quais arquivos ela contém
for _, _, listaArquivos in os.walk(caminhoEntrada):
#Mostra os arquivos
print(listaArquivos)
#Carrega o primeiro arquivo que ele encontrou na memória
arqUnidos = pd.read_excel(caminhoEntrada + listaArquivos[0])
#Faz um for para adicionar os próximos arquivos da pasta
for arq in listaArquivos:
#O Contador impede que ele adicione o primeiro arquivo 2 vezes
if a > 0:
#Pasta de data sets a unir
caminhoEntrada = 'C:\\Users\Tcode\\teste\\'
#Pasta com os arquivos unidos
caminhoSaida = 'C:\\Users\Tcode\\testeSaidas\\'
#Contador
a = 0
#Comando para ler na pasta quais arquivos ela contém
for _, _, listaArquivos in os.walk(caminhoEntrada):
#Mostra os arquivos
print(listaArquivos)
#Carrega o primeiro arquivo que ele encontrou na memória
arqUnidos = pd.read_excel(caminhoEntrada + listaArquivos[0])
#Faz um for para adicionar os próximos arquivos da pasta
for arq in listaArquivos:
#O Contador impede que ele adicione o primeiro arquivo 2 vezes
if a > 0:
#Carrega o próximo arquivo na variável arqAtual
#Depois adiciona o arqAtual no arquivo completo
arqAtual = pd.read_excel(caminhoEntrada + arq)
arqUnidos = pd.DataFrame.append(arqUnidos, arqAtual)
#Incrementa o contador
a = a + 1
#Gera um arquivo de saída com as bases unidas em formato .xlsx
arqUnidos.to_excel(caminhoSaida + 'AgoraFoi.xlsx', encoding='utf-8', index=False)
print('Feito com sucesso!')
Veja o resultado, todos os arquivos que estão na pasta são listados:
#Depois adiciona o arqAtual no arquivo completo
arqAtual = pd.read_excel(caminhoEntrada + arq)
arqUnidos = pd.DataFrame.append(arqUnidos, arqAtual)
#Incrementa o contador
a = a + 1
#Gera um arquivo de saída com as bases unidas em formato .xlsx
arqUnidos.to_excel(caminhoSaida + 'AgoraFoi.xlsx', encoding='utf-8', index=False)
print('Feito com sucesso!')
Veja o resultado, todos os arquivos que estão na pasta são listados:
Deixe seu comentário :-)
Abraço!
Tutoriais [Code]
Abraço!
Tutoriais [Code]
Comentários
Postar um comentário