两个问题: 1.文件编码问题,win系统excel另存的csv文件可以用pandas的encoding='gbk'来读写,对中文就可以很好的支持, python默认的'utf-8'编码的csv文件,excel打开中文是乱码 2.用pandas将多个同格式csv数据文件合并 源码如下:
#-*- coding: utf-8 -*-
import pandas as pd
def csv_merge(flist,fo,cols=None, encoding='gbk'):
l=len(flist)
for i in range(l):
s=pd.read_csv(data_path+flist[i],index_col=None, header=0, usecols=cols, na_values=[''],encoding=encoding)
if i==0:
s.to_csv(data_path+fo,encoding=encoding, index=False)
else:
s.to_csv(data_path+fo,encoding=encoding,mode='a', header=False, index=False)
import os
data_path=r'G:\data'
flist =os.listdir(data_path)
data_path+='\\'
fo='po.csv'
csv_merge(flist,fo,cols=[1,2,6])
来源:oschina
链接:https://my.oschina.net/u/2912942/blog/745171