pandas-pd.read_csv

こ雲淡風輕ζ 提交于 2020-12-03 11:57:36

read_csv()接受以下常见参数

参数 中文名 参数类型 默认参数 参数功能 说明
filepath_or_buffer   various

:文件路径、URL、或者

是read()函数返回的对象

   
sep 指定分隔符 str 默认是','    
delimiter 定界符 str 默认是None   指定该参数,sep失效
delim_whitespace   boolean 默认是False 指定空格或者'\t'是否作为分隔符使用 如果该参数指定为True,则delimiter失效
header       指定行号用于列名,默认指定是第0行作为列名。如果没有列名,则显式指定header = None  
names     默认是None 如果表格中没有列名,就显式指定header = None,然后由names= ["xx","xx"]指定列名。  
index_col   int or sequence or False 默认是None 用作行索引的列编号或者列名 当设定index_col = False时,强制pandas不使用第一个列作为行名
usecols   list-like 或者callable 默认是None 返回列的子集,就是你可以指定哪些列返回,比如usecols = [1,3,5]或者usecols = [' xx','xx']  xx是列名 输入0、1这种数字则顺序就没了,若想保留列的顺序,就输入列名。
squeeze   boolean 默认是False 如果只包含一列,则设置为True,会返回一个Series.  
prefix   str 默认是None 在没有列标题时,用来给列添加前缀。 比如prefix = 'xx',则列名就是xx0,xx1,xx2....
mangle_dupe_cols   boolean 默认是True 将列名重复的列,更名为X.0,X.1,X.2.. 如果设置为False,则覆盖所有重名列。
dtype   type 默认是None 指定每列数据的类型 dtype = {‘a’:np.float64,'b':np.int32}
skiprows   list-like或者interger 默认是None 跳过指定的行 skiprows = [1,2,3,4] or skiprows = lambda x :x%2 !=0
skipfooter   int 默认是0 从底部跳过的行 skiprows = [1,2,3]从尾部忽略123行
nrows   int 默认是None 需要读取的行数 nrows  = [1,2,3]从头部读取123行
na_values   scalar或者str或者list-like 默认是NOne 用于替换NA/NaN的值  
memory_map   boolean 默认是False 如果filepath是filepath_or_buffer,则直接将其映射到内存  
keep_default_na   boolearn 默认是True 与na_values搭配使用,  
na_values          
na_filter   boolean 默认是True 如果设置为False,则不检查有无空值,提高速度  
verbose   boolean 默认是False 指示替代非数字列的NA的数量  
skip_blank_lines   boolean 默认是True 如果是True则跳过空白行,为False则空白行用NaN替代。  
encoding   str 默认是None encoding  = 'utf-8'  
           
           
           
           
           
           
           
           
           

参考网址:https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html#io-read-csv-table

建议还是看英文介绍,详细

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!