记一次带逗号的数字类型处理

こ雲淡風輕ζ 提交于 2019-11-27 21:49:12

这个整型在西文中, 就是欧洲人的表示方法中 要使用 , 区分3位数字. 所以在int中会有逗号。

1 import pandas
2 pd=pandas.read_csv(r'D:\data\test01.csv')
3 print(pd.info())
4 print(pd.head(10))

可以看出area字段类型是object,现在我们的需求,就是将这个数据类型转换成int类型。

自定义转换函数:

import numpy as npdef convert_int(str_0):
    str_1=str_0.replace(',','')
    return np.int(str_1)

首先自定义函数,将字段中的逗号替换掉,然后转成int

print(pd['area'].apply(convert_int).head(3))

也可以在读取数据时进行数据类型转换,一步到位

pd=pandas.read_csv(r'D:\data\test01.csv',converters={'ID':str,'area':convert_int,'Scence':int})

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!