常用数据操作
students01 = pd.read_excel('C:/students.xlsx', index_col='ID', sheet_name='page01')
students02 = pd.read_excel('C:/students.xlsx', index_col='ID', sheet_name='page02')
# 合并两个数据集
# 默认axis=0 表示从上到下方向
# axis = 1 表示从左到右方向
students1 = pd.concat([students01, students02], axis=0).reset_index(drop=True)
students2 = pd.concat([students01, students02], axis=1)
# 追加列
students1['Age'] = 25
students1['Age'] = np.repeat(25, len(students1))
# 删除列
students1.drop(columns=['Age', 'Score'], inplace=True)
# 在原有的两列之间 插入新列
students1.insert(1, column='Foo', value=np.arrange(0, len(students1)))
# 修改列名
students1.rename(columns={"Foo":"FOO", "Bar":"BAR"}, inplace=True)
# 去掉空值
# 转换数据类型
students['ID'] = students['ID'].astype(float)
for i in range(5, 10):
students['ID'].at[i] = np.nan
students.dropna(inplace=True)
来源:oschina
链接:https://my.oschina.net/ski/blog/3183035