pandas # pandas 数据结构 # 导入 pandas import pandas as pd from pandas import DataFrame,Series import numpy as np Series的创建 两种创建方式: 由列表或numpy数组创建 默认索引为0到N-1的整数型索引 还可以通过设置index参数指定索引 Series(data=[1,2,3]) Series(data=[1,2,3],index=['a','b','c']) Series(data=np.random.randint(1,100,size=(3,))) 索引 切片 去重 # Series的索引和切片 s[0:2] # 可以使用s.head(),tail()分别查看前n个和后n个值 s.head(2) s.tail(2) 去空 运算 s1 = Series(data=[1,2,3,4],index=['a','b','c','d']) s2 = Series(data=[1,2,3,4],index=['a','b','e','d']) s = s1 + s2 # 当索引没有对应的值时,可能出现缺失数据显示NaN(not a number)的情况 s # 可以使用pd.isnull(),pd.notnull(),或s.isnull(),notnull()函数检测缺失数据