python数据分组运算
摘要: pandas 的 GroupBy 功能可以方便地对数据进行分组、应用函数、转换和聚合等操作。 # 原作者: lionets GroupBy 分组运算 有时也被称为 “split-apply-combine” 操作。其中的 “split” 便是借由 obj.groupby() 方法来实现的。 .groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False) 方法作用于一条轴向上,并接受一个 分组键 (by)参数来给调用者分组。分组键可以是Series 或列表,要求其长度与待分组的轴一致;也可以是映射函数、字典甚至数组的某条 列名(字符串) ,但这些参数类型都只是快捷方式,其最终仍要用于生成一组用于拆分对象的值。 lang:python >>> df = DataFrame({'key1':['a','a','b','b','a'], 'key2':['one','two','one','two','one'], 'data1':np.random.randn(5), 'data2':np.random.randn(5)}) >>> df data1 data2 key1 key2 0 0.922269 0.110285 a one 1 -0