Pandas GroupBy对象 索引与迭代方法
如下所示:
importpandasaspd df=pd.DataFrame({'性别':['男','女','男','女', '男','女','男','男'], '成绩':['优秀','优秀','及格','差', '及格','及格','优秀','差'], '年龄':[15,14,15,12,13,14,15,16]}) GroupBy=df.groupby("性别")
GroupBy.iter()
GroupBy对象是一个迭代对象,每次迭代结果是一个元组,元组的第一个元素是该组的名称(就是groupby的列的元素名称),第二个元素是该组的具体信息,是一个数据框,索引是以前的数据框的总索引
forname,groupinGroupBy: print(name) print(group) 女 年龄性别成绩 114女优秀 312女差 514女及格 男 年龄性别成绩 015男优秀 215男及格 413男及格 615男优秀 716男差
GroupBy.groups
显示分组的组名,以及所对应的索引
print(GroupBy.groups) {'女':Int64Index([1,3,5],dtype='int64'),'男':Int64Index([0,2,4,6,7],dtype='int64')}
GroupBy.indices
类似于GroupBy.groups
print(GroupBy.indices) {'女':array([1,3,5],dtype=int64),'男':array([0,2,4,6,7],dtype=int64)}
GroupBy.get_group(name[,obj])
获得某一个分组的具体信息
In[2]:GroupBy.get_group("男") Out[2]: 年龄性别成绩 015男优秀 215男及格 413男及格 615男优秀 716男差
Grouper([key,level,freq,axis,sort])
应用
可以先通过循环获得所有的组的名称
fornameinGroupBy: print(name)#获得所有分组的名称 GroupBy.get_group(name)#获得所有该名称的数据
以上这篇PandasGroupBy对象索引与迭代方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。