在Pandas中给多层索引降级的方法

2020-02-15 23:44:08

字体：大中小

来源：转载

供稿：网友

# 背景介绍通常我们不会在Pandas中主动设置多层索引,但是如果一个字段做多个不同的聚合运算, 比如sum, max这样形成的Column Level是有层次的,这样阅读非常方便,但是对编程定位比较麻烦. # 数据准备

import pandas as pdimport numpy as npdf = pd.DataFrame(np.arange(0, 14).reshape(7,2),columns =['a','b'] )df.a = df.a %3df['who'] = 'Bob'df.loc[df.a%4==0,'who'] = 'Alice'

	a	b	who
0	0	1	Alice
1	2	3	Bob
2	1	5	Bob
3	0	7	Alice
4	2	9	Bob
5	1	11	Bob
6	0	13	Alice

# 对一个字段同时用3个聚合函数

gp1 = df.groupby('who').agg({'b':[sum,np.max, np.min], 'a':sum})gp1

	b			a
	sum	amax	amin	sum
who
Alice	8.0	7.0	1.0	0
Bob	28.0	11.0	3.0	6

索引是有层次的,虚要通过下面这种方式,个人感觉不是很方便.下面介绍2种方法来解决这个问题

#有层次的索引访问方法gp1.loc['Bob', ('b', 'sum')]

28.0

# 直接去除一层

gp2 = gp1.copy(deep=True)gp2.columns = gp1.columns.droplevel(0)gp2

	sum	amax	amin	sum
who
Alice	8.0	7.0	1.0	0
Bob	28.0	11.0	3.0	6

# 把2层合并到一层

gp3 = gp1.copy(deep=True)gp3.columns = ["_".join(x) for x in gp3.columns.ravel()]gp3

上一篇：python获取微信小程序手机号并绑定遇到的坑

下一篇：Windows 8.1 64bit下搭建 Scrapy 0.22 环境

学习交流

如何重启打印机打印服务

如何重启打印机打印服务...

热门图片

猜你喜欢的新闻

猜你喜欢的关注

新闻热点

明兮语文停止运营发展资金链断裂

2020-02-16 09:52:44

2006年李俊编写了“熊猫烧香”电脑病毒，现在过得怎么样？

2020-02-15 15:53:44

谷歌合并Alphabet旗下子公司Jigsaw，未来会如何发展？

2020-02-11 22:02:38

NASA说今天地球引力最小能让扫帚立起来？原因很简单

2020-02-11 21:45:12

TCL集团宣布今日起正式更名为“TCL科技”

2020-02-07 10:36:18

黑莓曲终落，情怀价几何？

2020-02-06 12:16:44

疑难解答

图片精选

网友关注