首页 > 学院 > 开发设计 > 正文

数据分析之分组拆分

2019-11-11 05:23:42
字体:
来源:转载
供稿:网友

1.代码

import pandas as pd;import numpy as np;data = {"data1":np.random.randn(1000),"data2":np.random.randn(1000)};df1 = pd.DataFrame(data);factor = pd.cut(df1.data1,4);#get equal length factor1 = pd.qcut(df1.data1,5, labels=False);def get_stats(group):    return {"min":group.min(),"max":group.max(),"count":group.count()};grouped = df1.data2.groupby(factor1);PRint grouped.apply(get_stats).unstack().dropna();

2.结果

       count       max       mindata1                           0      200.0  3.111853 -3.5561491      200.0  2.726763 -3.0158562      200.0  2.265047 -3.4394363      200.0  2.709829 -4.0883414      200.0  2.978180 -2.819611


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表