对pandas的行列名更改与数据选择详解

2020-01-04 14:05:33

字体：大中小

来源：转载

供稿：网友

记录一些pandas选择数据的内容，此前首先说行列名的获取和更改，以方便获取数据。此文作为学习巩固。

这篇博的内容顺序大概就是：行列名的获取 —> 行列名的更改 —> 数据选择

一、pandas的行列名获取和更改

1. 获取: df.index() df.columns()

首先，举个例子，做一个DataFrame如下：

>>>import pandas as pd>>>import numpy as np>>>data = pd.DataFrame({'a':[1,2,3],'b':[4,5,6],'c':[7,8,9]})>>>data

pandas,行列名,更改

设置了列索引为 abc，行索引是自动生成的，也可以设置

>>>data.index = ['A','B','C']>>>data

pandas,行列名,更改

以下的做法都以这个 data 作为数据举例

接下来就可以获取索引了，index-行索引，columns-列索引

>>>data.index

pandas,行列名,更改

>>>data.columns

pandas,行列名,更改

2. 修改，看到有很多方法，这里推荐一种比较灵活好用的方法

 df.rename(index={ }, columns={ }, inplace=True)>>>data.rename(index={'A':'D', 'B':'E', 'C':'F'}, columns={'a':'d', 'b':'e', 'c':'f'}, inplace = True)>>>data

pandas,行列名,更改

说明3点：

1. index和columns无关，可以分别指定，也就是说，可以只修改行索引，那么rename()中只写index

2. 索引可以任意挑选，如此处，index={'A':'D', 'C':'F'} 则只改A和C，columns同样

3. inplace=True, 在原dataframe上改动

二、pandas的数据选择

1. 直接用索引选(不灵活、不推荐） df[ ]

1）选择‘a'列

>>>data['a']

pandas,行列名,更改

注意：

1. 这样取出的数据类型为 Series

2. 这种方法只能取出一列，不能用数字下标，不能多选或片选, data['a','b'] , data['a':'c'] , data[0]

2）选择'A','B'行

>>>data['A':'B'] >>>data[0:2] # 两种方法同一结果

pandas,行列名,更改

注意：

1. 这样取出的数据类型为 DateFrame

2. 这种方法只能用于片选行，可以用数字下标，不能单独取，即 data['A'] , data['A','B'] , data[1]

2.使用 .loc(推荐） df.loc()，()内参数先行后列，区别行列的取法

1) 取列：

>>>data.loc[:,['a','c']] #图1 需要行全取，再对应指定列

2）取行：

>>>data.loc[['A','B']] #图2 直接指定行

3）取行列交叉值：

>>>data.loc[['A'],['b','c']] #图3

pandas,行列名,更改

注意：

1. 区别 df.iloc()

.loc() —— 使用标签 label 作为索引取值

.iloc() —— 使用整数下标 index 作为索引取值,如上面三句可以换成以下三句，输出数据类型有不同

>>>data.iloc[:,[0,2]] # DataFrame>>>data.iloc[[0,1]] # DataFrame>>>data.iloc[0,[1,2]] # Series

2. 对于数字类型的变量，可以使用bool 选取行，列不能用bool，如

>>>data.loc[data.b>5] # DataFrame

pandas,行列名,更改

>>>data.loc[data.b>5,['c']] #DataFrame 输出为9位置的frame>>>data.iloc[data.b.values>5,[2]] #DataFrame 输出同上，需要有 .values取值

3. .ix[ ] 可以混用label和index，位置使用同 .loc[ ] .iloc[ ]

以上这篇对pandas的行列名更改与数据选择详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持VEVB武林网。

注：相关教程知识阅读请移步到python教程频道。

上一篇：python pandas读取csv后,获取列标签的方法

下一篇：Python numpy.array()生成相同元素数组的示例

学习交流

解决内存不足妙方

解决内存不足妙方...

热门图片

猜你喜欢的新闻

猜你喜欢的关注

新闻热点

雷军2020新年全员信：“5G+AIoT”五年投500亿

2020-01-03 21:43:53

春运售票超3亿张！售票总量再创历史新高

2020-01-03 20:41:46

Windows10市场份额全球第一微软是否再无敌手？

2020-01-03 20:31:47

比尔盖茨一次错误，付出2.8万亿的代价

2020-01-02 08:44:34

长江迎来最长禁渔期：十年禁渔，方才有鱼

2020-01-02 08:28:02

快手封杀淘宝？回应：系统升级，淘宝商品暂无法审核

2020-01-01 22:50:39

疑难解答

图片精选

网友关注