首页 > 编程 > Python > 正文

Pandas Shift函数的基础入门学习笔记

2020-02-15 23:41:58
字体:
来源:转载
供稿:网友

Pandas Shift函数基础

在使用Pandas的过程中,有时会遇到shift函数,今天就一起来彻底学习下。先来看看帮助文档是怎么说的:

>>> import pandas>>> help(pandas.DataFrame.shift)Help on function shift in module pandas.core.frame: shift(self, periods=1, freq=None, axis=0) Shift index by desired number of periods with an optional time freq  Parameters ---------- periods : int Number of periods to move, can be positive or negative freq : DateOffset, timedelta, or time rule string, optional Increment to use from the tseries module or time rule (e.g. 'EOM'). See Notes. axis : {0 or 'index', 1 or 'columns'}  Notes ----- If freq is specified then the index values are shifted but the data is not realigned. That is, use freq if you would like to extend the index when shifting and preserve the original data.  Returns ------- shifted : DataFrame

该函数主要的功能就是使数据框中的数据移动,若freq=None时,根据axis的设置,行索引数据保持不变,列索引数据可以在行上上下移动或在列上左右移动;若行索引为时间序列,则可以设置freq参数,根据periods和freq参数值组合,使行索引每次发生periods*freq偏移量滚动,列索引数据不会移动。

参数详解:

period:表示移动的幅度,可以是正数,也可以是负数,默认值是1,1就表示移动一次,注意这里移动的都是数据,而索引是不移动的,移动之后没有对应值的,就赋值为NaN。 freq: DateOffset, timedelta, or time rule string,可选参数,默认值为None,只适用于时间序列,如果这个参数存在,那么会按照参数值移动时间索引,而数据值没有发生变化。 axis: {0, 1, ‘index', ‘columns'},表示移动的方向,如果是0或者'index'表示上下移动,如果是1或者'columns',则会左右移动。

先来看一下一些简单的示例:

1、非时间索引下period的设置

假设存在一个DataFrame数据df:

index value1A 0B 1C 2D 3

如果执行以下代码  df.shift()  就会变成如下:

index value1A NaNB 0C 1D 2

执行 df.shift(2) 就会得到:

index value1A NaNB NaNC 0D 1

执行 df.shift(-1) 会得到:

index value1A 1B 2C 3D NaN

注意,shift移动的是整个数据,如果df有如下多列数据:

 AA BB CC DDa 0 1 2 3b 4 5 6 7c 8 9 10 11d 12 13 14 15

执行 df.shift(2) 的数据为:

 AA BB CC DDa NaN NaN NaN NaNb NaN NaN NaN NaNc 0.0 1.0 2.0 3.0d 4.0 5.0 6.0 7.0

如果只想移动df中的某一列数据,则需要这样操作: df['DD']= df['DD'].shift(1)

执行后的数据为:

 AA BB CC DDa 0 1 2 NaNb 4 5 6 NaNc 8 9 10 11d 12 13 14 15            
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表