数组是Numpy操作的主要对象,也是python数据分析的主要对象,本系列文章是本人在学习Numpy中的笔记。
文章中以下都基于以下方式的numpy导入:
import numpy as npfrom numpy import *
1、普通数组的创建——np.arange(), np.array(),
(1) arange()建立是顺序数组,函数原型:arange([start,]stop[,step],dtype=None)
其中start参数如果省略,则表示从0开始,默认的dtype为float32
#创建从0-19的一维数组ar_1ar_1=np.arange(20)#output: ar_1=array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,17, 18, 19])#创建11-20,step=2的一维数组ar_2ar_2=np.arange(11,21,2)#output:ar_2=array([11, 13, 15, 17, 19])
(2)array()的主要用于创建多维数组,原型为:array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)
#创建一个2*3的数组,数据类型为int32ary_1=np.array([[2,2,3],[5,7,3]],dtype=int32)#output:ary_1=([[2, 2, 3],# [5, 7, 3]], dtype=int32)#创建一个2*3*3的数组,数据类型默认:ary_2=np.array([[[3,4,5],[3.3,4.2,4.2],[1.3,2.2,5.8]],[[2.3,1.9,5.7],[4.5,6.7,9.7],[2.2,1.2,7.99]]])#output:#array([[[ 3. , 4. , 5. ],# [ 3.3 , 4.2 , 4.2 ],# [ 1.3 , 2.2 , 5.8 ]],## [[ 2.3 , 1.9 , 5.7 ],# [ 4.5 , 6.7 , 9.7 ],# [ 2.2 , 1.2 , 7.99]]])ary_2.dtype#output:dtype('float64'),
#虽然由int和float, array是以可以保存这些数据的最小数据类型保存,所以是float32
#当然也可以通过reshape等方式改变数组的维度,从而获得自己所需要的数组
ary_3=np.arange(20,30).reshape(2,5)
#output:ary_3
#array([[20, 21, 22, 23, 24],
# [25, 26, 27, 28, 29]])
2. 特殊数组的创建:
(1)空数组:empty(),empty_like()
#创建一个3*3的空数组:e_1=np.empty([3,3])#In [89]: PRint e_1#[[ 1.72723371e-077 2.68678134e+154 4.44659081e-323] #[ 0.00000000e+000 0.00000000e+000 0.00000000e+000] #[ 0.00000000e+000 0.00000000e+000 0.00000000e+000]]#填充的数值都是随机的random#通过empty_like创建与e_1一样形状的空数组e_2=np.empty_like(e_1)#In [93]: print e_2#[[ 1.72723371e-077 1.72723371e-077 2.00299617e-313] #[ 1.72723371e-077 5.92878775e-323 3.18299369e-313] #[ 0.00000000e+000 9.73471935e-309 0.00000000e+000]]
(2)其他特殊数组创建:eye, ones, zeros也有类似的结构,另外还有一个identity函数,用以创建方阵
#创建3*3主对角线为1的方阵:ey_1=np.eye(3,3,k=0)print ey_1#[[ 1. 0. 0.]#[ 0. 1. 0.]#[ 0. 0. 1.]]#ey_2的对角线uper了一个位置(行)ey_2=np.eye(3,3,k=1)pringt ey_2#[[ 0. 1. 0.]#[ 0. 0. 1.]#[ 0. 0. 0.]]
one_1=np.ones([5,9])print one_1#In [99]: print one_1#[[ 1. 1. 1. 1. 1. 1. 1. 1. 1.]#[ 1. 1. 1. 1. 1. 1. 1. 1. 1.]#[ 1. 1. 1. 1. 1. 1. 1. 1. 1.]#[ 1. 1. 1. 1. 1. 1. 1. 1. 1.]#[ 1. 1. 1. 1. 1. 1. 1. 1. 1.]]
zero_1=np.zeros([2,3])print zero_1#[[ 0. 0. 0.]#[ 0. 0. 0.]]
In [103]: idenOut[103]:array([[ 1., 0., 0., 0., 0., 0., 0.], [ 0., 1., 0., 0., 0., 0., 0.], [ 0., 0., 1., 0., 0., 0., 0.], [ 0., 0., 0., 1., 0., 0., 0.], [ 0., 0., 0., 0., 1., 0., 0.], [ 0., 0., 0., 0., 0., 1., 0.], [ 0., 0., 0., 0., 0., 0., 1.]])
3. 结构体数组
通常,一个数组保存的元素都是同源的,即数组内所有元素都需为同一个类型。在实际的数据分析过程中,尤其是二维spreadsheet式格式的数据,同一行的数据由不同的类型构成。这就需要为这种数据定义一个个性的dtype。dtype实际上是一个类,可以通过赋予参数定义特殊的结构体数组类型。(个人觉得有点类似于SAS中的informat)
#定义一个名称为person的dtype,通过dtype#一个peson由name,age和weight构成person=np.dtype([('name',str,20),('age',int32),('weight',float32)])print person#[('name', 'S20'), ('age', '<i4'), ('weight', '<f4')]#就可以创建dtype为person的数组了student=array([('cnblog',10,12.2),('myBlog',40,30)],dtype=person)#由于类型规定了参数的个数,所以需要用tuple来创建数组的行数(因为其不可变),否则可能会有一个readable的exceptionprint student#[('cnblog', 10, 12.199999809265137) ('myBlog', 40, 30.0)]
4. 从文件创建(后续会有专门介绍)
新闻热点
疑难解答