Numpy 就类似于一个数组,与Python的列表不同的是:Python的列表可以放入不同类型的数据,这样的好处是兼容性强,但是劣势是计算速度变慢,在大数据的处理时,我们需要高效率,所以Numpy便出现了;相比Python对象,Numpy的对象叫做ndarray
;
ndarray
的特点:
创建一个 ndarray 只需调用 NumPy 的 array 函数即可,如下:
numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)
参数说明:
名称 | 描述 |
---|---|
object | 数组或嵌套的数列 |
dtype | 数组元素的数据类型,可选 |
copy | 对象是否需要复制,可选 |
order | 创建数组的样式,C为行方向,F为列方向,A为任意方向(默认) |
subok | 默认返回一个与基类类型一致的数组 |
ndmin | 指定生成数组的最小维度 |
举例如下:
import numpy as np # 导入包
a = np.array([1,2,3,4]) #一维数组建立
print ('a:',a)
# 输出: a: [1 2 3 4]
b = np.array([[1,2,3,4],[5,6,7,8]]) # 二维数组
print ('b:',b)
# b: [[1 2 3 4]
# [5 6 7 8]]
c = np.array([[1,2,3,4],[5,6,7,8]],ndmin=3) # 指定最小纬度
print ('c:',c)
# c: [[[1 2 3 4]
# [5 6 7 8]]]
d = np.array([[1,2,3,4],[5,6,7,8]],dtype=complex) #制定数据类型
print ('d:',d)
# d: [[1.+0.j 2.+0.j 3.+0.j 4.+0.j]
# [5.+0.j 6.+0.j 7.+0.j 8.+0.j]]
由于是专门用来数据分析的包,故numpy支持非常多种数据类型,可根据需求选择合适的数据类型,可以大大提高运行速度;常用的数据类型如下:
备注:调用numpy 数据类型时,可以通过np.数据类型来调用,例如:np.int8,np.float16 等;
名称 | 类型代码 | 描述 |
---|---|---|
bool_ | ? | 布尔型数据类型(True 或者 False) |
int_ | 默认的整数类型(类似于 C 语言中的 long,int32 或 int64) | |
int8 | i1 | 字节(-128 to 127) |
int16 | i2 | 整数(-32768 to 32767) |
int32 | i4 | 整数(-2147483648 to 2147483647) |
int64 | i8 | 整数(-9223372036854775808 to 9223372036854775807) |
uint8 | u1 | 无符号整数(0 to 255) |
uint16 | u2 | 无符号整数(0 to 65535) |
uint32 | u4 | 无符号整数(0 to 4294967295) |
uint64 | u8 | 无符号整数(0 to 18446744073709551615) |
float_ | float64 类型的简写 | |
float16 | f2 | 半精度浮点数,包括:1 个符号位,5 个指数位,10 个尾数位 |
float32 | f4 / f | 单精度浮点数,包括:1 个符号位,8 个指数位,23 个尾数位 |
float64 | f8 / d | 双精度浮点数,包括:1 个符号位,11 个指数位,52 个尾数位 |
complex | complex128 类型的简写,即 128 位复数 | |
complex64 | c8 | 复数,表示双 32 位浮点数(实数部分和虚数部分) |
complex128 | c16 | 复数,表示双 64 位浮点数(实数部分和虚数部分) |
object | O | Python 对象类型 |
string_ | S | 固定长度字符串,如长度为20的字符串,为S20 |
a = np.array([1.1,2,3,4],dtype = np.float64)
print ('a:',a) # float64 类型
b = np.array([[1,2,3,4],[5,6,7,8]],dtype = 'f4')
print ('b:',b) # float32 类型
使用astype来改变数组的数据类型
a = np.array([1.1,2.3,3.5,4.7],dtype = np.float64)
b = a.astype(np.int_)
print(b)
# [1 2 3 4] 输出变为了整型
数据类型对象(numpy.dtype 类的实例)用来描述与数组对应的内存区域是如何使用;使用方法如下:
numpy.dtype(object, align, copy)
参数说明:
名称 | 描述 |
---|---|
object | 要转换为的数据类型对象 |
align | 如果为 true,填充字段使其类似 C 的结构体 |
copy | 复制 dtype 对象 ,如果为 false,则是对内置数据类型对象的引用 |
举例如下:
student = np.dtype([('name','S10'), ('age', 'i1'), ('marks', 'f4')])
a = np.array([('abc', 21, 50),('xyz', 18, 75)], dtype = student)
print(a)
# [(b'abc', 21, 50.) (b'xyz', 18, 75.)]