活动地址:CSDN21天学习挑战赛
numpy的数组生成方法是比较多的,大体分为以下几种:
1,生成0和1的整数数组
2,根据现有数据生成数组
3,生成固定范围的数组
4,生成随机数组
现在就以上面的四种方法一一演示。
一,
0和1的整数数组
新建一个8行3列的数据全部是用0填充的二维数组:
- import numpy as np
- a = np.zeros(shape=(8,3),dtype="f2")
- print(a,a.ndim)
结果如下:
- [[0. 0. 0.]
- [0. 0. 0.]
- [0. 0. 0.]
- [0. 0. 0.]
- [0. 0. 0.]
- [0. 0. 0.]
- [0. 0. 0.]
- [0. 0. 0.]] 2
新建一个4行3列的数据全部是用1填充的二维数组:
- b = np.ones(shape=(4,3),dtype="f4")
- print(b,b.ndim)
结果如下:
- [[1. 1. 1.]
- [1. 1. 1.]
- [1. 1. 1.]
- [1. 1. 1.]] 2
二,现有数组生成nparry
例如,有一个成绩表,该表为list:
- score=([[80, 89, 86, 67, 79] ,
- [78, 97, 89, 67, 81],
- [90, 94, 78, 67, 74] ,
- [91, 91, 90, 67, 69] ,
- [76, 87, 75, 67, 86],
- [70, 79, 84, 67, 84] ,
- [94, 92, 93, 67, 64],
- [86, 85, 83, 67, 80]])
- print(score,type(score))
结果如下:
[[80, 89, 86, 67, 79], [78, 97, 89, 67, 81], [90, 94, 78, 67, 74], [91, 91, 90, 67, 69], [76, 87, 75, 67, 86], [70, 79, 84, 67, 84], [94, 92, 93, 67, 64], [86, 85, 83, 67, 80]] 'list'>
将其转为nparray:
- data1 = np.array(score)
- print(data1,type(data1))
浅拷贝方式:
- data2 = np.asarray(score)
- print(data2,type(data2))
深拷贝方式:
- data3 = np.copy(score)
- print(data3,type(data3))
三,
生成固定范围的数组(该方法非常常用)
比如,生成0到10之间的100个数字组成的数组:
(1)
- data4 = np.linspace(1,10,100)
- print(data4,len(data4),data4.dtype)
此数组是等距离的。
(2)
- data5 = np.arange(1,10,2)
- print(data5)
这里的2是步时,1,10是范围,因此,输出是这样的:
[1 3 5 7 9]
四,
均匀分布的随机数和正太随机数
例如在-1和1之间生成10000个均匀分布的随机数,这里的均匀是概率学里的均匀,而不是事实均匀。low是包含-1,high是不包含1。划分了1000组画的直方图。
- import matplotlib.pyplot as plt
- import numpy as np
- data6 = np.random.uniform(low=-1,high=1,size=10000)
- plt.figure(figsize=(20,8),dpi=8)
- plt.hist(data6,1000)
- plt.show
结果如下:
- 0000 [ 0.63476024 0.30805251 -0.00222955 ... -0.97733247 0.56357678
- 0.33593682]
什么是正态分布
正态分布是-种概率分布。正态分布是具有两个参数μ和σ的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ是此随机变量的方差,所以正态分布记作N(μ, σ)。
np.random.normal(loc,scale,size) 也就是说,正太随机数需要三个参数,μ参数和σ参数(这个也叫离散度,离散率)和随机数目
例如,以身高1.75为标准,离散度为0.1,随机总数为100000,并绘制直方图,代码如下:
- import matplotlib.pyplot as plt
- import numpy as np
- data7 = np.random.normal(loc=1.75,scale=0.1,size=100000)
- plt.figure(figsize=(20,8),dpi=80)
- plt.hist(data7,10000)
- plt.show
-
- print(len(data7),data7)
结果如下:
100000 [1.65619401 1.7484766 1.81523809 ... 1.6623316 1.78668232 1.698971 ]
可以看到,直方图里的数据确实是以1.75为中轴,两边基本是分布一致。