首先导入numpy
import numpy as np
np.range(start, end, step)
: 获取指定区间和步长的列表。
np.arange(0, 1, 0.1) # 区间: [0, 1), 步长: 0.1
np.quantile(mlst, bins)
:按指定比例获取数据列表的分位数值。比如: 要获取mlst=[0,1,2,3,4]
的bins=[0.5]
分位数(即50%分位数):bined=[2]
。
# 指定比例
bins = np.arange(0, 1, 0.1)
# 数据列表
mlst = range(0, 101)
# 分位数值
mqtl = np.quantile(mlst, bins)
mqtl
np.digitize(mlst, bined)
:对应mlst列表中的数据落在bined对应数值(区域)的索引。
mlst = range(0, 101)
bins = np.arange(0, 1, 0.1)
mqtl = np.quantile(mlst, bins)
binned = np.digitize(mlst, mqtl)
binned
np.random.rand(int)
:生成int个[0,1)之间的随机数
np.random.rand(4)
注意:多次随机输出的数据不同。
np.random.seed(int)
:生成随机数前,指定随机种子为int,用于固定随机输出值。
np.random.seed(0) # 指定种子为0
np.random.rand(4) # 生成4个[0,1)之间的随机数
注意:固定种子后,多次随机生成的值相同。
np.random.permutation(list)
:打乱原来的list顺序。
np.random.permutation(range(10))
np.unique(list, return_inverse=True)
对list去重复,return_inverse
指定是否返回:原数组元素对应的去重后的索引。
lst = np.array([1,2,3,2,3,4,5])
ulst, ilst = np.unique(lst, return_inverse=True)
print(ulst)
print(lst)
print(ilst)
生成全为0的数组,可以指定多个维度。
np.zeros(5)
np.zeros((3, 5))
np.zeros((3, 2, 5))
也可通过np.zero_like
获取相同形状的数组。
np.zeros_like([1,2,3])
np.zeros_like([[1,2,3], [2,3,4]])
对数组求和。
np.sum([1,2,3]) # 求所有元素之和
np.sum([[1,2,3], [2,3,4]]) # 求所有元素之和
np.sum([[1,2,3], [2,3,4]], 0) # 按列求和
np.sum([[1,2,3], [2,3,4]], 1) # 按行求和
类似求和:求均值np.mean
、求最小np.min
、求最大np.max
获取最小值或最大值的索引argmin
、argmax
np.argmax([1,2,10,8,15]) # 最大值索引, 返回4
np.argmin([1,2,0]) # 最小索引,返回2
还可以获取排序后,原来的元素的索引:argsort
np.argsort([10,2,1,8]) # 排序后是[1,2,8,10], 返回对应排序后的索引
argwhere
获取非0的索引
np.argwhere([0,2,1,8,0,5]) # 返回非0值的索引
np.log
以
e
e
e为底取对数。np.log2
以
2
2
2为底。np.log10
以
10
10
10为底。
lst = np.array([1,2,3,2,3,4,5])
np.log(lst)
取对数前后:
import matplotlib.pyplot as plt
p1 = plt.scatter(range(len(lst)), lst, label='raw')
p2 = plt.scatter(range(len(lst)), np.log(lst), label='log')
plt.legend()
转置。与.T
相同。
np.array([[1,2,3], [2,3,4]]).transpose()
np.array([[1,2,3], [2,3,4]]).T
np.array([1,2])!=0
把多层数组/列表展开:np.concatenate
np.concatenate([[1,2,3], [2,2,3]])
np.concatenate([[1,2,3], [2,3]]) # 子元素长度不等
np.concatenate([1,2,3]) # 一维不能使用
统计>=0的整数
的出现次数:np.bincount
np.bincount([1,2,3,6]) # 先找到最大值为6, 然后统计0到6的整数(7个)出现的次数
np.bincount([1,2])
np.bincount([0, 0.1,0.2]) # 浮点数则视为0
np.bincount([-1,-2]) # 负数不可用
未完待续。。。
RandomState
np.random.RandomState(int_seed)
default_rng
np.random.default_rng(int_seed)
更多:
2023.10.25:新增
2023.11.14:增加 np.argmin/max/sort/where
、np.concatenate
、np.bincount