NumPy
是Python中最常用的数据科学库之一。它可以方便地让我们的日常工作变得简单。本文重点介绍Numpy
中的四个技巧,熟练掌握这些技巧可以让我们处理数据的方式变得更加高效。
闲话少说,我们直接开始吧!
在数据科学、深度学习和线性代数中,通常需要生成特殊的数组,如0和1组成的数组和矩阵,或单位矩阵。
NumPy
让上述操作变得非常简单!让我们看看如何使用Numpy
来进行编码,如下:
# Creating an array of zeroes
import numpy as np
zeroes = np.zeros(5)
print(zeroes)
# Returns:
# [0. 0. 0. 0. 0.]
上述代码中,我们使用了np.zeros()
函数来生成包含零的数组。上述代码创建了一个一维向量。
类似地,我们可以传入其他shape
来创建其他一些特殊数组,如下:
# Creating Special Arrays in NumPy
import numpy as np
zeros = np.zeros((2,2))
ones = np.ones((2,2))
identity = np.identity(3)
print(zeros)
print(ones)
print(identity)
# Returns:
# [[0. 0.]
# [0. 0.]]
# [[1. 1.]
# [1. 1.]]
# [[1. 0. 0.]
# [0. 1. 0.]
# [0. 0. 1.]]
函数np.where()
主要用于筛选(和替换)数组中的值。这是一个功能强大的函数,它可以非常方便地实现查找和替换操作。
接着,我们先来看一个过滤数据的基本示例:
# Filtering Arrays with NumPy where()
import numpy as np
arr = np.array([1,2,3,4,5,6,7,8])
print(np.where(arr > 5))
# Returns:
# (array([5, 6, 7]),)
类似地,我们可以使用该函数替换满足过滤条件的值。举例如下:
# Replacing Values with NumPy where()
import numpy as np
arr = np.array([1,2,3,4,5,6,7,8])
print(np.where(arr > 5, 1, arr))
# Returns:
# [1 2 3 4 5 1 1 1]
在上面的示例中,我们将要替换满足条件的值传入第二个参数。在第三个参数中,我们传递要用于任何不满足条件的对象的值。
改变矩阵的形状可能是在NumPy
中需要执行的最常见的操作之一。例如,在使用深度神经网络时,需要确保数组具有特定的形状非常重要。与其他示例一样,NumPy
让上述操作变得非常简单!
让我们看看如何将一维数组转换为多维矩阵:
# Reshaping a NumPy Array
import numpy as np
arr = np.arange(9)
arr = np.reshape(arr, (3,3))
print(arr)
# Returns
# [[0 1 2]
# [3 4 5]
# [6 7 8]]
在上面的示例中,我们使用np.reshape()
将一维数组转换为3x3矩阵。
类似地,我们可以使用np.tranpose()
函数来将矩阵进行转置,如下所示:
# Transposing an Array in NumPy
import numpy as np
arr = np.array([[1,2,3,4]])
print(f'Original Array: \n{arr}')
arr = np.transpose(arr)
print(f'Modified Array: \n{arr}')
# Returns
# Original Array:
# [[1 2 3 4]]
# Modified Array:
# [[1]
# [2]
# [3]
# [4]]
在最后一节中,我们来学习如何使用函数np.unique()
来计算数组中的唯一值。
当然,我们也可以通过传入counts=True
参数,此时上述函数将返回一个包含唯一值和计数的元组。
示例如下:
# Counting Unique Values in an Array
import numpy as np
arr = [1,1,1,2,2,1,3,4,5,1,2]
values, counts = np.unique(arr, return_counts=True)
print(values)
print(counts)
# Returns:
# [1 2 3 4 5]
# [5 3 1 1 1]
在上面的示例中,第一个返回的数组按其出现的顺序输出唯一值。第二个包含每个值出现的频率。例如,数组arr
中数字1出现了五次!
在本教程中,我们学习了使用NumPy
的四种重要方法。同时Numpy
库非常庞大,有很多有用的特性。希望本教程能让我们更深入地了解如何有效地使用该库进行日常工作开发。