#学习笔记#
在学习神经网络的过程中发现对numpy的操作不是非常熟悉,遂找到了Numpy 100题。
- print(sum(range(5),-1))
- from numpy import *
- print(sum(range(5),-1))
- Z**Z
-
- 2 << Z >> 2
-
- Z <- Z
-
- 1j*Z
-
- Z/1/1
-
- Z
Z
- np.array(0) / np.array(0)
- np.array(0) // np.array(0)
- np.array([np.nan]).astype(int).astype(float)
np.sqrt(-1) == np.emath.sqrt(-1)
x和y坐标 (★★☆)- print(sum(range(5),-1))
- from numpy import *
- print(sum(range(5),-1))
1.输出9
2.输出10
解释:在导入numpy库前,sum的第二个参数的作用是初始值,所以相当于:-1 + 0 + 1 + 2 + 3 + 4
注意,这是初始值不是起始值,如果是sum(range(2,5),-1),实际上是: -1 + 2 + 3 + 4
第二个print输出的是10,在导入了NumPy之后,使用的sum函数实际上是numpy.sum,而不是内置的sum。在NumPy的sum函数中,第二个参数(在这个案例中是-1)不是初始值,而是指定求和操作应该沿着哪个轴进行。当使用-1作为轴参数时,它指的是数组的最后一个轴。
- Z**Z
- 2 << Z >> 2
- Z <- Z
- 1j*Z
- Z/1/1
- Z
Z
- # 1.Z**Z是合法的,它表示Z的Z对应元素的次方
- Z = np.array([1,2,3,4,5])
- # Z**Z
- # 输出:[1,4,27,256,3125]
-
- # 2.2 << Z >> 2是合法的,它表示Z的每个元素向左移动2位,再向右移动2位
- 2 << Z >> 2
- # 输出:[1,2,4,8,16]
-
- # 3.Z <- Z是合法的,表示检查Z中的每个元素是否小于-Z结果是一个布尔数组
- Z <- Z
- # 输出:[False False False False False]
-
- # 4.1j*Z是合法的,它表示将每个元素的实部和虚部分别相乘
- 1j*Z
- # 输出:[0.+1.j 0.+2.j 0.+3.j 0.+4.j 0.+5.j]
-
- # 5.Z/1/1是合法的,它表示将Z的每个元素除以1
- Z/1/1
- # 输出:[1. 2. 3. 4. 5.]
-
- # 6.Z
Z不合法,在python中不能直接将比较运算符连续使用而不进行逻辑组合应当使用and or 连接
- np.array(0) / np.array(0)
- np.array(0) // np.array(0)
- np.array([np.nan]).astype(int).astype(float)
- np.array(0) / np.array(0)
- # 会得到一个运行时警告,并且结果将是NaN(not a number)
- # 因为在Numpy中除以0会产生一个无穷大的浮点数表示(inf),而当0除以0时,无法定义确切的数值,因此结果会被表示为NaN
- # NaN表示不是一个数字,它是一个特殊的浮点数类型,用于表示浮点数计算中的错误情况。
- # 值得注意的是,这是numpy的行为,而不是python内置出发运算符的行为。在python中,0除以0会抛出一个ZeroDivisionError异常。
- np.array(0) // np.array(0)
- # 会得到一个运行时警告,并且结果将是0
- # 因为在Numpy中,整数除以整数的结果是一个整数,所以0除以0的结果是0,这只适用于整数除法,对于浮点数除法,结果仍然会是NaN
- np.array([np.nan]).astype(int).astype(float)
- # 会得到一个警告,结果是:-2.147484e+09
- # 在numpy中,np.nan是一个特殊的浮点数类型,转化为整数时会得到一个负无穷大的整数值,而后转化为浮点数时,会得到一个浮点数能表示的最小数值
- # 远离零点四舍五入可以使用numpy的'np.ceil'对正数和‘np.floor’对负数进行处理来表示,
- # 反方向四舍五入,1.4得2,-1.1得-2,1.5得2,-1.6得-2
- np.random.seed = 1
- Z = np.array([1.523127,-0.973028,1.488869,1.135266,1.706664,-1.815817,0.917672,-0.813865,-0.270150,0.310724])
- def round_away_from_zero(arr):
- # 对正数使用np.ceil,对负数使用np.floor
- return np.where(arr > 0, np.ceil(arr), np.floor(arr))
-
- round_away_from_zero(Z)
- # 输出:[2.,-1.,2.,2.,2.,-2.,1.,-1.,-1.,1.]
- # 可以使用Numpy的'np.intersect1d'函数来找到两个数组的交集
- arr1 = np.array([1, 2, 3, 4, 5])
- arr2 = np.array([4, 5, 6, 7, 8])
- common_values = np.intersect1d(arr1, arr2)
- print(common_values)
- import warnings
- # 忽略所有警告
- warnings.filterwarnings("ignore")
np.sqrt(-1) == np.emath.sqrt(-1)
不为真
np.sqrt: 当给定非负输入时,这个函数正常工作,返回输入的平方根。如果输入是负数,np.sqrt 会返回一个NaN(非数字),因为在实数范围内,负数没有平方根。 np.emath.sqrt: 这个函数专门用于处理更广泛的数学问题,包括负数的平方根。对于负数输入,np.emath.sqrt 返回一个复数结果。例如,np.emath.sqrt(-1) 会返回虚数单位 1j,这是因为在复数域中,负一的平方根被定义为虚数单位。
- # 可以使用Numpy的'numpy.datetime64'和'numpy.timedelta64'对象来获取昨天、今天和明天的日期
- today = np.datetime64('today', 'D') # 获取今天的日期
- yesterday = today - np.timedelta64(1, 'D') # 获取昨天的日期
- tomorrow = today + np.timedelta64(1, 'D') # 获取明天的日期
- print("Today:", today)
- print("Yesterday:", yesterday)
- print("Tomorrow:", tomorrow)
- # 输出结果:
- # Today: 2024-03-14
- # Yesterday: 2024-03-13
- # Tomorrow: 2024-03-15
- # 可以使用numpy的date_range函数配合numpy.datetime64来获取2016年7月的所有日期
- dates_july_2016 = np.arange('2016-07-01', '2016-08-02', dtype = 'datetime64[D]')
- # 就地计算无拷贝意味着无新的空间被分配,计算结果直接覆盖了原始数据。
- A = np.array([[1, 2, 3], [4, 5, 6]])
- B = np.array([[7, 8, 9], [10, 11, 12]])
-
- B = A + B
- B = B * -A / 2
- print(B)
- # 输出:[[ -4. -10. -18.]
- # [-28. -40. -54.]]
- A = np.random.rand(3, 4)
- # 方法1: 使用np.floor函数.np.floor函数会向下取整,适用于正数
- A_int_floor = np.floor(A)
- # 方法2:使用np.trunc函数.np.trunc函数会截断小数部分,保留整数部分
- A_int_trunc = np.trunc(A)
- # 方法3:使用astype方法转换为整数类型
- A_int_astype = A.astype(int)
- # 方法4:使用np.round函数.np.round函数会四舍五入取整
- A_int_round = np.round(A)
- # 整数
- random_matrix = np.random.randint(0, 5, size=(5, 5)) # 在random.randint中,前两个参数控制生成的范围,size 是控制数组形状
- # 浮点数
- random_matrix_float = np.random.rand(5,5) * 4 # 在random.rand中,与randint不同,是控制形状的,因为其会默认生成0-1之间的随机浮点数
random_matrix = np.random.randint(0, 10, size=(10,))
- # 可以直接使用np.random.rand函数生成,然后使用一些方法来控制其范围
- vec = np.random.rand(10) * (1 - 0.02) + 0.01
- random_vec = np.random.rand(10)
- sorted_vec = np.sort(random_vec)
- # 一般情况下,使用np.sum函数即可,如果追求更优可以使用np.einsum函数,其内部使用BLAS库来加速计算
- import time
-
- array = np.random.rand(1000000)
- start = time.time()
- np.sum(array)
- end = time.time()
- print('sum方法:',end - start)
-
- start1 = time.time()
- np.einsum('i->',array)
- end1 = time.time()
- print('einsum方法:',end1 - start1)
- # 输出结果:
- # sum方法: 0.0010001659393310547
- # einsum方法: 0.00099945068359375
- A = np.random.rand(5)
- B = np.random.rand(5)
- # 严格相等
- # 检查A和B是否完全相等
- are_equal = np.array_equal(A, B)
- print("A和B完全相等:", are_equal)
-
- # 近似相等
- # 检查A和B是否近似相等
- are_close = np.allclose(A, B, atol=1e-8)
- print("A和B近似相等:", are_close)
- # 可以通过修改数组的flags.writeable属性来实现
- # 创建一个随机数组
- arr = np.random.rand(5)
- # 打印原始数组
- print("原始数组:", arr)
- # 将数组设置为只读
- arr.flags.writeable = False
- # 尝试修改数组
- try:
- arr[0] = 1
- except ValueError as e:
- print("错误信息:", e)
- # 输出结果:
- # 原始数组: [0.60665849 0.58338168 0.69089184 0.66636523 0.22322251]
- # 错误信息: assignment destination is read-only
- # 在笛卡尔坐标系中的位置可以转换为极坐标系中的半径和角度
- # 创建一个随机的10x2矩阵表示笛卡尔坐标
- coords = np.random.rand(10, 2)
-
- r = np.sqrt(np.sum(coords**2, axis=1)) # 计算每个坐标点的模
- theta = np.arctan2(coords[:, 1], coords[:, 0]) # 计算每个坐标点的角度
- polar_coords = np.column_stack((r, theta))
-
- print('极坐标\n',polar_coords)
- # 创建一个大小为10的随机向量
- random_matrix = np.random.rand(10)
- # 方法一
- max_value = np.max(random_matrix)
- random_matrix[random_matrix == max_value] = 0
- # 方法二
- max_index = np.argmax(random_matrix)
- random_matrix[max_index] = 0
x和y坐标 (★★☆)- # 定义结构化数据类型,包含两个浮点数字段x和y
- dtype = [('x', float), ('y', float)]
-
- # 创建一个结构化数组来覆盖[0,1]x[0,1]区域
- # 例如,我们可以创建一个4x4的网格
- num_points = 4
- x_values = np.linspace(0, 1, num_points)
- y_values = np.linspace(0, 1, num_points)
-
- # 使用网格的笛卡尔积来生成所有坐标点
- grid = np.meshgrid(x_values, y_values)
-
- # 组合x和y坐标点并创建结构化数组
- coordinates = np.zeros(num_points*num_points, dtype=dtype)
- coordinates['x'], coordinates['y'] = grid[0].flatten(), grid[1].flatten()
-
- print("结构化数组的x和y坐标:")
- print(coordinates)
- X = np.array([1, 2, 3, 4])
- Y = np.array([4, 5, 6, 7])
- # 将X变形为列向量,以便进行广播,利用广播机制可以有效避免显式编写嵌套循环
- X = X[:,np.newaxis]
- C = 1.0/(X - Y)
- print("柯西矩阵",C)
- # 整数类型
- integer_types = [np.int8, np.int16, np.int32, np.int64]
- print("整数类型的最小和最大值:")
- for int_type in integer_types:
- info = np.iinfo(int_type)
- print(f"{int_type.__name__:>10}: min = {info.min}, max = {info.max}")
-
- # 浮点数类型
- float_types = [np.float16, np.float32, np.float64]
- print("\n浮点数类型的最小和最大正值(非精确值):")
- for float_type in float_types:
- info = np.finfo(float_type)
- print(f"{float_type.__name__:>10}: min = {info.min}, max = {info.max}")
- print(f"{float_type.__name__:>10}: smallest normal = {info.tiny}, largest positive = {info.max}")
-
- # 特殊注意:对于浮点数,最小值表示最小的正规化的浮点数。
- # 浮点数还有更小的非正规化数,但它们具有较小的精度。
- # 默认情况下,大数组的打印都会被截断,可以使用numpy.set_printoptions函数来调整打印选项
- # 通过设置参数'threshold'为numpy.inf,可以打印出所有元素
- np.set_printoptions(threshold=np.inf)
- large_array = np.random.rand(10000)
- print(large_array)
- # 可以通过计算数组中每个元素与该标量的绝对差值,然后找到这些差值中最小的那个
- x = np.random.randint(1,1000,size = 100)
- target = 888
-
- x_ = np.abs(x - target)
-
- result = x[x_ == x_.min()]
- print(result)
后续会更行全部100题
以上
学习在于行动,总结和坚持,共勉
