在Python中,特别是当使用NumPy数组或类似的二维数据结构时,
[行 : , 列 : ]
才是正确的语法来同时选择特定的行和列。但是,在实际应用中,我们经常会看到以下几种情况:
x_selected_columns = array[ : , [列索引1, 列索引2, …]]
冒号 : 表示选择所有行
用,相隔
列表 [列索引1, 列索引2, …] 指定了要选择的列。
x_selected_rows = array[[行索引1, 行索引2, …] , :]
列表 [行索引1, 行索引2, …] 指定了要选择的行
中间用,相隔
而冒号 : 表示选择所有列。
x_selected_rows_columns = array[[行索引1, 行索引2, …], [列索引1, 列索引2,…]]
,相隔
对于Iris数据集,如果选择所有的行以及第0列和第1列(即花萼长度和花萼宽度),
import numpy as np
from sklearn.datasets import load_iris
#加载Iris数据集
iris = load_iris()
#选择所有的行以及第0列和第1列 ,切片操作
x_pedal_length_width = iris.data[:, [0, 1]]
#x_pedal_length_width 现在是一个二维数组,包含了所有样本的花萼长度和花萼宽度
print(x_pedal_length_width)