在进行正则化逻辑回归的时候,需要用到特征映射的方法:将一个二维特征(x1, x2)根据自己的需要映射到高维。
如下图所示的例子:
# 这里x,y是np数组的形式,as_ndarray默认为false,这是作者定义的函数
def feature_mapping(x, y, power, as_ndarray=False):
data = {"F{}{}".format(i - p, p): np.power(x, i - p) * np.power(y, p)
for i in np.arange(power + 1)
for p in np.arange(i + 1)
}
if as_ndarray:
return np.array(pd.DataFrame(data))
else:
return pd.DataFrame(data)
我们的结果展示为:
F00 F10 F01 ... F24 F15 F06
0 1.0 0.051267 0.699560 ... 6.294709e-04 8.589398e-03 1.172060e-01
1 1.0 -0.092742 0.684940 ... 1.893054e-03 -1.398103e-02 1.032560e-01
2 1.0 -0.213710 0.692250 ... 1.048821e-02 -3.397345e-02 1.100469e-01
3 1.0 -0.375000 0.502190 ... 8.944062e-03 -1.197765e-02 1.604015e-02
4 1.0 -0.513250 0.465640 ... 1.238395e-02 -1.123519e-02 1.019299e-02
.. ... ... ... ... ... ... ...
113 1.0 -0.720620 0.538740 ... 4.374511e-02 -3.270412e-02 2.444980e-02
114 1.0 -0.593890 0.494880 ... 2.115493e-02 -1.762810e-02 1.468924e-02
115 1.0 -0.484450 0.999270 ... 2.340073e-01 -4.826843e-01 9.956280e-01
116 1.0 -0.006336 0.999270 ... 4.003286e-05 -6.313306e-03 9.956280e-01
117 1.0 0.632650 -0.030612 ... 3.514745e-07 -1.700678e-08 8.229060e-10