什么是超平面
我们最常见的平面概念是在三维空间中定义的:
它由两个性质定义:
- 方程是线性的: 是空间点的各分量的线性组合
- 方程数量为1
若抛却维度等于3的限制, 就得到了超平面的定义. 方程数量为1, 它的本质其实是自由度比空间维度(d)小一. 自由度的概念可以简单的理解为至少要给定多少个分量的值才能确定一个点. 例如, 三维空间里的(超)平面只要给定了((x,y,z))中任意两个分量, 剩下的一个的值就确定了. 先确定值的两个分量是自由的, 因为它们想取什么值就能取什么值;剩下的那个是"不自由的", 因为它的值已经由另外两确定了. 二维空间里的超平面为一条直线. 一维空间里超平面为数轴上的一个点.
现在用数学语言定义一下.
(d)维空间中的超平面由下面的方程确定:
其中,(w)与(x)都是(d)维列向量,(x = (x_1, x_2, dots, x_d)^T)为平面上的点, (w=(w_1, w_2, dots, w_d)^T)为平面的法向量.(b)是一个实数, 代表平面与原点之间的距离.
点到超平面的距离
假设点(x')为超平面(A: w^Tx + b = 0)上的任意一点, 则点(x)到(A)的距离为(x-x')在超平面法向量(w)上的投影长度:
超平面的正面与反面
一个超平面可以将它所在的空间分为两半, 它的法向量指向的那一半对应的一面是它的正面, 另一面则是它的反面.
判断一个点是在超平面的正面还是反面(面向的空间里)
还是要用到它的法向量(w).
仍然假设点(x')为超平面(A: w^Tx + b = 0)上的任意一点, 点(x)为待判断的点.
若(x-x')与(w)的夹角小于(90^{circ}), 则(x)在(A)的正面, 否则在反面
所以判定依据为:
若将距离公式中分子的绝对值去掉, 让它可以为正为负. 那么, 它的值正得越大, 代表点在平面的正向且与平面的距离越远. 反之, 它的值负得越大, 代表点在平面的反向且与平面的距离越远.