1、模式往往表现为具有时间或空间分布的信息。计算机中具有时空分布的信息表现为向量,即数组。数组中元素的序号可以对应时间与空间,也可以对应其他的标识。
-记得从前上线性代数时,叶正麟老师就讲过,向量是我们自己定义的度量尺度。面试时要学生举例说明一个100维的向量,如果只能想到空间中的三维剩下的无从入手,那就不好了。还记得当时老师举了一个例子,说有一个飞机,它的所在空间作为可以作为向量的三个分量、在那一点处朝着三个坐标方向的速度又可以作为三个分量,这样就是一个六维向量了,如果再加上时间等其他信息,那么飞机当时的状态就可以用一个向量来描述。
2、人们为了掌握客观事物,按事物相似的程度组成类别。模式识别的作用和目的就在于面对某一具体事物时将其正确地归入某一类别。
-孩子在学习新事物时貌似也是遵循这样的规律。先知道这个是凳子那个是凳子,但是是三脚的还是四脚的还是别的什么样子的,都还没开始细分。先学习一类事物,然后再关注这一类的细节。
3、从不同角度看人脸,视网膜上的成像也不同,但我们可以识别出这个人是谁,把所有不同角度的像都归入某个人这一类。如果给每个类命名,并且用特定的符号来表达这个名字,那么模式识别可以看成是从具有时间和空间分布的信息向着符号所作的映射。
-“从具有时间和空间分布的信息向着符号所作的映射”说得很好。
4、有两种基本的模式识别方法,即统计模式识别方法和结构(句法)模式识别方法。
-统计模式识别方法应该指的是贝叶斯那一类的模式识别方法,那么结构模式识别方法又是指什么呢?难道是指类似编译器中使用的状态机那一类的东西吗?
5、一般我们把原始数据组成的空间叫测量空间,把分类识别赖以进行的空间叫特征空间,通过变换,可把在维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式。
-特征向量的抽象是要依靠行业经验来进行吧?
6、分类决策就是在特征空间中用统计的方法把被识别对象归为某一类别。基本做法是在样本训练基础上确定某个判决规则,使按这种判决规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小。
-说道最小错误率和最小损失又想起了stanford的机器学习公开课上老师讲的例子。把好的药分到错的药里和把错的药分到好的药里,两者的风险是相差很大的。我们人类大脑里面的判决器到底是谁?某个神经细胞就可以完成判决功能吗?还是需要一个组织进行协作??蓝色大脑项目千万要争取到资金呀……