1.hmmlearn工具包
实现中文分词,完全没懂。
第九章:走进深度学习-神经网络算法
前言:机器学习下面的一个分支,运用神经网络算法的,属于深度学习。
深度学习算法一般是和计算机视觉挂钩的。
1.k近邻算法(KNN)。
K近邻算法很好理解。就是当前待分类点的K个邻居,属于哪种分类的概率大,我们也就将这个点分到该类别下。利用此图,可以更好地理解。
优缺点:
相当于待分类的这个点,要和所有的样本都计算一次距离,所以时间复杂度为O(n)
可以用来测试的一个数据集(CIFAR-10):
计算距离的话,可以选用L1距离,也可以显示L2距离(欧式距离),欧式距离用的比较多。
交叉验证:
主要是为了解决测试集只能使用一次,而待求解的参数比较多的缺陷。对训练集进行切割,重新多次选定不同的数据源,作为训练集。来求解参数的一种方法。