这周主要是学习数学了,关于python的学习并不多。
关于PRML绪论方面的阅读
PRML 的学习基本上是学十得一。
关于机器学习这方面的内容就目前的学习状况而言是实在不能建空中楼阁,还是需要稳扎稳打。所以这周主要还是看了PRML这本书的序章部分。
说是序章其实以及给了个深度学习的大概了,甚至还过了一遍大二学习的概率论。学习强度还是有点大。
首先还是一个简单的例子来引出深度学习。这是一个简单的回归问题,假设数据集由函数 sin(2πx)sin(2πx) 产生。目标变量带有随机的噪声。为了保证数据集的全部拟合,作者使用多项式来进行:
当然以书中内容而言,拟合过程复杂而结果也令人沮丧,不过得出了一个重要结论:
从直觉上讲,我们看到有着更大的M值的更灵活的多项式被过分地调参,使得多项式被调节成了与目标值的随机噪声相符。
这也就是为什么寻找模型对于机器学习来说是如此重要了
之后就是几乎完整的过了一遍概率论,包括概率密度、期望和方差、贝叶斯概率和高斯分布这些。
关于知识图谱方面的学习
1. 知识抽取。
知识抽取技术,从一些公开的半结构化、非结构化的数据中提取出实体、关系、属性等知识要素。
这方面就是关于实体的识别了,目前还处于尝试各种工具的阶段。。
2. 知识表示。
知识表示形成的综合向量对知识库的构建、推理、融合以及应用均具有重要的意义。
基于三元组的知识表示形式受到了人们广泛的认可,但似乎目前图数据库更为流行和方便,所以下一个目标就定在学习neo4j 方面。