一、转载博客
转载在:https://www.douban.com/note/640290683/
注0:《deep learning》的chapter 5有一部分讲maximum likelihood,那里讲地更清楚,建议直接去参考那里的内容。
注1:今天走在路上,突然想明白了似然度是怎么回事,它就是用来度量模型和数据之间的相似度,所以叫它似然度。
注2:原文链接:https://codesachin.wordpress.com/2016/07/24/the-basics-of-likelihood/
Defining the Likelihood Function
While assumes you know your model and tries to analyze data according to it, F2 keeps the data in perspective while figuring out how well different sets of parameters describe it.
概率,是你已经知道模型,去分析数据。
- 概率对象:真实对模拟
似然度,是你只知道数据,去模拟一个模型,分析模拟模型和数据(真实模型)的相似度。简单来说,似然度就是相似度,两个变量之间的相似度。
- 似然度:模拟对真实
There is a very, very important distinction between probability and likelihood functions – the value of the probability function sums (or integrates, for continuous data) to 1 over all possible values of the input data. However, the value of the likelihood function does not integrate to 1 over all possible combinations of the parameters.
概率的和为1,但是不能说似然度的和为一
The only thing you can be sure of, is this: If F2(θ1)>F2(θ2) , then it is more likely that denote the parameters of the underlying model.
我门只能通过似然度数值来说明模型与数值的拟合程度,似然度高,就说明模型越接近于数据真实的模型;即便似然度值为0.99,这也不能说明该似然模型最好,其他模型的似然度可能为0.999
问题:不能确定最大似然度,即不能确定最好的似然模型
原因:最大似然度值不能确定
解决:maximum likelihood estimate。通过求导,可以获得似然模型的极值,在求导过程中,用log来简化计算
扩展----在语音识别中,p(o|w)观察似然度,表示潜在句子与声学序列的相似度
二、我在学习卷积函数时的一点想法,不知对错
1. 似然度,likelihood
我认为似然度可以理解为可能性。
对于一些简单的事件,比如抛硬币,我们很清楚抛硬币的概率计算公式/模型。
但是现实生活中存在很多复杂的事件或数据,我们不能直接给出它们的概率计算公式/模型。
我们只知道这类复杂事件模型在输入某一具体数值(input)时会产生唯一对应的数据结果(output),所以只能从这些数值变化规律中推测出一个尽可能符合这类事件变化规律的近似概率模型。
推测近似概率模型的过程类似于机器学习的训练过程。先以某些已知的标签数据去训练模型,然后用训练好的模型去推测这类事件未发生事件的发生概率。
这种人工训练模型(positive)去模拟真正的概率模型(true)的过程叫拟合。
这种近似概率模型与真正的概率模型的相似度叫似然度,likelihood。我们为了使推测的近似概率模型性能达到最优,使近似概率模型与真正模型之间的相似度达到最大,即为最大似然,maximum likelihood。