总感觉直接求正确率就够了。
待修改时可参考:http://blog.sina.com.cn/s/blog_900690c60101czyo.html
http://blog.csdn.net/abcjennifer/article/details/7359370
对于检索问题,召回率很容易理解:
对于分类问题,总感觉有点怪异:
看看这些比喻,也许有些形象:http://www.zhihu.com/question/19645541
这个全面一点:http://blog.sina.com.cn/s/blog_900690c60101czyo.html
这个好:
http://blog.csdn.net/marising/article/details/6543943#
http://www.360doc.com/content/14/0823/10/13518188_403996763.shtml
好吧,让我们看看一下三幅图,来说明一下折中问题:(我的想法)
图1:作为参照,准确率为80/(80+5)=94.1%,(右的5),召回率为80/(80+5)=94.1%
图2:想增强实际正例判为正例的概率,那么希望调整某些参数,使得如下图第一行。可是,通常,对于不够强大的分类器而言,会导致原来负例判为负例的情况也倾向判为正例,即第二行。即分类器趋向于分成正例了,这是我们不想看到的。
图3:和图2相反,想增强实际负例判为负例的概率,那么希望调整某些参数,使得如下图第一行。可是,通常,对于不够强大的分类器而言,会导致原来正例判为正例的情况也倾向判为负例,即第二行。即分类器趋向于分成负例了,这是我们不想看到的。
怎么画:
那么,如何画PR曲线呢?
通过设置不同的阈值。譬如,一种可能的做法是,根据得分判断两类,得分范围为low~high,那么,在low~high之间一系列值,然后求得不同的准确率和召回率,进而画出P-R曲线。