http://blog.csdn.net/wen718/article/details/5960666
在对汉语分词性能进行评估时,采用了常用的3个评测指标:准确率(P)、召回率(R)、综合指标F值(F)。准确率表示在切分的全部词语中,正确的所占的比值。召回率指在所有切分词语中(包括切分的和不应该忽略的),正确切分的词语所占的比值。准确率描述系统切分的词语中,正确的占多少。召回率表示应该得到的词语中,系统正确切分出了多少。计算公式如下:
P= 准确切分的词语数/切分出的所有词语数
R=准确切分的词语数/应该切分的词语数
实际评估一个系统时,应同时考虑P和R,但同时要比较两个数值,很难做到一目了然。所以常采用综合两个值进行评价的办法,综合指标F值就是其中一种。计算公式如下:
F=(β的平方+1)PR/(β的平方*P+R)
其中,β决定对P侧重还是对R侧重,通常设定为1、2或1/2。β取值为1,即对二者一样重视。
摘自《基于字的词位标注汉语分词》