郑昀@玩聚RT 20091027
答某网友问。
1、
在语义的世界里,可以近似地说:万事万物都是特征提取。
你只要找到特征,事情就好办。
如果你找不到明确的特征,那么什么样的机器智能也无法准确地帮助你。
多数时候,唯一的麻烦在于,你所认为的特征,实际上不是特征。。。
2、
很多时候,某一个需求,必须你亲自去琢磨去寻找特征,外界未必有什么解决办法。
个人觉得不了解自然语言处理原理的同学们,通常会走弯路。
所以,要想把自己的需求准确地和自然语言处理技术对接上,还是要对基本原理做一个了解。
比如你连特征都提取不出来,却希望语义技术能帮到你,甚至急吼吼地寻找中文分词的开源方案,也许会事倍功半。
所以还是先了解自然语言处理技术的基本原理为好,磨刀不误砍柴工。
3、
你期望毕其功于一役吗?
自然语言处理的真实应用里是很难有什么场景找到一个通吃特征的。
都是一层一层特征叠加的。
一层特征去掉一部分垃圾数据。如此反复。终成正果。
注意方法论。
郑昀 北京报道