基于词的分析与处理是自然语言处理尤其是中文文本分析中非常基础的技术,一般会根据词的语义划分来设定不同
的分析方向,比如情感分析、观点挖掘、舆情监控等。从语言学角度来讲,词的语义划分主观性太大,不太好控制
,通常为了让语义划分变得客观,都需要首先分析词的语法意义,通常这个阶段叫做词性标注。下面是中文词语在
语法角度的划分:
|--实词
|--名词(专有名词、普通名词)
|--具体名词
|--表示事物:树木、月饼
|--表示人物:作家、教师
|--表示时间:黑夜、春节
|--表示处所:学校、城市
|--表示方位:上方、东面
|--抽象名词:事业、道德
|--形容词
|--普通形容词
|--表形态的:大、小
|--表性质的:好、坏
|--表状态的:富、美
|--非谓形容词:长期、特等、万能、共同
|--动词
|--行为:穿、跳、走、纪念、朗诵
|--发展:生长、枯萎、发芽、结果、产卵
|--心理:喜欢、恨、气愤
|--判断:是、为、乃
|--存现:消失、显现、有、丢失、幻灭
|--使令:禁止、勒令、使、让、令
|--能感:会、愿意、可以、能够
|--趋向:来、去、上、下
|--数词
|--确数词
|--概数词
|--序数词
|--代词
|--人称代词
|--疑问代词
|--指示代词
|--量词
|--名量词
|--动量词
|--虚词
|--冠词
|--介词
|--感叹词
|--连词
|--副词
|--助词
|--拟声词