特牛生活网

中文 NLP (2) -- ICTCLAS分词_ictclas词性-CSDN博客

网友收藏
文章浏览阅读681次。随着白话文的兴起,构成中文的最小独立单位由字转入词。因此分词是中文处理的第一步,没有这一步中文处理也就无法再进行下去。中文分词有三大流派:1.机械式分词法:将文档中的字符串与词典中的词条逐一匹配,如果命中,则匹配成功。2.基于语法和规则:主要是为了解决分词中的第一大难题:歧义切分。因此在分词的基础上同时进行句法,语义分析,利用句法和语义信息进行词性标注,已解决分词歧义现象。3.统计..._ictclas词性
标签:ictclas词性