特牛网址导航

基于规则的中文分词方法_基于规则的方法有哪些-CSDN博客

网友收藏
文章浏览阅读3.6k次。基于规则的中文分词方法前记目前,常见的中文分词方法可以分为三类:基于字典、词库匹配的分词方法(基于规则)这种方法是将待分的句子与一个充分大的词典中的词语进行匹配。常用的有:正向最大匹配,逆向最大匹配,最少切分法。实际应用中,将机械分词作为初分手段,利用语言信息提高切分准确率。优先识别具有明显特征的词,以这些词为断点,将原字符串分为较小字符串再机械匹配,以减少匹配错误率,或将分词与词类..._基于规则的方法有哪些