Words

中文分词:双向匹配最大算法(BI-MM)

中文分词:双向匹配最大算法(BI-MM) 启发式规则: 1.如果正反向分词结果词数不同,则取分词数量较少的那个 2.如果分词结果词数相同 a. 分词结果相同,就说明没有歧义,可返回任意一个 b. 分词结果不同,返回其中单字较少的那个 代码实现 #使用双向最大匹配算法实现中文分词 words_dic = [] import BMM #引入逆向匹配算...