python同义词替换的实现(jieba分词)
TihuanWords.txt文档格式
注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。
年休假年假年休
究竟到底
回家场景我回来了
代码
importjieba defreplaceSynonymWords(string1): #1读取同义词表,并生成一个字典。 combine_dict={} #synonymWords.txt是同义词表,每行是一系列同义词,用空格分割 forlineinopen("TihuanWords.txt","r",encoding='utf-8'): seperate_word=line.strip().split("") num=len(seperate_word) foriinrange(1,num): combine_dict[seperate_word[i]]=seperate_word[0] print(seperate_word) print(combine_dict) #2提升某些词的词频,使其能够被jieba识别出来 jieba.suggest_freq("年休假",tune=True) #3将语句切分成单词 seg_list=jieba.cut(string1,cut_all=False) f="/".join(seg_list).encode("utf-8") f=f.decode("utf-8") print(f) #4返回同义词替换后的句子 final_sentence="" forwordinf.split('/'): ifwordincombine_dict: word=combine_dict[word] final_sentence+=word else: final_sentence+=word #printfinal_sentence returnfinal_sentence string1='年休到底放几天?' print(replaceSynonymWords(string1))
结果
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。