python同义词替换的实现(jieba分词)
作者:Lty美丽人生 发布时间:2022-02-10 20:58:00
标签:python,同义词,替换
TihuanWords.txt文档格式
注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。
年休假 年假 年休
究竟 到底
回家场景 我回来了
代码
import jieba
def replaceSynonymWords(string1):
# 1读取同义词表,并生成一个字典。
combine_dict = {}
# synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
for line in open("TihuanWords.txt", "r", encoding='utf-8'):
seperate_word = line.strip().split(" ")
num = len(seperate_word)
for i in range(1, num):
combine_dict[seperate_word[i]] = seperate_word[0]
print(seperate_word)
print(combine_dict)
# 2提升某些词的词频,使其能够被jieba识别出来
jieba.suggest_freq("年休假", tune=True)
# 3将语句切分成单词
seg_list = jieba.cut(string1, cut_all=False)
f = "/".join(seg_list).encode("utf-8")
f = f.decode("utf-8")
print(f)
# 4返回同义词替换后的句子
final_sentence = " "
for word in f.split('/'):
if word in combine_dict:
word = combine_dict[word]
final_sentence += word
else:
final_sentence += word
# print final_sentence
return final_sentence
string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))
结果
来源:https://blog.csdn.net/weixin_44208569/article/details/104048793


猜你喜欢
- 本例以Linux上安装Pyhton3.8版本为例进行说明1、依赖包安装yum -y install zlib-devel bzip2-dev
- 安装selenium打开命令控制符输入:pip install -U selenium火狐浏览器安装firebug:www.firebug.
- 本文实例讲述了Python实现账号密码输错三次即锁定功能。分享给大家供大家参考,具体如下:初学Python—1#实现账号输错三次即锁定use
- 在Numpy中NaN值一般出现在数据清洗前,出现这个值说明这个数据是缺失的在有些时候我们会选择直接删除这些数据,但有些时候这些数据是不能删除
- 中国,美国,英国3国时间js同步动态显示,对于做企业网站的朋友相信用的到,特别是做英文网站的朋友,加上这一段代码会给你的网站增色不少!本文j
- 简介模板方法模式,是行为型的设计模式。定义一个操作中的算法的骨架,而将一些步骤延迟到子类当中,使得子类可以不改变一个算法的结构即可重新定义该
- 简洁的隐藏垂直菜单在hover时将内容展开。这样的效果在JS里有很多个版本,但这个可以说是绝无仅有的CSS版本。此菜单可以在IE5.5,IE
- 首先,想要实现的功能是递归遍历文件夹,遇到满足条件的文件时,用yield返回该文件的位置。如果不用递归器,可以这样实现:path_list
- 本文介绍MySQL数据库中执行select查询语句,查询指定列的数据,即指定字段的数据。再来回顾一下SQL语句中的select语句的语法:S
- 要选择有助于使查询执行更快的列,应遵循如下规则(这里,“BLOB 类型”应该理解为即包含B L O
- 平时在写asp代码的时候有很多重复的内容要写,麻烦的要命,比如在收集表单提交的数据时,特别是表单的输入域比较多时,要不断写好多的reques
- 视频观看视频敌人精灵这是我们“Shmup”项目的第2部分!在本课中,我们将添加一些敌人的精灵供玩家躲
- tf.nn.conv2d与tf.layers.conv2d的区别在写CNN中注意到tensorflow目前有tf.nn.conv2d和tf.
- 本文实例讲述了Python基类函数的重载与调用方法。分享给大家供大家参考。具体分析如下:刚接触Python语言的时间不长,对于这个语言的很多
- 在使用Python绘制图表前,我们需要先安装两个库文件numpy和matplotlib。Numpy是Python开源的数值计算扩展,可用来存
- SQL2000的SA密码不能更改的解决方法,在更改sa的密码出现下面的错误:Error 21776: [SQL-DMO] The name
- 客户端HTTP请求URL只是标识资源的位置,而HTTP是用来提交和获取资源。客户端发送一个HTTP请求到服务器的请求消息,包括以下格式:请求
- 本文实例为大家分享了python批量转换图片为黑白的具体代码,供大家参考,具体内容如下用到的库:OpenCV、osimport cv2imp
- 1.字母和数字键的键码值(keyCode) 按键 键码 按键 键码 按键 键码 按键 键码 A 65 J 74 S 83 1 49 B 66
- 在Python个人博客程序开发实例框架设计中,我们已经完成了 数据库设计、数据准备、模板架构、表单设计、视图函数设计、电子邮件支持 等总体设