python同义词替换的实现(jieba分词)
作者:Lty美丽人生 发布时间:2022-02-10 20:58:00
标签:python,同义词,替换
TihuanWords.txt文档格式
注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。
年休假 年假 年休
究竟 到底
回家场景 我回来了
代码
import jieba
def replaceSynonymWords(string1):
# 1读取同义词表,并生成一个字典。
combine_dict = {}
# synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
for line in open("TihuanWords.txt", "r", encoding='utf-8'):
seperate_word = line.strip().split(" ")
num = len(seperate_word)
for i in range(1, num):
combine_dict[seperate_word[i]] = seperate_word[0]
print(seperate_word)
print(combine_dict)
# 2提升某些词的词频,使其能够被jieba识别出来
jieba.suggest_freq("年休假", tune=True)
# 3将语句切分成单词
seg_list = jieba.cut(string1, cut_all=False)
f = "/".join(seg_list).encode("utf-8")
f = f.decode("utf-8")
print(f)
# 4返回同义词替换后的句子
final_sentence = " "
for word in f.split('/'):
if word in combine_dict:
word = combine_dict[word]
final_sentence += word
else:
final_sentence += word
# print final_sentence
return final_sentence
string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))
结果
来源:https://blog.csdn.net/weixin_44208569/article/details/104048793
0
投稿
猜你喜欢
- 前言在实际开发中, 有不少的场景需要使用到模糊查询, MongoDB shell 模糊查询很简单:db.collection.find({&
- 前言Python中,.whl文件是使用wheel格式存储的一种Python安装包,同时也是一个标准的内置包格式。可以将其看作Python库的
- 如下所示:#coding utf-8a=0.001 #定义收敛步长xd=1 #定义寻找步
- 安装的依赖包flaskpymysqlflask_scriptflask_migrateflask_sqlalchemy创建Flask项目(项
- 1、Linux主机重定向 Godaddy的Liunx主机,Godaddy本身已经支持Apache,所以直接创建一个.htaccess文件就可
- 什么是Inception ResnetV2Inception ResnetV2是Inception ResnetV1的一个加强版,两者的结构
- 设计是一个输入-输出的过程,因为首先有用户的需求,客户的项目才有设计的产生,设计是带有目的性和市场行为的,当然也有一部分的创造性设计,仅仅为
- 本文讨论 MySQL 的备份和恢复机制,以及如何维护数据表,包括最主要的两种表类型:MyISAM 和 Innodb,文中设计的 MySQL
- 有的时候取出全部数据库记录也许正好满足你的要求,不过,在大多数情况下我们通常只需得到部分记录。这样一来该如何设计查询呢?当然会更费点脑筋了,
- 目录一、建立画布二、用plt.subplot函数建立坐标系,并分别绘制折线图和柱状图三、完整代码如下所示四、对应效果图如下所示一、建立画布i
- IIS上设置301 跳转相信大家都会,只要在网站-属性-主目录里 选择重定向URL就行了,这样整站就跳转到目标站点了,但是有个问
- 语法格式如下:assert expression等价于:if not expression: raise AssertionErrorass
- 本文实例为大家分享了python贪吃蛇游戏的具体代码,供大家参考,具体内容如下贪吃蛇游戏截图:首先安装pygame,可以使用pip安装pyg
- 最近游戏项目在多个国家上线,每个国家都对应两份儿svn目录(一份是本地策划目录,一份是线上目录)。于是乎维护变得很烦躁。需要先更新本地策划s
- 谷歌在大型图像数据库ImageNet上训练好了一个Inception-v3模型,这个模型我们可以直接用来进来图像分类。下载链接: https
- 本文实例讲述了Python基于pillow判断图片完整性的方法。分享给大家供大家参考,具体如下:1、安装第三方库。pip install p
- <input type=button value=刷新 onclick="window.location.reload()&
- MySQL 5.0.16的乱码问题可以用下面的方法解决:1.设置phpMyAdminLanguage:Chinese simplified
- 我就废话不多说了,大家还是直接看代码吧~import pymysqlfrom sshtunnel import SSHTunnelForwa
- 增强的toggleClass()1.toggleClass也可以和addClass一样,用空格分隔多个class名称了。.toggleCla