位置：首页>> 网络编程>> Python编程>> Python实现word2Vec model过程解析

Python实现word2Vec model过程解析

作者：Leslie_Chan　　发布时间：2023-10-07 14:22:10　

标签：Python,实现,word2Vec,model

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='％(asctime)s : ％(levelname)s : ％(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
# load the file if it has already been trained, to save repeating the slow training step below
model = gensim.models.Word2Vec.load(fname)
else:
# can take a few minutes, grab a cuppa
model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
for w2 in words:
print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec，所以我们直接开始建立模型

这是建立模型的过程，最后会出现saving Word2vec的语句，代表已经成功建立了模型

这是输入了 gorvement和news关键词后所反馈的词语 --- administration，他们之间的相关性是0.508

当我在输入 women 和 man ，他们显示的相关性的0.638 ，已经是非常高的一个数字。

值得一提的是，我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话，可以自己建立该模型，通过传入不同的语料库，来calc 一些term的相关性噢

来源：https://www.cnblogs.com/lesliechan/p/11966642.html

0

投稿

猜你喜欢

使用Python开发游戏运行脚本成功调用大漠插件
闲来无事，想通过python来实现一些简单的游戏辅助脚本，而游戏辅助脚本的主要原理就是通过程序来查找游戏程序窗口，模拟实现鼠标点击和键盘按键
Python利用Gradio与EasyOCR构建在线识别文本的Web应用
前言随着人工智能的不断发展，各种智能算法越来越普遍，本文就给大家介绍一种通过训练好的算法进行文字识别的方法，而且是Web页面可视化操作，方便
Python实现自动化刷抖音的实例
前言都说抖音有毒，一刷就停不下来了。看来抖音这款产品紧紧抓住了人们内心深处的某些需求。当然今天不是来探讨抖音这款产品的啊。今天我们来学习如何
Python教程之基本运算符的使用(上)
Python 运算符通常用于对值和变量执行操作。这些是用于逻辑和算术运算的标准符号。在本文中，我们将研究不同类型的 Python 运算符。&
js实现砖头在页面拖拉效果
用js实现一个砖头在页面，但鼠标点击拖动时，砖头在页面上形成拖拉效果：刚开始时：鼠标点击拖动后：实现代码：<html> <
python实现class对象转换成json/字典的方法
本文实例讲述了python实现class对象转换成json字典的方法。分享给大家供大家参考，具体如下：# -*- encoding: UTF
mysql索引对排序的影响实例分析
本文实例讲述了mysql索引对排序的影响。分享给大家供大家参考，具体如下：索引不仅能提高查询速度，还可以添加排序速度，如果order by
python 贪心算法的实现
贪心算法贪心算法（又称贪婪算法）是指，在对问题求解时，总是做出在当前看来是最好的选择。也就是说，不从整体最优上加以考虑，他所做出的是在某种意
CentOS 7下部署php7.1和开启MySQL扩展的方法教程
前言之前在CentOS7安装php7.1的时候有遇到PHP源及PHP7.1不支持MySQL扩展问题，上午抽空安装了下终于解决了这两个问题，特
用Python编写个解释器实现方法接受
前言在本文中，我们将设计一个可以执行算术运算的解释器。我们不会重新造轮子。文章将使用由 David M. Beazley 开发的词法解析器
高效率的GetRows()的使用方法
Rs.GetRows(N)：N代表获取记录数量 Rs.GetRows(1)：1表示只返回一行记录 Rs.GetRows(-1)：-1表示默认
python中的列表和元组实例详解
python中的列表和元组# 1.列表的格式# [数据1,数据2,数据3,···]# 列表可变数据类型# 列表可以存储多个数据，数据之间的
精美漂亮的php分页类代码
这是一款简单，方便，功能齐全的分页类，可以根据自己的需要更改CSS样式文件以实现分页颜色的控制，利用p
Flask框架学习笔记之模板操作实例详解
本文实例讲述了Flask框架学习笔记之模板操作。分享给大家供大家参考，具体如下：flask的模板引擎是Jinja2。引入模板的好处是增加程序
python 求定积分和不定积分示例
求f(x) = sin(x)/x 的不定积分和负无穷到正无穷的定积分sin(x)/x 的不定积分是信号函数sig ，负无穷到正无穷的定积分为
MySQL命令终端有beep声
使用MySQL的命令终端时，如果输入SQL有误，将有beep声。若要关闭该功能，根据mysql --help，使用mysql --no-be
一篇文章带你搞懂Python类的相关知识
一、什么是类类（class），作为代码的父亲，可以说它包裹了很多有趣的函数和方法以及变量，下面我们试着简单创建一个吧。这样就算创建了我们的第
Python中矩阵创建和矩阵运算方法
矩阵创建1、from numpyimport *;a1=array([1,2,3])a2=mat(a1)矩阵与方块列表的区别如下：2、dat
Python常用模块用法分析
本文较为详细的讲述了Python中常用的模块，分享给大家便于大家查阅参考之用。具体如下：1.内置模块(不用import就可以直接使用)常用内
Python 高级库15 个让新手爱不释手(推荐)
在本文中，我挑选了15个最有用的软件包，介绍它们的功能和特点1. DashDash 是比较新的软件包，它是用纯 Python 构建数据可视化

python实现斐波那契递归函数的方法

keras 获取某层的输入/输出 tensor 尺寸操作

python源文件的字符编码知识点详解

Python3.x+pyqtgraph实现数据可视化教程

python网络编程之多线程同时接受和发送

Django request.META.get()获取不到header头的原因分析

安装pyecharts1.8.0版本后导入pyecharts模块绘图时报错: “所有图表类型将在 v1.9.0 版本开始强制使用 ChartItem 进行数据项配置 ”的解决方法

python并发编程 Process对象的其他属性方法join方法详解

解决echarts中饼图标签重叠的问题

Python函数参数基础介绍及示例

wps怎么更换字体? wps字体替换方法

python plotly画柱状图代码实例

如何解决 iPhone 行事历中毒、出现垃圾广告？

明日之后在哪领国美十一礼包-明日之后国美十一礼包领取地址一览

崩坏3记忆战场阿湿波阵容如何搭配？记忆战场阿湿波阵容搭配心得

抖音文字找茬大师桥洞老人帮助流浪老人改善生活答案是什么

Python验证的50个常见正则表达式

抖音文字的力量突袭制服匪徒如何过关

pyqt4教程之messagebox使用示例分享

从零开始的异世界生活INFINITY魔法器怎么搭配最好？魔法器搭配技巧一览

手机版 网络编程 asp之家 www.aspxhome.com