关于jieba.cut与jieba.lcut的区别及说明
作者:stay_foolish12 发布时间:2022-12-10 17:02:20
标签:jieba.cut,jieba.lcut
jieba.cut与jieba.lcut的区别
jieba.cut生成的是一个生成器,generator,也就是可以通过for循环来取里面的每一个词。
word_list= [word for word in jieba.cut(text)]
jieba.lcut 直接生成的就是一个list
Prefix dict has been built succesfully.
Full Model 我/来/北京/上学
['我', '来', '北京', '上学']
jieba的几个分词接口:cut、lcut、posseg.cut、posseg.lcut
cut
cut提供最基本的分词功能,返回的结果是个生成器generator,可通过迭代的方法访问各个分词
lcut
lcut和cut方法的区别是:lcut返回的是list。也可以通过list(jieba.cut()) 来等价jieba.lcut()
prosseg
的方法
posseg.cut 和 posseg.lcut的区别雷同,只不过posseg还提供了词性,方便对句法做分析
s = '我们都是小青蛙 呱呱呱呱 喜欢快乐的生活 还会讲笑话'
import jieba
jieba.cut(s) # <generator object cut at 0x10a6e5500>
list(jieba.cut(s)) # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
jieba.lcut(s) # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
import jieba.posseg
jieba.posseg.cut(s) # <generator object cut at 0x10cc80eb0>
list(jieba.posseg.cut(s)) # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]
jieba.posseg.lcut(s) # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]
来源:https://blog.csdn.net/stay_foolish12/article/details/107466309
0
投稿
猜你喜欢
- 对MySQL的用户而言,备受诟病的一个问题就是导入SQL备份文件时不能并发,使得导入的效率很低。今天,我们就来改变下思路,尝试一下并发导入的
- 为什么要用缓存?首先说,为什么要用缓存的,由于Django是 * 站,所有每次请求均会去数据进行相应的操作,当程序访问量大时,耗时必然会更加
- //图片上传<SCRIPT RUNAT=SERVER LANGUAGE=VBSCRIPT> Function GetUpload
- 一 Insert 语句1.在数据中只插入默认值:insert into [DBTrain].[dbo].[log_info]default
- 线性逻辑回归本文用代码实现怎么利用sklearn来进行线性逻辑回归的计算,下面先来看看用到的数据。这是有两行特征的数据,然后第三行是数据的标
- 之前在网上看过好多关于mysql.sock不见的问题,并没有关注这个东西存在的意义,直到自己的mysql也出现了相同的问题。让人纠结了一把…
- 在人工智能开启的时代,Python作为人工智能的首选语言,前景可以预见。因此学习Python的人越来越多。不过,很多初学Python的小白都
- 代码:function checkall(checkNames){ var allBoxs = document.getElem
- 本文实例讲述了python批量生成本地ip地址的方法。分享给大家供大家参考。具体分析如下:这段代码用于在本地计算机上生成本地ip地址绑定到网
- 最近碰到一个mysql5数据库的问题。就是一个标准的servlet/tomcat网络应用,后台使用mysql数据库。问题是待机一晚上后,第二
- 今天使用python计算数据相关性,但是发现计算出的表格中间好多省略号,而且也不对齐。这也太难看了。于是在程序里加了三行:pd.set_op
- keras根据层名称来初始化网络def get_model(input_shape1=[75, 75, 3], input_shape2=[
- 阻塞定义当来自应用程序的第一个连接控制锁而第二个连接需要相冲突的锁类型时,将发生阻塞。其结果是强制第二个连接等待,而在第一个连接上阻塞。不管
- # -*- coding: utf-8 -*-class Heap(object): @classmet
- pytorch的广播语义(broadcasting semantics),和numpy的很像,所以可以先看看numpy的文档:1、什么是广播
- 本文实例讲述了js显示动态时间的方法。分享给大家供大家参考,具体如下:Date对象的方法Date 对象能够使你获得相对于国际标准时间(格林威
- 环境介绍python3.5.2 64位django 1.10.3apache 2.4 64位windows 10重点在apache上。pyt
- 废话不多说原因:在Anaconda下打包的很多不必要的模块进去,导致最终的exe文件过于庞大。解决办法:要用纯净的python来打包即可避免
- 一: 基本使用:1:环境的安装:pip install flask-sqlalchemypip install pymysql2:组件初始化
- 本文实例讲述了golang实现unicode转换为字符串string的方法。分享给大家供大家参考,具体如下:package mainimpo