关于jieba.cut与jieba.lcut的区别及说明
作者:stay_foolish12 发布时间:2022-12-10 17:02:20
标签:jieba.cut,jieba.lcut
jieba.cut与jieba.lcut的区别
jieba.cut生成的是一个生成器,generator,也就是可以通过for循环来取里面的每一个词。
word_list= [word for word in jieba.cut(text)]
jieba.lcut 直接生成的就是一个list
Prefix dict has been built succesfully.
Full Model 我/来/北京/上学
['我', '来', '北京', '上学']
jieba的几个分词接口:cut、lcut、posseg.cut、posseg.lcut
cut
cut提供最基本的分词功能,返回的结果是个生成器generator,可通过迭代的方法访问各个分词
lcut
lcut和cut方法的区别是:lcut返回的是list。也可以通过list(jieba.cut()) 来等价jieba.lcut()
prosseg
的方法
posseg.cut 和 posseg.lcut的区别雷同,只不过posseg还提供了词性,方便对句法做分析
s = '我们都是小青蛙 呱呱呱呱 喜欢快乐的生活 还会讲笑话'
import jieba
jieba.cut(s) # <generator object cut at 0x10a6e5500>
list(jieba.cut(s)) # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
jieba.lcut(s) # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
import jieba.posseg
jieba.posseg.cut(s) # <generator object cut at 0x10cc80eb0>
list(jieba.posseg.cut(s)) # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]
jieba.posseg.lcut(s) # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]
来源:https://blog.csdn.net/stay_foolish12/article/details/107466309
0
投稿
猜你喜欢
- 1.前言最近在用 Python 写一个小工具,这个工具主要就是用来管理各种资源的信息,比如阿里云的 ECS 等信息,因为我工作的电脑使用的是
- 从文件中读取数据读取整个文件这里假设在当前目录下有一个文件名为'pi_digits.txt'的文本文件,里面的数据如下:3.
- 这里首先要介绍官方文档,对python有了进一步深度的学习的大家们应该会发现,网上不管csdn或者简书上还是什么地方,教程来源基本就是官方文
- NumPy是一个关于矩阵运算的库,熟悉Matlab的都应该清楚,这个库就是让python能够进行矩阵话的操作,而不用去写循环操作。下面对nu
- 钉钉设置机器人首先在钉钉设置钉钉机器人群设置—> 智能群助手—>添加机器人—>自定义添加完成,得到一个Webhook AP
- Windows下ORACLE完全卸载:使用OUI可以卸载数据库,但卸载后注册表和文件系统内仍会有部分残留。这些残留不仅占用磁盘空间,而且影响
- 其实我们平时在深度学习中所说的卷积操作,在 opencv 中也可以进行,或者说是类似操作。那么它是什么操作呢?它就是图像的模糊(滤波)处理。
- 本文实例讲述了python生成IP段的方法。分享给大家供大家参考。具体实现方法如下:#!/usr/local/bin/python#-*-
- 需要用到的库有selenium,还需要安装Chrome浏览器驱动,具体如何安装我就不详述了在这里我模拟了csdn的登录过程**1**.首先打
- 这段时间我一直在说设计需要有层次感,这种层次感可能有很多类型,比如色彩的层次感,或是元素的层次感。当一个设计缺乏层次感的时候页面所表现出来的
- 下面这个函数使用FSO对象来判断服务器上的某个文件是否存在:<%Private Function Dir(byVa
- 在SQL Server中进行开发会让你身处险地,并且寻找快速解决方案。我们编辑了前十名关于SQL Server开发的常见问题。对常见的针对表
- 如下所示:#python解决字符串倒序输出def string_reverse(m): num=len(m) a=[] for i in r
- 之前写的单向链表和环形链表都只是单向的,只能单向遍历,不能根据后面的节点获取前面的节点,除非进行反转操作。双向链表每个节点都有两个指针,这两
- 前言:项目的成就感来源于大家~~必须先感谢一切该感谢的人!(旁白:写了很多次设计实录分享,这次是最百感交集的一次,话多这习惯还大家海涵~嘻嘻
- 安装anaconda登录anaconda的官网下载,anaconda是一个集成的工具软件不需要我们再次下载。anaconda官网点击下载跳转
- 装饰器的价值不言而喻,可以用来增强函数功能、简化代码、减少代码冗余。它的使用场景同样很多,比较简单的场景包含打印日志、统计运行时间,这类例子
- 目录前言1. 使用Lambda来修改Pandas数据框中的值2. 使用f-string来连接字符串3. 用Zip()函数对多个列表进行迭代4
- 背景:有一个list,里面的每一个元素都是dict,根据某一个key进行去重,在这里,key代表question#!/usr/bin/env
- 在进行python的开发过程中一直倡导使用虚拟环境来进行项目隔离,这样不会因为python的包不同而导致各种问题,但是以往为了图省事简单,安