so easy!10行代码写个"狗屁不通"文章生成器功能
作者:liu志军 发布时间:2023-03-19 06:53:30
前几天,GitHub 有个开源项目特别火,只要输入标题就可以生成一篇长长的文章。
背后实现代码一定很复杂吧,里面一定有很多高深莫测的机器学习等复杂算法
不过,当我看了源代码之后
这程序不到50行
尽管我有多年的Python经验,但我竟然一时也没有看懂
这代码放到编辑器里还特么真能执行
当然啦,原作者也说了,这个代码也是在无聊中诞生的,平时撸码是不写中文变量名的, 中文变量名只是最开始瞎写的时候边写语料边写代码时懒得切英文输入法了。
中文变量名也就忍了,但代码逻辑不好懂,最后我还是忍着剧烈的头痛把它的原理读懂了。
这究竟咋实现的呢?
我肯定是不服的,这代码要是被Python之父看见了,他一定后悔发明这门语言。
其实,生成的文章内容都来自于素材文件 data.json, 这个文件的结构是个字典结构
{
"famous":[
"爱迪生a,天才是百分之一的勤奋加百分之九十九的汗水。b",
"查尔斯·史a,一个人几乎可以在任何他怀有无限热忱的事情上成功。b",
....
],
"bosh":[
"现在, 解决x的问题, 是非常非常重要的. 所以, ",
"我们不得不面对一个非常尴尬的事实, 那就是, ",
....
],
"after":[
"这不禁令我深思. ",
"带着这句话, 我们还要更加慎重的审视这个问题: ",
....
],
"before":[
"曾经说过",
"在不经意间这样说过",
....
]
}
famous
里面收集了很多名人语录, 里面的关键字”a”和”b” 将分别被 before
和 after
列表中的内容替换,这样处理后句子看起来具有逻辑性
bosh
里面是各种各样的的废话, 里面关键字”x”最后会用标题替换,这样会让人感觉,这篇文章还是和标题有那么一丢丢联系的。
一篇完整的文章就是靠不断随机从famous、bosh列表获取元素,之后拼接成一篇文章。
搞懂了原理,如果我们自己来写的话,除去代码注释,就10来行代码
import random
import json
data = json.load(open("data.json", encoding="utf-8"))
def generator(title, length=800):
"""
:param title: 文章标题
:param length: 生成正文的长度
:return: 返回正文内容
"""
body = ""
while len(body) < length:
num = random.randint(0, 100)
if num < 10:
body += "\r\n"
elif num < 20:
body += random.choice(data["famous"]) \
.replace('a', random.choice(data["before"])) \
.replace('b', random.choice(data['after']))
else:
body += random.choice(data["bosh"])
body = body.replace("x", title)
return body
来测试一下
from bullshit import generator
content = generator("我爱Python")
print(content)
输出
一般来说, 问题的关键究竟为何? 既然如何,
对我个人而言,我爱Python不仅仅是一个重大的事件,还可能会改变我的人生.
我爱Python, 到底应该如何实现. 生活中, 若我爱Python出现了, 我们就不得不考虑它出现了的事实. 从这个角度来看, 易卜生说过一句富有哲理的话, 伟大的事业,需要决心,能力,组织和责任感。我希望诸位也能好好地体会这句话. 我们不妨可以这样来想: 我们不妨可以这样来想: 奥斯特洛夫斯基曾经提到过, 共同的事业,共同的斗争,可以使人们产生忍受一切的力量。这不禁令我深思. 在这种困难的抉择下, 本人思来想去, 寝食难安.问题的关键究竟为何? 带着这些问题, 我们来审视一下我爱Python. 我爱Python似乎是一种巧合,但如果我们从一个更大的角度看待问题,这似乎是一种不可避免的事实.
现在, 解决我爱Python的问题, 是非常非常重要的. 所以, 对我个人而言,我爱Python不仅仅是一个重大的事件,还可能会改变我的人生. 现在, 解决我爱Python的问题, 是非常非常重要的. 所以,这样看来, 在这种不可避免的冲突下,我们必须解决这个问题. 既然如何, 要想清楚, 我爱Python, 到底是一种怎么样的存在. 既然如此, 总结的来说, 经过上述讨论, 我爱Python因何而发生?总结的来说, 就我个人来说, 我爱Python对我的意义, 不能不说非常重大. 而这些并不是完全重要, 更加重要的问题是, 问题的关键究竟为何? 笛卡儿曾经提到过, 我的努力求学没有得到别的好处,只不过是愈来愈发觉自己的无知。这句话语虽然很短, 但令我浮想联翩. 我认为, 我爱Python, 发生了会如何, 不发生又会如何. 经过上述讨论,
在这种困难的抉择下, 本人思来想去, 寝食难安.我爱Python, 到底应该如何实现. 我爱Python, 到底应该如何实现.
你还自定义内容长度
content = generator("我爱Python", length=1000)
print(content)
输出
要想清楚, 我爱Python, 到底是一种怎么样的存在. 我们都知道, 只要有意义, 那么就必须慎重考虑.了解清楚我爱Python到底是一种怎么样的存在, 是解决一切问题的关键.
从这个角度来看, 一般来说, 带着这些问题, 我们来审视一下我爱Python. 我们不得不面对一个非常尴尬的事实, 那就是, 吉姆·罗恩在不经意间这样说过, 要么你主宰生活,要么你被生活主宰。这句话把我们带到了一个新的维度去思考这个问题: 我爱Python, 到底应该如何实现. 每个人都不得不面对这些问题. 在面对这种问题时, 问题的关键究竟为何? 可是,即使是这样,我爱Python的出现仍然代表了一定的意义. 我们一般认为, 抓住了问题的关键, 其他一切则会迎刃而解.了解清楚我爱Python到底是一种怎么样的存在, 是解决一切问题的关键.我认为, 了解清楚我爱Python到底是一种怎么样的存在, 是解决一切问题的关键.我爱Python, 到底应该如何实现. 我爱Python的发生, 到底需要如何做到, 不我爱Python的发生, 又会如何产生. 现在, 解决我爱Python的问题, 是非常非常重要的. 所以, 我们不妨可以这样来想: 现在, 解决我爱Python的问题, 是非常非常重要的. 所以, 我爱Python, 到底应该如何实现. 马克思说过一句富有哲理的话, 一切节省,归根到底都归结为时间的节省。这启发了我. 我们不妨可以这样来想: 我爱Python似乎是一种巧合,但如果我们从一个更大的角度看待问题,这似乎是一种不可避免的事实. 问题的关键究竟为何? 歌德曾经说过一句富有哲理的话,流水在碰到底处时才会释放活力。带着这句话, 我们还要更加慎重的审视这个问题: 我们不得不面对一个非常尴尬的事实, 那就是, 我们不得不面对一个非常尴尬的事实, 那就是, 我爱Python, 到底应该如何实现. 一般来讲, 我们都必须务必慎重的考虑考虑. 我们都知道, 只要有意义, 那么就必须慎重考虑.总结的来说,
我们一般认为, 抓住了问题的关键, 其他一切则会迎刃而解.
这种事实对本人来说意义重大, 相信对这个世界也是有一定意义的.既然如何, 就我个人来说, 我爱Python对我的意义, 不能不说非常重大. 我爱Python, 发生了会如何, 不发生又会如何. 莎士比亚说过一句著名的话, 意志命运往往背道而驰,决心到最后会全部推倒。这句话语虽然很短, 但令我浮想联翩.
是不是很简单。
当然,你也可以引入更多NLP等技术进来,不过这对我来说
原项目地址:https://github.com/menzi11/BullshitGenerator
重构后的代码地址:
https://github.com/lzjun567/BullshitGenerator
总结
以上所述是小编给大家介绍的so easy!10行代码写个"狗屁不通"文章生成器功能网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
来源:https://blog.csdn.net/lantian_123/article/details/103172069
猜你喜欢
- 目录1.垂直(纵向)切分1.1 垂直分库 1.2 垂直分表 2. 水平(横向)切分2.1 根据数值范围2.2 根据数值取
- <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "h
- 一. adb 相关命令:1. 关闭adb服务:adb kill-server2. 启动adb服务 adb start
- jQuery 简介jQuery 库可以通过一行简单的标记被添加到网页中。您需要具备的基础知识在您开始学习 jQuery 之前,您应该对以下知
- 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 在Python中有很多库可以用来抓取网页,我们先学习urll
- 本文较为详细的分析了了Python的对象体系。分享给大家供大家参考。具体如下:Guido用C语言创造了Python,在Python的世界中一
- 在线音乐播放器,使用python的Tkinter库做了一个界面,感觉这个库使用起来还是挺方便的,音乐的数据来自网易云音乐的一个接口,通过ur
- Python自带一个轻量级的关系型数据库SQLite。这一数据库使用SQL语言。SQLite作为后端数据库,可以搭配Python建网站,或者
- 给定图像集如下,所有类别的图片均在一个文件夹内:给定与图片名相匹配的表格,声明每张图片对应的类别(共有20个类别):那么,如何根据表格中所给
- 引用body标签有两做法: 第一种:使用DOM Core 即引用某个给定文档的第一个(也是仅有的一个)body标签 document.get
- 一、创建一个进程实例化 Process 类创建一个进程对象然后调用它的 start 方法即可生成一个子进程from multiprocess
- 前言cookie使用最多的地方想必是保存用户的账号与密码,可以避免用户每次登录时都要重新输入1.vue中cookie的安装在终端中输入命令n
- 按需导入:安装插件首先需要引入额外的插件:前**vite-plugin-components已重命名为unplugin-vue-compon
- 定义和用法strftime() 函数根据区域设置格式化本地时间/日期。语法strftime(format,timestamp)参数 描述 f
- 解决方法一: mysql安装时候的编码, 看下my.ini,有无 [mysql] default-character-set=utf8 [c
- import socketimport re'''广东省 * 厅出入境政务服务网护照,通行证办理进度查询。分析网址格式
- 一、关系数据库1.数据模型实体间的关系分为以下有三种:1*)一对一模型一对一(one-to-one)关系模型用二维表格表示数据及数据联系,是
- 构思学生管理系统 应该包含老师注册登录 管理学生信息(增删改查)还有数据持久化因为数据存入JSON文件 增删改查都需要读取和修改文件所以需要
- 本文实例讲述了Python使用正则表达式过滤或替换HTML标签的方法。分享给大家供大家参考,具体如下:python正则表达式关键内容:pyt
- window对象是JavaScript浏览器对象模型中的顶层对象,包含多个常用方法和属性: 1 打开新窗口 window.open(page