Python采集情感音频的实现示例
作者:极客飞虎 发布时间:2023-06-11 23:17:10
前言
我最近喜欢去听情感类的节目,比如说,婚姻类,我可能老了吧。我就想着怎么把音乐下载下来了,保存到手机上,方便我们业余时间去听。
发送请求
首先,我们要确定我们的目标网址,我们想要获取到每一个音频的地址。
我们发送请求,获取网页源代码。我们相信大家这里的代码都会写了。
url = 'https://www.ximalaya.com/album/37453303'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36',
}
res = requests.get(url,headers=headers)
requests
是 Python 的一个内置模块,用于发送 HTTP 请求。在这个例子中,我们使用 requests.get()
函数向 https://www.ximalaya.com/album/37453303
发送一个 GET 请求,并将请求头和响应体作为参数传递给函数。
获取数据
info_list = re.findall('"tracks":[(.*?)]', res.text)[1]
print(info_list)
子字符串列表中的第一个元素就是我们要找的 tracks
字符串。我们将其存储在 info_list
变量中,并使用 print()
函数输出。
我们发现,我们想要的数据,就在我们匹配的内容中。里面包含了每一个音乐的标题和其id,我们接下来把这个获取下来。
注意,这里,不是json数据,所以,我们只能正则去匹配。
解析数据
我们通过对比url发现,我们只需要拿到uid,就可以直接访问到音频。这里就不多解释。
audio = f'https://www.ximalaya.com/revision/play/v1/audio?id={trackId}&ptype=1'
我们只需要把trackID换掉,就可以了。请求上面的url,就可以拿到音频的地址。接下来,我们写代码。
for trackId, title in zip(trackIds, titles):
audio = f'https://www.ximalaya.com/revision/play/v1/audio?id={trackId}&ptype=1'
print(audio)
audio_res = requests.get(audio, headers=headers)
audio_url = audio_res.json()['data']['src']
print(audio_url)
zip()
函数用于将两个列表合并成一个列表。在这个例子中,我们使用 zip()
函数将 trackIds
和 titles
两个列表合并成一个列表,并将其存储在 trackIds
变量中。
然后,我们将 trackId
和 title
转换为字符串格式,并将其存储在 audio
变量中。
接下来,我们使用 requests.get()
函数向 audio
发送一个 GET 请求,并将请求头和响应体作为参数传递给函数。最后,我们使用 json()
方法将响应体中的 data
字段转换为 JSON 格式,并使用 ['data']['src']
取出了 src
属性,即 audio_url
的值,并将其存储在 audio_url
变量中。
保存数据
music_content = requests.get(audio_url, headers=headers).content
with open('music//' + f'{title}' + '.mp3', mode='wb') as filename:
filename.write(music_content)
print(title, '保存成功')
接下来,我们请求这个网页,保存二进制到本地。with open()
语句用于自动关闭文件,确保文件在使用完毕后被正确关闭。在这个例子中,我们使用 with open()
语句打开一个名为 music//
+ title
+ .mp3
的文件,并将其保存到变量filename
中。
然后,我们使用 write()
方法将音频内容写入文件中。
来源:https://juejin.cn/post/7224418285798408252
猜你喜欢
- 代码如下:<html> <head> &nb
- python 获取网页编码方式实现代码<span style="font-family: Arial, Helvetica,
- 这篇论坛文章详细的讲解了使用SQL Server 2008管理非结构化数据的具体方法,更多内容请参考下文:microsoft SQL Ser
- MySQL有多种存储引擎:MyISAM、InnoDB、MERGE、MEMORY(HEAP)、BDB(BerkeleyDB)、EXAMPLE、
- Access数据库被损坏主要分为以下几种情况:1、严重损坏;2、轻度损坏;3、有些表被损坏或有些表的部分记录被损坏。下面就分情况介绍解决办法
- CONVERT将某种数据类型的表达式显式转换为另一种数据类型。由于某些需求经常用到取日期格式的不同.现以下可在SQL Server中将日期格
- 检测submit事件的冒泡情况:<!doctype html><html dir="ltr" lang
- 作者:AngelGavin 出处:CSDNInternet Explorer 5.0 对 XML 提供哪个级别的支持?Inter
- 如何实现优惠打折? 代码及说明见下:<%@ LANG
- 常用的四种SQL命令:1.查询数据记录(Select)语法:Select 字段串行 From table Where 字段=内容例
- 从开始认识CSS(DW4)那时起,我就知道了CSS的强大,但从未用CSS排版过,因为我曾经尝试过学习,但感觉太难了而且用DW的表格,所见及所
- 今天因为程序里面要把写入数据库的html源代码以html源编码的形式显示在页面里面,而不要被浏览器解释成。。找了N久都不知道怎么做后来看了一
- 随着JS与XHTML的应用普及,越来越多的web界面应用技术出现在网站上,比如我们常见的日历控件,搜索下拉框等,这些web界面应用技术大大的
- AJAX应用因为它们的表现力的丰富、更加互动和更加迅速的响应得到了赞扬声;这些优点都是通过使用XMLHttpRequest对象来动态的载入数
- 本文实例讲述了PHP判断密码强度的方法。分享给大家供大家参考,具体如下:一、php页面$score = 0;if(!empty($_GET[
- 该章节为 Python自动化办公篇 的最后一章,通过定时任务发送邮件的方式学习定时模块的使用 --> schedule 。(该章内容篇
- Python中pass的作用空语句 do nothing保证格式完整保证语义完整以if语句为例,在c或c++/java中:if(true);
- Pytorch的核心是两个主要特征:1.一个n维tensor,类似于numpy,但是tensor可以在GPU上运行2.搭建和训练神经网络时的
- 这篇文章主要介绍了python isinstance函数用法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值
- 最近看到N多介绍CSS框架,前些天我说过一句话:“在我有限的视野里,还没见到可以真正可以称得上css框架的东东~”,当然也可能是我的视野太小