python Selenium实现付费音乐批量下载的实现方法
作者:1treeS 发布时间:2023-02-28 17:26:58
必备环境
废话
每年回家都要帮我爸下些音乐,这对我来说都是轻车熟路!可当我打开网易云点击下载按钮的时候,可惜已物是人非啦!
开个 VIP 其实也不贵,临时用用也就¥15!但 IT 男的尊严必须要有,于是开始徜徉于搜索引擎中
最后在知乎中,搜索到一个网址VIP付费音乐解析
P.S.
再次感谢提供该服务的作者!如果你下载的音乐数量不多,直接这里搜索下载,下载后修改文件名即可!并且在这个网址中点击播放列表
-点击同步
,可以同步网易云的歌单!之后批量下载即是下载这些网易云的歌单!但是下载某个歌单中的几百首歌,手动下载就不现实了!在点击同步
中需要输入你的网易云 UID,这 UID 的获取方式如下:第一步打开网易云随便选中一首歌,右键复制链接
然后随便找个地方粘贴这个链接,例如https://music.163.com/song?id=25727803&userid=275613591
最后这串数字就是 UID!
程序运行环境
第一步安装一个python3
,这个简单吧!贴上我的版本 python3.65,安装时注意勾选Add in path
第二步下载FFmpeg
,这是用来解析视频和音频的,作为you-get
的辅助工具,下载点这里,下载后解压添加环境变量即可
第三步安装you-get
,这是个下载视频音频的神器,有兴趣可以深入研究!之后我打算写个下载任意视频的工具,嘿嘿这是后话了!安装方式很简单pip install you-get
环境配置就这样,还是非常轻松的,下面会解释下代码
源码
完整代码
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time, os
# import threding
def get_music_name_link():
main_handle = browser.current_window_handle
fp = open('E:\\Project_PY\\file\\musiclink.txt','wb')
fp2 = open('E:\\Project_PY\\file\\musicname.txt','wb')
try:
for i in list(range(2,400)):
browser.switch_to_window(main_handle)
txt = browser.find_element_by_xpath('/html/body/div[3]/div/div[2]/div[2]/div[1]/div/div[%d]' % i).text + '\n'
fp2.write(bytes(txt,encoding='utf-8'))
location = browser.find_element_by_xpath('/html/body/div[3]/div/div[2]/div[2]/div[1]/div/div[%d]' % i)
ActionChains(browser).move_to_element(location).perform()
browser.find_element_by_xpath('/html/body/div[3]/div/div[2]/div[2]/div[1]/div/div[%d]/span[5]/div/span[2]' % i).click()
time.sleep(2)
all_handles = browser.window_handles
browser.switch_to_window(all_handles[-1]) # lastest
url_link = browser.current_url + '\n'
fp.write(bytes(url_link,encoding='utf-8'))
browser.close()
except Exception as e:
print('get_music_name_link meet some problem! {}'.format(e))
fp.close()
fp2.close()
def download_music(list_name):
with open('E:\\Project_PY\\file\\musicname.txt','r',encoding='utf-8') as fp1:
music_name = fp1.readlines()
len1 = len(music_name)
fp2 = open('E:\\Project_PY\\file\\musicname_format.txt','w',encoding='utf-8')
for i in range(3,len1,4):
music_name_format = music_name[i].strip() + '\n'
fp2.write(music_name_format)
fp2.close()
with open('E:\\Project_PY\\file\\musiclink.txt','r',encoding='utf-8') as fp1:
with open('E:\\Project_PY\\file\\musicname_format.txt','r',encoding='utf-8') as fp2:
for music_link,music_name in zip(fp1.readlines(),fp2.readlines()):
you_get_link = 'you-get "{}" -o "E:\\Project_PY\\file\\music\\{}" -O "{}"'.format(music_link.strip(),list_name,music_name.strip())
you_get_link = you_get_link.strip()
# print(you_get_link)
os.system(you_get_link)
url = 'http://music.zhuolin.wang/'
uid = input('please input your uid:')
options = webdriver.FirefoxOptions()
options.add_argument('--headless')
browser = webdriver.Firefox(firefox_options=options)
browser.implicitly_wait(8)
browser.get(url)
# browser.maximize_window()
browser.set_window_size(1000,100000)
browser.find_element_by_xpath('/html/body/div[3]/div/div[1]/div/span[3]').click()
# scroll = browser.find_element_by_xpath('//*[@id="mCSB_1_dragger_vertical"]')
# ActionChains(browser).drag_and_drop_by_offset(scroll,0,100).perform()
# time.sleep(2)
all_handles = browser.window_handles
browser.switch_to_window(all_handles[-1]) # lastest
time.sleep(1)
browser.find_element_by_xpath('/html/body/div[3]/div/div[2]/div[1]/div[1]/div/span/div[2]/span').click()
all_handles = browser.window_handles
browser.switch_to_window(all_handles[-1]) # lastest
time.sleep(1)
browser.find_element_by_xpath('/html/body/div[6]/div[2]/input').send_keys(uid)
browser.find_element_by_xpath('/html/body/div[6]/div[3]/a[1]').click()
# t1 = threading.Thread(target=get_music_name)
# t2 = threading.Thread(target=get_music_link)
# t3 = threading.Thread(target=download_music)
for i in list(range(3,100)):
try:
print('downloading song_list{}! please waiting....'.format(i))
browser.find_element_by_xpath('/html/body/div[3]/div/div[2]/div[1]/div[1]/div/div[%d]/img' % i).click()
dir_name = browser.find_element_by_xpath('/html/body/div[3]/div/div[2]/div[1]/div[1]/div/div[%d]/p' % i).text
time.sleep(1)
get_music_name_link()
download_music(dir_name)
browser.find_element_by_xpath('/html/body/div[3]/div/div[1]/div/span[3]').click()
time.sleep(1)
all_handles = browser.window_handles
browser.switch_to_window(all_handles[-1]) # lastest
time.sleep(5)
except Exception as e:
print('get_song_list meet some problem! {}'.format(e))
browser.quit()
核心代码解释
总共有三个函数:
函数一
get_music_name_link
,主要是获取音乐名称以及音乐的下载链接函数二
download_music
,获取歌单名称,然后拼接下载链接和音乐名,调用you-get
开始下载到对应目录函数三
main
,主要是利用 UID 获取歌单,以及批量下载歌单中的曲目
需要注意的几个点:
1.使用了sleep(1)
休眠一秒,如果网络较慢需要将所有的sleep
休眠时间加长
2.所有的路径需要自己根据本机修改
3.如果要修改代码一定要注意switch_to_window
来切换窗口
4.73行的for i in list(range(3,100))
是用来选择下载的歌单,歌单从 1 开始计数
程序演示
输入网易云的 UID!
然后静静的等待即可...此过程中会有部分音乐的播放声音,不喜欢可以开静音下
当所有的链接解析完成后就会调用you-get
下载,此过程会自动创建与歌单名相同的文件夹
下载完成后
P.S.
如果要下载所有歌单,就不需要修改代码,直接输入网易云的 UID 运行即可!如果要下载某个具体的歌单只需要改动73行的这个循环for i in list(range(3,100))
,所以说程序还是比较简单的,缺点可能就是没时间写 UI,而且也不太会 pyqt 之类的,只会点 MFC!所以将就用吧,功能还是很齐全的!
来源:https://segmentfault.com/a/1190000018001854
猜你喜欢
- 本文实例讲述了python自动化测试之从命令行运行测试用例with verbosity,分享给大家供大家参考。具体如下:实例文件recipe
- 首先你得引入bootstrap与jquery推荐一个CDN:http://cdn.gbtags.com/index.html然后就是开始编写
- 网站标准(或称“WEB标准”)对于每一个开发网站和做网页的人来说,都是不可忽视的,这不仅是一个潮流,而是一个标准,一个更加符合规范的做法,而
- SELECT表名=case when a.colorder=1 then d.name else '' end,表说明=ca
- 本文实例讲述了Python zip()函数用法。分享给大家供大家参考,具体如下:这里介绍python中zip()函数的使用:>>
- 不得不承认,傲游在用户体验方面是做得比较好的,所以它的用户群非常大。也正因为如此,它的某些不好的特性也造成了开发人员不可忽略的浏览器兼容问题
- 进入:直接输入python即可,如图所示退出:1:输入exit(),回车2:输入quit(),回车3:输入ctrl+z,回车来源:https
- 通过session,我们可以在多次浏览器请求中保持数据, 接下来的部分就是用session来处理用户登录了。 当然,不能仅凭用户的一面之词,
- 最近学习python并发,于是对多进程、多线程、异步和协程做了个总结。一、多线程多线程就是允许一个进程内存在多个控制权,以便让多个函数同时处
- Flask Script扩展提供向Flask插入外部脚本的功能,包括运行一个开发用的服务器,一个定制的Python shell,设置数据库的
- 出图是项目里常见的任务,有的项目甚至会要上百张图片,所以批量出土工具很有必要。arcpy.mapping就是ArcGIS里的出图模块,能快速
- 客户强烈要求使用淘宝的首页商品分类效果,很BT~,没辙就满足一下人家的需求。通过淘宝案例,立即想到了显示/隐藏层的效果,于是在DW中画了几个
- 一,PHP脚本与动态页面。 PHP脚本是一种服务器端脚本程序,可通过嵌入等方法与HTML文件混合,也可以类,函数封装等形式,以模板的方式对用
- 最近写一个小爬虫,需要拿到邮箱信息,发现拿不到,也不是ajax接口。最后查资料发现是被Cloudflare加密起来了,有加密肯定有解密。通过
- 几天前我在考虑使用 python 从 whatsapp 发送消息。和你们一样,我开始潜伏在互联网上寻找一些解决方案并找到了关于twilio.
- 本文实例讲述了Python获取任意xml节点值的方法。分享给大家供大家参考。具体实现方法如下:# -*- coding: utf-8 -*-
- 前言众所周知,python拥有丰富的内置库,还支持众多的第三方库,被称为胶水语言,随机函数库random,就是python自带的标准库,他的
- 在 Facebook 上有一个彩蛋:登录 facebook.com ,点击你首页的任何地方,键盘输入 Up, Up, Down, Down,
- 使用环境:人才网项目中有一个简历保密设置,其中有一个过滤关键词,只有某个企业的公司名中包含有其中的一个关键字,就不显示该份简历,当然,我还没
- YUI Compressor 压缩 JavaScript 的内容包括:移除注释移除额外的空格细微优化标识符替换(Identifier Rep