Python利用Selenium实现自动观看学习通视频
作者:Baker_Streets 发布时间:2022-03-12 16:32:03
标签:Python,Selenium,观看视频
一、登录
以信号与系统课程为例,直接输入网址则出现登录界面:
由于学号登录需要验证码,因此选择电话登录:
直接在开发者工具中找到手机号输入框、密码输入框和登录按钮,并进行输入和点击:
import time
from selenium.webdriver import Chrome
web = Chrome()
web.get('https://mooc2-ans.chaoxing.com/mycourse/stu?courseid=203430340&clazzid=43992529&cpi=93003203&enc=9726840999ffc15f3f441bb5466882e6&t=1637651449831&pageHeader=1')
# 登录
phone = web.find_element_by_class_name('ipt-tel')
pwd = web.find_element_by_class_name('ipt-pwd')
login = web.find_element_by_class_name('btn-big-blue')
phone.send_keys('电话号码')
pwd.send_keys('密码')
login.click()
time.sleep(2)
二、进行一个页面的视频观看
登录成功后,如下:
找到所有的知识点页面:
all_no_list = web.find_elements_by_xpath('//span[@class="catalog_points_yi"]')
执行以上代码后,发现错误,通过开发者工具发现其在iframe中,因此需要先进入iframe:
# 进入iframe
frame_content = web.find_element_by_xpath('//*[@id="frame_content-zj"]')
web.switch_to.frame(frame_content)
time.sleep(2)
# 查找所有未完成的知识点页面
all_no_list = web.find_elements_by_xpath('//span[@class="catalog_points_yi"]')
紧接着进入第一个页面:
# 跳转到第一个知识点页面
all_no_list[0].click()
web.switch_to.window(web.window_handles[-1]) # 跳转到该知识点界面
time.sleep(5)
查找未完成的知识点的div(同样需要进入iframe):
iframe = web.find_element_by_id('iframe') # 每次刷新后,都要进入内部iframe
web.switch_to.frame(iframe)
# 筛选,去除已完成的知识点
k_points = web.find_elements_by_css_selector('div.ans-attach-ct:not(.ans-job-finished)')
进入视频的播放:
num = len(k_points)
for i in range(0, num):
k_point = k_points[i]
# 查找任务图标个数,1为知识点,0为不是知识点
icon_num = len(k_point.find_elements_by_xpath('./div[contains(@class,"ans-job-icon")]'))
if icon_num == 0: # 再次筛选,去除不是知识点的div
continue
# 进行视频的播放
video_iframe = k_point.find_element_by_xpath('./iframe') # 视频iframe
print(video_iframe)
time.sleep(2)
web.switch_to.frame(video_iframe) # 进入视频iframe
time.sleep(2)
web.find_element_by_class_name('vjs-big-play-button').click() # 点击播放按钮
time.sleep(1)
web.find_element_by_xpath('//*[@id="video"]/div[5]/div[6]/button').click() # 静音
# 播放和暂停按钮
pause_btn = web.find_element_by_xpath('//button[contains(@class,"vjs-play-control")and '
'contains(@class,"vjs-control")and contains(@class,"vjs-button")]')
while (1): # 播放等待
time.sleep(1) # 每1秒,检查视频是否播放完毕
if (pause_btn.get_attribute('title') == "重播"): # 点击后播放,即播放完毕状态
break
print('视频播放完毕')
# 视频播放完毕,退出播放iframe,然后退出循环,再次查找该页面的所有知识点(k_points)
web.switch_to.default_content()
print('退出知识点iframe')
time.sleep(2)
经过测试后,发现播放完一个视频后,k_points
(即知识点列表)发生改变,不能继续使用该列表中的元素,因此需要重新获取,则需要刷新页面。
观看一个视频方法如下:
# 完成一个页面的所有未完成的知识点
def view_one_page_points():
while (1):
iframe = web.find_element_by_id('iframe') # 每次刷新后,都要进入内部iframe
web.switch_to.frame(iframe)
# 筛选,去除已完成的知识点
k_points = web.find_elements_by_css_selector('div.ans-attach-ct:not(.ans-job-finished)')
num = len(k_points)
flag = False
for i in range(0, num):
if i == (num - 1): # 是最后一个,表示该页刷完
flag = True
k_point = k_points[i]
# 查找任务图标个数,1为知识点,0为不是知识点
icon_num = len(k_point.find_elements_by_xpath('./div[contains(@class,"ans-job-icon")]'))
if icon_num == 0: # 再次筛选,去除不是知识点的div
continue
# 进行视频的播放
video_iframe = k_point.find_element_by_xpath('./iframe') # 视频iframe
print(video_iframe)
time.sleep(2)
web.switch_to.frame(video_iframe) # 进入视频iframe
time.sleep(2)
web.find_element_by_class_name('vjs-big-play-button').click() # 点击播放按钮
time.sleep(1)
web.find_element_by_xpath('//*[@id="video"]/div[5]/div[6]/button').click() # 静音
# 播放和暂停按钮
pause_btn = web.find_element_by_xpath('//button[contains(@class,"vjs-play-control")and '
'contains(@class,"vjs-control")and contains(@class,"vjs-button")]')
while (1): # 播放等待
time.sleep(1) # 每1秒,检查视频是否播放完毕
if (pause_btn.get_attribute('title') == "重播"): # 点击后播放,即播放完毕状态
break
print('视频播放完毕')
# 视频播放完毕,退出播放iframe,然后退出循环,再次查找该页面的所有知识点(k_points)
web.switch_to.default_content()
print('退出知识点iframe')
time.sleep(2)
web.refresh() # 刷新页面,之后需重新进入iframe
time.sleep(2)
print('刷新页面')
break
if flag: # 该页面知识点播放完毕
break
pass
三、所有视频的观看
之前在主页面获取了所有的知识点页面:
all_no_list = web.find_elements_by_xpath('//span[@class="catalog_points_yi"]')
和上一点的k_points
需要重新获取类似,all_no_list
每完成一个页面则也需要重新获取,因此代码如下:
while (1):
# 进入iframe
frame_content = web.find_element_by_xpath('//*[@id="frame_content-zj"]')
web.switch_to.frame(frame_content)
time.sleep(2)
# 查找所有未完成的知识点页面
all_no_list = web.find_elements_by_xpath('//span[@class="catalog_points_yi"]')
list_num = len(all_no_list) #知识点页面个数
if list_num == 0: # 没有知识点页面,即全部刷完
break
# 跳转到第一个知识点页面
all_no_list[0].click()
web.switch_to.window(web.window_handles[-1]) # 跳转到该知识点界面
time.sleep(5)
#####
view_one_page_points() # 播放该知识点页面的所有未完成的知识点视频
#####
print('完成一个知识点页面...')
web.close() # 关闭当前窗口
# 该页面知识点完毕,关闭当前窗口,选择下一个知识点窗口
web.switch_to.window(web.window_handles[0]) # 变更视角到该课程主界面
time.sleep(1)
# 刷新页面
web.refresh()
time.sleep(2)
print('刷新主页面')
pass
四、总代码
import time
from selenium.webdriver import Chrome
web = Chrome()
web.get('https://mooc2-ans.chaoxing.com/mycourse/stu?courseid=203430340&clazzid=43992529&cpi=93003203&enc=9726840999ffc15f3f441bb5466882e6&t=1637651449831&pageHeader=1')
# 1. 登录
phone = web.find_element_by_class_name('ipt-tel')
pwd = web.find_element_by_class_name('ipt-pwd')
login = web.find_element_by_class_name('btn-big-blue')
phone.send_keys('手机号码')
pwd.send_keys('密码')
login.click()
time.sleep(2)
# 完成一个页面的所有未完成的知识点
def view_one_page_points():
while (1):
iframe = web.find_element_by_id('iframe') # 每次刷新后,都要进入内部iframe
web.switch_to.frame(iframe)
# 筛选,去除已完成的知识点
k_points = web.find_elements_by_css_selector('div.ans-attach-ct:not(.ans-job-finished)')
num = len(k_points)
flag = False
for i in range(0, num):
if i == (num - 1): # 是最后一个,表示该页刷完
flag = True
k_point = k_points[i]
# 查找任务图标个数,1为知识点,0为不是知识点
icon_num = len(k_point.find_elements_by_xpath('./div[contains(@class,"ans-job-icon")]'))
if icon_num == 0: # 再次筛选,去除不是知识点的div
continue
# 进行视频的播放
video_iframe = k_point.find_element_by_xpath('./iframe') # 视频iframe
print(video_iframe)
time.sleep(2)
web.switch_to.frame(video_iframe) # 进入视频iframe
time.sleep(2)
web.find_element_by_class_name('vjs-big-play-button').click() # 点击播放按钮
time.sleep(1)
web.find_element_by_xpath('//*[@id="video"]/div[5]/div[6]/button').click() # 静音
# 播放和暂停按钮
pause_btn = web.find_element_by_xpath('//button[contains(@class,"vjs-play-control")and '
'contains(@class,"vjs-control")and contains(@class,"vjs-button")]')
while (1): # 播放等待
time.sleep(1) # 每1秒,检查视频是否播放完毕
if (pause_btn.get_attribute('title') == "重播"): # 点击后播放,即播放完毕状态
break
print('视频播放完毕')
# 视频播放完毕,退出播放iframe,然后退出循环,再次查找该页面的所有知识点(k_points)
web.switch_to.default_content()
print('退出知识点iframe')
time.sleep(2)
web.refresh() # 刷新页面,之后需重新进入iframe
time.sleep(2)
print('刷新页面')
break
if flag: # 该页面知识点播放完毕
break
pass
while (1):
# 进入iframe
frame_content = web.find_element_by_xpath('//*[@id="frame_content-zj"]')
web.switch_to.frame(frame_content)
time.sleep(2)
# 查找所有未完成的知识点页面
all_no_list = web.find_elements_by_xpath('//span[@class="catalog_points_yi"]')
list_num = len(all_no_list) #知识点页面个数
if list_num == 0: # 没有知识点页面,即全部刷完
break
# 跳转到第一个知识点页面
all_no_list[0].click()
web.switch_to.window(web.window_handles[-1]) # 跳转到该知识点界面
time.sleep(5)
#####
view_one_page_points() # 播放该知识点页面的所有未完成的知识点视频
#####
print('完成一个知识点页面...')
web.close() # 关闭当前窗口
# 该页面知识点完毕,关闭当前窗口,选择下一个知识点窗口
web.switch_to.window(web.window_handles[0]) # 变更视角到该课程主界面
time.sleep(1)
# 刷新页面
web.refresh()
time.sleep(2)
print('刷新主页面')
pass
其他
bug:
如以下存在该div的页面,则无法读取其中视频。
来源:https://blog.csdn.net/weixin_46628481/article/details/121609595
0
投稿
猜你喜欢
- 简介Github:https://github.com/spf13/cobraStar:26.5KCobra是一个用Go语言实现的命令行工具
- 在产品开发中,由UED发起的项目越来越多,但是现在的问题是很难为其设定商业价值的目标。如果没有明确的商业价值目标,很多公司根本没办法花大成本
- 栅格系统的形成1692年,新登基的法国国王路易十四感到法国的印刷水平强差人意,因此命令成立一个管理印刷的皇家特别委员会。他们的首要任务是设计
- 前言:有些时候,为了设定手机铃声或者发抖音视频,我们会耗费大量时间在剪辑音乐高潮部分上。那么这个音乐高潮的提取能不能自动化呢?当然可以。先来
- 如何用FILESYSTEMOBJECT组件来做一个站内搜索?看看下面我们提供的例子,主要由searchpage.htm和searchresu
- 内容摘要:除了内部性能增强和优化外,IIS6.0版本的 Active Server Pages(ASP)&nb
- 在Linux系统下Python连接Redis的基本配置方法具体操作步骤系统环境:OS:Oracle Linux Enterprise 5.6
- 本文实例讲述了Python实现简单的文本相似度分析操作。分享给大家供大家参考,具体如下:学习目标:1.利用gensim包分析文档相似度2.使
- 保存为.py文件后 运行脚本在后面添加进程名称即可 比如:python proinfo.py qq 即可获取QQ的进程信息,注意不区分大小写
- 一 计算公式:二 实现代码(1)import mathfrom tqdm import tqdmimport timetotal,s,n,t
- 程序能实现什么a.完成gap值的自定义输入以及两条需比对序列的输入b.完成得分矩阵的计算及输出c.输出序列比对结果d.使用matplotli
- strftime()函数的用法strftime()函数可以把YYYY-MM-DD HH:MM:SS格式的日期字符串转换成其它形式的字符串。s
- PEP 3107引入了功能注释的语法,PEP 484 加入了类型检查标准库 typing 为类型提示指定的运行时提供支持。示例:def f(
- 学习Django框架时,创建一个引擎及索引时报错,具体报错如下:执行命令:python3 manage.py rebuild_index报如
- ScrapyScrapy是一个比较好用的Python爬虫框架,你只需要编写几个组件就可以实现网页数据的爬取。但是当我们要爬取的页面非常多的时
- 设计页面时,经常会从一个页面打开一个子窗口以供浏览者查看。通常,这种子窗口中的内容一经浏览者看过,对于浏览者而言就不再需要,而他们常常会忘记
- 以前没见过这个效果,滚动纵向滚动条看看效果就明白了这样的效果,广告商应该比较喜欢。<!DOCTYPE html PUBLIC &quo
- 鼠标双击滚动屏幕,单击停止滚动,很多小说新闻网站都有这个很人性化的功能,阅读起小说、新闻来很方便,不用手动拉滚动条。js代码如下:<h
- 触发器的概念:“在数据库中为响应一个特殊表格中的某些事件而自动执行的程序代码。”(Wikipedia)说得简单一些,它是在一个特殊的数据库事
- 当然,每个人都可以编写CSS代码,甚至你现在已经让它为你的项目工作了。但是CSS还可以更好吗?开始用这5个Tips改进你的CSS吧!1.合理