位置：首页>> 网络编程>> Python编程>> python urllib爬取百度云连接的实例代码

python urllib爬取百度云连接的实例代码

作者：baddog_　　发布时间：2022-03-07 19:06:28　

标签：python,爬取,百度云

翻看自己以前写的程序，发现写过一个爬取盘多多百度云资源的东西，完全是当时想看变形金刚才自己写的，而且当时第一次接触python大概写了有2天才搞出来这个程序，学习python语言，可以看得出来那时候的代码写的真的low。虽然现在也不怎么样，哈哈，一直学习中，不做过多解释，上图上代码，因为变量的声明是什么我自己也忘了（手动傲娇），连写入文件当时都不会哈哈哈哈哈哈哈哈，也不知道class中可以通过init初始化，唉学习python原来我学到了这么多东西，感谢python

from bs4 import BeautifulSoup
import urllib
import requests
import re

adr =[]

''''对搜素资源名字进行url编码'''
search_text =raw_input('请输入搜索资源名：')
search_text = search_text.decode('gbk')
search_text = search_text.encode('utf-8')
search_text = urllib.quote(search_text)

''''获取文件地址'''
home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)

'''获取百度云地址'''
def getbaidu(adr):
for i in adr:
url = urllib.urlopen('http://www.panduoduo.net'+i)
bs = BeautifulSoup(url)
bs1 = bs.select('.dbutton2')
href = re.compile('http\％(\％|\d|\w|\/\/|\/|\.)*')
b = href.search(str(bs1))
name = str(bs.select('.center')).decode('utf-8')
text1 = re.compile('\<h1\sclass\=\"center"\>[\d|\w|\D|\W]*\</h1\>')
text2 = text1.search(name)
rag1 = re.compile('\>[\d|\w|\D|\W]*\<')
if text2:
text3 = rag1.search(text2.group())
if text3:
print text3.group()
if b:
text = urllib.unquote(str(b.group())).decode('utf-8')
print text

'''初始化'''
def init(adr):
soup = BeautifulSoup(home)
soup = soup.select('.row')
pattern = re.compile('\/r\/\d+')
for i in soup:
i = str(i)
adress = pattern.search(i)
adress = adress.group()
adr.append(adress)

print 'running---------'
init(adr)
getbaidu(adr)

来源：http://www.jianshu.com/p/5290b9273fe3?utm_source=tuicool&utm_medium=referral

0

投稿

猜你喜欢

thinkphp实现发送邮件密码找回功能实例
本文实例讲述了thinkphp实现发送邮件密码找回功能的方法。分享给大家供大家参考。具体实现方法如下：首先下载mail.class.php类
简单PHP上传图片、删除图片实现代码
上传图片： if (!empty($_FILES["img"]["name"])) { //提取文件
基于Python列表解析(列表推导式)
列表解析——用来动态地创建列表[expr for iter_var in iterable if cond_expr]例子一：map(lam
Spring数据库多数据源路由配置过程图解
项目中需要根据不同业务进行分库，首先是将业务不同业务映射到不同过的数据库( biz --> db，可能存在多对一情况)，查看sprin
使用keras时input_shape的维度表示问题说明
Keras提供了两套后端，Theano和Tensorflow，不同的后端使用时维度顺序dim_ordering会有冲突。对于一张224*22
详解python statistics模块及函数用法
本节介绍 Python 中的另一个常用模块 —— statistics模块，该模块提供了用于计算数字数据的数理统计量的函数。它包含了很多函数
浅谈web分析
记得很早以前看到过这样的一段介绍：想象你在逛街边的一家书店，如果最终你没有购买任何图书就直接离开了，店长并不会知道你来过。但是如果你买了书，
Pycharm 2020年最新激活码（亲测有效）
PyCharm 具备一般 IDE 的功能，比如，调试、语法高亮、项目管理、代码跳转、智能提示、自动完成、单元测试、版本控制…另外，PyCha
vue3+vite使用jsx和tsx详情
安装@vitejs/plugin-vue-jsxyarn add -D @vitejs/plugin-vue-jsxnpm i -D @vi
6款jQuery图表插件[译]
随着jQuery、Mootools、prototype等知名的JavaScript框架的应用变的越来越强大，浏览器对最新版本CSS属性的支持
Linux下mysql的root密码修改方法
前言在服务部署在mysql上应该有好几个月了，因为现在的工作基本都在终端，因此很少登陆，今天要修改个东西，忽然发现我竟然已经彻底忘记了mys
Study jQuery in a Simplified Way
学习复杂代码的最好方法是简化：(function(win, undefined) { var jQuery = f
安装dbus-python的简要教程
写一个 python 脚本需要用到 dbus，但因为 dbus-python 这个包并没有提供 setup.py ，所以无法通过 pip
个性类文字制作ps教程
做个性休闲类项目课程材料，对这方面要求多一些，要总结方法、手法、想法等等，头大了；这里总结了一个做个性字体设计的方法，分享一下；方法是比较简
python使用装饰器作日志处理的方法
装饰器这东西我看了一会儿才明白，在函数外面套了一层函数，感觉和java里的aop功能很像；写了2个装饰器日志的例子，第一个是不带参数的装饰器
Vue实现web分页组件详解
本文实例为大家分享了Vue实现web分页组件的具体代码，供大家参考，具体内容如下效果演示源代码<!DOCTYPE html>&l
vue项目中data数据之间互相访问的实现
如下代码：<div id="vue_det"> <
最新的关键SQL Server漏洞已被微软证实
微软在12月22日早上发布新的安全通告证实，一处远程执行代码漏洞影响到了整个SQL Server产品线。该漏洞的入侵代码在两周前已经被公布在
基于Python实现简单的人脸识别系统
前言最近又多了不少朋友关注，先在这里谢谢大家。关注我的朋友大多数都是大学生，而且我简单看了一下，低年级的大学生居多，大多数都是为了完成课程设
Golang中数据结构Queue的实现方法详解
前言本文主要给大家介绍了关于Golang中数据结构Queue实现的相关内容，分享出来供大家参考学习，下面话不多说了，来一起看看详细的介绍吧。

基于Tensorflow一维卷积用法详解

Python实现暴力破解有密码的zip文件的方法

python实现在控制台输入密码不显示的方法

利用python调用摄像头的实例分析

对python过滤器和lambda函数的用法详解

再也不用花钱买漫画!Python爬取某漫画的脚本及源码

Python使用Appium在移动端抓取微博数据的实现

详解django中视图函数的FBV和CBV

Python+OpenCV图片局部区域像素值处理改进版详解

opencv 图像轮廓的实现示例

java springmvc实现验证码功能

Win10开机启动项怎么修改设置？

Win8.1系统中的任务管理器怎么打开 3种打开Win8.1任务管理器方法图解

空文件夹无法删除怎么办？空文件夹无法删除的解决教程

Win7系统关机变成了重启该怎么办？

我的侠客莫邪子情缘任务怎么完成

动物朋友王国DL-4荆棘巢穴怎么打

C#编程实现向并口设备发送指令、获取并口设备的状态

win10预览版19018更新内容是什么？win10最新版信息介绍

如何调节Win10开始菜单高度

手机版 网络编程 asp之家 www.aspxhome.com