位置：首页>> 网络编程>> Python编程>> Python网络爬虫信息提取mooc代码实例

Python网络爬虫信息提取mooc代码实例

作者：159566　　发布时间：2022-01-02 12:18:23　

标签：python,爬虫,信息,mooc

实例一--爬取页面

import requests
url="https//itemjd.com/2646846.html"
try:
r=requests.get(url)
r.raise_for_status()
r.encoding=r.apparent_encoding
print(r.text[:1000])
except:
print("爬取失败")

正常页面爬取

实例二--爬取页面

import requests
url="https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
kv={'user-agent':'Mozilla/5.0'}
r=requests.get(url,headers=kv)
r.raise_for_status()
r.encoding=r.apparent_encoding
print(r.text[1000:2000])
except:
print("爬取失败")

对访问用户名有限制，模拟浏览器对网站请求

实例三--爬取搜索引擎

#百度的关键词接口：http://www.baidu.com/s?wd=keyword
#360的关键词接口：http://www.so.com/s?q=keyword
import requests
keyword="python"
try:
kv={'wd':keyword}
r=requests.get("http://www.baidu.com/s",params=kv)
print(r.request.url)
r.raise_for_status()
print(len(r.text))
except:
print("爬取失败")
--------------------------------------------------
import requests
keyword="python"
try:
kv={'q':keyword}
r=requests.get("http://www.so.com/s",params=kv)
print(r.request.url)
r.raise_for_status()
print(len(r.text))
except:
print("爬取失败")

实例四--:爬取图片

import requests
import os
url="http://image.nationalgeographic.com.cn/2017/0211/20170211061910157.jpg"
root="F://pics//"
path=root+url.split('/')[-1]
try:
if not os.path.exists(root):
os.mkdir(root)
if not os.path.exists(path):
r=requests.get(url)
with open(path,'wb') as f:
f.write(r.content)
f.close()
print("文件保存成功")
else:
print("文件已经存在")
except:
print("爬取失败")

爬取并保存图片

实例五--IP地址归属地查询：

http://m.ip138.com/ip.asp?ip=ipaddress

url="http://www.ip138.com/iplookup.asp?ip="
try:
r=requests.get(url+'202.204.80.112'+'&action=2')
r.raise_for_status()
r.encoding=r.apparent_encoding
print(r.text[-500:])
except:
print("爬取失败")

来源：https://www.cnblogs.com/cy2268540857/p/12424091.html

0

投稿

猜你喜欢

一个修改Oracle数据库用户密码的小诀窍
有时候我们可能不知道一个用户的密码，但是又需要以这个用户做一些操作，又不能去修改掉这个用户的密码，这个时候，就可以利用一些小窍门，来完成操作
对“关于购物车的想法”的一些回复
刚看到吴磊同学的一些关于购物车的想法，正巧本人丁学对电子商务这方面比较熟悉，跳出来献丑了，希望对一些同行有些用处。本来想回复到下面的，结果发
客户端限制只能上传jpg格式图片的js代码
function checkPhoto(fnUpload) { var filename = fnUpload.value; alert(f
python selenium 获取标签的属性值、内容、状态方法
获取标签内容使用element.attribute()方法获取dom元素的内容，如：dr = driver.find_element_by_
通过表单的做为二进制文件上传request.totalbytes提取出上传的二级制数据
代码如下:<input name="file" type="file"> formsiz
将MySQL的作为文件系统使用
利用MySQLfs这个工具，我么可以在MySQL关系数据库中存储文件系统。MySQLfs将文件系统中文件的字节内容分解成数据库中的元组，而数
请给PNG8一个机会
系列一：图片格式介绍Gif格式特点透明性Gif是一种布尔透明类型，既它可以是全透明，也可以是全不透明，但是它并没有半透明（alpha 透明）
Sub-Pixel Bug?!
jQuery之父John Resig写过一篇《Sub-Pixel Problems in CSS》，一个50px宽的div中有4个float
Javascript 利用 DOM 特性的两个小技巧
此类技巧还有很多，欢迎继续分享解析 URL从 James Padolsey 的 Blog中看到的个小技巧，就是利用 a 标签的 DOM 属性
MySQL应用技巧之内存使用线程独享
在这里我们将介绍的是MySQL内存使用上的线程独享，线程独享内存主要用于各客户端连接线程存储各种操作的独享数据，如线程栈信息，分组排序操作，
Python使用扩展库pywin32实现批量文档打印实例
本文代码需要正确安装Python扩展库pywin32，建议下载whl文件进行离线安装。然后调用win32api的ShellExecute()
asp下去除超链接的函数
<％ Function ReplaceUrl2(HTMLstr) Dim n,st
Python实现统计文本中的字符数量
最近，由于工作需要统计一下文本文档中的各种不同类字符的数量。将txt文本文档中包含的的中文、英文、数字等字符数量进行统计。这当然可以使用py
对Python的Django框架中的项目进行单元测试的方法
Python中的单元测试我们先来回顾一下Python中的单元测试方法。下面是一个 Python的单元测试简单的例子：假如我们开发
PHP下常用正则表达式整理
--------------------------------------------------------- 正则收藏手机号码： $
全面理解javascript的caller,callee,call,apply概念
(注：在看到大家如此关注JS里头的这几个对象，我试着把原文再修改一下，力求能再详细的阐明个中意义 2007-05-21）在提到上述的概念之前
Python的迭代器和生成器
先说迭代器，对于string、list、dict、tuple等这类容器对象，使用for循环遍历是很方便的。在后台for语句对容器对象调用it
解释FCKeditor样式的工作原理
FCKeditor的样式设置涉及到了两个文件，一个是你定义好的样式表文件.css，另一个是告诉fck样式表如何使用的xml文件，两个文件确一
二级域名原理以及asp实现程序
要达到二级名的效果，必须一下条件以及流程：1、必须有一个顶级域名，而且此域名必须做好泛解析并做好指向。2、必须有一台属于你的独立的服务器。泛
javascript面向对象三大特征之封装实例详解
本文实例讲述了javascript面向对象三大特征之封装。分享给大家供大家参考，具体如下：封装封装(Encapsulation)：就是把对象

Python实现图片格式转换

Python之京东商品秒杀的实现示例

python实现在图片上画特定大小角度矩形框

详解超星脚本出现乱码问题的解决方法(Python)

Python实现向服务器请求压缩数据及解压缩数据的方法示例

python 返回一个列表中第二大的数方法

关于Torch torchvision Python版本对应关系说明

Django中使用haystack+whoosh实现搜索功能

Python谱减法语音降噪实例

python 装饰器(Decorators)原理说明及操作代码

Android带进度条的文件上传示例（使用AsyncTask异步任务）

Excel快捷键大全让你会的不止是复制粘贴

WPS表格办公—如何实现隔多行选择

怎么退出微信5.2 微信5.2如何切换账号

windows7系统怎么显示顽固的隐藏文件夹(利用WinRAR查看)

金山毒霸进军泰国市场或将为网游国际化布局

Spring Boot启动时调用自己的非web逻辑

iPhone 人为损坏报价分为几级？维修时备用机损坏、丢失怎么办？

Win10电脑屏幕分辨率调不了？Win10电脑屏幕分辨率最佳方法

Windows 10 10056最新预览版截图曝光啦

手机版 网络编程 asp之家 www.aspxhome.com