位置：首页>> 网络编程>> Python编程>> python基于BeautifulSoup实现抓取网页指定内容的方法

python基于BeautifulSoup实现抓取网页指定内容的方法

作者：光索与诺　　发布时间：2022-11-29 12:11:48　

标签：python,BeautifulSoup,抓取

本文实例讲述了python基于BeautifulSoup实现抓取网页指定内容的方法。分享给大家供大家参考。具体实现方法如下：

# _*_ coding:utf-8 _*_
#xiaohei.python.seo.call.me:)
#win+python2.7.x
import urllib2
from bs4 import BeautifulSoup
def jd(url):
page = urllib2.urlopen(url)
html_doc = page.read()
soup = BeautifulSoup(html_doc.decode('gb2312','ignore'))
for i in soup.find_all('div', id="sortlist"):
one = i.find_all('a')
two = i.find_all('li')
print ("％s ％s" ％ (one,two))
jd("http://channel.jd.com/computer.html")

希望本文所述对大家的Python程序设计有所帮助。

0

投稿

猜你喜欢

简单了解python的内存管理机制
Python引入了一个机制：引用计数。引用计数python内部使用引用计数，来保持追踪内存中的对象，Python内部记录了对象有多少个引用，
Oracle数据库的备份及恢复策略研究
摘要：恢复丢失的数据库文件在很大程度上取决于所采用的备份策略。本文从恢复的灵活性出发，对Oracle8数据库的备份及恢复策略进行了探讨，
Mysql存储过程循环内嵌套使用游标示例代码
BEGIN -- 声明变量 DECLARE v_addtime_begin varchar(13); DECLARE v_addtime_e
linux 部署apache服务的步骤
部署apache服务的步骤：准备环境：关闭防火墙：service iptables stop设置开机关闭防火墙：chkconfig ipt
Python使用scrapy采集数据时为每个请求随机分配user-agent的方法
本文实例讲述了Python使用scrapy采集数据时为每个请求随机分配user-agent的方法。分享给大家供大家参考。具体分析如下：通过这
教你使用Sublime text3搭建Python开发环境及常用插件安装另分享Sublime text3最新激活注册码
一、Python下载安装1、Python官方下载地址：https://www.python.org/downloads官方下载速度太慢，你可
Python实现中一次读取多个值的方法
Python 2里面读取输入的函数是raw_input()， Python 3的是input()，读入一个值后回车读取输入就退出了，想要一次
关于Keras Dense层整理
我就废话不多说了，大家还是直接看代码吧！'''Created on 2018-4-4'''k
Linux下mysql 8.0安装教程
本文介绍了如何在Linux下安装MySQL8.0，供大家参考，具体内容如下准备工作：mysql8.0 rpm文件测试工具（比如 idea的d
pytorch读取图像数据转成opencv格式实例
pytorch读取图像数据转成opencv格式方法：先转成numpy通用的格式，再将其转换成opencv格式。pytorch读取的数据使用l
python开发之Docker入门安装部署教程
一、安装Docker安装环境：系统：CentOS Linux7 x86_64安装脚本wget -qO- https://get.docker
mysql如何配置白名单访问
mysql 配置白名单访问的步骤1.登录mysql -uroot -pmysql2.切换至mysql库use mysql;3.查看有白名单权
Python多线程threading模块用法实例分析
本文实例讲述了Python多线程threading模块用法。分享给大家供大家参考，具体如下：多线程 - threadingpython的th
基于Python编写一个 * 信息窗口脚本
前言Hello！大家好，有好几天没有跟大家见面咯~不知道大家是否在等待《小玩意儿》专栏的更新呢上一篇的文章【老师见打系列】：我只是写了一个自
深入解析Python中的WSGI接口
概述WSGI接口包含两方面：server/gateway 及 application/framework。server调用由applicat
python 遍历可迭代对象的实现方法
可迭代(iterable)迭代(遍历)就是按照某种顺序逐个访问对象中的每一项。Python中有很多对象都是可以通过for语句来直接遍历的，例
实例讲解Python中函数的调用与定义
调用函数：#!/usr/bin/env python3 # -*- coding: utf-8 -*- # 函数调用 >>>
python3+PyQt5实现使用剪贴板做复制与粘帖示例
本文是对《Python Qt GUI快速编程》的第10章的例子剪贴板用Python3+PyQt5进行改写，分别对文本，图片和html文本的复
python实现猜数字游戏(无重复数字)示例分享
import time, randomclass GuessNum: def __init__(self
Python编程pytorch深度卷积神经网络AlexNet详解
2012年，AlexNet横空出世。它首次证明了学习到的特征可以超越手工设计的特征。它一举打破了计算机视觉研究的现状。AlexNet使用了8

Python简单读写Xls格式文档的方法示例

django 捕获异常和日志系统过程详解

pycharm 2020 1.1的安装流程

Jupyter notebook运行Spark+Scala教程

python OpenCV学习笔记直方图反向投影的实现

Python爬虫定时计划任务的几种常见方法(推荐)

举例讲解Django中数据模型访问外键值的方法

Django 拆分model和view的实现方法

通过Python绘制中国结的示例代码

一文详解如何用GPU来运行Python代码

史上最详细的苹果Macbook快捷键使用

Win10消费者预览版开启Cortana 2015年初发布

Win7如何调整DPI以解决间距不同内容有大有小问题

抖音文字成精找马如何过关

Wps如何调整文字字符的间距？

英雄联盟手游放逐之刃瑞文技能有哪些

万能五笔输入法功能详细介绍

玩梗高手狗狗情人劫怎么玩

微软奉劝用户放弃IE IE浏览器存在远程代码执行漏洞

站长请注意友情链接中的伎俩

手机版 网络编程 asp之家 www.aspxhome.com