投稿    登录
  博主录制的Python3爬虫视频教程已发布!详情请戳Python3爬虫视频教程!希望大家支持!非常感谢!

最新发布 第5页

静觅崔庆才的个人博客

Python

[Python3网络爬虫开发实战] 4.2-使用Beautiful Soup

[Python3网络爬虫开发实战] 4.2-使用Beautiful Soup
前面介绍了正则表达式的相关用法,但是一旦正则表达式写的有问题,得到的可能就不是我们想要的结果了。而且对于一个网页来说,都有一定的特殊结构和层级关系,而且很多节点都有id或class来作区分,所以借助它们的结构和属性来提取不也可以吗? 这一节中,我们就来介绍一个强大的解析工具Bea...

崔庆才 3个月前 (01-28) 3048浏览 0评论 11喜欢

Python

[Python3网络爬虫开发实战] 4.1-使用XPath

[Python3网络爬虫开发实战] 4.1-使用XPath
XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言。它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索。 所以在做爬虫时,我们完全可以使用XPath来做相应的信息抽取。本节中,我们就来介绍XPath的基本用法。...

崔庆才 3个月前 (01-28) 2943浏览 0评论 12喜欢

Python

[Python3网络爬虫开发实战] 4-解析库的使用

[Python3网络爬虫开发实战] 4-解析库的使用
上一章中,我们实现了一个最基本的爬虫,但提取页面信息时使用的是正则表达式,这还是比较烦琐,而且万一有地方写错了,可能导致匹配失败,所以使用正则表达式提取页面信息多多少少还是有些不方便。 对于网页的节点来说,它可以定义id、class或其他属性。而且节点之间还有层次关系,在网页中可...

崔庆才 3个月前 (01-28) 1236浏览 0评论 3喜欢

Python

[Python3网络爬虫开发实战] 3.4-抓取猫眼电影排行

[Python3网络爬虫开发实战] 3.4-抓取猫眼电影排行
本节中,我们利用requests库和正则表达式来抓取猫眼电影TOP100的相关内容。requests比urllib使用更加方便,而且目前我们还没有系统学习HTML解析库,所以这里就选用正则表达式来作为解析工具。 1. 本节目标 本节中,我们要提取出猫眼电影TOP100的电影名称、...

崔庆才 3个月前 (01-27) 3953浏览 0评论 15喜欢

Python

[Python3网络爬虫开发实战] 3.3-正则表达式

[Python3网络爬虫开发实战] 3.3-正则表达式
本节中,我们看一下正则表达式的相关用法。正则表达式是处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。 当然,对于爬虫来说,有了它,从HTML里提取想要的信息就非常方便了。 1. 实例引入 说了这么多,可能我们对它到底是个什么还是比...

崔庆才 3个月前 (01-27) 3325浏览 0评论 17喜欢

Python

[Python3网络爬虫开发实战] 3.2.2-高级用法

[Python3网络爬虫开发实战] 3.2.2-高级用法
在前一节中,我们了解了requests的基本用法,如基本的GET、POST请求以及Response对象。本节中,我们再来了解下requests的一些高级用法,如文件上传、cookie设置、代理设置等。 1. 文件上传 我们知道requests可以模拟提交一些数据。假如有的网站需要...

崔庆才 3个月前 (01-27) 2320浏览 0评论 14喜欢

Python

[Python3网络爬虫开发实战] 3.2.1-基本用法

[Python3网络爬虫开发实战] 3.2.1-基本用法
1. 准备工作 在开始之前,请确保已经正确安装好了requests库。如果没有安装,可以参考1.2.1节安装。 2. 实例引入 urllib库中的urlopen()方法实际上是以GET方式请求网页,而requests中相应的方法就是get()方法,是不是感觉表达更明确一些?下面通...

崔庆才 3个月前 (01-27) 3014浏览 0评论 11喜欢

Python

[Python3网络爬虫开发实战] 3.2-使用requests

[Python3网络爬虫开发实战] 3.2-使用requests
上一节中,我们了解了urllib的基本用法,但是其中确实有不方便的地方,比如处理网页验证和Cookies时,需要写Opener和Handler来处理。为了更加方便地实现这些操作,就有了更为强大的库requests,有了它,Cookies、登录验证、代理设置等操作都不是事儿。 接下...

崔庆才 3个月前 (01-27) 2495浏览 0评论 7喜欢