投稿    登录
  《Python3网络爬虫开发实战》赠书活动正在进行中!详情请戳赠书活动!欢迎参与!非常感谢!

 分类:Python

Python

[Python3网络爬虫开发实战] 5.3.1-MongoDB存储

[Python3网络爬虫开发实战] 5.3.1-MongoDB存储
MongoDB是由C++语言编写的非关系型数据库,是一个基于分布式文件存储的开源数据库系统,其内容存储形式类似JSON对象,它的字段值可以包含其他文档、数组及文档数组,非常灵活。在这一节中,我们就来看看Python 3下MongoDB的存储操作。 1. 准备工作 在开始之前,请确...

崔庆才 11个月前 (01-29) 7663浏览 0评论 18喜欢

Python

[Python3网络爬虫开发实战] 5.2.1-MySQL存储

[Python3网络爬虫开发实战] 5.2.1-MySQL存储
在Python 2中,连接MySQL的库大多是使用MySQLdb,但是此库的官方并不支持Python 3,所以这里推荐使用的库是PyMySQL。 本节中,我们就来讲解使用PyMySQL操作MySQL数据库的方法。 1. 准备工作 在开始之前,请确保已经安装好了MySQL数据库并保...

崔庆才 11个月前 (01-29) 9008浏览 7评论 30喜欢

Python

[Python3网络爬虫开发实战] 5.2-关系型数据库存储

[Python3网络爬虫开发实战] 5.2-关系型数据库存储
关系型数据库是基于关系模型的数据库,而关系模型是通过二维表来保存的,所以它的存储方式就是行列组成的表,每一列是一个字段,每一行是一条记录。表可以看作某个实体的集合,而实体之间存在联系,这就需要表与表之间的关联关系来体现,如主键外键的关联关系。多个表组成一个数据库,也就是关系型数据...

崔庆才 11个月前 (01-29) 3481浏览 1评论 12喜欢

Python

[Python3网络爬虫开发实战] 5.1.3-CSV文件存储

[Python3网络爬虫开发实战] 5.1.3-CSV文件存储
CSV,全称为Comma-Separated Values,中文可以叫作逗号分隔值或字符分隔值,其文件以纯文本形式存储表格数据。该文件是一个字符序列,可以由任意数目的记录组成,记录间以某种换行符分隔。每条记录由字段组成,字段间的分隔符是其他字符或字符串,最常见的是逗号或制表符。不...

崔庆才 11个月前 (01-29) 7891浏览 14评论 21喜欢

Python

[Python3网络爬虫开发实战] 5.1.1-TXT文本存储

[Python3网络爬虫开发实战] 5.1.1-TXT文本存储
将数据保存到TXT文本的操作非常简单,而且TXT文本几乎兼容任何平台,但是这有个缺点,那就是不利于检索。所以如果对检索和数据结构要求不高,追求方便第一的话,可以采用TXT文本存储。本节中,我们就来看下如何利用Python保存TXT文本文件。 1. 本节目标 本节中,我们要保存知乎...

崔庆才 11个月前 (01-29) 7613浏览 57评论 32喜欢

Python

[Python3网络爬虫开发实战] 5-数据存储

[Python3网络爬虫开发实战] 5-数据存储
用解析器解析出数据之后,接下来就是存储数据了。保存的形式可以多种多样,最简单的形式是直接保存为文本文件,如TXT、JSON、CSV等。另外,还可以保存到数据库中,如关系型数据库MySQL,非关系型数据库MongoDB、Redis等。 转载请注明:静觅 » [Pytho...

崔庆才 11个月前 (01-29) 4254浏览 0评论 9喜欢

Python

[Python3网络爬虫开发实战] 4.3-使用pyquery

[Python3网络爬虫开发实战] 4.3-使用pyquery
在上一节中,我们介绍了Beautiful Soup的用法,它是一个非常强大的网页解析库,你是否觉得它的一些方法用起来有点不适应?有没有觉得它的CSS选择器的功能没有那么强大? 如果你对Web有所涉及,如果你比较喜欢用CSS选择器,如果你对jQuery有所了解,那么这里有一个更适合...

崔庆才 11个月前 (01-28) 11267浏览 28评论 29喜欢