投稿    登录
  博主录制的Python3爬虫视频教程已发布!详情请戳Python3爬虫视频教程!希望大家支持!非常感谢!

哎哟卧槽的文章

Python

小白进阶之Scrapy第四篇(图片下载管道篇)

小白进阶之Scrapy第四篇(图片下载管道篇)
这几天一直有小伙伴而给我吐槽说,由于妹子图站长把www.mzitu.com/all这个地址取消了。导致原来的那个采集爬虫不能用啦。 正好也有小伙伴儿问Scrapy中的图片下载管道是怎么用的。 就凑合在一起把mzitu.com给重新写了一下。 首先确保你的Python环境已安装...

1个月前 (04-23) 2718浏览 17评论 10喜欢

Python

小白学爬虫系列教程

小白学爬虫系列教程
听大才哥说好像我的文章挺难找的,这整理一下。 基础知识篇: 这玩意儿我没写,各位参考大才哥的: Python爬虫学习系列教程 Python3爬虫学习视频教程 小白系列教程 小白爬虫第一弹之抓取妹子图 小白爬虫第二弹之健壮的小爬虫 小白爬虫第三弹之去重去重 小白爬虫第四弹之爬虫快...

2个月前 (04-11) 9426浏览 4评论 1156喜欢

Python

Scrapy小技巧-MySQL存储

Scrapy小技巧-MySQL存储
这两天上班接手,别人留下来的爬虫发现一个很好玩的 SQL脚本拼接。 只要你的Scrapy Field字段名字和 数据库字段的名字 一样。那么恭喜你你就可以拷贝这段SQL拼接脚本。进行MySQL入库处理。 具体拼接代码如下: ...

2个月前 (03-19) 2628浏览 6评论 33喜欢

技术杂谈

Scrapy分布式的前篇–让redis和MongoDB安全点

Scrapy分布式的前篇–让redis和MongoDB安全点
各位小伙伴 大家好啊!年假结束了··· 也该开始继续我的装逼之旅了。 年前博文的结尾说了 还有一个基于Scrapy的分布式版本、 今天这博文就先给大家做些前期工作,其实吧、最主要的是防止你的服务器因为这篇博文被轮········· 博文开始之前 我们先来看篇文章: http://...

4个月前 (02-03) 2343浏览 5评论 10喜欢

Python

小白进阶之Scrapy第二篇(登录篇)

小白进阶之Scrapy第二篇(登录篇)
  其实拿这个网站当教程刚开始我是拒绝、换其他网站吧,又没什么动力···· 然后就··········· 上一篇Scrapy带大家玩了 Spider 今天带带大家玩的东西有两点、第一CrawlSpider、第二Scrapy登录。 目标站点:www.haoduofuli...

4个月前 (01-22) 12107浏览 16评论 24喜欢

Python

小白进阶之Scrapy第一篇

小白进阶之Scrapy第一篇
这博文写得我懒癌犯了,最后的那个章节内容排序,我没有实验是否是正确的,不过这只是个教大家用Scrapy的教程,正确与否并不重要···  如果不正确,记得留言;等我懒癌过了,我再改改······ 还有其它的问题也是一样··· ,把问题留言下; 等我懒癌过了·· 我改回来!嗯!是等我...

6个月前 (12-07) 53256浏览 103评论 83喜欢

Python

小白爬虫第四弹之爬虫快跑(多进程+多线程)

小白爬虫第四弹之爬虫快跑(多进程+多线程)
PS:使用多线程时好像在目录切换的问题上存在问题,可以给线程加个锁试试 Hello 大家好!我又来了。 你是不是发现下载图片速度特别慢、难以忍受啊!对于这种问题 一般解决办法就是多进程了!一个进程速度慢!我就用十个进程,相当于十个人一起干。速度就会快很多啦!(为什么不说多线程?...

6个月前 (11-20) 12971浏览 33评论 85喜欢

Python

小白爬虫第三弹之去重去重

小白爬虫第三弹之去重去重
好了!开头要说点啥,我想你们已经知道了! 没错!我又来装逼了·· 前面两篇博文,不知道大家消化得怎么了。不知道各位有没注意到,前面两篇博文完成的工作,只能保证下载;你电脑不能关机,不能断网,总之不能出意外!否则啊!!! !!!!你就得重头开始啊!!!! 今天,我们来想想办法...

7个月前 (11-05) 12056浏览 42评论 61喜欢

Python

小白爬虫第二弹之健壮的小爬虫

小白爬虫第二弹之健壮的小爬虫
我又来装逼了!上次教大家写了一个下载www.mzitu.com全站图片的小爬虫练手、不知道大家消化得怎么样? 大家在使用的时候会发现,跑着跑着 就断掉了!报错了啊!丢失连接之类的。幸幸苦苦的抓了半天又得从头来,心累啊! 这就是网站的反爬虫在起作用了,一个IP访问次数过于频繁就先...

7个月前 (10-30) 18521浏览 51评论 164喜欢