投稿    登录
  博主录制的Python3爬虫视频教程已发布!详情请戳Python3爬虫视频教程!希望大家支持!非常感谢!
  • Python3爬虫视频学习教程
  • 干货!IT小伙伴们实用的网站及工具大集合!持续更新!
  • PHP高级特性学习总结
  • Python爬虫学习系列教程
Java

面向对象结构1

面向对象结构1
之前也发表过这样的一篇文章,可发现自己没有写好,所以今天又重新写了一下,这回就可以了。 前面可能有些东西没有理清,跟大家说声抱歉。 首先我们先列出java的基本结构 //——————-类—R...

Twinkle 1周前 (10-12) 135浏览 0评论 3喜欢

Java

java基础之数据类型

java基础之数据类型
PS:此文章为小白提供,大佬请绕道!!!! 首先特别感谢大才哥给我提供这个平台,未来我希望把java这个版块的内容补全。 今天要讲的是数据类型,最最最基础的内容~ java标识符、数据类型、关键字 开始我们先看下如何注释java代码。 标识符:类名,方法名,变量。 有三种方式分别...

Twinkle 3周前 (09-27) 218浏览 1评论 4喜欢

未分类

小白进阶第七篇(Splash负载均衡)

小白进阶第七篇(Splash负载均衡)
对于Scrapy处理Ajax 处理方式当然是同家兄弟Splash比较靠谱! 但是Splash有个很坑爹的毛病就是负载承受相对较小·· 一不留神就GG了·········· 然后也就没有然后了~~! 所以准备给Splash做一个负载均衡;后端放一大堆的Splash这样总不会GG了吧...

哎哟卧槽 4周前 (09-26) 277浏览 0评论 9喜欢

Python

自建免费PYTHON爬虫代理IP池

自建免费PYTHON爬虫代理IP池
大家好,我还是小四毛,不是崔老师!!!!崔老师在隔壁,哈哈哈。 写了一个从网上抓取代理IP,然后构建代理IP池的脚本,放在了这里:https://github.com/xiaosimao/IP_POOL 以后应该还会有很多的改动, 欢迎有兴趣的同学star,以便及时可以收到改动...

四毛 4周前 (09-22) 2757浏览 1评论 21喜欢

Net

HTTP 206 获取文件部分内容和范围请求

HTTP 206 获取文件部分内容和范围请求
HTTP 2xx 范围内的状态码表明了“客户端发送的请求已经被服务器接受并且被成功处理了”。 HTTP/1.1 200 OK 是 HTTP 请求成功后的标准响应,当你在浏览器中打开某个网站后,你通常会得到一个 200 状态码。HTTP/1.1 206 状态码表示的是“客户端通过发...

崔庆才 1个月前 (09-15) 284浏览 0评论 10喜欢

Python

轻型爬虫框架

轻型爬虫框架
 大家好,我是四毛,  不是崔老师。   恩,今天的内容很短, 主要都写在了README.md里面。     写了一个将爬虫基本步骤都封装起来的小框架,地址在https://github.com/xiaosimao/AiSpider, 欢迎Star...

四毛 1个月前 (09-12) 2502浏览 2评论 13喜欢

Python

Neo4j简介及Py2Neo的用法

Neo4j简介及Py2Neo的用法
Neo4j是一个世界领先的开源图形数据库,由 Java 编写。图形数据库也就意味着它的数据并非保存在表或集合中,而是保存为节点以及节点之间的关系。 Neo4j 的数据由下面几部分构成: 节点 边 属性 Neo4j 除了顶点(Node)和边(Relationship),还有一种...

崔庆才 2个月前 (08-31) 920浏览 1评论 15喜欢

Python

记scikit-learn贝叶斯文本分类的坑(弄了个笨办法解决了,有其它办法的小哥儿请指点)

记scikit-learn贝叶斯文本分类的坑(弄了个笨办法解决了,有其它办法的小哥儿请指点)
基本步骤: 1、训练素材分类: 我是参考官方的目录结构: 每个目录中放对应的文本,一个txt文件一篇对应的文章:就像下面这样 需要注意的是所有素材比例请保持在相同的比例(根据训练结果酌情调整、不可比例过于悬殊、容易造成过拟合(通俗点就是大部分文章都给你分到素材最多的那个类别去...

哎哟卧槽 2个月前 (08-23) 996浏览 1评论 9喜欢