投稿    登录
  《Python3网络爬虫开发实战》赠书活动正在进行中!详情请戳赠书活动!欢迎参与!非常感谢!

崔庆才的文章

http://cv.cuiqingcai.com
Python

中文分词原理及工具

中文分词原理及工具
原理 中文分词,即 Chinese Word Segmentation,即将一个汉字序列进行切分,得到一个个单独的词。表面上看,分词其实就是那么回事,但分词效果好不好对信息检索、实验结果还是有很大影响的,同时分词的背后其实是涉及各种各样的算法的。 中文分词与英文分词有很大的不同,...

1年前 (2018-03-15) 9881浏览 3评论 31喜欢

Python

正则表达式中零宽断言的用法

正则表达式中零宽断言的用法
了解了正则表达式,想必一般情况下的匹配都不会出现什么问题,但是如果一些特殊情况,可能需要用到一些更高级的正则表达式匹配操作,本节我们来说明一下正则表达式的一个较常用又比较重要的知识点——零宽断言。 实例引入 首先我们来看一个例子,这里有一段问答对话: 问:我用的是Windows ...

1年前 (2018-03-02) 6903浏览 107评论 46喜欢

Python

机器学习主要术语

机器学习主要术语
什么是(监督式)机器学习?简单来说,它的定义如下: 机器学习系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测。 下面我们来了解一下机器学习的基本术语。 标签 在简单线性回归中,标签是我们要预测的事物,即 y 变量。标签可以是小麦未来的价格、图片中显示的动物品种、音...

1年前 (2018-03-01) 3965浏览 0评论 24喜欢

Python

TensorFlow layers模块用法

TensorFlow layers模块用法
TensorFlow 中的 layers 模块提供用于深度学习的更高层次封装的 API,利用它我们可以轻松地构建模型,这一节我们就来看下这个模块的 API 的具体用法。 概览 layers 模块的路径写法为 tf.layers,这个模块定义在 tensorflow/python/...

1年前 (2018-02-22) 11515浏览 1评论 15喜欢

Python

TensorFlow验证码识别

TensorFlow验证码识别
本节我们来用 TensorFlow 来实现一个深度学习模型,用来实现验证码识别的过程,这里我们识别的验证码是图形验证码,首先我们会用标注好的数据来训练一个模型,然后再用模型来实现这个验证码的识别。 验证码 首先我们来看下验证码是怎样的,这里我们使用 Python 的 captch...

1年前 (2018-02-21) 15812浏览 0评论 33喜欢

Python

[Python3网络爬虫开发实战] 后续章节

[Python3网络爬虫开发实战] 后续章节
本书此部分内容属进阶内容,暂不开放。 如需查看更多可以购买书籍查看。 购买地址: https://item.jd.com/26114674847.html https://item.jd.com/26124473455.html 本书由图灵教育-人民邮电出版社出版发行。 作者:崔...

1年前 (2018-02-07) 45962浏览 5评论 63喜欢

Python

[Python3网络爬虫开发实战] 7.4-使用Selenium爬取淘宝商品

[Python3网络爬虫开发实战] 7.4-使用Selenium爬取淘宝商品
在前一章中,我们已经成功尝试分析Ajax来抓取相关数据,但是并不是所有页面都可以通过分析Ajax来完成抓取。比如,淘宝,它的整个页面数据确实也是通过Ajax获取的,但是这些Ajax接口参数比较复杂,可能会包含加密密钥等,所以如果想自己构造Ajax参数,还是比较困难的。对于这种页面...

1年前 (2018-01-31) 34955浏览 1评论 78喜欢