做爬虫的同学肯定或多或少会为验证码苦恼过,在最初的时候,大部分验证码都是图形验证码。但是前几年「极验」验证码横空出世,行为验证码变得越来越流行,其中之一的形式便是滑块验证码。
滑块验证码是怎样的呢?如图所示,验证码是一张矩形图,图片左侧会出现一个滑块,右侧会出现一个缺口,下侧会出...
崔庆才
2019-11-08 18:38 4056浏览 8评论
21喜欢
人工智能技术(以下称 AI)是人类优秀的发现和创造之一,它代表着至少几十年的未来。在传统的编程中,工程师将自己的想法和业务变成代码,计算机会根据代码设定的逻辑运行。与之不同的是,AI 使计算机有了「属于自己的思想」,它就像生物一样,能够「看」、「听」、「说」、「动」、「理解」、「...
韦世东学算法和反爬虫
2019-11-05 19:56 2459浏览 2评论
15喜欢
想必大家都或多或少听过 TensorFlow 的大名,这是 Google 开源的一个深度学习框架,里面的模型和 API 可以说基本是一应俱全,但 TensorFlow 其实有很多让人吐槽的地方,比如 TensorFlow 早期是只支持静态图的,你要调试和查看变量的值的话就得一个个...
崔庆才
2019-06-25 20:00 4239浏览 4评论
15喜欢
本节来详细说明一下 Seq2Seq 模型中一个非常有用的 Attention 的机制,并结合 TensorFlow 中的 AttentionWrapper 来剖析一下其代码实现。
Seq2Seq
首先来简单说明一下 Seq2Seq 模型,如果搞过深度学习,想必一定听说过 Seq2...
崔庆才
2018-03-25 1:41 21115浏览 2评论
36喜欢
原理
中文分词,即 Chinese Word Segmentation,即将一个汉字序列进行切分,得到一个个单独的词。表面上看,分词其实就是那么回事,但分词效果好不好对信息检索、实验结果还是有很大影响的,同时分词的背后其实是涉及各种各样的算法的。
中文分词与英文分词有很大的不同,...
崔庆才
2018-03-15 21:32 22983浏览 1评论
35喜欢
本节详细说明一下深度学习环境配置,Ubuntu 16.04 + Nvidia GTX 1080 + Python 3.6 + CUDA 9.0 + cuDNN 7.1 + TensorFlow 1.6。
Python 3.6
首先安装 Python 3.6,这里使用 Anacon...
崔庆才
2018-03-12 15:45 30019浏览 235评论
35喜欢
我们知道,Seq2Seq 现在已经成为了机器翻译、对话聊天、文本摘要等工作的重要模型,真正提出 Seq2Seq 的文章是《Sequence to Sequence Learning with Neural Networks》,但本篇《Learning Phrase Represe...
崔庆才
2018-02-27 0:52 15742浏览 0评论
13喜欢
TensorFlow 中的 layers 模块提供用于深度学习的更高层次封装的 API,利用它我们可以轻松地构建模型,这一节我们就来看下这个模块的 API 的具体用法。
概览
layers 模块的路径写法为 tf.layers,这个模块定义在 tensorflow/python/...
崔庆才
2018-02-23 3:42 26698浏览 1评论
18喜欢
本节我们来用 TensorFlow 来实现一个深度学习模型,用来实现验证码识别的过程,这里我们识别的验证码是图形验证码,首先我们会用标注好的数据来训练一个模型,然后再用模型来实现这个验证码的识别。
验证码
首先我们来看下验证码是怎样的,这里我们使用 Python 的 captch...
崔庆才
2018-02-21 15:05 29706浏览 1评论
40喜欢
本节我们来尝试使用 TensorFlow 搭建一个双向 LSTM (Bi-LSTM) 深度学习模型来处理序列标注问题,主要目的是学习 Bi-LSTM 的用法。
Bi-LSTM
我们知道 RNN 是可以学习到文本上下文之间的联系的,输入是上文,输出是下文,但这样的结果是模型可以根据...
崔庆才
2018-01-22 2:18 22570浏览 1评论
29喜欢