0
点赞
收藏
分享

微信扫一扫

爬虫中有关验证码的问题处理

jjt二向箔 2022-03-12 阅读 46

在爬虫中,经常要处理登陆的相关事宜,有时候登陆界面会需要提交验证码,如何处理验证码?
解决办法:若是自己编写模块,需要涉及深度学习,这就是另一块大的内容了。在这里简单调用已经封装好的模块来实现获取验证码,本文以超级鹰为例,网址:http://www.chaojiying.com

1.超级鹰的使用
(1)首先注册并登陆,来到用户中心往下拉,可以绑定微信并获得题分
(2)点击软件ID->生成一个软件ID,记住你的软件ID及Key
(3)点击开发文档->选择Python语言->点击下载
(4)解压缩后,文件夹中有一个python文件,放入你的项目中
在你编写的爬虫项目中,from chaojiying import Chaojiying_Client

2.相关代码编写

img_src = list.xpath(./a/img/@src)[0] #找到验证码图片的地址
img_data = request.get(url=img_src,headers=headers).content #获取该图片地址的二进制文本
with open("./code.jpg","wb") as fp:
	fp.write(img_data) #将该图片作为jpg格式存储到项目的同目录下
chaojiying = Chaojiying_Client("","","") #实例化一个超级鹰对象,其中第一个参数为软件名称,第二个为软件ID,第三个为Key
result = chaojiying.PostPic("code.jpg","1902") #解析存储到jpg图片,其中第二个参数需要根据超级鹰网站上的价格体系自行调整

至此拿到验证码数据

举报

相关推荐

0 条评论