Python +Selenium解决图片验证码登录或注册问题(推荐)

2020-02-15 21:19:07

字体：大中小

来源：转载

供稿：网友

1. 解决思路

首先要获得这张验证码的图片，但是该图片一般都是用的js写的，不能够通过url进行下载。
解决方案：截图然后根据该图片的定位和长高，使用工具进行裁剪
裁剪完毕之后，使用工具解析该图片。

2. 代码实现

2.1 裁剪出验证码图片

裁剪图片需要使用 Pillow 库，进入pip包路径后输入安装命令pip install Pillow:
之前安装的时候忘记了截图，只能够截一张安装后的图片了 ╰(:з╰∠)_

安装完成后，代码实现方式如下：

#coding=utf-8from selenium import webdriverimport timefrom PIL import Imagefrom selenium.webdriver.support.wait import WebDriverWaitdriver = webdriver.Chrome()# 进入该网站driver.get("http://www2.nmec.org.cn/wangbao/nme/sp/root/account/signup.html")# 能否在5s内找到验证码元素，能才继续if WebDriverWait(driver,5).until(lambda the_driver:the_driver.find_element_by_id("CaptchaImg"), "查找不到该元素"): # 对于一次截屏无法到截到验证码的情况，需要滚动一段距离，然后验证码的y坐标也应该减去这段距离 scroll = 500 js = "document.documentElement.scrollTop='%s'" %scroll driver.execute_script(js) # 截下该网站的图片 driver.get_screenshot_as_file("E:/Python_selenium_advance/Picture/full.png") # 获得这个图片元素 img_ele = driver.find_element_by_id("CaptchaImg") # 得到该元素左上角的 x，y 坐标和右下角的 x，y 坐标 left = img_ele.location.get('x') upper = img_ele.location.get('y') - 500 right = left + img_ele.size.get('width') lower = upper + img_ele.size.get('height') # 打开之前的截图 img = Image.open("E:/Python_selenium_advance/Picture/full.png") # 对截图进行裁剪，裁剪的范围为之前验证的左上角至右下角范围 new_img = img.crop((left, upper, right, lower)) # 裁剪完成之后保存到指定路径 new_img.save("E:/Python_selenium_advance/Picture/croped.png")  time.sleep(2) driver.quit()else: print("找不到验证码元素")

2.2 使用图鉴商用接口来识别验证码

接口介绍网址：http://www.ttshitu.com/docs/python.html#pageTitle

调用该接口直接使用网页上的接口文档就行，代码如下：

import jsonimport requestsimport base64from io import BytesIOfrom PIL import Imagefrom sys import version_infodef base64_api(uname, pwd, softid, img): img = img.convert('RGB') buffered = BytesIO() img.save(buffered, format="JPEG") if version_info.major >= 3:  b64 = str(base64.b64encode(buffered.getvalue()), encoding='utf-8') else:  b64 = str(base64.b64encode(buffered.getvalue())) data = {"username": uname, "password": pwd, "softid": softid, "image": b64} result = json.loads(requests.post("http://api.ttshitu.com/base64", json=data).text) if result['success']:  return result["data"]["result"] else:  return result["message"] return ""

上一篇：python 爬取疫情数据的源码

下一篇：python连接PostgreSQL过程解析