python调用文字识别OCR，轻松搞定验证码

我们可以登录百度云，然后看看里面的接口文档。接口功能还是有比较丰富的应用场景的。encoding:utf-8importrequestsimportbase64'''通用文字识别'''request_url="https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"#二进制方式打开图片文件f=open('[本地文件]','rb')img=base64.b64encode(...

今天带你们去研究一个有趣的东西，文字识别OCR。不知道你们有没有想要识别图片，然后读出文字的功能。例如验证码，如果需要自动填写的话就需要这功能。还有很多种情况需要这功能的。

我们可以登录百度云，然后看看里面的接口文档。接口功能还是有比较丰富的应用场景的。
#encoding:utf-8importrequestsimportbase64'''通用文字识别'''request_url="https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"#二进制方式打开图片文件f=open('[本地文件]','rb')img=base64.b64encode(f.read())params={"image":img}access_token='[调用鉴权接口获取的token]'request_url=request_url+"?access_token="+access_tokenheaders={'content-type':'application/x-www-form-urlencoded'}response=requests.post(request_url,data=params,headers=headers)ifresponse:print(response.json())
这里面所有的代码都帮你弄好了，直接拿来就用，这是官方文档里面的。然后我们看一下需要填写的就是access_token。这里面的access_token是需要调用请求才能返回的。
#encoding:utf-8importrequests#client_id为官网获取的AK，client_secret为官网获取的SKhost='https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【官网获取的AK】&client_secret=【官网获取的SK】'response=requests.get(host)ifresponse:print(response.json())
首先建立起应用，然后查看自己的client_id=【官网获取的AK】&client_secret=【官网获取的SK】。把这两个东西填写上就行。然后response.json()中会带有所需要的access_token的。

我们来测试一下。

最后运行之后，简单就能识别出结果。
欢迎和我讨论有关程序的问题，也可以答疑。
关注公众号：诗一样的代码，交一个朋友。
2024-09-19

mengvlog 阅读 251 次 更新于 2026-03-03 07:08:49 我来答关注问题 0

1 个回答檬味博客专题活动

其他代码类似问题

檬味博客在线解答立即免费咨询

python调用文字识别OCR，轻松搞定验证码

其他代码类似问题

代码相关话题