通过pip安装百度AI库,然后使用glob库获取指定路径下的指定后缀的文件。使用client = AipOcr()初始化百度AI对象,遍历待处理图片,逐个打开并读取,调用AI识别,结果存储在message字典中,提取出需要的文字内容并保存至文本文件。对于表格识别,百度AI提供了tableRecognitionAsync接口,但要求图片大小必须在1K~...
python调用百度AI识别文字和表格
为了调用百度AI识别文字和表格,首先需要在百度AI社区注册账户并获取ID、密钥。确保每个ID每天免费可以识别200次,详情可参阅百度AI免费额度说明。通过pip安装百度AI库,然后使用glob库获取指定路径下的指定后缀的文件。使用client = AipOcr()初始化百度AI对象,遍历待处理图片,逐个打开并读取,调用AI识别,结果存储在message字典中,提取出需要的文字内容并保存至文本文件。
对于表格识别,百度AI提供了tableRecognitionAsync接口,但要求图片大小必须在1K~4M之间。使用tableRecognitionAsync()函数识别表格文档,返回的table字典中,通过request_id获取识别完成后的Excel下载地址。通过request_id调用getTableRecognitionResult()获取结果,打印结果后,找到对应的Excel下载链接。下载链接可以自动复制并粘贴到浏览器中,下载包含识别结果的Excel文件。该文件包含6张工作表,body储存表格内容,header储存表头文字,footer储存表尾文字。
实现批量识别和自动下载Excel文件的流程如下:在获取Excel下载路径前,通过检查识别结果字典中'ret_msg'的值判断识别是否完成,直到状态显示为“已完成”时,提取下载链接。然后使用requests.get()函数获取并下载链接信息,完成自动化处理。2024-08-22