Invoices 是国人开源的增值税发票 OCR 识别项目,可通过 API 接口,使用flask微服务架构,识别type:增值税电子普通发票,增值税普通发票,增值税专用发票;识别字段为:发票代码、发票号码、开票日期、校验码、税后金额等。基于C和Python编写,遵守MIT开源协议。

环境

  1. python3.5/3.6
  2. 依赖项安装:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
  3. 有GPU环境的可修改安装requirements.txt对应版本的tensorflow-gpu,config.py文件中控制GPU的开关

模型架构

YOLOv3 + CRNN + CTC

模型

  1. 模型下载地址:链接:https://pan.baidu.com/s/1bjtd3ueiUj3rt16p2_YQ2w
  2. 将下载完毕的模型文件夹models放置于项目根目录下

服务启动

  1. python3 app.py
  2. 端口可自行修改
  3. 服务调用地址:http://...: [端口号]/invoice-ocr,例:http://127.0.0.1:11111/invoice-ocr

测试demo

  1. 测试工具:postman,可自行下载安装
  2. 增值税电子普票测试结果

源代码:https://github.com/guanshuicheng/invoice