OCR本地化应用

OCR (Optical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

安装完成以后,基本上文件层次如下:

  • imgs 存放要是别的文件
  • tr 训练后的扩展文件库
  • tr_gpu gpu版本的库
  • 其它的一些文件

OCR本地化应用
由于这个项目原生是没有接口调用功能,在此基础上加了采用flask写的接口
import flask, json
from flask import request
import tr
import sys, cv2, time, os
from PIL import Image, ImageDraw, ImageFont
import numpy as np
from io import BytesIO

server = flask.Flask(__name__)

@server.route('/getText', methods=['get', 'post'])
def getText():
    img_file = request.files['file']
    img_file.save("imgs/22.png")
    txt = tr.run("imgs/22.png")
    return json.dumps(txt, ensure_ascii=False)
if __name__ == '__main__':
    server.run(debug=True, port=8888, host='0.0.0.0')

代码跑起来的结果:

OCR本地化应用
跑完了以后我们测试接口:
OCR本地化应用
经过多此测试,本模型对比较工整的文本数据比较友好,是比率能达到99.99%,对于手写字体识别率方面还是有一点差。
总结了本开源项目的优点和缺点:
免费、易用、扩展性适中
手写识别差、cpu占用较高

另外一个大神提供了TrWebOcr支持web使用的ocr

OCR本地化应用
用vue写的一个前端界面,用tornado写的web接口
OCR本地化应用
对外接口
def make_app():
    from backend.webInterface import tr_run
    from backend.webInterface import tr_index

    return tornado.web.Application([
        (r"/api/tr-run/", tr_run.TrRun),
        (r"/", tr_index.Index),
        (r"/(.*)", StaticFileHandler,
         {"path": os.path.join(current_path, "dist/TrWebOcr_fontend"), "default_filename": "index.html"}),

    ], **settings)

主方法,入口

if __name__ == "__main__":
    define("port", default=8089, type=int, help='指定运行时端口号')
    define("open_gpu", default=0, type=int, help='是否开启gpu')

    tornado.options.parse_command_line()
    port = options.port
    open_gpu = options.open_gpu

    if open_gpu == 0:
        manage_running_platform.change_version('cpu')
    else:
        manage_running_platform.change_version('gpu')
    app = make_app()

    server = tornado.httpserver.HTTPServer(app)

    server.bind(port)
    server.start(1)
    print(f'Server is running: http://{host_ip()}:{port}')
    print(f'Now version is: {manage_running_platform.get_run_version()}')

    tornado.ioloop.IOLoop.current().start()
  • tr开源项目地址: https://github.com/myhub/tr
  • TrWebOCR地址:https://github.com/alisen39/TrWebOCR/

Original: https://blog.csdn.net/weixin_36723038/article/details/121639167
Author: 欧菲斯集团
Title: OCR本地化应用

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/746907/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球