Skip to content

Latest commit

 

History

History
60 lines (45 loc) · 4.4 KB

ADVANCED.md

File metadata and controls

60 lines (45 loc) · 4.4 KB

进阶使用

⏳ OcrConfig参数调优

HardWareConfig参数说明如下:

参数名 说明 类型 权限
numThread CPU 核心数量 int 读写
gpuIndex GPU0一般为默认GPU,参数选项:使用CPU(-1)/使用GPU0(0)/使用GPU1(1)/...,默认0 int 读写

⚠️ ONNX不使用GPU,填写-1

ParamConfig参数说明如下:

参数名 说明 类型 权限
padding 图像外接白框,用于提升识别率,文字框没有正确框住所有文字时,增加此值。默认50。 int 读写
maxSideLen 按图像长边进行总体缩放,放大增加识别耗时但精度更高,缩小减小耗时但精度降低,maxSideLen为0表示不缩放 int 读写
boxScoreThresh 文字框置信度门限,文字框没有正确框住所有文字时,减小此值,默认0.5f float 读写
boxThresh 值越大,文字部分会越小,默认0.3f float 读写
unClipRatio 单个文字框大小倍率,越大时单个文字框越大,默认1.6f float 读写
doAngleFlag 启用/禁用 文字方向检测,只有图片倒置的情况下(旋转90~270度的图片),才需要启用文字方向检测,默认关闭 boolean 读写
mostAngleFlag 启用/禁用 角度投票(整张图片以最大可能文字方向来识别),当禁用文字方向检测时,此项也不起作用,默认关闭 boolean 读写

✍️ 想更深入了解,请移步config.yaml参数解释

⚠️ 版本说明

系统架构 Onnx Ncnn
mac-arm64 支持,版本v1.2.2 支持,版本v1.2.0
mac-x86_64 支持,版本v1.2.2 支持,版本v1.1.2
linux-x86_64 支持,版本v1.2.2 支持,版本v1.1.2
linux-x86 不支持,暂无相应机器进行编译 不支持,暂无相应机器进行编译
linux-arm64 支持,版本v1.2.2 不支持,暂无相应机器进行编译
windows-x86_64 支持,版本v1.2.2 支持,版本v1.1.2
windows-x86 支持,版本v1.2.2 不支持
  • onnx和ncnn的版本指的是RapidOcrNcnn或者RapidOcrOnnx的版本
  • win7可能存在问题,未经测试
  • 不支持我的系统?
    • 请参考README中的FAQ-Q2,自行编译相关库文件
    • 如果您成功编译了相应平台的库文件,希望您能提供issue供更多人使用

🆒 Onnx和Ncnn简单对比

/ RapidOcrNcnn RapidOcrOnnx
PP-OCR支持版本 仅支持PP-OCRv3 支持PP-OCRv4和PP-OCRv3
更新模型-方式一 前往自行更新地址,在release下载模型 前往自行更新地址,在release下载最新的模型
更新模型-方式二 自行编译 自行编译
使用平台 移动端建议使用ncnn CPU端建议使用onnx

🎷 分支说明

  • main: 主分支
  • light-0.0.4: 旧版本,可加载自行编译的库文件
  • dev: 开发分支