Skip to content

Latest commit

 

History

History
38 lines (30 loc) · 2.01 KB

README_CN.md

File metadata and controls

38 lines (30 loc) · 2.01 KB

基于MXNet的CTPN

简介

CTPN是一个不错的场景文字检测算法。

English Document

训练

  1. 执行脚本init.sh(Windows下init.bat)以初始化工程;
  2. 此处下载预训练模型至model文件夹;
  3. google drivebaidu yun 下载数据集. 数据集已由 @eragonruan 为CTPN专门准备好;
  4. 解压下载好的数据集至 'VOCdevkit' 文件夹, 将 rcnn/config.py 中的 default.root_pathdefault.dataset_path 设置为 <你的目录>/VOCdevkit/VOC2007'. 你也可以修改 rcnn/config.py 文件中的其他超参数;
  5. 运行 python train_ctpn.py 可开始训练. 运行 python train_ctpn.py --gpus '0' --rpn_lr 0.01 --no_flip 0 在 gpu 0 上以学习率 0.01 和翻转数据增强模式进行训练。

测试

输入 python demo_ctpn.py --image "<你的图像路径>" --prefix model/rpn1 --epoch 8 进行测试。

我们的结果

注意: 以下全部图像均下载自互联网,如果对你有影响,请联系我进行删除。

硬件需求

任何至少具备 2GB 显存的 NVIDIA 显卡都OK.

参考

  1. https://github.com/tianzhi0549/CTPN
  2. https://github.com/eragonruan/text-detection-ctpn

TODO

  • 准备自定义数据集的教程
  • 支持Windows
  • 支持网络模型的发布以及支持C++的推断