CTPN是一个不错的场景文字检测算法。
- 执行脚本init.sh(Windows下init.bat)以初始化工程;
- 从此处下载预训练模型至
model
文件夹; - 从 google drive 或 baidu yun 下载数据集. 数据集已由 @eragonruan 为CTPN专门准备好;
- 解压下载好的数据集至
'VOCdevkit'
文件夹, 将rcnn/config.py
中的default.root_path
和default.dataset_path
设置为<你的目录>/VOCdevkit/VOC2007'
. 你也可以修改rcnn/config.py
文件中的其他超参数; - 运行
python train_ctpn.py
可开始训练. 运行python train_ctpn.py --gpus '0' --rpn_lr 0.01 --no_flip 0
在 gpu 0 上以学习率 0.01 和翻转数据增强模式进行训练。
输入 python demo_ctpn.py --image "<你的图像路径>" --prefix model/rpn1 --epoch 8
进行测试。
注意:
以下全部图像均下载自互联网,如果对你有影响,请联系我进行删除。
任何至少具备 2GB 显存的 NVIDIA 显卡都OK.
- 准备自定义数据集的教程
- 支持Windows
- 支持网络模型的发布以及支持C++的推断