[Question]: 根据官方文档利用label studio进行文档信息抽取标注，然后用脚本转换，发现前一两个字会漏掉，有什么好的处理方法么。 #9501

lidra · 2024-11-26T12:43:12Z

请提出你的问题

根据官方文档利用label studio进行文档信息抽取标注，然后用脚本转换，发现前一两个字会漏掉，有什么好的处理方法么。
我尝试了在标注的时候标注框尽可能往前放，也是不行。

lidra · 2024-11-26T12:44:50Z

如果转换后的json文件不对，怎么进行调整呢，看不太懂格式，不知道怎么调整。

wawltor · 2024-11-26T12:45:38Z

能截图或者提供下相关日志信息吗？

lidra · 2024-11-26T12:50:13Z

是标注的身份证图片，隐私问题，不好抛原图。给你看一下我标注的图和抽取结果

lidra · 2024-11-26T13:22:03Z

能截图或者提供下相关日志信息吗？

您看下我的回答

wawltor · 2024-11-27T03:11:52Z

能截图或者提供下相关日志信息吗？

您看下我的回答

这个看起来是label stuido标注的问题，建议去 https://github.com/HumanSignal/label-studio 建个issue看看

lidra · 2024-11-27T06:57:47Z

能截图或者提供下相关日志信息吗？

您看下我的回答

这个看起来是label stuido标注的问题，建议去 https://github.com/HumanSignal/label-studio 建个issue看看

nin您好，我看着感觉是转换脚本label_studio.py处理的时候出现的问题。转换脚本代码还没完全读明白，不知道是否有这块代码的逻辑解释，但是我debug了一下，脚本的第一步是做ocr识别，这一步会出现识别文字不准确的问题。我怀疑有可能是ocr识别的位置框不准确导致的，这需要搞清楚脚本的逻辑定位问题。

lidra · 2024-11-27T07:00:25Z

能截图或者提供下相关日志信息吗？

您看下我的回答

这个看起来是label stuido标注的问题，建议去 https://github.com/HumanSignal/label-studio 建个issue看看

nin您好，我看着感觉是转换脚本label_studio.py处理的时候出现的问题。转换脚本代码还没完全读明白，不知道是否有这块代码的逻辑解释，但是我debug了一下，脚本的第一步是做ocr识别，这一步会出现识别文字不准确的问题。我怀疑有可能是ocr识别的位置框不准确导致的，这需要搞清楚脚本的逻辑定位问题。

您好，我想表达的意思是，label_studio.py的处理逻辑就注定通过脚本出来的数据就不是百分百准确和靠谱的，是不是需要人工干预来保证训练数据的准确性。如果需要人工干预，那如何干预呢，是否有教程。

lidra added the question Further information is requested label Nov 26, 2024

paddle-bot bot assigned gongel Nov 26, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Question]: 根据官方文档利用label studio进行文档信息抽取标注，然后用脚本转换，发现前一两个字会漏掉，有什么好的处理方法么。 #9501

[Question]: 根据官方文档利用label studio进行文档信息抽取标注，然后用脚本转换，发现前一两个字会漏掉，有什么好的处理方法么。 #9501

lidra commented Nov 26, 2024

lidra commented Nov 26, 2024

wawltor commented Nov 26, 2024

lidra commented Nov 26, 2024

lidra commented Nov 26, 2024

wawltor commented Nov 27, 2024

lidra commented Nov 27, 2024

lidra commented Nov 27, 2024

[Question]: 根据官方文档利用label studio进行文档信息抽取标注，然后用脚本转换，发现前一两个字会漏掉，有什么好的处理方法么。 #9501

[Question]: 根据官方文档利用label studio进行文档信息抽取标注，然后用脚本转换，发现前一两个字会漏掉，有什么好的处理方法么。 #9501

Comments

lidra commented Nov 26, 2024

请提出你的问题

lidra commented Nov 26, 2024

wawltor commented Nov 26, 2024

lidra commented Nov 26, 2024

lidra commented Nov 26, 2024

wawltor commented Nov 27, 2024

lidra commented Nov 27, 2024

lidra commented Nov 27, 2024