18 条回复  ·  1966 次点击
TheGreatSage 初学 2025-12-31 16:47:35
用过,做购物小票识别,准确率一半一半吧,很考验拍照的角度
cryptovae 初学 2025-12-31 17:06:16
试一下这个? https://opendatalab.github.io/MinerU/zh/demo/
lululau 小成 2025-12-31 17:49:12
试试讯飞云的: https://iocr.xfyun.cn/experience/bigModelDocumentIdentification https://i.imgur.com/dGqXR5I.png
yaleyu 小成 2025-12-31 18:14:18
最近发现一个识别率挺高的 OCR ,https://github.com/datalab-to/surya, 识别你的图片如下 https://i.imgur.com/mj4rvAF.png
supermama 小成 2025-12-31 18:30:24
用了好几年,一直是自己二次训练。稳定性还不错。
v2306 楼主 初学 2025-12-31 18:42:40
@yaleyu #13 可以啊
v2306 楼主 初学 2025-12-31 18:43:27
@supermama #14 老哥怎么二次训练啊,没搞过
yaleyu 小成 2025-12-31 18:47:41
@f306 #15 我也是前段时间有识别表格的需求,发现 PP- Structure 老是错位,还有要识别带音乐符号的字幕,PP-OCR 识别不了音乐符号🎵,找到这个的,不过这个超级慢。
v2306 楼主 初学 2025-12-31 18:57:29
@yaleyu #17 一模一样哈,PP-structure 真的不好用,识别我那张图数量和单价数值都是连在一起的。这个 VL 也慢
12
返回顶部