设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
这样是否可以保证 OCR 识别率接近百分之 100 ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
求职半个月,感觉快撑不住了,想听听大家的
›
F站怎么有这么多人以 PC 为荣?
›
共事了 7 年的同事今天 last day,还是会有
›
ChatGPT, Claude, Gemini 会员三选一 应该
›
离线听书 App 上架 Google Play,寻找封闭测
今日热议主题
被花了很多心思带教了一年多的小弟背刺了
请教招 web 前端面试都该问些啥
iOS Home Control(右上角下拉界面)设备顺
求推荐价格 500 左右的游戏鼠标?
[杭州招聘] Golang 后端工程师
古籍文本的 OCR,大家有没推荐好的开源项目
intel qsv ffmpeg 编码问题
用 AI 撸了一个游戏产业图和电影产业图
招钱包测试总监
广西电信疑似被部分限速
显示全部
|
最新评论
30 条回复
·
3283 次点击
21#
InkAndBanner
小成
2025-9-22 11:49:43
@dem0ns #18 抱歉 没有 我们是阿里系的 优先用 qwen
22#
AutumnVerse
初学
2025-9-22 11:49:44
这不就是多源对比纠错吗? 完整方案应该是这样的,3 个源 ocr 对比,如果有 2 个源一样,就直接取用,3 个全都不一样,丢给大模型或人工纠错。 纠错结果丢给 ocr 模型二次训练
23#
MIUIOS
初学
2025-9-22 11:50:24
我遇到你这个问题,我的做法是 OCR 出来后丢给 llm 大模型去修复
24#
malusama
小成
2025-9-22 11:52:19
直接 ocr 丢给 LLM 修复呗。 你这样一致的能有多少,准确率上去了不得看看能召回多少吗? 你这都没有多少是输出一致的吧
25#
AutumnVerse
初学
2025-9-22 11:53:14
@Julaoshi 不可能,机器学习网络参数是固定的,无论你什么尺寸,前向传播前都会 resize 成固定尺寸 你觉得识别率高了仅仅是插针拉伸裁剪之类的算法导致识别结果不一样了而已,从算法原理上放大不可能影响识别率
26#
Insolitude
初学
2025-9-22 12:16:16
调用过 Google 的 ai ocr 的接口,效果感觉还不如本地的 ocr ,,可能手写体 ai 会更好点。让 llm 优化传统 ocr 的结果,感觉是个不错的思路。目前我用的本地 ocr 主要就中文的标点会识别成英文标点的问题,发给 llm 很容易解决。
27#
syscall
初学
2025-9-22 13:47:17
@Julaoshi 模型目标尺寸训练时定死了. 即使是动态 shape, 但同样的设置下模型接收的输入尺寸就是一样的.
28#
8355
小成
2025-9-22 13:58:51
@Suinn #2 那如果是这样的话,大模型产生幻觉了导致大模型返回的错误值,此时安业务逻辑无法识别了那怎么处理?
29#
canteon
初学
2025-9-22 14:03:17
人工校对
30#
tusj
初学
2025-9-22 14:09:23
先 OCR 识别生成文本结果,再大模型对文本纠正一下低级错误。这样组合怎样?
下一页 »
1
2
3
4
/ 4 页
下一页
浏览过的版块
问与答
投资
技术
酷工作
NAS
交易
Apple
Google
生活
返回顶部