设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
私有化部署 OCR 解决方案请教
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
求职半个月,感觉快撑不住了,想听听大家的
›
共事了 7 年的同事今天 last day,还是会有
›
F站怎么有这么多人以 PC 为荣?
›
2025 各位心目中的最佳购买
›
ChatGPT, Claude, Gemini 会员三选一 应该
今日热议主题
iPhone 现在的广告和输入法还是无解吗?
投了 500 份简历后,我终于看清求职平台的
NetProxy-Magisk —基于 Xray 核心 的系统
隔壁这个什么[进一步压实]味儿真的太浓了。
多益网络徐波在美国代孕生了 12 个娃,并不
(外包)寻找 Three.js/WebGL/Webgpu 开发
[aua.ee] 流放 Minecraft 超硬核无规则生存
吐槽下,感觉国产模型/Agent 不靠谱
cf 显示中国的搜索引擎还是百度为主
拯救词穷:一个提效 git 工具
显示全部
|
最新评论
17 条回复
·
1900 次点击
11#
xomix
小成
2025-7-24 09:25:03
@Sh1xin 对,所以我说你的 ai 要提前介入,场景检测框之前能不能让 ai 拆成不同的图片然后再 ocr ?
12#
Sh1xin
楼主
初学
2025-7-24 09:28:36
@test00001 gemini 不是开源的,没法私有化部署,不考虑。之前也试过直接发给 GPT O3 模型,识别效果特别好。可惜没法私有化部署。直接把图片发送给 gemma 3 27b 的话,识别的文字错误率太高,不可用
13#
Ipsum
初学
2025-7-24 09:31:14
不怕出事,就用 wx 的那个 ocr 。训练得很好。
14#
xinyu391
小成
2025-7-24 09:32:57
可以用我司的 文档解析服务 支持 图片,pdf (扫描档,电子档),公式,表格等。 https://www.textin.com/market/detail/xparse
15#
visper
小成
2025-7-24 09:36:37
yolo 训练,识别出框,然后通过框把图片截图出来再给 paddleocr.
16#
hmxxmh
初学
2025-7-24 09:40:12
pdf 的试一下 minerU 和 docing, 图片用 yolov8+ppocr
17#
SanjinGG
小成
2025-7-24 09:43:52
自己优化,要不就买商用的
18#
fannheyward
小成
2025-7-24 09:46:22
https://github.com/chatdoc-com/OCRFlux 识别效果和准确率都非常好
1
2
/ 2 页
浏览过的版块
职场话题
分享创造
问与答
分享发现
Apple
二手交易
返回顶部