设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
有人实际部署过 GPT-OSS-20b 么? 需要什么配置能跑得比 ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
求职半个月,感觉快撑不住了,想听听大家的
›
共事了 7 年的同事今天 last day,还是会有
›
F站怎么有这么多人以 PC 为荣?
›
2025 各位心目中的最佳购买
›
ChatGPT, Claude, Gemini 会员三选一 应该
今日热议主题
观 《F站怎么有这么多人以 PC 为荣?》有感
你们会对 NAS 进行磁盘碎片整理吗?
阿里云的 SSL 证书,部署还要花钱的吗
收个 5060ti 16G 显卡
iPhone 现在的广告和输入法还是无解吗?
投了 500 份简历后,我终于看清求职平台的
NetProxy-Magisk —基于 Xray 核心 的系统
隔壁这个什么[进一步压实]味儿真的太浓了。
多益网络徐波在美国代孕生了 12 个娃,并不
(外包)寻找 Three.js/WebGL/Webgpu 开发
显示全部
|
最新评论
19 条回复
·
2112 次点击
11#
katsusan
小成
2025-9-1 20:12:32
16G 能跑的前提是需要英伟达 50 系 blackwell 的 FP4 ,其它平台应该要更多
12#
privil
小成
2025-9-1 20:26:52
@chiaf #1 跑个量化的字节开源模型 seed-oss-36b 试试,其实比 gpt-oss-20b 还给力点。
13#
totty
楼主
初学
2025-9-1 20:28:23
@YsHaNg 我再去试试判断语言,幻觉在这个场景下感觉还好。
14#
totty
楼主
初学
2025-9-1 20:29:46
@bearqq 这个速度感觉有点压力,一次翻译文本输入就得大几百 token ,用户要等太久
15#
totty
楼主
初学
2025-9-1 20:30:09
@privil 问对地方了
16#
Pteromyini
小成
2025-9-1 20:49:10
翻译最好还是用字节专门的 seed 或者用翻译数据集微调一个小规模的模型。小规模的通用模型包括 gpt-oss 实在不太行,激活参数本身也太小了,幻觉难免。
17#
tomclancy
初学
2025-9-1 20:53:44
我是 9900x 3090 ,思考的时候 GPU 直接满负荷狂转,思考完直接安静了
18#
totty
楼主
初学
2025-9-1 21:18:11
@Pteromyini OKK
19#
totty
楼主
初学
2025-9-1 21:18:27
@tomclancy 火星子既视感
20#
kennylam777
小成
2025-9-1 21:20:26
@katsusan 不用, 我試過用 3090 + Llama.cpp 能直接跑 FP4 的 GGUF, 速度也不錯, 100tps 而 5090 可以滿血跑 context 128k, 160tps 以上
1
2
/ 2 页
浏览过的版块
问与答
二手交易
职场话题
汽车
分享发现
分享创造
Apple
返回顶部