设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
节点
飞墙
Follow
明白贴
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
想自己本地跑大模型,学习大模型,做一些微调等操作,目 ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
1 月 20 号失业, 2 月 1 号离婚,还有更快
›
沪深 300 指数能不能买
›
经过此次飞牛的漏洞,搞不懂为什么都喜欢直
›
回家的高铁要坐 8 小时,这个时间怎么度过
›
哪家的智能开关稳定性比较好
今日热议主题
不想上班,不想上班
今天 GEMINI 网页版本长度 6 万左右就报限
感觉 openclaw(原 Clawdbot)这东西想法很
Google AI Mode 中文这么通俗易懂吗
wechat 最近偶现无法收消息
你会选一个会过日子但不喜欢的人,还是选一
完了,脑子里只有放假,活干不进去了
AI 也老 6 了起来、也懂人情世故
可以买铜 ETF 了
web3 测试工程师 Crypto 交易所(CEX) 远程
显示全部
|
最新评论
36 条回复
·
4010 次点击
31#
dododada
初学
2025-9-5 08:42:32
大模型?你这个配置一般的推理没问题,但是大模型微调不行,再微调也是大模型,deepseek 满血配置 200W 起步,你这个只能跑量化
32#
wnpllrzodiac
初学
2025-9-5 08:52:54
没钱就别自己训练了。4090 最起码的,一张还不够
33#
totoro52
小成
2025-9-5 09:03:25
amd 跑模型? 很难评价
34#
aqqwiyth
小成
2025-9-5 09:11:11
不考虑一下每秒 token 吞吐量这个指标?
35#
misaki321
小成
2025-9-5 09:31:42
来张 4090 ,至少能跑非量化的 7b
36#
squarefong17
小成
2025-9-5 09:37:36
@charlenehe43 他说的那 CPU 跟 M4 pro 在一个性能水平,CPU 、GPU 和带宽都是。哪怕是功耗受限的笔记本跑 qwen-30b-a3b ,最高能有近 50 tokens/s 。跑这个规模的语言模型的场景,cuda 根本不是问题,vulkan 加速就够快了,瓶颈在带宽。
37#
goodryb
初学
2025-9-5 09:53:15
推理、微调、训练 所需要的资源你可以简单想象成 1:10:100 ,所以你要先清楚你准备做什么,如果只是刚开始想玩玩,建议可以先找 GPU 算力平台租卡来用,或者云厂商都有对应的服务先玩玩,玩的差不多了也就知道你要什么了 显卡首推 NVIDIA ,业界公认 NO.1
1
2
3
4
/ 4 页
浏览过的版块
Apple
返回顶部