设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
节点
飞墙
Follow
明白贴
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
nvlink 能让多个显卡的显存叠加起来用吗? ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
工位搬迁,发生了一件不愉快的事
›
感觉千问的这个活动产品负责人实在动脑子了
›
豆包的聪明程度很一般,为什么却是国内最火
›
似乎永远无法走出失恋
›
AI 编程先别说好不好用,贵是真的贵,个人
今日热议主题
刚注册了 https://jianzhan.la 域名,我能
mac 迁移到新机,如何迁移时尽可能保证新 m
用 AI 写了一些视频或直播间下载的工具
爱她美爆了,那么还有谁呢?
网信部门对快手平台依法作出处罚
[无套路] Opus4.6 无需注册直接用,昨日已
当父母容易啊,太容易了!
WSL Dashboard v0.3.0 开源发布,感谢 F站
劝大家不要办理任何运营商的看似优惠的活动
大家现在是如何将业务原型转化成自然语言和
显示全部
|
最新评论
11 条回复
·
1281 次点击
11#
rogerer
初学
2025-6-3 10:45:48
有很多种方式来并行。最简单的,你如果有 256 个 batch 要训练/推理,那就分成若干份,比如 4 个 64 个样本,这样就能一次推理得到 256 个样本的结果。但是如果模型参数足够大,以至于一张卡装不下,那就得在其他层面进行并行。
12#
paopjian
小成
2025-6-3 10:54:22
不同模型使用方法不一样吧,nvlink 用于加强卡间通信的, 比如这张卡算完的中间结果给下张卡继续计算, 这张卡处理下一个数据,或者训练完一个 batch 后互相更新本地参数. 并行计算也分多种方式, nvlink 是为了极致运算效率的, pcie 能用就先 pcie 吧
1
2
/ 2 页
浏览过的版块
问与答
酷工作
返回顶部