设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
自己部署 GLM4.7 或者 MiniMax2.1,能接入 Claude code ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
L 站被爆出有盲水印
›
看了《为什么国漫进步这么明显,有人却还是
›
是我的问题还是女朋友的问题
›
见证黄金和白银历史了,涨得时候创造记录,
›
我们是不是处于第四次工业(科技)革命中。
今日热议主题
NanoBananaPro 原生 API,稳定高并发 GCP T
[免费使用] run skill ai, completely free
如何解决微信绑定美国手机号,好友微信不停
我相信很多人部署 openclaw 都遇到了 web_s
[分享] 周末项目 yomemo.ai:跨 LLM 的持久
假装在旅游~
想上个 gemini pro 家庭组车位,有的佬私我
150 出红茶移动 RedteaGo 中国大陆 100G 36
16 寸的 MacBook 配大屏吗
[油猴脚本] B 站弹幕合并器
显示全部
|
最新评论
37 条回复
·
3970 次点击
31#
redbeanzzZ
小成
2026-1-20 19:51:10
github 上 claude code router 试下呢?还有 zcf
32#
Rrrrrr
初学
2026-1-20 20:02:38
2 楼正解
33#
deeplee
初学
2026-1-20 22:33:16
我们公司是内网自己部署的 glm4.7 ,配合 claude code + superpowers ,简单的项目效果还可以
34#
yycyanyicheng
初学
2026-1-20 23:14:30
code plan 9.9 5 小时 40 条 prompt. 手上有 cursor + claude sonnet 4.5 + codex 整体玩下来感觉还可以,就是做一些指令的时候没有那么好,同样的谷歌插件代码,miniax2.1 搞了几次搞不定,其实换了 codex 它也是有错误。 目前还没有强烈感觉到它很差劲的地方。平替是可以的
35#
bwnjnOEI
初学
2026-1-20 23:28:17
好几个开源 llm 网关,统一所有接口而且可以遥测和统计 token ,另外多卡用 vllm 或 sglang 部署都有很好的并发优化。必须先部署上之后效果需要不断优化,就对着这俩文档研究参数和基本原理就行
36#
bwnjnOEI
初学
2026-1-20 23:33:30
@bwnjnOEI 但是我不建议使用 claude code router ,至少公司使用这个不可行,推荐 Bifrost go 写的比 litellm python 的快
37#
bwnjnOEI
初学
2026-1-20 23:56:32
@bwnjnOEI 难点就是瞬时 token 数量会不会爆显存,如果观测一段时间爆了要么加算计要么上手段比如 fp8 (前提调点精度能不能接受
38#
starlion
小成
2026-1-21 00:35:39
可以啊,自己搞个大模型网关,通过这个网关来调用网关后面的大模型能力,就像 nginx 差不多
1
2
3
4
/ 4 页
浏览过的版块
NAS
iPhone
职场话题
返回顶部