设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
自己部署 GLM4.7 或者 MiniMax2.1,能接入 Claude code ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
L 站被爆出有盲水印
›
Idea 是不是要破产了?
›
看了《为什么国漫进步这么明显,有人却还是
›
何为国漫?什么才算好作品?
›
见证黄金和白银历史了,涨得时候创造记录,
今日热议主题
上线了一款完全浏览器本地的数据分析处理工
你们有给当地官员邮寄举报信的经验吗
Quicker 软件有什么便宜的购买渠道?
大家的公网 v4 地址多少时间变动一次?
飞牛 0day 后门专杀脚本
出 PopClip 席次。 20/设备
Seed3D - 一张照片,秒出可打印 3D 模型!
昨天黄金和白银跌幅大家怎么看?
「亏否」分享一下运营一年的小程序,评论就
web 串口和 web adb
显示全部
|
最新评论
37 条回复
·
3967 次点击
31#
redbeanzzZ
小成
2026-1-20 19:51:10
github 上 claude code router 试下呢?还有 zcf
32#
Rrrrrr
初学
2026-1-20 20:02:38
2 楼正解
33#
deeplee
初学
2026-1-20 22:33:16
我们公司是内网自己部署的 glm4.7 ,配合 claude code + superpowers ,简单的项目效果还可以
34#
yycyanyicheng
初学
2026-1-20 23:14:30
code plan 9.9 5 小时 40 条 prompt. 手上有 cursor + claude sonnet 4.5 + codex 整体玩下来感觉还可以,就是做一些指令的时候没有那么好,同样的谷歌插件代码,miniax2.1 搞了几次搞不定,其实换了 codex 它也是有错误。 目前还没有强烈感觉到它很差劲的地方。平替是可以的
35#
bwnjnOEI
初学
2026-1-20 23:28:17
好几个开源 llm 网关,统一所有接口而且可以遥测和统计 token ,另外多卡用 vllm 或 sglang 部署都有很好的并发优化。必须先部署上之后效果需要不断优化,就对着这俩文档研究参数和基本原理就行
36#
bwnjnOEI
初学
2026-1-20 23:33:30
@bwnjnOEI 但是我不建议使用 claude code router ,至少公司使用这个不可行,推荐 Bifrost go 写的比 litellm python 的快
37#
bwnjnOEI
初学
2026-1-20 23:56:32
@bwnjnOEI 难点就是瞬时 token 数量会不会爆显存,如果观测一段时间爆了要么加算计要么上手段比如 fp8 (前提调点精度能不能接受
38#
starlion
小成
2026-1-21 00:35:39
可以啊,自己搞个大模型网关,通过这个网关来调用网关后面的大模型能力,就像 nginx 差不多
1
2
3
4
/ 4 页
浏览过的版块
汽车
NSFW
分享发现
投资
二手交易
Mac mini
剧集
返回顶部