|
OpenRouter 可以,但我至今没弄明白它怎么设置分流。。。而且想用它的 OpenAI 的模型也不行,提示所在区域不可用,估计是判定我绑定的大陆信用卡了;
硅基的我用来翻译,外加 7*24 小时跑了一些脚本,跑了一周没有断过,并发限制也低(我脚本限制一秒 5 个并发,但实际限制好像是一秒 100 个没记错的话),适合个人开发者放服务器搞一些小项目,比较稳定,用的 Qwen2.5-14B 和 32B 的模型。
Groq 快确实快,跟硅基没有更明显的优势,因为是海外需要梯子很快才能有感知,不然首字节取决于你梯子的速度。
Grok 我也用,用的 Grok-2-1102 ,并发限制记得是每秒 8 个,对我跑脚本够了,因为之前绑定了信用卡,每月给 150 美刀额度,所以跑脚本的时候上面有 Qwen 返回结果我检查不合规的,会 fallback 到 grok ,也比较稳定没断过。( fallback 的顺序是 qwen2.5-14b -> qwen2.5-32b -> grok2 )
不过现在这些我都不用了(除了跑脚本),用 ChatGPT 的客户端,它那个交互细节尤其是快捷唤出的功能做的很好很克制,已经付费 Plus 订阅了。 |