|
@coderchen 每家网页版本的 app ,背后的 agentic engineering 是除开 llm 裸模型以外的软实力。跑分那种玩法,api 测各家模型的时候,agentic engineering 都不是各家的完全体,我相信用 api 跑打分的 Gemini 3pro 的可能比 openai 的 5.1 更强,但体感用下来,无论是网页版还是 cursor 的内置调用,小项目用 5.1 都比 Gemini 3pro 强。
网上的 java 仔还是太多,模板代码+一堆微服务文档上下文整下来,gemini 3pro 的上下文长度的优势能发挥出来,但推理能力还真没看出有吊打 4.0opus 和 5.0+的 gpt 的程度😁 |