飞社-令人惊奇的创意工作者社区-程序员大模型发展到当前，让我对事物的发展有一些体会

xuanbg

@coefuqin 解魔方有公式的，随便你打乱成什么样子，只要按公式转就能还原的。

coefuqin

@xuanbg 可以给出几个解魔方解对的 demo 给机器人看，让它自己学习怎么解魔方。这是对于“大脑”泛化能力的测试。行动是对“小脑”泛化能力的测试。如果“大脑”+“小脑”都能泛化的话，说明它可以去厨房学习切菜和炒菜了。

coefuqin

@MidCoder #18 我举例的场景，同时测试了随机场景下，具身智能机器人的“大脑”+“小脑”的小样本或者零样本的泛化能力，这个能力是目前厂商最缺失的。如果能做到这样，就不需要像当前一样对于每个场景都做强化学习的训练了。和你理解的仅仅在 LLM 领域里的东西，完全不同。

Machcd

重点应该在工程，而不是被资本裹挟着一股脑去莽算法，这个思路是对的

coefuqin

@MidCoder #18 给你看个去年的 paper 。https://sayplan.github.io/

MidCoder

@coefuqin 感谢，我学习一下

coefuqin

@xuanbg https://robopen.github.io/ 去年的 paper ，能泛化到未曾识别的物体做动作，但是真正能理解魔方解，然后双手解魔方，这个估计还要几年。

coefuqin

@MidCoder #25 我也是今天下午搜了一下，发现 LLM+DRL ，这么看起来，好像还有点搞头。等前沿的兄弟们蹚出一条路，还可以模他们的石头，哈哈。

pkoukk

我不觉得用所谓工程技术填平缝隙这条路是对的就像你 LangChain 写的再好，也不如模型支持 MCP AI 时代的交互模式应该是完全不同的，拿现有经验去搞的那些 agent 真是别扭，也一点都不好用

MidCoder

@pkoukk 我觉得不管是 langchain 还是 MCP ，他目的是解决模型无法实时感知世界的问题，因为模型训练是离线的，训练完之后，他的知识储备和具备的推理思维范围，取决于训练时数据快照。而 function call 和 MCP 等这些架构工具，都是去将模型能力和现实业务场景结合起来，将实际场景的上下文实时给到模型，利用模型推理和理解去解决业务场景的问题

浏览过的版块