32 条回复  ·  3644 次点击
xuanbg 小成 2025-6-12 16:42:05
@coefuqin 解魔方有公式的,随便你打乱成什么样子,只要按公式转就能还原的。
coefuqin 初学 2025-6-12 17:05:03
@xuanbg 可以给出几个解魔方解对的 demo 给机器人看,让它自己学习怎么解魔方。这是对于“大脑”泛化能力的测试。行动是对“小脑”泛化能力的测试。如果“大脑”+“小脑”都能泛化的话,说明它可以去厨房学习切菜和炒菜了。
coefuqin 初学 2025-6-12 17:07:42
@MidCoder #18 我举例的场景,同时测试了随机场景下,具身智能机器人的“大脑”+“小脑”的小样本或者零样本的泛化能力,这个能力是目前厂商最缺失的。如果能做到这样,就不需要像当前一样对于每个场景都做强化学习的训练了。和你理解的仅仅在 LLM 领域里的东西,完全不同。
Machcd 初学 2025-6-12 17:53:07
重点应该在工程,而不是被资本裹挟着一股脑去莽算法,这个思路是对的
coefuqin 初学 2025-6-12 17:55:18
@MidCoder #18 给你看个去年的 paper 。https://sayplan.github.io/
MidCoder 楼主 初学 2025-6-12 17:56:49
@coefuqin 感谢,我学习一下
coefuqin 初学 2025-6-12 18:00:35
@xuanbg https://robopen.github.io/ 去年的 paper ,能泛化到未曾识别的物体做动作,但是真正能理解魔方解,然后双手解魔方,这个估计还要几年。
coefuqin 初学 2025-6-12 18:06:39
@MidCoder #25 我也是今天下午搜了一下,发现 LLM+DRL ,这么看起来,好像还有点搞头。等前沿的兄弟们蹚出一条路,还可以模他们的石头,哈哈。
pkoukk 小成 2025-6-12 18:24:26
我不觉得用所谓工程技术填平缝隙这条路是对的 就像你 LangChain 写的再好,也不如模型支持 MCP AI 时代的交互模式应该是完全不同的,拿现有经验去搞的那些 agent 真是别扭,也一点都不好用
MidCoder 楼主 初学 2025-6-12 18:35:26
@pkoukk 我觉得不管是 langchain 还是 MCP ,他目的是解决模型无法实时感知世界的问题,因为模型训练是离线的,训练完之后,他的知识储备和具备的推理思维范围,取决于训练时数据快照。而 function call 和 MCP 等这些架构工具,都是去将模型能力和现实业务场景结合起来,将实际场景的上下文实时给到模型,利用模型推理和理解去解决业务场景的问题
返回顶部