飞社-令人惊奇的创意工作者社区-程序员Java 端怎么弄大模型的长期记忆

ethanpeng · 2025-11-26 08:43:23

@soap0X 长期记忆不需要检索吧，为啥要用向量库？

dode · 2025-11-26 09:01:47

那不就是信息和用户绑定，每次会话时都带着呗

dandankele · 2025-11-26 09:14:52

你的问题核心应该是知识检索吧，用户提问，但你不知道去拿哪些数据来喂给大模型？看你的描述像是围绕个人画像数据方面做的检索，身高、体重、血糖，如果个人的数据量不大、字段不多的话，考虑整体扔给大模型。。。如果个人数据量比较大，那么就要考虑你的问题了，如何抽取出所需的信息给大模型。。我目前有两种想法： 1. 将个人画像数据做简单处理，将大量维度数据按小维度扔进向量库，然后根据用户提问做相似性检索取出扔给大模型。 2. 调整应用编排，多次调用大模型，每次调用针对不同关注点做处理。例如首次调用主要是引入意图识别，让大模型根据用户问题帮你识别出可能需要什么 category 下的哪个 key 的个人信息，然后你再去 es 检索。这种缺陷可能会增加响应时间。

2025-11-26 09:24:51

可以提供工具和增加提示词让大模型自己决策什么时候需要“回忆”，什么时候需要“更新偏好”，应该会灵活点

sincw · 2025-11-26 09:28:58

我觉得 Qoder 那个记忆弄得挺好的

realJamespond · 2025-11-26 09:37:32

memo0,graphiti 。system prompt 加上每次对话先查一下向量库？

whoami9426 · 2025-11-26 09:37:53

你得反着来,像 claude code 一样,需要什么代码提供 tools 让 llm 自己用 function calling 查询搜索,而不是用 rag 去给他堆上下文

浏览过的版块