16 条回复  ·  1792 次点击
ethanpeng 小成 2025-11-26 08:43:23
@soap0X 长期记忆不需要检索吧,为啥要用向量库?
dode 小成 2025-11-26 09:01:47
那不就是信息和用户绑定,每次会话时都带着呗
dandankele 初学 2025-11-26 09:14:52
你的问题核心应该是知识检索吧,用户提问,但你不知道去拿哪些数据来喂给大模型? 看你的描述像是围绕个人画像数据方面做的检索,身高、体重、血糖,如果个人的数据量不大、字段不多的话,考虑整体扔给大模型。。。 如果个人数据量比较大,那么就要考虑你的问题了,如何抽取出所需的信息给大模型。。 我目前有两种想法: 1. 将个人画像数据做简单处理,将大量维度数据按小维度扔进向量库,然后根据用户提问做相似性检索取出扔给大模型。 2. 调整应用编排,多次调用大模型,每次调用针对不同关注点做处理。例如首次调用主要是引入意图识别,让大模型根据用户问题帮你识别出可能需要什么 category 下的哪个 key 的个人信息,然后你再去 es 检索。这种缺陷可能会增加响应时间。
72 小成 2025-11-26 09:24:51
可以提供工具和增加提示词让大模型自己决策什么时候需要“回忆”,什么时候需要“更新偏好”,应该会灵活点
sincw 小成 2025-11-26 09:28:58
我觉得 Qoder 那个记忆弄得挺好的
realJamespond 小成 2025-11-26 09:37:32
memo0,graphiti 。system prompt 加上每次对话先查一下向量库?
whoami9426 初学 2025-11-26 09:37:53
你得反着来,像 claude code 一样,需要什么代码提供 tools 让 llm 自己用 function calling 查询搜索,而不是用 rag 去给他堆上下文
12
返回顶部