13 条回复  ·  1516 次点击
coefu 初学 2025-8-27 11:44:51
@soulflysimple123 为什么你会认为他们会鸟你的电话???🤣
Ricardoo 小成 2025-8-27 11:49:59
分析下效果不好的原因是什么,是召回阶段还是答案生成阶段,不同问题阶段的处理方式不同 1. 召回阶段,做好多路召回,向量召回( huggingface 上的知名 embedding 模型都试下,bge 、qwen 等)和传统 ES 召回都做下,效果不会太差,如果领域术语较多,可能 es 召回效果还要更好一些。 2. 答案生成阶段,这个评估的更多了,首先调 API 试试大尺寸模型,看对领域内理解够不够。 - 够的话直接部署大模型完事。 - 如果不行。1. 考虑做领域内 continue pretrain, 把领域内知识学进去,然后走 SFT ,也许需要 RL, 人力物力 100w 可能不够,这种方案需要一个团队来搞。2. 走 PE + 多 agent ,为大模型添加更多的上下文背景知识。现在领域内大模型都倾向于这种模式
gaobh 小成 2025-8-27 11:51:13
中间要搞结构化处理
netizen 初学 2025-8-27 12:04:00
单纯做文档向量化检索的效果确实很差,可以研究下 #11 的思路。
12
返回顶部