|
分析下效果不好的原因是什么,是召回阶段还是答案生成阶段,不同问题阶段的处理方式不同
1. 召回阶段,做好多路召回,向量召回( huggingface 上的知名 embedding 模型都试下,bge 、qwen 等)和传统 ES 召回都做下,效果不会太差,如果领域术语较多,可能 es 召回效果还要更好一些。
2. 答案生成阶段,这个评估的更多了,首先调 API 试试大尺寸模型,看对领域内理解够不够。
- 够的话直接部署大模型完事。
- 如果不行。1. 考虑做领域内 continue pretrain, 把领域内知识学进去,然后走 SFT ,也许需要 RL, 人力物力 100w 可能不够,这种方案需要一个团队来搞。2. 走 PE + 多 agent ,为大模型添加更多的上下文背景知识。现在领域内大模型都倾向于这种模式 |