飞社-令人惊奇的创意工作者社区-问与答批了 100 万预算让我负责搭建行业知识库大模型 , 但是目前还没有思路

coefu

@soulflysimple123 为什么你会认为他们会鸟你的电话？？？🤣

Ricardoo

分析下效果不好的原因是什么，是召回阶段还是答案生成阶段，不同问题阶段的处理方式不同 1. 召回阶段，做好多路召回，向量召回（ huggingface 上的知名 embedding 模型都试下，bge 、qwen 等）和传统 ES 召回都做下，效果不会太差，如果领域术语较多，可能 es 召回效果还要更好一些。 2. 答案生成阶段，这个评估的更多了，首先调 API 试试大尺寸模型，看对领域内理解够不够。 - 够的话直接部署大模型完事。 - 如果不行。1. 考虑做领域内 continue pretrain, 把领域内知识学进去，然后走 SFT ，也许需要 RL, 人力物力 100w 可能不够，这种方案需要一个团队来搞。2. 走 PE + 多 agent ，为大模型添加更多的上下文背景知识。现在领域内大模型都倾向于这种模式

gaobh

中间要搞结构化处理

netizen

单纯做文档向量化检索的效果确实很差，可以研究下 #11 的思路。