13 条回复  ·  1505 次点击
urlpha 小成 2025-9-8 09:18:18
@inbox #1 如果不熟悉整条路径,跑出一套 poc 大概一周够的,就用线上成熟的平台,比如阿里百炼、火山方舟。 后续就是工程化的过程,预处理、提示词、流程编排等,一般弄出一般来根据试运行反馈慢慢优化。
jjwjiang 小成 2025-9-8 09:22:31
个人觉得别找外面,这个场景是非常基础非常确定的 AI 应用场景,各大基础模型提供商都很成熟了,跟着教程整理下数据挂上 RAG ,然后自己调调 prompt 基本就可以了,自给自足可以灵活调整,到外面你就等着扯皮吧
WithoutSugarMiao 初学 2025-9-8 11:32:15
我现在的公司就是专门帮其他公司做智能体的。我目前负责的两个项目,一个是面向央企的,总招标千万级别,一个是和化工企业共建的,价值也在百万左右,但是我们做的都是完整的解决方案,如果光是训练模型,可能便宜不少。 但你如果是技术,还是推荐你自己做的。看你的数据是什么类型的,如果是文档型的,和大家说的一样,可以直接用 RAG 。如果非常细的业务场景可以直接微调,几万条的数据已经能有非常好的效果了。 可以参考下这个例子( https://www.aliyun.com/solution/tech-solution-deploy/2925027 )。从一句话中提取结构化信息,用 1000 条左右的数据,就把 0.6B 模型的准确率从 14% 提升到了百分之 98%。 至于什么时候用 RAG ,什么时候微调,其实一般都是结合使用的。比如那个化工项目,甲方提供了 产品对应的化学原料(例如:塑料的原料可能有聚氯乙烯 PVC 、聚乳酸 PLA 、色母粒等),用这些数据训练产品原料预测模型,输入是产品名称,输出就是预测需要的化学原料。然后还有一些文档,比如某些产品的原料使用标准、基础化工原料介绍,这种就放在 RAG 里,执行任务的时候检索。 价格的话,我自己训练模型一般用这个 https://www.autodl.com/ 里面的机器比常用云会便宜点。比如阿里云 80G 显存 一小时 50 多,这个服务 13 块钱一小时。 你训练的时候可以按照小时买,估计几千块钱 就能支持你训练好模型,部署的时候可以转包年包月。
dododada 初学 2025-9-8 13:24:50
看你做什么吧,如果是纯文本或者普通的文档,上面说的 rag 就行了,但是如果是操作指导书一类的,只有模型没什么用,这些东西前期的识别太复杂了,还是要上规则链,端到端目前不太行
12
返回顶部