设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
节点
飞墙
Follow
明白贴
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
问与答
›
有没有熟悉大模型开发的, help!
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
书房桌子小, Studio Display 想接两台主机
›
各位现在还在用 GPT 还是转向别的 LLM
›
同级别年限差不多的测试 QA 薪资比开发高,
›
有没有免费易用的 md 编辑器推荐一下
›
BNBrain 进展更新:现在可以全程 AI 部署并
今日热议主题
出个红米 note8pro
百度汉语没有苹果 app 吗?
看了张艺谋的新片《惊蛰无声》
vibe coding 了一个熬夜/倒时差的小工具
为什么这么简单的 Python 问题, ChatGPT
多年的后端编程经验让 AI 编程干的兴奋又惆
为什么使用插件 FSHEX Polish 2.4.19 竟然
[吐槽] 零基础靠 AI 搓了个佳能打印小程序
linkedin 怎么知道你是什么人?
Claude VS GLM VS Kimi VS MiniMax VS Gemi
显示全部
|
最新评论
24 条回复
·
2709 次点击
11#
mohuani
初学
2025-5-27 10:01:01
@zhh2271 他应该是在逗你玩
12#
KongKong369
初学
2025-5-27 10:01:16
@hefish 这兄弟在和你扯呢。
13#
Mzs
小成
2025-5-27 10:04:34
1. 远远没到训练的程度 2. 知识库的质量先保证好 3. https://dify.ai 4. 多多调试提示词
14#
love060701
小成
2025-5-27 10:08:08
1 、如果上下文不长,直接把你们公司常用的文档当系统 prompt 写进去,需要使用上下文比较长的模型,DeepSeek 不行因为上下文太短,可以找 128K 上下文版本的 Qwen 。 2 、微调模型,基于某个版本的模型做额外的训练,推荐基于 70B 版本的模型做训练,微调好像只能基于密集模型,MoE 模型的微调比较困难。DeepSeek R1 也不行的,只能使用 DeepSeek 蒸馏出的模型。 3 、RAG ,就是外挂知识库,数据标准化->向量化,LLM 回答问题时把知识库作为上下文,可以使用 DeepSeek R1 作为 LLM ,有 Dify 、n8n 之类的开源实现,不过你们公司有那么多资源部署自己的 DeepSeek R1 么?
15#
chanlk
小成
2025-5-27 10:08:56
这是想弄一个知识库吧 https://i.imgur.com/MAyk5GN.png
16#
zhh2271
楼主
初学
2025-5-27 10:10:51
@renmu 是这样,主管叫我先基于一个商业工具开发一个大模型出来,后续再把这个迁移到我们的软件,商业工具的文档是非常丰富的。然后迁移的话也只需要实现我们部门的一个模块就好了,暂时不需要管其它部门
17#
zhh2271
楼主
初学
2025-5-27 10:12:38
@love060701 显卡是有的,A100 应该有挺多的,就是不知道会不会给我用
18#
zhh2271
楼主
初学
2025-5-27 10:14:16
@love060701 这个生成脚本、规则文件的我感觉很难弄,像一些代码什么的,我感觉文档问答的话是不是用 RAG 就行了,但是这种脚本生成应该要怎么做啊
19#
Felixchen1062
初学
2025-5-27 10:18:05
从微调做起可以看看 unsloth, llmfactory, 如果想做 rag, workflow 之类的可以看看 dify, langchain,llamaindex 平台 , 固定行业脚本编写可能需要你有一些 prompt 经验, 以上内容拿去 gemini research,让他给你介绍一遍
20#
zhh2271
楼主
初学
2025-5-27 10:18:23
@love060701 1 这个应该不行,EDA 相关的文档很多
下一页 »
1
2
3
/ 3 页
下一页
返回顶部