77 条回复  ·  8222 次点击
cheese 初学 2025-12-25 12:18:33
技术论坛,就算不做大模型,也好歹跟上技术认知。2025 年了,连蒸馏都没听过,还在问你爸爸是谁。 在小米 AI 出来前你真的用过 AI 吗? 离奇的好笑
ShadowPower 小成 2025-12-25 12:44:03
2023 年那会还说谷歌模型抄袭百度文心一言呢 一些小知识: LLM 模型训练出来之后并不知道自己是谁训练的,自己叫什么名字 通过系统提示词,或者监督微调,可以让模型知道自己是谁训练的,叫什么名字 上面那一步操作,会影响模型在其他方面的性能
dragondove 小成 2025-12-25 12:56:27
怀疑楼主是不是程序员了,怎么感觉连开源都没接触过,难绷
skiy 小成 2025-12-25 13:01:46
估计 op 也没啥有用的知识分享了。已 block 。
ccpp132 小成 2025-12-25 13:07:11
这甚至都不能说明他用了 gemini 做蒸馏。因为训练大模型也不会特意说训练材料里加入你是谁,是谁训练的。你问大模型,他不知道自己是谁,他只会从语料里找一个会训练大模型的来编回答
kylesean 初学 2025-12-25 13:09:46
这个模型很烂,工具调用都调用不明白,在我的 agent 里,会把 skills 解析成工具调用,导致输出错误的 xml 格式。其他模型都测试了国产的,gpt 的,都没有,就它有。
shine1996 小成 2025-12-25 13:24:30
f 人均大模型开发专家
maomaosang 小成 2025-12-25 13:27:38
「实在抱歉」 给楼主点赞,楼主讲究人儿,知错能道歉。
royzxq 小成 2025-12-25 13:50:26
小米要是真套壳你猜第二天千亿营销费用是不是已经上了
JYii 小成 2025-12-25 13:54:59
你对这个问题认知不足,这是小问题。你能道歉,这根本不是问题了。
返回顶部