77 条回复  ·  8227 次点击
Yjhenan 小成 2025-12-25 09:34:43
数据不都是蒸馏出来吗还是怎么着,反正各大模型都有这毛病 https://i.imgur.com/TYtySHv.png https://i.imgur.com/TYtySHv.png
cryptovae 初学 2025-12-25 09:35:51
小米罗福莉前 DeepSeek 研究员,加上上面说的,还不懂吗
yhxx 小成 2025-12-25 09:35:55
@miniliuke 哈哈哈哈 iframe
keethebest 小成 2025-12-25 09:36:39
很正常啊 训练数据问题 以前 gimini 还说自己是百度的模型呢
brazz 小成 2025-12-25 09:36:55
好像没复现出来 https://aistudio.xiaomimimo.com/
iorilu 小成 2025-12-25 09:37:08
小米要能有 flash 水平, 早吹起来了
coconutwater 楼主 初学 2025-12-25 09:38:27
@brazz #14 我是直接接入的 api 调用
dhb233 小成 2025-12-25 09:40:48
哪怕看你的图,也说明不了是谷歌的模型啊,transformer 本来就是所有 AI 的基础啊。
coconutwater 楼主 初学 2025-12-25 09:42:52
经过f友提醒,重新查了相关资料,确实是数据清洗的时候出问题的概率比较大,不能直接说是套壳: "目前的开源或自研模型,为了提升逻辑和对话能力,通常会使用“蒸馏法”——即使用更强的模型(如 Google 的 Gemini 、OpenAI 的 GPT-4 )生成的优质对话数据来训练自己的小模型。小米在训练 MiMo f 时,可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。"
Gondolier 初学 2025-12-25 09:45:41
@tsja 这倒是真的。同样的苹果的 Apple Intelligence 也很弱智
返回顶部