飞社-令人惊奇的创意工作者社区-程序员小米 mino fshex flash 套壳谷歌模型

Yjhenan · 2025-12-25 09:34:43

数据不都是蒸馏出来吗还是怎么着，反正各大模型都有这毛病 https://i.imgur.com/TYtySHv.png https://i.imgur.com/TYtySHv.png

cryptovae · 2025-12-25 09:35:51

小米罗福莉前 DeepSeek 研究员，加上上面说的，还不懂吗

yhxx · 2025-12-25 09:35:55

@miniliuke 哈哈哈哈 iframe

keethebest · 2025-12-25 09:36:39

很正常啊训练数据问题以前 gimini 还说自己是百度的模型呢

brazz · 2025-12-25 09:36:55

好像没复现出来 https://aistudio.xiaomimimo.com/

iorilu · 2025-12-25 09:37:08

小米要能有 flash 水平, 早吹起来了

coconutwater · 2025-12-25 09:38:27

@brazz #14 我是直接接入的 api 调用

dhb233 · 2025-12-25 09:40:48

哪怕看你的图，也说明不了是谷歌的模型啊，transformer 本来就是所有 AI 的基础啊。

coconutwater · 2025-12-25 09:42:52

经过f友提醒，重新查了相关资料，确实是数据清洗的时候出问题的概率比较大，不能直接说是套壳: "目前的开源或自研模型，为了提升逻辑和对话能力，通常会使用“蒸馏法”——即使用更强的模型（如 Google 的 Gemini 、OpenAI 的 GPT-4 ）生成的优质对话数据来训练自己的小模型。小米在训练 MiMo f 时，可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。"

Gondolier · 2025-12-25 09:45:41

@tsja 这倒是真的。同样的苹果的 Apple Intelligence 也很弱智