飞社-令人惊奇的创意工作者社区-程序员小米 mino fshex flash 套壳谷歌模型

cheese · 2025-12-25 12:18:33

技术论坛，就算不做大模型，也好歹跟上技术认知。2025 年了，连蒸馏都没听过，还在问你爸爸是谁。在小米 AI 出来前你真的用过 AI 吗？离奇的好笑

ShadowPower · 2025-12-25 12:44:03

2023 年那会还说谷歌模型抄袭百度文心一言呢一些小知识： LLM 模型训练出来之后并不知道自己是谁训练的，自己叫什么名字通过系统提示词，或者监督微调，可以让模型知道自己是谁训练的，叫什么名字上面那一步操作，会影响模型在其他方面的性能

dragondove · 2025-12-25 12:56:27

怀疑楼主是不是程序员了，怎么感觉连开源都没接触过，难绷

skiy · 2025-12-25 13:01:46

估计 op 也没啥有用的知识分享了。已 block 。

ccpp132 · 2025-12-25 13:07:11

这甚至都不能说明他用了 gemini 做蒸馏。因为训练大模型也不会特意说训练材料里加入你是谁，是谁训练的。你问大模型，他不知道自己是谁，他只会从语料里找一个会训练大模型的来编回答

kylesean · 2025-12-25 13:09:46

这个模型很烂，工具调用都调用不明白，在我的 agent 里，会把 skills 解析成工具调用，导致输出错误的 xml 格式。其他模型都测试了国产的，gpt 的，都没有，就它有。

shine1996 · 2025-12-25 13:24:30

f 人均大模型开发专家

maomaosang · 2025-12-25 13:27:38

「实在抱歉」给楼主点赞，楼主讲究人儿，知错能道歉。

royzxq · 2025-12-25 13:50:26

小米要是真套壳你猜第二天千亿营销费用是不是已经上了

JYii · 2025-12-25 13:54:59

你对这个问题认知不足，这是小问题。你能道歉，这根本不是问题了。