设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
关于大模型原理的感叹
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
我的人生好像有点坏掉了,请大家给点建议
›
长话短说 大家觉得花三十万结婚,存款花完
›
关于在大城市留不下来这件事,大家都是怎样
›
域名不用了记得要及时注销备案
›
重度苹果用户投华做了两面派
今日热议主题
回忆姥爷
两三年内翻倍的票
一通宵肝了个全网 AI 中转站比价工具
关于 clash dns 的问题
苦于 Xcode 不支持国内大模型,所以我做了
求个 M-team 的邀请,有其他站的数据
我把 AI 用到了爬虫上,做了一款工具
请教下各国海关数据如何拿到?
Vmware Workstation 使用 WHP,似乎无法睿
使用 Parallels Desktop 安装 Windows 的各
显示全部
|
最新评论
33 条回复
·
3515 次点击
11#
risan
初学
2025-11-24 11:17:18
你可以了解一下“涌现”,会有自己的答案的
12#
xtreme1
小成
2025-11-24 11:20:50
这不是前两年的日经话题么, 主流的一个观点是(我的总结不一定准确), 人类自己的"学习理解"就是在压缩信息, 即找到最短的编码方式, 而这和"预测哪个字最可能出现", 在数学上是同一回事. 相关文章可以搜索 Compression is Intelligence.
13#
jonsmith
小成
2025-11-24 11:32:57
AI 炼丹师,LLM 的内部逻辑是未解之谜。
14#
meihuanyu88x
初学
2025-11-24 11:33:22
知道了原理以后,依旧会觉得它是魔法.
15#
sillydaddy
初学
2025-11-24 11:49:42
你不是一个人。即使是如杨立昆或辛顿这样的行业内专家,也不理解。大模型就是一个黑盒。辛顿是这样解释 LLM 的:你把文字转为另一个空间的向量,这个向量表达了文字的各种 feature ,然后这个向量经过了 LLM 的复杂操作,输出一个同样表达各种 feature 的新向量。这就是“理解”的含义。 可以看一下 3blue1brown 相关的科普视频,****几千万次****的播放量: https://www.youtube.com/watch?v=wjZofJX0v4M&list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi&index=7
16#
IndexOutOfBounds
初学
2025-11-24 12:01:27
@meihuanyu88x 这个同感,我自己撸了个玩具模型,过程中问了很多 Why ,依然不敢说有很透彻的了解,不过也正常可解释性目前也还只是研究方向 https://github.com/glidea/tinygpt
17#
ShinichiYao
小成
2025-11-24 12:14:17
你不需要知道大脑是怎么工作的,你只要照着上帝的设计把它通过电路模拟出来就行了
18#
apkapb
小成
2025-11-24 12:18:27
我突然想到: 0-1 是最难的,现在 AI 已经过了 0-1 了,这会导致大量的企业投入巨量资金来研究,以后肯定会越来越好的。
19#
TabGre
小成
2025-11-24 12:18:59
@sillydaddy 地址好像不全
20#
cmdOptionKana
初学
2025-11-24 12:19:27
@ShinichiYao “上帝的设计”是指什么?
下一页 »
1
2
3
4
/ 4 页
下一页
浏览过的版块
酷工作
二手交易
问与答
OpenAI
宽带症候群
返回顶部