16 条回复  ·  1767 次点击
evegod 楼主 初学 2025-12-19 00:43:21
@Pig930 您好,还没有 paper ,在升级版本到新的更大数据集上训练看效果中,下个版本也会开源给大家看,新的版本会写 paper 和相关日志给大家参考。
evegod 楼主 初学 2025-12-19 00:48:07
@Xs0ul 这是我个人开源项目哦,至少本地化可运行,挺有参考意义的,代码是完全开源的,里面算法基本是显示使用的,你可以用 gemini 或者 gpt 看一下代码数学逻辑构成,大致正确,但是现在 gemini 针对其的调参方向是错的建议。这算是面向 Gemini 编程的我的一个里程碑。我从本科计算机专业毕业都 12 年没有写代码了,ps 上学时也没咋写过代码,代码都是跑的 matlab ,我也挺高兴现在有这样好的工具能学习帮助我编程跑通程序训练,挺好玩的。
Xs0ul 初学 2025-12-19 00:54:29
看了你的 code 还有之前的帖子,你代码里只提到了 loss 下降,但这并不能说明模型有效,你至少得有些别的验证,比如 exact match ,edit distance ,perplexity 这些最基础的 metrics
evegod 楼主 初学 2025-12-19 01:12:54
@Xs0ul 您好,这个项目本身现在看来有些像一个内核程序雏形,下一步的计划不是用它来做静态 ai 训练,目标是用它做即时运算和自持型 ai 的核心程序,有新版本和新东西做完了会和大家好好说的。计划时间不会太长,大概一周时间吧。
WuSiYu 小成 2025-12-19 01:48:35
@evegod 有探索精神自己动手实践是好的,不过做学术不是这么搞的,AI 领域一天的新论文都有几百几千篇,你不能指望别人主动去花时间复现一个甚至还不完整的工作,还是先等你至少能放出一些效果或者评测结论后再说吧
evegod 楼主 初学 2025-12-19 03:56:30
@WuSiYu 好的啊,有好的结果和你说。
c0xt30a 小成 2025-12-19 08:57:10
都四维时空干涉了,OP 先写一下波函数吧。
12
返回顶部