|
|
coefu
初学
2025-9-17 15:35:23
|
@craftsmanship 保守一点就是做一些 application 到 k8s 里,将一些可以抽象出来的逻辑抽象成 k8s operator 模式。开拓一点的就是将 MLops 里的一些逻辑抽象到 k8s 里,比如当前的 HAMi gpu 虚拟化和 kubeflow ;或者做 LLM 推理的 分布式推理,将分布式推理抽象到 k8s 里,主要是算子??,减少手工干预,标准化;再进步点就是 LLM 分布式训练了,这部分对 LLM 的过程要比较熟悉,起码 LLM from scratch 的原理是掌握的,剩下就是和 MLsys 挂钩了。 |
|