16 条回复  ·  1806 次点击
coefu 初学 2025-9-17 15:35:23
@craftsmanship 保守一点就是做一些 application 到 k8s 里,将一些可以抽象出来的逻辑抽象成 k8s operator 模式。开拓一点的就是将 MLops 里的一些逻辑抽象到 k8s 里,比如当前的 HAMi gpu 虚拟化和 kubeflow ;或者做 LLM 推理的 分布式推理,将分布式推理抽象到 k8s 里,主要是算子??,减少手工干预,标准化;再进步点就是 LLM 分布式训练了,这部分对 LLM 的过程要比较熟悉,起码 LLM from scratch 的原理是掌握的,剩下就是和 MLsys 挂钩了。
HSn0918 初学 2025-9-17 15:37:56
旷视,朋友之前云原生部门工作过,065 不打卡,就偶尔可能有 oncall
coefu 初学 2025-9-17 15:40:28
@craftsmanship 我觉着,厂商和开源社区,还是有区别的。开源社区还是有些事情,可以做的。比如 llama.cpp 目前没有成熟的 跨 machine 的分布式推理方案,这部分和 k8s 结合一下,有点搞头。 厂商一般都是要性能的,vllm+kuberay ,不过有些小厂商可能还没走通这条路。 信创化的进程中,也有点活儿可以搞,部分的硬件还需要对应的软件算子,算子开发了,高效的用起来,也可以和 k8s 结合一波。
qishua 小成 2025-9-17 16:02:52
旷视之前裁员过,裁的校招 or 应届 or 刚进旷视未满一年的新员工等等
oppoic 初学 2025-9-17 16:35:43
这个 n 应该超高,三层楼那么高
mayooot 楼主 初学 2025-9-17 19:05:43
@coefu 是的,目前也是意向旷视了,也能休息一俩周了
Alphasxd 初学 2025-9-17 21:38:28
@HSn0918 甜蜜蜜
12
返回顶部