44 条回复  ·  4761 次点击
paopjian 小成 2025-11-14 10:16:46
除非是本次更新的致命 bug, 优先回退保证使用, 其他情况都重走开发流程 做 bugfix 开发
yhxx 小成 2025-11-14 10:22:32
如果是个普通国内公司,并且你是真的很想要这份工作,建议你直接背: **立刻** 上报安全生产负责人/值班分管领导等,同时判断严重级别,经领导确认后向相关人员(研发、运营、安全、公关、政府事务等)同步 同时分析事故原因,确认影响面,提供止血方案,如回滚、降级、关闭开关等供负责人决策(啥都没有?等死吧 :doge: 但是既然这是面试,就提前准备一下啊,“为了预防这种情况,我领导建设了整套发布流程,遇到故障可 xx 秒内做到 xxxx”) 成立故障响应小组,确认处理方案,定时同步进展、风险、预估恢复时间 问题解决后,等大家休息好,复盘,查原因、补文档、补监控、补测试,避免同类问题再次发生。
nuansediao 小成 2025-11-14 10:31:27
谁好人家晚上还看钉钉阿?
fao931013 初学 2025-11-14 10:40:37
回滚 即答
blackmatch 初学 2025-11-14 10:41:29
公司肯定要有一套执行流程,建议了解一下这方面。 总的原则是:先尽快让业务恢复正常。 一般的流程是:oncall -> 值班人员评估影响 -> 摇人(包括测试、研发等)-> 给出解决方案 -> 执行修复 -> SIT/staging 验证 -> 发版 -> 生产环境验证 -> 输出报告、复盘优化。 如果影响很小,可以第二天处理,按照公司制定的 SOP 流程走。
z327774948 初学 2025-11-14 10:42:10
跟你有啥关系,项目和代码都属于老板,出 bug 也是老板的 bug ,不是你的 bug[dog 狗头保命]
banmuyutian 小成 2025-11-14 10:45:49
问出这种问题的基本都是小作坊。。
mosesyou 初学 2025-11-14 10:47:20
1. 线上故障平时要有 sop 2. 1 分钟发现问题,5 分钟定位问题,10 分钟解决问题;对应做好日志、监控、告警、devops
lifei6671 小成 2025-11-14 10:55:03
@huang86041 互联网公司没有独立运维,开发者本身就兼职运维了。https://i.imgur.com/N9E3iZ2.png
0x663 小成 2025-11-14 10:59:31
看是什么情况,toB 的业务先安抚客户情绪,然后关掉手机睡觉,明天起来把问题抛群里。 公司自营业务的话,问问他们有没有按照规范走流程,先把 BUG 提禅道,然后关掉手机睡觉,明天起来再说。
返回顶部