跳过正文

运维

Go 错误处理最佳实践

·1830 字·9 分钟
在运维工具中正确处理错误:错误包装与解包、可重试判断、统一错误输出格式、带上下文的错误信息,避免常见的错误处理反模式

kubectl 命令速查手册

·2472 字·12 分钟
kubectl 实用命令手册,按场景分类整理,涵盖资源查看、Pod调试、日志查看、滚动更新、扩缩容、强制删除等高频操作。

Shell 脚本运维速查手册

·2585 字·13 分钟
Shell 运维速查手册,包含文本处理(awk/sed/grep)、进程排查、网络诊断、批量操作模板,以及实用的脚本编写规范。
如何设计一个好的告警体系

如何设计一个好的告警体系

·570 字·3 分钟
从真实的告警噪音泛滥经历出发,分享如何用 SLI/SLO 重新设计告警体系,包括告警分级、规则设计原则、路由策略和复盘机制。