<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>K8s 完全指南 on vishine</title><link>https://blog.vishine.top/series/k8s-%E5%AE%8C%E5%85%A8%E6%8C%87%E5%8D%97/</link><description>Recent content in K8s 完全指南 on vishine</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Wed, 29 Oct 2025 09:30:00 +0800</lastBuildDate><atom:link href="https://blog.vishine.top/series/k8s-%E5%AE%8C%E5%85%A8%E6%8C%87%E5%8D%97/index.xml" rel="self" type="application/rss+xml"/><item><title>CoreDNS 深度排障：K8s DNS 问题完全指南</title><link>https://blog.vishine.top/posts/coredns-troubleshooting-guide/</link><pubDate>Wed, 29 Oct 2025 09:30:00 +0800</pubDate><guid>https://blog.vishine.top/posts/coredns-troubleshooting-guide/</guid><description>DNS 问题是 K8s 中最难定位的问题之一，因为它的失败往往是间歇性的、有延迟的，看起来像网络问题，实际上是 DNS 超时。本文记录了我在生产环境排查过的多类 DNS 故障，附详细的抓包分析和调优配置。</description></item><item><title>混沌工程实战：Chaos Mesh 在 K8s 中注入故障</title><link>https://blog.vishine.top/posts/chaos-mesh-practice/</link><pubDate>Sat, 13 Sep 2025 09:56:00 +0800</pubDate><guid>https://blog.vishine.top/posts/chaos-mesh-practice/</guid><description>混沌工程不是破坏系统，而是在可控环境中提前暴露脆弱点。本文记录了我用 Chaos Mesh 在生产级 K8s 集群中设计并执行混沌演练的完整过程，包括安装、实验配置、Workflow 编排和游戏日流程设计。</description></item><item><title>OPA/Kyverno：K8s 准入控制策略实战</title><link>https://blog.vishine.top/posts/opa-kyverno-admission-control/</link><pubDate>Thu, 11 Sep 2025 13:36:00 +0800</pubDate><guid>https://blog.vishine.top/posts/opa-kyverno-admission-control/</guid><description>没有准入控制的 K8s 集群就像一个没有门卫的机房——任何人都能随意进出。本文记录了我在多个生产集群部署 Kyverno 策略的实战经验，涵盖资源限制强制、镜像来源白名单、标签规范、以及与 OPA Gatekeeper 的对比选型思路。</description></item><item><title>Kubernetes 成本优化实战：系统性降本的四条路径</title><link>https://blog.vishine.top/posts/k8s-%E6%88%90%E6%9C%AC%E4%BC%98%E5%8C%96%E5%AE%9E%E6%88%98/</link><pubDate>Mon, 18 Aug 2025 13:07:00 +0800</pubDate><guid>https://blog.vishine.top/posts/k8s-%E6%88%90%E6%9C%AC%E4%BC%98%E5%8C%96%E5%AE%9E%E6%88%98/</guid><description>真实的降本案例：从发现成本异常到分析根因，通过 Karpenter 节点弹性伸缩、资源请求规格治理、大机型收敛等手段，系统性降低 AWS EC2 成本。包含具体配置和执行思路。</description></item><item><title>Kubernetes NetworkPolicy 网络隔离实战</title><link>https://blog.vishine.top/posts/kubernetes-network-policy/</link><pubDate>Sun, 15 Jun 2025 09:00:00 +0800</pubDate><guid>https://blog.vishine.top/posts/kubernetes-network-policy/</guid><description>系统讲解 Kubernetes NetworkPolicy 的工作机制与生产实战配置，覆盖 deny-all 基础模板、常见隔离场景、Cilium 扩展、多租户设计、测试验证方法及常见陷阱。</description></item><item><title>Helm 工程化实践：从 Chart 设计到多环境管理</title><link>https://blog.vishine.top/posts/helm-engineering-practice/</link><pubDate>Sat, 14 Jun 2025 10:20:00 +0800</pubDate><guid>https://blog.vishine.top/posts/helm-engineering-practice/</guid><description>基于生产踩坑经验，系统梳理 Helm Chart 结构设计、_helpers.tpl 复用技巧、多环境 values 管理策略、私有 Harbor 仓库推送流程，以及 --atomic 升级与回滚的正确姿势。</description></item><item><title>Karpenter 深度解析：下一代 K8s 节点自动扩缩</title><link>https://blog.vishine.top/posts/karpenter-deep-dive/</link><pubDate>Wed, 11 Jun 2025 11:33:00 +0800</pubDate><guid>https://blog.vishine.top/posts/karpenter-deep-dive/</guid><description>从 Cluster Autoscaler 迁移到 Karpenter 之后，集群扩容速度和节点利用率都有明显提升。本文详细拆解 Karpenter 的核心机制、关键配置项，以及在多套生产集群运行中踩过的坑。</description></item><item><title>Istio Service Mesh 落地实战：从 Sidecar 注入到灰度发布</title><link>https://blog.vishine.top/posts/istio-service-mesh-practice/</link><pubDate>Fri, 06 Jun 2025 12:06:00 +0800</pubDate><guid>https://blog.vishine.top/posts/istio-service-mesh-practice/</guid><description>记录 Istio Service Mesh 从零落地的完整过程，包括 sidecar 注入原理、VirtualService 灰度发布流量切分、DestinationRule 熔断与负载均衡配置、PeerAuthentication mTLS 加固，以及用 istioctl analyze 排查常见问题。</description></item><item><title>Kubernetes 集群升级策略：零停机升级的完整实践指南</title><link>https://blog.vishine.top/posts/kubernetes-upgrade-strategy/</link><pubDate>Wed, 14 May 2025 09:56:00 +0800</pubDate><guid>https://blog.vishine.top/posts/kubernetes-upgrade-strategy/</guid><description>K8s 集群升级听起来简单，实际操作中坑很多：API 弃用导致的 Helm 失败、Admission Webhook 拦截升级流量、PDB 配置不当导致服务中断。这篇文章从真实的升级经验出发，给出一套可复用的零停机升级方案。</description></item><item><title>K8s Gateway API：告别 Ingress，拥抱下一代流量路由</title><link>https://blog.vishine.top/posts/kubernetes-gateway-api/</link><pubDate>Mon, 12 May 2025 13:36:00 +0800</pubDate><guid>https://blog.vishine.top/posts/kubernetes-gateway-api/</guid><description>Gateway API 已经 GA，是时候认真考虑从 Ingress 迁移了。本文梳理 Gateway API 的设计理念、实际配置示例和迁移注意事项。</description></item><item><title>Kubernetes 存储体系生产实践：PV/PVC/StorageClass 全解</title><link>https://blog.vishine.top/posts/kubernetes-storage-practice/</link><pubDate>Tue, 06 May 2025 13:50:00 +0800</pubDate><guid>https://blog.vishine.top/posts/kubernetes-storage-practice/</guid><description>从存储基础概念到生产实战，覆盖 StorageClass 动态供给配置、AWS EBS 和 EFS CSI 驱动安装、StatefulSet 存储管理、PVC 在线扩容操作、跨 AZ 挂载失败排查，以及有状态服务数据迁移方案。</description></item><item><title>ETCD 运维实战：部署、备份恢复与 K8s 集群数据管理</title><link>https://blog.vishine.top/posts/etcd-ops-practice/</link><pubDate>Sun, 13 Apr 2025 13:37:00 +0800</pubDate><guid>https://blog.vishine.top/posts/etcd-ops-practice/</guid><description>ETCD 是 Kubernetes 的命脉，所有集群状态都存储在这里。本文从实际运维角度梳理部署、备份、恢复和配置动态更新的完整操作链路，包含多个踩坑经验。</description></item><item><title>Kubernetes 日志采集方案选型：从技术对比到生产落地</title><link>https://blog.vishine.top/posts/k8s-logging-solution/</link><pubDate>Tue, 25 Feb 2025 11:01:00 +0800</pubDate><guid>https://blog.vishine.top/posts/k8s-logging-solution/</guid><description>记录我们团队从无到有建立 Kubernetes 日志采集系统的完整历程，最终选择 Fluent Bit + Fluentd + Elasticsearch 方案的技术依据，以及生产环境踩过的那些坑。</description></item><item><title>Kubernetes RBAC 安全加固实战：最小权限到 NetworkPolicy</title><link>https://blog.vishine.top/posts/kubernetes-rbac-security/</link><pubDate>Fri, 24 Jan 2025 12:36:00 +0800</pubDate><guid>https://blog.vishine.top/posts/kubernetes-rbac-security/</guid><description>从真实安全事件出发，系统讲解 Kubernetes RBAC 最小权限设计、ClusterRole 与 Role 的适用场景、审计日志分析 RBAC 问题的方法，以及 NetworkPolicy 实现命名空间和 Pod 级别的网络隔离。</description></item><item><title>Kubernetes YAML 工程化：常用资源模板与生产最佳实践</title><link>https://blog.vishine.top/posts/kubernetes-yaml-patterns/</link><pubDate>Sun, 19 Jan 2025 09:56:00 +0800</pubDate><guid>https://blog.vishine.top/posts/kubernetes-yaml-patterns/</guid><description>写好 Kubernetes YAML 不只是语法问题，更多是工程经验的沉淀。本文梳理了生产环境中常见的 YAML 反模式，并给出各类资源的完整可用模板。</description></item><item><title>Kubernetes 资源管理实战——QoS、ResourceQuota、VPA 体系化实践</title><link>https://blog.vishine.top/posts/kubernetes-resource-management/</link><pubDate>Thu, 16 Jan 2025 13:36:00 +0800</pubDate><guid>https://blog.vishine.top/posts/kubernetes-resource-management/</guid><description>我在生产中见过太多因为资源配置不当导致的事故：不设 limits 的服务把节点内存吃光导致 OOM 驱逐、requests 设得过高导致 Pod 调度不上去、HPA 配置错误导致扩缩失灵。这篇文章把 K8s 资源管理体系从头到尾捋一遍，让你建立完整的资源治理思路。</description></item><item><title>Kubernetes 网络深度解析——CNI、kube-proxy、NetworkPolicy 完全指南</title><link>https://blog.vishine.top/posts/kubernetes-networking-deep-dive/</link><pubDate>Fri, 10 Jan 2025 13:50:00 +0800</pubDate><guid>https://blog.vishine.top/posts/kubernetes-networking-deep-dive/</guid><description>K8s 网络是很多工程师的知识盲区，平时不出问题就忽略，一出问题就完全不知道从哪下手。我在多次生产网络故障的排查中，深刻理解了 K8s 网络的每一层。这篇文章从 Pod 网络模型讲到 NetworkPolicy 实战，帮你建立完整的 K8s 网络知识体系。</description></item><item><title>Kubernetes 从零开始：工程师视角的入门指南</title><link>https://blog.vishine.top/posts/kubernetes-beginner-guide/</link><pubDate>Sun, 20 Oct 2024 09:17:00 +0800</pubDate><guid>https://blog.vishine.top/posts/kubernetes-beginner-guide/</guid><description>Docker Compose 能运行多个容器，为什么还需要 Kubernetes？本文从这个问题出发，用类比的方式讲清楚 Pod/Deployment/Service/Ingress 等核心概念，给出最常用的 kubectl 命令和完整的入门部署示例。</description></item></channel></rss>