Kubernetes 博客

Kubernetes v1.36 抢先一览

借由 Chad Crowell, Kirti Goyal, Sophia Ugochukwu, Swathi Rao, Utkarsh Umre | 2026.03.30 在博客

Kubernetes v1.36 将于 2026 年 4 月底发布。本次发布将包含移除和弃用项，并带来数量可观的增强功能。以下是我们在这个发布周期中最期待的一些特性。请注意，本文信息反映的是 v1.36 开发的当前状态，发布前仍可能发生变化。 Kubernetes API 的移除与弃用流程 Kubernetes 项目针对功能有一套文档完善的弃用策略。该策略规定，稳定版 API 只有在有新的稳定替代版本时才会被弃用，并且 API 在每个稳定级别都有最短生命周期。被弃用的 API 会被标 …

更多

Ingress2Gateway 1.0 正式发布：通往 Gateway API 的途径

借由 Beka Modebadze (Google), Steven Jin (Microsoft) | 2026.03.20 在博客

随着 Ingress-NGINX 计划于 2026 年 3 月正式退役，Kubernetes 网络图景正处于一个转折点。对于大多数组织而言，问题不在于是否迁移到 Gateway API，而在于如何安全地完成迁移。从 Ingress 迁移到 Gateway API 是 API 设计的根本性转变。 Gateway API 提供了一个模块化、可扩展的 API，并对 Kubernetes 原生的基于角色的访问控制（RBAC）提供了强大的支持。相反，Ingress API 较为简单， …

更多

在 Kubernetes 上使用 Agent Sandbox 运行智能体

借由 Janet Kuo Justin Santa Barbara | 2026.03.20 在博客

人工智能领域正经历着一场巨大的架构变革。在生成式人工智能的早期，与模型交互通常被视为一个瞬态的、无状态的函数调用：一个启动、执行可能仅 50 毫秒便终止的请求。如今，人工智能 2.0 正在取代人工智能 1.0。人工智能生态系统正从短暂、孤立的任务转向部署多个持续运行的、协同工作的 AI 智能体。这些自主智能体需要维护上下文信息、使用外部工具、编写和执行代码，并在较长时间内相互通信。当平台工程团队寻找合适的架构来托管这些新型 AI 工作负载时， Kubernetes 脱颖而出，成为自然 …

更多

宣布成立 AI 网关工作组

借由 Keith Mattix, Nir Rozenbaum, Morgan Foster, Flynn | 2026.03.09 在博客

Kubernetes 社区包含多个特别兴趣小组（SIG）和工作组（WG），旨在促进相关贡献者之间就重要议题展开讨论。今天，我们很高兴地宣布成立 AI 网关工作组，这是一项专注于为 Kubernetes 环境中支持 AI 工作负载的网络基础设施制定标准和最佳实践的新举措。什么是 AI 网关？在 Kubernetes 环境中，AI 网关指的是网络网关基础设施（包括代理服务器、负载均衡器等），它通常实现 Gateway API 规范，并针对 AI 工作负载提供增强功能。 AI 网关并非定 …

更多

节点就绪控制器简介

借由 Ajay Sundar Karuppasamy (Google) | 2026.02.03 在博客

在标准的 Kubernetes 模型中，节点是否适合运行工作负载取决于一个简单的“就绪”状态。然而，在现代 Kubernetes 环境中，节点需要复杂的底层架构依赖项（例如网络代理、存储驱动程序、GPU 固件或自定义健康检查）才能完全运行，从而可靠地托管 Pod。今天，我代表 Kubernetes 项目宣布推出节点就绪控制器。该项目引入了一个声明式系统来管理节点污点，从而在节点启动过程中扩展了就绪保护机制，使其超越了标准条件。通过基于自定义健康信号动态管理污点，该控制器确保工作负载仅 …

更多

Ingress NGINX：Kubernetes 指导委员会和安全响应委员会的声明

借由 Kat Cosgrove（指导委员会） | 2026.01.29 在博客

Kubernetes 将于 2026 年 3 月停止维护 Ingress NGINX，该基础设施是大约一半云原生环境的关键组成部分。 Ingress NGINX 的停止维护计划已于 2026 年 3 月正式宣布，此前多年来， Kubernetes 一直公开警告该项目急需贡献者和维护者。项目停止维护后，将不再发布任何错误修复、安全补丁或任何类型的更新。此事不能被忽视、敷衍了事，更不能拖延到最后一刻才处理。我们再怎么强调这种情况的严重性，以及立即开始迁移到替代方案（例如 Gateway …

更多

Headlamp 2025 年度项目亮点

借由 Evangelos Skopelitis (Microsoft) | 2026.01.22 在博客

本公告是对最初在 Headlamp 博客上发布的帖子的回顾。 Headlamp 在 2025 年取得了长足的发展。该项目持续成长，覆盖了更多平台和团队；通过插件机制支持了新的工作流和集成方式；同时也看到了来自更广泛社区的协作不断增强。我们想借此机会分享一些最新进展，并重点介绍 Headlamp 在过去一年中的演进与变化。更新加入 Kubernetes SIG UI 今年标志着该项目的一个重要里程碑：Headlamp 现已成为 Kubernetes SIG UI 的正式组成部分。此举使路 …

更多

宣布成立 Checkpoint/Restore 工作组

借由 Radostin Stoyanov, Viktória Spišaková, Adrian Reber, Peter Hunt | 2026.01.21 在博客

Kubernetes 社区包含多个特别兴趣小组（SIG）和工作组（WG），旨在促进感兴趣的贡献者之间就重要议题展开讨论。今天，我们宣布成立新的 Kubernetes Checkpoint Restore WG，专注于将 Checkpoint/Restore 功能集成到 Kubernetes 中。动机和应用场景工作组讨论了以下几个高层次的应用场景：优化交互式工作负载（例如 Jupyter Notebook 和 AI 聊天机器人）的资源利用率加速初始化时间较长的应用程序启动， …

更多

Kubernetes v1.35：扩展容忍度运算符以支持数值比较（Alpha）

借由 Heba Elayoty (Microsoft) | 2026.01.05 在博客

许多生产级 Kubernetes 集群会混合使用按需（on-demand，高 SLA）节点与 spot/可抢占（preemptible，低 SLA）节点，以在保证关键工作负载可靠性的同时优化成本。平台团队需要一个“安全默认值”，让大多数工作负载远离风险容量，同时又允许特定工作负载用明确阈值显式选择接受（opt-in），例如“我可以容忍失败概率最高 5% 的节点”。目前，Kubernetes 的污点与容忍度（taints and tolerations）可以匹配精确值或检查键是否存在，但 …

更多

Kubernetes v1.35: 通过就地重启 Pod 实现更高的效率

借由 Yuan Wang Giuseppe Tinti Tomio Sergey Kanzhelev | 2026.01.05 在博客

Kubernetes 1.35 版本引入了一项强大的新特性，满足了用户对 Pod 就地重启的迫切需求。这项名为“重启所有容器”（Restart All Containers，1.35 版本为 Alpha 版）的特性，相比于资源用量较高的删除并重建整个 Pod 的方式，能够更高效地重置 Pod 的状态。该特性对于 AI/ML 工作负载尤为实用，使应用程序开发人员能够专注于核心训练逻辑，同时将复杂的故障处理和恢复机制交给边车容器和声明式 Kubernetes 配置来处理。 …

更多

张贴在 2026