#K8s

LINUX 云原生 K8S KUBELET 服务无法启动报 CODE=EXITED, STATUS=1/FAILURE错误 多种原因及解决

出现这种问题的原因有多种,如果status=255且反复重启动则是正常的,配置并创建pod后就好了。如果是status=1/FAILURE则可能是以下几种问题具体如下1.证书过期导致kubelet无法正常起动。可以参考:k8skubelet服务无法启动报code=exited,status=1/FAILURE错误_世宝...

从零开始入门 K8s | GPU 管理和 Device Plugin 工作机制

本文整理自《CNCFxAlibaba云原生技术公开课》第20 讲。/导读:2016年,随着AlphaGo的走红和TensorFlow项目的异军突起,一场名为AI的技术革命迅速从学术圈蔓延到了工业界,所谓 AI革命从此拉开了帷幕。该热潮的背后推手正是云计算的普及和算力的巨大提升。经过近几年的发展,AI...

从零开始入门 K8s | 调度器的调度流程和算法介绍

/导读:Kubernetes作为当下最流行的容器自动化运维平台,以声明式实现了灵活的容器编排,本文以v1.16版本为基础详细介绍了K8s的基本调度框架、流程,以及主要的过滤器、Score算法实现等,并介绍了两种方式用于实现自定义调度能力。Kubernetes作为当下最主流的容器自动化运维平台,作为K8s的容器编排的核心...

从零开始入门 K8s | Kubernetes 调度和资源管理

首先来看第一部分-Kubernetes的调度过程。如下图所示,画了一个很简单的Kubernetes集群架构,它包括了一个kube-ApiServer,一组Web-hookControllers,以及一个默认的调度器kube-Scheduler,还有两台物理机节点Node1和Node2,分别在上面部署了两个kubelet...

嗖的一下!只要一条命令,K8s监控数据一键写入时序数据库

/这里的“快速”有多快呢?一条命令就能搞定!本文就介绍如何使用helm一键完成k8s监控数据到阿里云InfluxDB®的存储链路。对于helm的安装和使用,网上有很多资料,这里不赘述。有一点需要注意,虽然近期helm3已经发布,但短期内不是所有的helmchart都兼容helm3,比如社区的这个issue。本文依然使用...

从零开始入门 K8s | etcd 性能优化实践

本文整理自《CNCFxAlibaba云原生技术公开课》第17讲。/导读:etcd是容器云平台用于存储关键元信息的组件。阿里巴巴使用etcd已经有3年的历史,在今年双11过程中它又一次承担了关键角色,接受了双11大压力的检验。本文作者从etcd性能背景出发,带领我们了解了 etcdserver端性能优化及etc...

从零开始入门 K8s | 手把手带你理解 etcd

本文整理自《CNCFxAlibaba云原生技术公开课》第16讲。/导读:etcd 是用于共享配置和服务发现的分布式、一致性的KV存储系统。本文从etcd项目发展所经历的几个重要时刻开始,为大家介绍了etcd的总体架构及其设计中的基本原理。希望能够帮助大家更好的理解和使用etcd。etcd诞生于CoreOS公司...

K8s 集群节点在线率达到 99.9% 以上,扩容效率提升 50%,我们做了这 3 个深度改造

 点击下载《不一样的双11技术:阿里巴巴经济体云原生实践》本文节选自《不一样的双11技术:阿里巴巴经济体云原生实践》一书,点击上方链接即可下载!/导读:2019年阿里巴巴核心系统100%以云原生方式上云,完美地支撑了双11大促。这次上云的姿势很不一般,不仅是拥抱了Kubernetes,而且还以拥抱Kubern...

云原生生态周报 Vol. 12 | K8s 1.16 API 重大变更

1 K8s1.16将废弃一系列旧的API版本:影响面涉及NetworkPolicy、PodSecurityPolicy、DaemonSet,Deployment,StatefulSet,andReplicaSet和Ingress。请各位K8s用户和开发者关注。相关API都是进行了迁移如下:NetworkPol...

寻找 K8s 1.14 Release 里的“蚌中之珠”

/摘要: K8s1.14发布了,ReleaseNote那么长,我们该从何读起?本文由张磊、心贵、临石、徙远、衷源、浔鸣等同学联合撰写。Kubernetes1.14.0Release已经于3月25日正式发布。相信你也已经注意到,相比于1.13和1.12版本,这次发布包含的重要变更非常多,其对应的ReleaseN...

从零开始入门 K8s | 可观测性:你的应用健康吗?

首先来看一下,整个需求的来源:当把应用迁移到Kubernetes之后,要如何去保障应用的健康与稳定呢?其实很简单,可以从两个方面来进行增强:首先是提高应用的可观测性;第二是提高应用的可恢复能力。从可观测性上来讲,可以在三个方面来去做增强:首先是应用的健康状态上面,可以实时地进行观测;第二个是可以获取应用的资源使用情况;...

从零开始入门 K8s | 应用存储和持久化数据卷:存储快照与拓扑调度

存储快照产生背景在使用存储时,为了提高数据操作的容错性,我们通常有需要对线上数据进行snapshot,以及能快速restore的能力。另外,当需要对线上数据进行快速的复制以及迁移等动作,如进行环境的复制、数据开发等功能时,都可以通过存储快照来满足需求,而K8s中通过CSISnapshottercontroller来实现...

从零开始入门 K8s | 应用存储和持久化数据卷:核心知识

PodVolumes首先来看一下PodVolumes的使用场景:场景一:如果pod中的某一个容器在运行时异常退出,被kubelet重新拉起之后,如何保证之前容器产生的重要数据没有丢失?场景二:如果同一个pod中的多个容器想要共享数据,应该如何去做?以上两个场景,其实都可以借助Volumes来很好地解决,接下来首先看一下...

超大规模商用 K8s 场景下,阿里巴巴如何动态解决容器资源的按需分配问题?

/导读:资源利用率一直是很多平台管理和研发人员关心的话题。本文作者通过阿里巴巴容器平台团队在这一领域的工作实践,整理出了一套资源利用提升的方案,希望能够带给大家带来一些讨论和思考。不知道大家有没有过这样的经历:当我们拥有了一套Kubernetes集群,然后开始部署应用的时候,我们应该给容器分配多少资源呢?这很难说。由于...

K8s 从懵圈到熟练 – 镜像拉取这件小事

/导读:相比K8s集群的其他功能,私有镜像的自动拉取,看起来可能是比较简单的。而镜像拉取失败,大多数情况下都和权限有关。所以,在处理相关问题的时候,我们往往会轻松的说:这问题很简单,肯定是权限问题。但实际的情况是,我们经常为一个问题,花了多个人的时间却找不到原因。这主要还是我们对镜像拉取,特别是私有镜像自动拉取的原理理...
首页上一页12345...下一页尾页