基于 KUBERNETES 的 容器器 + AI 平台

使用 Kubernetes 对企业最大的挑战是什么? 已经采用了微服务框架的应用,如何快速的迁移到 Kubernetes 上? 在实际生产环境中,如何更好的运维 Kubernetes 集群? Caicloud Compass 深度整合 Kubernetes,为用户提供以多集群、多租户为核心的资源管理能力;降低企业运维成本、时间成本。助力企业搭建功能完备、界面易用、性能卓越的容器平台。
展开查看详情

1.基于 KUBERNETES 的 容器器 + AI 平台 如何助⼒力力企业数字化和智能化转型 xiaoqin@caicloud.io VP of R&D

2.提纲 构建集群与管理理资源 - 73s 视频演示 多集群和镜像仓库 多租户和旧系统的集成 运⾏行行和构建应⽤用 Rudder - 应⽤用编排技术框架 Cyclone - 持续集成与交付引擎 运⾏行行 AI 应⽤用(机器器学习) - 58s 视频演示 Kubeflow 的应⽤用 Kubeflow 之上

3.构建集群与管理理资源

4.

5.多集群和镜像仓库 • 企业想要的 • 隔离性和安全性 • 容错性与混合云 • 功能多样性与上线流程 • 如何实现 • K8s - 单『控制集群』, 多『⽤用户集群』 • 镜像仓库 - 单『默认仓 库』,多仓库集成

6.管理理集群和节点 • 技术概览 • cloud provider • custom resource • ansible

7.管理理镜像仓库 • Cargo (内部项⽬目)- ⽣生产级镜像仓库解决⽅方案,基于 • ⼀一键⾼高可⽤用部署和维护 • 为多租户和复杂权限集成⽽而增强 『token service』 • 管理理基于规则的镜像仓库 • 其他企业需要的优化功能

8. 企业典型的多租户模型 User User group … Namespace Deployment Pod Service k8s objects 租户 Tenant Registry 
 CI/CD Config Application … project workspace group template resources CPU MEM Storage Device (GPU) …. quota quota quota quota quota

9.⽤用户场景 - OPENSTACK 租户集成 • 企业真实场景 - 集成旧系 统,并⾏行行跑业务。 • 资源对照表 • Tenant 与 Project • Namespace 与 Network(Neutron) • Service/Ingress 与 LBaaS(Neutron) • openstack/kuryr- kubernetes

10.运⾏行行和构建应⽤用

11.跑在 KUBERNETES 上的应⽤用 • k8s 基础资源之外 • 资源分组和整体状态 • 重⽤用 YAML 配置 • 版本化 • 启动依赖 • Helm 很棒,但是 …… 典型企业应⽤用的架构

12.CAICLOUD/RUDDER ⼀一套基于 k8s 控制器器模式的原⽣生的应⽤用管理理 和编排运⾏行行时 安全性与扩展性:从 k8s 原⽣生模式中获益 状态可读:跟踪所有 k8s 对象状态 版本化:快速从历史版本回滚 • 2 CRDs - Release, Release History • 1 控制器器 - Rudder aka Release Controller • 开源 • https://github.com/caicloud/rudder • https://github.com/caicloud/canary-release • https://github.com/caicloud/charts • https://github.com/caicloud/helm-registry Rudder 技术架构

13.构建应⽤用 典型 CI/CD 流程

14.CAICLOUD/CYCLONE 云原⽣生 CI/CD 引擎 设计 - 云原⽣生,k8s 亲和性 性能 - 为企业场景优化 扩展性 - ⽀支持 AI ⼯工作流 Cyclone 技术架构 • 开源 • https://github.com/caicloud/cyclone

15.运⾏行行 AI 应⽤用

16.

17.KUBEFLOW 的应⽤用 • Kubeflow 社区的联合创始⼈人 • kubeflow/tf-operator • 定义 TFJob Spec (CRD) • 跟踪 TensorFlow 任务运⾏行行状态 • ⽀支持分布式 TensorFlow 任务

18.KUBEFLOW 之上 • 借⼒力力容器器平台提供⽣生产级的集群资源管理理 • ⼯工作区隔离与共享 • 数据、模型、环境、应⽤用等 • 全⾯面⽀支持 AI ⼯工作流 • 探索开发 • 线上运⾏行行

19. P7 展台 关注并回复 kubecon18