flink on yarn 和 flink on Kubernetes 的优缺点是?

2020-05-06 09:15发布

3条回答
汽水味的小盆友
2021-09-29 18:17

首先是以一个 Kubernetes 非内核开发人员的角度去探讨其和 YARN 之间的关系。众所周知,Apache Hadoop YARN 可能是在国内用途最广的一个调度系统,主要原因在于 Hadoop HDFS 在国内或者是在整个大数据业界,是一个使用最广泛的存储系统。因此,基于其上的 YARN 也自然而然成为了一个广为使用的一个调度系统,包括早期的 Hadoop MapReduce。随着 YARN 2.0 之后 Framework 的开放,Spark on YARN 以及 Flink on YARN 也可以在 YARN 上进行调度。


当然 YARN 本身也存在一定的局限性。


  • 如资源隔离,因为 YARN 是以 Java 为基础开发的,所以它很多资源方面的隔离有一些受限。

  • 另外对 GPU 支持不够,当然现在的 YARN 3.0 已经对 GPU 的调度和管理有一定支持,但之前版本对 GPU 支持不是很好。


所以在 Apache 基金会之外,CNCF 基金会基于 Native Cloud 调度的 Kubernetes 出现了。


从开发人员角度来看,我认为 Kubernetes 是更像一个操作系统,可以做非常多的事情。当然这也意味着 Kubernetes 更复杂、学习曲线比较陡峭,你需要理解很多定义和概念。相比之下,YARN 主要管理资源调度部分,对整个操作系统而言,它体量要小很多。当然,不可置否,它也是一个大数据生态的先驱。


一周热门 更多>