实时平台如何管理多个 Flink 版本?(上)

为啥会出现多个版本?

  • Flink 社区本身迭代速度非常快,目前阿里云有一大波的人专职做 Flink 开源,另外还拥有活跃的社区贡献者,所以功能开发较快,bug 修复速度较快,几乎每 4 个月一个大版本,每个大版本之间迭代的功能非常多,代码变动非常大,API 接口变动也大,动不动就干翻自己了。

  • 社区迭代快就快呗,为什么公司也要要不断跟着社区鼻子走?社区迭代快意味着功能多,修复的 bug 多,相对于早期版本意味着稳定性也高些。除了国内一二线公司有特别多的专职人去负责这块,大多数中小公司最简单最快捷体验到稳定性最高、功能性最多、性能最好的 Flink 版本无非是直接使用最新的 Flink 版本。举个例子:Flink SQL 从最早期(1.9)的功能、性能到目前 1.14,差别真的大很多,优化了特别多的地方,增强了很多功能。原先使用 Flink SQL 完成一个流处理任务非常麻烦,还不如直接写几十行代码来的快,目前我情愿写 SQL 去处理一个流任务。那么自然会跟着升级到新版本。

  • 用户 A 问 Flink SQL 支持单独设置并行度吗?用户 B 问实时平台现在支持 Flink 1.13 版本的 Window TVF?这个要 Flink xxx 版本才能支持,要不你升级一下 Flink 版本到 xxx?这样就能支持了,类似的场景还有很多,对于中小公司的实时平台负责人来说,这无非最省事

你可能感兴趣的:(大数据实时计算引擎,Flink,实战与性能优化,java,python,大数据,人工智能,数据库)