业务100%云化,中间件全面升级到公共云架构
作者:中间件支持集团上云技术小组
校对&审核:望宸
2019年,阿里巴巴100%的核心系统运行在阿里云上;
2021年,阿里巴巴100%的业务都运行在阿里云上。
阿里巴巴,已经成为全球首家,将所有业务都放在自家公共云上的大型科技公司。
举全集团之力,将业务全部迁移至公共云,不仅是对云和科技的笃定,也证明了阿里云有能力应对高难度、超复杂环境下的技术挑战,为客户享受云上技术红利提供了更坚实的实践保障。
架构一致性,开源、自研、商业化三位可一体
在今年的天猫双十一中,中间件支撑了5403亿的交易量,并全面升级到了公共云架构。
此次的架构升级,是以开源为内核、以公共云为基础、以 OpenAPI 进行解偶扩展,在架构上,对开源、自研、商业化进行统一。通过采用和反哺开源、推动社区建设,通过阿里巴巴丰富的业务场景、打磨技术的性能和可用性,通过云上商业化服务更多企业、打造更好的用户体验,全方位锤炼云上产品的竞争力。这个过程中,阿里巴巴业务的研发效率提升了20%,CPU资源利用率提升了30%,应用100%云原生化,在线业务容器可达百万规模,计算效率大幅提升,双11计算成本下降30%。
接下去,我们将全方位揭秘业务100%云化过程中,后端 BaaS 化,运行时 Mesh 化,业务侧 Serverless 化的全过程。
中间件后端 BaaS 化,有状态应用也可分钟级交付
以往的双十一建站交付都是线性的。先交付 IaaS 资源,然后再交付中间件,最后在交付业务。
今年,中间件升级到公共云架构后,IaaS 资源和中间件同步交付,节省了两者串行交付的时间。中间件公共云架构运维底座全部切到 K8s 上,让有状态的中间件也能做到极致弹性,使得中间件的交付效率从天级别,降低到了分钟级,极大地提升了交付效率,降低了资源保有时间和资源成本。
后端的支撑系统也全面升级,如通过对接阿里云账号权限体系,来解决安全问题;通过对接计量计费体系,来解决 IT 资产数字化问题,为集团各个技术团队的经营者可以通过账单形式,可视化的进行成本优化。
在用户界面上,也升级支持了 IPv6,为阿里巴巴生产网全面向 IPv6 架构演进,做好了准备。
海外业务 Mesh 化,异地多活可下沉 Sidecar
阿里巴巴海外有 AE&Lazada 等多种业务形态,异地多活体系侵入性大,技术架构不统一,从而影响了全局高可用和研发协同效率。
随着服务网格架构的演进和成熟,我们逐步将服务路由标准化,路由功能层次化,通过插件模式让业务进行扩展,让异地多活体系下沉到 Sidecar,和业务逻辑解偶,探索异地多活通用、无侵入、低成本的解决方案。今年,这套体系在海外业务得到了充分验证,为未来商业化积累了实践经验。
随着 Mesh 化服务架构的深度应用,除了异地多活功能下沉 Sidecar,阿里巴巴还基于 Mesh 化架构,统一了流量调度技术与产品架构,降低了流量调度实施和治理成本,提升服务容灾能力和线上服务治理效率,实现了更加灵活和稳定的调度规则下发,及单元间切流。
业务侧 Serverless 化,实现研发提效 38%,弹性提升 200%
Serverless 是集团降本提效的首选技术方案。
今年双11,Serverless 不仅成功承载了3 倍的峰值流量 ,应用场景上也拓宽了 2 倍,整体研发运维体系提升 38%,主要表现在以下两个关键点上。
1. 夯实三位一体技术体系,使用阿里云函数计算 FC 支撑大促全面 Serverless 化
函数计算 FC 与阿里内部的运维体系,实现全面标准化对接,打通研发的最后一公里。首次实现了业务全链路“ FaaS + BaaS ”的 Serverless 全流程研发体系。
在函数计算进入集团之前,云上的 Serverless 技术体系一直无法融入到开发者生态,虽然功能丰富、强大,但是无法被业务使用,甚至出现了使用 Serverless 技术后,研发成本反而增高的情况。所以,我们在 2021 年,发力 Serverless-Devs 工具链,基于标准的接口与集团内部的技术社区,共同打造了专属于 Serverless 的研发体系,把云上的技术巧妙的融入到了集团。
我们通过双 11 大促场景作为“磨刀石”,把关键的核心技术进行进一步打磨,然后反哺给云上的商业化产品和工具链,夯实三位一体的技术体系,今年交出了满意的答卷,全面支撑 2021 天猫 双 11 各类业务场景,覆盖淘特、淘系、阿里妈妈、1688、高德和飞猪等多类业务场景,数量提升 2 倍,峰值流量总数同比增加 3 倍,实现了 百万 QPS 的突破,整体研发提效达到 38%。