随着大数据、人工智能和高性能计算的迅猛发展,在大数据分析、基因测序、芯片设计、数据库和AI训练等“大计算”应用场景中,计算资源需求呈现爆发式增长态势,而传统的计算架构在资源利用率、扩展性、IO性能等方面存在诸多挑战。
为了应对这些挑战,天翼云提出全新的云计算基础设施产品理念——聚合计算,旨在突破物理限制,资源池化分离,聚合异构算力。天翼云聚合计算是由天翼云自主研发的下一代云计算算力基础设施,面向数据库、芯片设计、大数据、AI训练等场景,提供超聚合主机、超大内存主机、内存即服务、池化计算加速四种产品和服务。通过高速总线互联技术,聚合计算不仅继承了传统云主机弹性、高可靠等优势,同时具备内存跨机共享、vCPU“无限”扩展和内存空间热变配等特性,为复杂业务场景提供源源不断的算力。
依托领先的高速总线互联技术,天翼云聚合计算平台通过“分离”与“聚合”两大创新理念,实现了计算资源的高效利用和灵活扩展。其中,在分离方面,传统计算架构中的CPU、内存和存储资源通常紧密耦合在一起,限制了资源的灵活调度和高效利用,并且传统的存算分离只是将磁盘存储从计算节点放到远端,形成存储池,内存仍旧在本地计算节点中。天翼云聚合计算平台在此基础上,将内存也抽离出来,形成独立内存池资源,具有独立的高可用和弹性优势,从而实现了存算分离架构的“最后五公里”。聚合是指天翼云聚合计算平台在资源分离基础上实现了资源的按需组合,用户可以根据具体需求,将CPU、内存和存储资源灵活组合,形成适合特定任务的计算实例。
基于分布式虚拟化、零数据拷贝总线网络、内存池化与共享等创新技术,天翼云聚合计算平台在通算、智算、超算、数据库等多个“大计算”应用场景中展现出强大的优势。
在通算的量化交易场景中,量化交易需要对交易所每支股票的数据进行独立分析、计算、预测,从而生成不同的交易策略。这类计算为非矩阵运算,只能在CPU中进行计算,所以CPU的核数越多,并行处理的股票就越多,随之收益就越高。针对股票不同的投资策略,用户可以通过天翼云超聚合主机自动扩容,充分利用多核算力进行业务加速。
在智算场景中,天翼云超聚合主机可以实现大模型分布式训练业务统一内存视图,以及基于共享内存语义的跨物理主机数据共享。同时,弹性共享内存池可充当存储集群的缓存,减少大量基于网络的数据搬运开销。
在超算场景中,基因测序业务对内存资源的需求量非常大,但是对内存读写时延及带宽资源不敏感。基于此类需求可以利用天翼云超大内存主机带来的大内存、内存池化共享的特性实现业务加速。
在数据库场景中,通过高速总线互联,天翼云超聚合主机可将多台物理机聚合为一个主机实例,特别是针对集中式数据库,可显著降低应用程序在不同物理机节点之间及不同SQL节点间通信的开销,有效提升数据库处理效率,从而满足各种高性能和复杂数据库部署场景需求。
作为云服务国家队,天翼云提出聚合计算理念并推进落地应用,赋能云计算基础设施全面升级。未来,天翼云将以聚合计算为抓手,继续引领云计算产业变革,为客户提供更加高效、灵活的计算服务,使能行业数智化转型升级。