InfoQ 推荐 ( ) • 2024-04-19 17:39

4月18日,2024九章云极DataCanvas智算操作系统新品发布会于北京召开,全新产品DATACANVAS AIDC OS智算操作系统(以下简称AIDC OS)正式官宣。这款智算系统也成为了九章云极DataCanvas公司在“算法+算力”一体化AI服务战略旅程上全新的实践里程碑。

AIGC时代,底层计算有多重要?

发布会上,九章云极DataCanvas公司董事长方磊深度剖析大模型影响下的计算世界的新方向和新机遇,揭示了当前底层计算变革的重要性和复杂性,并展望软件与硬件共同演进的相互影响和创新空间。他指出,软件定义算力的时代即将到来,AIDC OS智算操作系统在这场变革中将起到关键作用。

 九章云极DataCanvas公司董事长方磊

 

当前,新一轮的底层计算变革正由大模型的崛起而引发。底层计算从来都是软件与硬件协同的结果,软件和硬件的紧密协作显得尤为重要,也各自迎来全新的机遇与挑战。

 

回顾计算世界的演变历程,一条共性的客观规律显而易见:硬件始终以满足最终计算需求为导向不断演进,而软件则以操作系统的形态作为桥梁,将硬件与应用无缝衔接。在这场变革中,随着硬件技术的不断发展和同质化趋势的加剧,软件的创新空间变得愈发广阔,其在变革中所扮演的角色也愈发重要。

 

在这一大背景下,AIFS人工智能基础软件孕育出了巨大的发展机会,AIDC OS智算系统也借着这股东风应运而生。

 

与传统服务于硬件的资源管理驱动不同,AIDC OS智算系统以AI使用能力为驱动。它不仅关注硬件资源的有效管理和利用,更着眼于如何更好地满足终端用户对算力的核心需求:通过智能调度和优化配置,AIDC OS致力于将可用的、好用的、经济的算力提供给使用者。

五大核心价值,链接底层硬件和大模型应用层

九章云极DataCanvas公司联合创始人暨CTO尚明栋正式发布DATACANVAS AIDC OS智算操作系统,他介绍,AIDC OS智算操作系统在智算中心产业生态中处于中间位置,在底层硬件芯片和上层大模型之间建立了高效的链接。

 

AIDC OS能够向下协同大规模GPU算力,确保硬件资源得到有效利用和高效管理;同时,向上提供完整的大模型工具链,为大模型训练和推理以及大模型应用提供便捷、高效的开发环境,满足复杂AI任务的需求。

 

直击异构算力资源纳管困难、算力调度能力不足且利用率低、AI加速优化能力不足以及AI大模型训练微调门槛高等行业痛点,AIDC OS在设计前期构建了告别“裸金属”、为AI而生、全局加速优化、异构算力纳管与调度和1度算力五大价值基核,并以此为根基设计产品功能。发布会上,尚明栋先生从核心价值出发,详细介绍了AIDC OS的亮点功能和性能。

 

告别“裸金属”

通过构建多层次、全方位的算力需求满足机制,包含超级智算集群、弹性容器集群、GPU云服务器、AI容器实例等系列产品,为精准匹配和满足多样化规模及复杂度的算力需求提供保障。

为AI而生

专注于人工智能核心任务,包括大模型的训练、微调、部署和推理等服务。提供集“算力、数据、算法、调度”为一体的融合服务,旨在推动人工智能产业化的创新发展。

全局加速优化

实现并行加速、编译优化、内核加速、算法加速、内存优化、通信加速等六大加速,释放硬件效能。集群训练效率提升100%,单卡利用率提升50%;模型推理速度提高4倍,Token吞吐量增加5倍。

异构算力纳管与调度

提供包含国内外多种算力资源的适配、纳管、调度和优化。通过实时监控和管理各智算中心的智算设备,以及创新的调度算法,成功实现跨智算中心的海量算力智能调度,大幅提升算力资源的利用率。

1度算力

DATACANVAS AIDC OS从用户视角出发,首次提出了统一的算力服务计量单位“度”(DCU),并用其实现标准化的算力计量计费,旨在为用户实现“买到即用到”的算力服务,为未来算力资源互联互通打下良性商业基础。