日前,第十五届全国高性能计算学术年会在内蒙古呼和浩特召开,本次活动由中国计算机学会主办,华为云HPC解决方案总经理张东升与知名院士、高校教授、科研机构研究员、国外优秀学者及国际国内行业大咖一起,围绕“计算见智赢未来”主题,就行业应用创新,技术未来趋势展开交流探讨。会中,张东升首次提出HPC“柔性计算”概念,引导行业关注用户体验和个性化需求。
会中,张东升在《华为开创HPC3.0多元计算的“芯”时代》主题演讲中指出,HPC经过近20多年的快速发展,正从之前营养不良的“计划经济”粗放式快速发展,逐步实现富足“小康生活”,HPC建设目前不是量的问题,中国HPC数量已经占比全球Top500的219席位,占比43.8%,数量上排名世界第一。而在核心技术、用户体验及利用率上还处于起步阶段,HPC下一步目标的发展是解决“缺芯少魂”和用户体验的痛点问题。
“缺芯少魂”,缺的是芯片,少的是操作系统、应用软件。张东升介绍,华为推出的鲲鹏CPU、面向AI的昇腾芯片,自研的管理芯片、自研网卡芯片、自研的存储、欧拉操作系统、自研的MPI和数学库等,可以实现自我革新的HPC生态全堆栈,目前已迁移HPC应用软件200余个。
“柔性计算”是解决HPC用户体验而提出的新概念。“类比柔性制造一样,是以用户为导向的,以每个用户需求确定HPC的方案和配置,面向C端的“C2B”“C2P2B”等模式是柔性计算的精髓所在”,张东升解释。HPC行业应用和场景领域繁多,据统计有2000多种,但传统国家超算中心等单位建设HPC试图用一套系统和配置,承接各行各业,以一种模式覆盖所有的需求,这就是“计划经济”思维模式。
传统建设HPC是一次规划5年再申请预算更新,单一固定周期性建设是对用户需求的忽视。而华为云可以为每个用户提供专属的“局域网”VPC,提供裸机、虚拟机、容器计算,也可以提供鲲鹏、X86、GPU、FPGA等算力,每个用户都有自己的独立root权限,个性化的应用软件和版本,按需升级最新的版本,自主可控调试配置。这些都是传统超算中心无法想象和难以实现的,行业里2000多个软件基本每天都在滚动更新。张东升补充道:“华为云HPC彻底将研究员从繁琐IT工作中解放出来,使用个性化最新的软件和应用,按需弹性使用HPC,使科学家聚焦行业创新,突破人类认知极限”。
华为云还推出了HPCS2,可以一键式部署安装HPC集群,5分钟左右集群和作业调度软件Slurm/SGE就都创建好,极大提高用户的易用性。
此外,华为创造性提出了融合AI、HPC、大数据平台三种,改变了传统烟囱似的建设,构建了统一的数据湖。三种解决方案资源配比动态调度,大大提高了资源的利用率和降低了成本。华为提出了“芯+端+边+5G+云+AI”,5G的上线,将数据传输的通道打通,给未来HPC云化提供了开放的想象力空间。
张东升特别指出,华为基于ARM架构打造了自己的鲲鹏处理器,华为云又基于华为鲲鹏处理器打造了鲲鹏云服务和解决方案,开启云上的多元新架构。华为云提供了多元化的HPC计算平台,在统一的云平台下,除了提供传统基于X86架构的算力之外,还推出了基于自主可控的鲲鹏架构的算力服务。
面向开发者、合作伙伴、高校和科研机构,华为提供了沃土AI开发者使能计划;面向合作伙伴,华为鲲鹏凌云伙伴计划,计划首批投入1亿元生态资金为合作伙伴提供全面支持。华为希望通过沃土AI计划和鲲鹏凌云计划,搭建一个技术交流、人才培养、机遇共创的通道,与学术界和产业界共同构建超算的新生态。
华为已经具备从芯片到服务器到云平台的全栈自主创新能力,软硬件深度协同使华为云鲲鹏云服务具备极致性能。未来,华为云将继续保持开放的架构,为教育科研机构和企业提供多元化的超算服务和解决方案,更好地满足客户不同场景的需求,提供“多元计算”和“柔性计算”的华为云HPC解决方案。