党的二十大报告指出:“加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。”当前,新一代信息技术与实体经济加速融合、算力基础设施建设日益加速,人工智能产业集群纷纷涌现。根据《中国综合算力指数(2023年)》白皮书,我国算力产业保持高速增长,人工智能算力在整个算力结构中的占比已经超过25%。
近日,工业和信息化部等6部门联合印发《算力基础设施高质量发展行动计划》,文件提出:到2025年,中国算力规模超过300 EFLOPS(FLOPS即每秒执行的浮点运算次数,1EFLOPS="10"^18FLOPS),智能算力占比达到35%。
随着人工智能应用场景的扩展和对算力需求的提升,AI模型的规模及复杂性也在不断持续增加,这对计算资源的调度和优化方法提出了更高要求。计算资源不仅需要具备强大的处理能力,更需要灵活适应多样化计算任务与场景的需求。
异构加速联合创新深度推动openEuler社区共建
在由开放原子开源基金会、中国电子技术标准化研究院、国家工业信息安全发展研究中心、中国软件行业协会共同主办的操作系统大会2023上,计算行业专家、学者,领先企业代表和社区开发者围绕2023年占据中国服务器操作系统市场份额第一,达36.8%的openEuler操作系统及其技术成果、商业实践、生态繁荣、社区治理及全球化进行热议。
会上,openEuler社区委员会主席江大勇表示,智能时代,操作系统需要面向AI不断创新,欧拉与AI深度融合,用AI赋能openEuler更智能,以openEuler使能AI更高效。未来,openEuler要继续打造多样性算力平台,对多样化的智能处理器也要异构支持,成为智能时代的数字基础设施。
在AI智算场景日益丰富的背景下,软硬融合的异构并行架构已经成为计算产业的关键支撑。这种架构覆盖了多样化的算力供应和精度需求,不仅存在于高性能计算领域,还延伸至云计算、边缘计算和终端设备等多个层面。随着人工智能的进一步发展,多元化场景和多样性算力需求将持续推动计算架构的创新,使得异构并行计算的需求更加迫切。
华南理工大学基于“鲲鹏+昇腾+FusionOS”打造异构计算平台并行加速解决方案,使异构并行高性能计算平台更高效、更好用,实现AI算力底座基础上的应用从国外平台计算生态上迁移到openEuler国产主流的计算平台。
在通用计算与AI智算平台的结合中,超聚变服务器操作系统FusionOS提供了集成AI硬件调优生态、高效AI模型部署、鲲鹏架构支持、虚拟化性能领先和软硬件一体化防护等能力,这为技术底座提供了开箱即用的便利。华南理工团队针对前沿AI场景,深入优化了模型部署、算子迁移和多卡多节点通信,进一步提升了底层算力。结合主流计算平台,团队构建了系统化的异构加速平台,涵盖加速层、组件层和性能优化。
华南理工打造的异构计算平台并行加速解决方案,与超聚变在异构加速领域和AI领域进行深度探索与实践,实现了协同软硬创新、加速算力释放。此外,华南理工团队对openEuler操作系统进行了自动化部署、迁移研究和实践,与openEuler开源社区深度联动,积极参与欧拉社区建设,深度推动了openEuler系统的实际应用和AI生态的发展。
华南理工异构计算平台并行加速解决方案协同AI创新
在构建异构计算平台的并行加速解决方案的过程中,华南理工大学计算机科学与工程学院教授、博士生导师陆璐教授领导的团队从仿真模型的构建、算力平台的优化、操作系统层面的改进、到网络环境的优化,全方位地提升了异构计算平台的性能,确保了其在同等环境下能够更快、更好地运行。
陆璐教授领导的团队开发了一套通用的仿真模型,该模型能在多样的计算环境中评估算力供应和计算效率。为确保平台性能最优化,团队对算力中心实施了严格的基准测试,并对平台进行了技术优化,在维持其强大的计算功能同时,也保证了运行的高效与稳定性。在操作系统层面,团队依托openEuler开源社区进行了深度研究,携手超聚变操作系统团队共同优化了底层算子的运行效率,确保了相关库在openEuler操作系统上能够高效运作,进而加快了系统处理计算任务的速率,优化了性能表现。针对大规模运算系统中复杂的网络环境,团队专注于协同数千张显卡和数千个节点的高效运作问题,实现了系统在并行计算中的性能最优化。
华南理工异构计算平台并行加速解决方案基于主流计算平台进行并行加速,包含应用层、加速层、组件层、算力层、基础软件层、硬件层,实现了“鲲鹏+昇腾”异构平台搭建以及计算仿真模型资源评估;核心算子库(GEMM、FFT等)优化;HPL、HPL-AI基准测试平台搭建和优化;多卡异构计算平台性能优化;基于异构并行高性能计算应用软件平台的建设和示范应用。
异构计算平台并行加速解决方案以开源加速库为锚点,提供集算子、算法为一体的综合优化方案,采用异构计算并行加速的方式作为算力供给的主流方式,提供基于通用算力+AI智算和异构算力的计算资源,能够广泛为各行各业提供迫切需要的安全、稳定、高效的算力解决方案。
异构计算并行加速解决方案研究成果具有示范推广价值
面对如何提升异构计算平台计算效率的难题,使应用迁移后的计算速率跑起来,快起来,陆璐教授团队完成了一系列典型AI应用迁移调优。在迁移应用的实际运行中,华南理工团队就如何提升运行速度和效率,形成了一系列具有示范推广意义的研究成果。
在基础算子库研发优化中,华南理工团队携手超聚变操作系统团队通过技术合作,开展基于BLAS基础算子性能优化,FFT核心算子优化开发,解决算子亲和问题,实现了算力加速,经过优化后的算子库性能提升了50%。
异构计算平台并行加速解决方案是华南理工大学在教育信息化和计算平台建设方面的创新实践,是高校响应国家教育现代化战略、推动数字中国建设的生动案例。在解决方案中,华南理工团队的优秀研究成果,在AI算力基座、异构计算、算力加速和计算效率方面具有典例参考和推广示范价值。
通过在超聚变服务器操作系统FusionOS进行迁移研究和实践,参与openEuler开源社区生态建设,进行AI模型部署、AI算子迁移调优、多卡与多节点通信优化,与国内领先算力企业的深度合作,华南理工大学不仅在异构计算平台的并行加速解决方案上取得了突破,而且在积极参与openEuler开源生态建设中,推动了教育信息化和操作系统开源生态向更高水平的发展。异构计算平台并行加速解决方案的成熟经验,为其他高校提供了教育信息化建设与产教融合、产学合作的参考,有助于构建更加开放、共享的教育技术生态,推动数字中国建设和教育事业的全面振兴和长远发展。