新一代高效能计算机体系结构的探索者 ——记北京航空航天大学计算机学院刘磊教授

来源:中国网    2025-06-09 15:13
来源: 中国网
2025-06-09 15:13 
分享
分享到
分享到微信

在当今的信息化时代,高效能的计算机系统是经济社会发展的支柱,从云服务到手机应用,滲透在我们生活的方方面面。研发新一代高效能计算机系统是我国科技战略的重要发展方向及需求。

北京航空航天大学计算机学院刘磊教授紧密围绕国家重大方向及需求,在国家重点研发计划、国家自然科学基金等重要科研项目的支持下,带领团队面向新一代高效能计算机系统,在处理器内存体系架构、操作系统、量子计算系统等前沿方向,突破了一系列关键技术,构建起从计算机硬件架构设计、系统软件自主创新,再到应用场景深度拓展的全栈式技术体系。相关成果已在多个领域实现产业化落地,有力推动了我国新一代计算机系统的技术创新与应用生态建设,为科技自立自强注入动力。

潜心钻研、突破瓶颈

对于计算机系统来说,计算单元与内存之间的“内存墙”问题始终存在,内存体系依然是计算机系统效能的瓶颈,如果没有高能效的片上、片外内存体系架构,以及系统层的管理与调度机制,整个计算系统的效能也难以提升。

针对行业核心技术难题,刘磊及团队在处理器内存架构、内存管理及系统优化方面深耕15年,先后提出基于新材质的新型内存体系架构、片上及片外内存体系垂直设计与优化机制,并研发出应对云/端设备高负载、低延迟、多样性的内存资源管理、调度、优化系统。实践表明,系列成果显著提升了内存系统及整机的效能,大幅降低“内存墙”带来的性能瓶颈的影响。研究成果形成系统性技术方案与知识体系,为行业发展提供了新的技术路线与方法论,已在多个领域落地应用,获得业界高度认可。

求实进取、创新系统

对于现代计算机系统来说,随着硬件系统的发展,系统集成的新型硬件也越来越复杂多样。然而,目前操作系统的有限,例如,资源管理与调度机制通常还是采用简单规则或启发式算法,在应对复杂计算环境需求及计算环境时显的捉襟见肘,导致硬件系统的利用率较低,系统效能常处在次优的状态。因此,系统软件层如何利用好各类计算、内存等硬件资源是关键,如果系统层的管理与调度的能力欠缺,那么就算堆叠再多的硬件资源也无法发挥预期的效能,并且会造成资源浪费,增加经济损失。

为了解决上述问题,刘磊带领科研团队探索了人工智能驱动的操作系统设计与优化的技术路线(AI for System),研发了面向国产服务器、移动端设备、智能手机等多元终端的智能化操作系统核心组件(如智能化的系统资源调度、算力调度、任务调度等),大幅提升了国产计算机系统的效能、服务质量(QoS)等关键指标,应用落地成效显著。尤其是对于移动端设备、手机等效能要求高的设备,刘磊团队研发的智能化算力调度、智能化资源管理机制,将手机平均帧渲染时间大幅降低,并且大幅降低了主要应用场景下(如短视频播放、新闻浏览等)系统能耗及每秒丢帧数,使手机用户有更流畅、不卡顿且更省电的体验。

另辟蹊径、提升算力

现有的冯·诺伊曼经典计算架构,即使通过大量堆砌现有算力资源并消耗大量能量,也存在一些不能处理(或不能以高效能比的算法处理)的问题。量子计算是科技战略发展的重要方向,量子计算机则有可能在未来展现其优越性。从技术上来讲,物理学家坚持改良物理器件以提高量子位稳定性;计算机科学家希望通过改良量子计算机软/硬件栈的方式提高量子计算机的能力。目前,国内外均在积极研发稳定可靠的量子计算机系统。

为推动我国量子计算实用化,刘磊带领团队率先研发了量子计算机操作系统(QuOS)在理论上设计了QuOS模型,突破了一系列关键技术,提出面向复杂结构超导量子芯片、分布式量子计算的量子任务管理与映射机制,能够应对包含大规模物理量子位的2D量子芯片、3D量子芯片、融合多个量子芯片的分布式计算架构,及量超融合计算架构等新型量子计算环境。同时,刘磊提出多量子任务管理的抽象模型、管理方法、任务映射、调度及运行时优化方法,实现了量子位实时状态感知的程序映射,智能化全局跨程序量子位SWAP映射交换,及多任务管理调度机制。此外,刘磊与团队提出操作系统内核态量子位资源管理及虚拟化机制,可高效管理单设备、分布式环境下的多量子设备、模拟设备等,高效支撑量子任务在更大范围内的统一调度及映射。

为进一步使量子计算机与国家建设深度融合,更好的支撑我国的经济与社会的发展,刘磊及团队进一步研发了支撑量子云服务的关键技术及系统(QuCloud/QuCloud+),创新的提出根据预测可达的准确率构建并发调度程序组合的量子云任务调度方法,综合计算量子门操作执行错误率、串扰噪声、并发多量子任务之间资源竞争等因素,构建精准的量子程序执行保真度预估模型,实现量子任务动态组合与智能调度。团队进一步提出保障并发多量子程序准确度、服务质量的运行时机制,动态优化任务,动态调度量子位资源,有效解决由于量子芯片资源竞争、噪声干扰等不确定因素导致性能下降的问题,显著提升量子云任务及资源调度的公平性,大幅提升了量子云服务质量。

系列成果为高效能计算机系统扩展量子算力,经典计算与量子计算混合计算架构提供了技术路线,使量子计算机、量子算力具备更强的可用性,加速产业应用落地,更好的服务社会经济。同时,更引领了量子系统软件及操作系统领域的研究方向,为可编程量子计算软件栈的发展打下了基础,有力推动相关学科的建设。尤为突出的是,团队关于QuCloud量子操作系统、量子云任务调度的研究成果发表于计算机体系结构领域CCF A类顶级会议HPCA-2021.这是国内科研团队在该领域A类顶会发表的首篇量子计算机系统长文,填补了国内学术空白,引发国际学术界广泛关注。

服务业界、提升影响

刘磊教授常年坚持工作在科研第一线,其主导研发的系列成果以第一/通讯作者发表在领域内顶级学术会议/刊物(如ISCA、HPCA、FAST、TACO、TC、TPDS等),成果影响了一批科研工作者及学生。

刘磊教授十余年来积极努力的服务于学术界,曾两次担任ACM/IEEE国际权威学术会议的大会主席,暨第32届国际超级计算大会ACM ICS-2018(超算领域顶级学术会议)的大会主席,国际工作集特征研讨会IEEE ISWC-2020(权威学术会议)的大会主席,这两个学术会议在体系结构领域具有很高学术声誉及影响力。两次会议的举办均获得巨大成功,其中ICS-2018至今依然是该会议历史上参会人数最多、产生国际影响力最大的案例之一。通过主办学术会议,提升了国内体系结构学科、国内领域学者在国际上的影响力,促进了国内外学者的交流与合作。此外,刘磊常年任职于领域内权威学术会议,担任程序委员会委员,学术任职基本覆盖了领域内全部权威学术会议/刊物,包括领域四大顶会ISCA、MICRO、HPCA、ASPLOS等在内的15个顶级学术会议,及10余种ACM/IEEE权威学术刊物。作为国内在国际学术界任职服务最广泛的青年学者代表之一,刘磊通过持续的贡献,为推动我国计算机体系结构学科的国际化发展和学术生态建设注入坚实的力量。(文/丁旭)

免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn