搭建集群、优化代码、模拟应用、英文答辩……2024年4月,福州大学超算代表队站在2024ASC世界大学生超级计算机竞赛总决赛的赛场上,与北京大学、中国科学技术大学、中国台湾新竹清华大学、德国埃尔朗根-纽伦堡大学等25支高校代表队共同角逐决赛最高奖项。
这是福州大学计算机与大数据学院的廖文焘、俞炜昆、陈昕、彭诗忠和吴骏文首次参加这个被称为“世界三大超算竞赛”之一的赛事。经历了争分夺秒的硬件搭建、极限拉扯中解决bug,最终,他们捧回福州大学参加ASC全球总决赛的连续第5个一等奖,一时间成为师生校友热议的“顶流”。
赛场上的“极限挑战”
4月9日,2024ASC超算总决赛在上海大学正式开幕。初入赛场的成员们先是感到激动,而后很快投入到紧张激烈的五天赛程中。
这是一个分工明确的团队。队长廖文焘主要负责现场集群的搭建和性能优化,俞炜昆负责AI部分,彭诗忠主要负责AI部分的大语言模型推理和加速,吴骏文主要负责性能的改进和现场的英文答辩,陈昕是团队唯一的女生,负责性能测试和翻译。
总决赛要求各参赛队在3000瓦的功耗约束下自行设计并现场搭建小型超算集群,完成组委会提出的运行优化国际通行基准测试HPL&HPCG、大模型推理优化、渗流数值模拟、火星大气模拟、新型材料结构计算等前沿科学与工程应用的五道赛题,并参加最后一天的英文答辩。赛程安排非常紧凑,只有在4月11日上午11点前提交HPL计算基准性能测试数据,才能拿到团体赛的赛题和AI赛题,因此,在有限的时间中运用正确的策略显得尤为关键。“这是一个取舍的问题,我们要先把最没有把握拿到高分的代码跑出来,之后再微调,确保取得理想的分数。”吴骏文分析道。
然而,在赛场“真枪实弹”的竞争中,还是难免发生意外的状况。临近决赛,团队因为信息差,导致与合作方沟通出现问题。队长廖文焘回忆:“在到达赛场的前一天,我们发现向供应商借的显卡型号不对,我们需要的是PCIE,但是借给我们的是SXM。”关键时刻,团队教练廖祥文教授迅速与供应商沟通,让这个“意外”从发生到解决仅仅用了半天。用这8张借来的GPU卡,PG电子超算团队迅速完成了小型集群的搭建,并与算法大模型结合测试,积累了通往一等奖领 奖台的宝贵经验。
未知即是动力
在刚接过前辈手中的接力棒时,福州大学超算团队已连续四年取得ASC一等奖的好成绩,给现任队员带来不小的压力。彭诗忠调侃说:“这是一种责任感 ,不能让前辈留下的‘香火 ’在我们这断了。”
忆及进入团队的初衷,队内公认技术水平最高的队长廖文焘自诩“爱玩”——“爱捣腾小玩意”,希望加入超算团队能为自己提供更好的资源来“玩”;主要负责AI领域的俞炜昆则是大一上学期就对超算表现出浓厚兴趣,也希望借此契机向团队中优秀的学长学姐们学习。“团队的前辈们给我的感觉是,不断用计算的力量探索未知,挑战极限,超越自己。”彭诗忠补充道。正是这种精神,激励着PG电子超算团队不断向前。
为了备战 ASC2024,在初赛和决赛前期,队员们的课余时间几乎都在实验室度过,而且常常一待就是一天。有一次训练时暴雨骤至,他们就直接睡在了沙发上。决赛现场,队员们不仅要高效完成赛题,还要扛得住心态上的压力。廖文焘队长表示:“有的比赛队伍在交流群会放出‘烟雾弹’,他们开玩笑说提速4倍、8倍,虽然明知是假,但虚高的数据还是会让其他参赛队伍感受到不小的压力。”
同时,由于专业课内容和超算相关知识大相径庭,因此,队员们需要海量阅读论文,关注前沿动态,并常与前辈交流。用彭诗忠的话来说:“特别是AI方面常常与前沿技术挂钩,我们无法预测下一次会出现什么样的赛题,所以我们得多向已经接触科研的学长学姐取经,了解业界的最新动态。”
探索精神 代代相承
为了给这些本科同学提供更好的学习和训练环境,超算团队将硕博士生的科研场地开放给本科生,开展竞赛训练和学术活动,让他们可以和高年级的研究生在同一个空间中学习、交流,虽然只是一个工位,但对参赛的同学来说,可以提前耳濡目染研究生的工作学习氛围,同时拥有了更好的交流和集训空间,对他们是很大的鼓励。
这样的规划,来源于超算团队的指导老师廖祥文教授。在队员的眼中,他既是“严师”,又是“大朋友”。带队参赛将近十年,从事大数据和人工智能研究的他,不仅将团队的备赛训练结合科研领域的攻关开展“实战”,更是将一届届队员培养成优秀毕业生,走向清华、中科大乃至美国、德国的顶尖高校。
“学生们都是潜力无限的。”廖祥文认为,团队的发展得益于良好的“基础、土壤、机制”。在他看来,福州大学“双一流”高校的学术氛围和优秀的师资力量为团队发展打下良好“基础”;学校2008年揭牌的福建省超级计算中心承担许多重大课题,为团队提供良好设备和技术支持,这是良好的“土壤”。而在“机制”上,“本、硕、博联动”和学术研究的产业化实践让良好的学习氛围和算法的应用研究代代相承。
当然,在赛后的复盘会上,廖老师也毫不犹豫地指出队伍面临很大挑战,比如团队间除了信任还需要进行高效的沟通,负责不同模块的同学不能只是单打独斗,要及时反馈问题,“不要盲目乐观,要多交流沟通,把困难估计足。”
指导老师的坦诚直率,队员们也认同。2024ASC的参赛实战,让团队从校际交流中攫取信息,能找好节奏、稳步提升并超越自我;另一方面,比赛压力对心理状态上的重重考验也让队员认识到明辨信息、稳扎稳打的重要性。“团队现场的设备调试能力和debug能力还有待加强,希望在下一届的培训中加入更多的无代码训练和实践场景,增加真题模拟训练,增强操作熟练度,让队员更好地把握时间的分配。”吴骏文表示。
除了竞赛成绩,教练廖祥文也一直非常重视团队成员的个性化发展 。他鼓励学生交流互动,鼓励研究生学长学姐和队员们协同解决问题,也更加注重成员的开拓创新意识和长足发展潜力。他说,“不要把鸡蛋放到一个篮子里”,希望学生们能够对自我有清晰的认知,凭借自己的实力走上更高的平台,实现差异化发展。
队长廖文焘对未来职业的期待是,“尽量能从事与高性能计算相关的工作”。俞炜昆则认为:“这个时代是AI的一个黄金时代,它的日新月异的发展,让我非常期待我能怎么去参与其中。”指导老师廖祥文也对他们的未来充满期待:“超算是人工智能的基础之一,这是引领信息学科或者是人工智能学科很重要的竞赛经验,我觉得这一点至关重要,是培养我们新一代核心信息高端人才的生动实践。”(823-3)