2022年11月15日下午,第四届中国超级算力大会ChinaSC2022暨中国智能计算产业联盟理事会在北京继续召开。大会线下人数600+参会嘉宾亲临会场,在线人数更是突破10万+,2022国际人工智能算力AIPerf500排行榜,ACM SIGHPC China 优秀博士颁奖,众多专家学者分享了在智能超算领域的创新成果与实践。
2022国际人工智能算力AIPerf500排行榜
中国科学院计算技术研究所研究员张云泉、清华大学副教授翟季冬共同主持了2022国际人工智能算力AIPerf500排行榜发布。
张云泉介绍,联盟参考超算T0P100的成功经验,发起了一个由中国人领衔的国际排行榜——国际人工智能算力AIPerf500排行榜,原因是人工智能算力的精度与传统超算不同,有32位、16位、8位、4位甚至更低的,很多厂家报道结果的时候不特别说明是怎么估算的,容易产生一些误导,包括对超算领域产生冲。该标准是由清华大学团队研发的,目前以国内为主,希望疫情放开以后把国外的机器也包括进来,在大家的支持下共建行业标准,引导行业健康良性长期的发展。
清华大学副教授翟季冬回顾了AIPerf500在过去一年里的最新进展和今年的最新排行榜。
他谈到,随着人工智能在各个应用领域上的快速普及以及大规模计算系统的大发展,公众需要一个简单有效的指标来帮助判断系统的人工智能算力。传统的高性能计算机评测方法和体系与当前人工智能需求的性能并不完全一致,而目前的人工智能基准程序又不足以支持上千加速卡级别大规模计算系统的评测。针对以上问题,AIPerf计算机学会提出AIPerf,一种基于自动学习的可变规模人工智能基准评测程序。其底层基于AutoML技术,通过算法自动搜索合适的神经网络模型结构,找到针对特定任务效果最好的解。AutoML + NN现有两个主要方面:超参数搜索、网络结构搜索;AutoML具有足够的并行度,常常需要同时训练大量候选模型来对结构进行评估。
目前AIPerf已经可以在多种主流的高性能异构系统下(包括NVIDIA V100 GPU,A100 GPU,T4 GPU,基于ARM架构的华为Altas集群,基于国产芯片的超级计算机等)稳定运行并评分,并且已经可以支持4千张加速卡以上级别的大规模评测,可以有效区分出不同规模系统的AI算力差异。
过去一年里,AIPerf 评测程序希望支持各种不同的人工智能芯片,安装部署非常方便,因而围绕轻量化和可移植开展了大量的工作。
在轻量方面,AutoML开始是基于微软NI架构的,评测程序因为并不需要这么多复杂功能,就只保留了最核心的AutoML算法和网络架构生成,这样就成为可以非常方便的移植评测程序。
在移植方面,因为有很多种人工智能框架,评测程序在模型中抽象出一个Graph IR层,把模型映射到这个中间层,这样就可以支持很多深度学习测试框架,可以在很多平台上把系统跑起来。另外针对云平台的移植,在去年也做了非常大的改进。
今年推出的AIPerf Green500,相应的程序和测试规范也已经放在网上,厂商希望测试AIPerfGreen 500,可以在官方网站AI Perf.org进行下载。未来将在国际推广、更多硬件和更多框架支持,以及优化评分等方面做更多的工作。
翟季冬还对ACM SIGHPC China榜单进行了解读,并对获得第一名的鹏城实验室-云脑∥进行了介绍。
大会还举行了ACM SIGHPC China 优秀博士颁奖仪式。
智能超算领域创新成果与实践分享
华为HPC首席技术研究专家丁肇辉发表鲲鹏高性能计算软件栈创新与应用主题报告时谈到,算力、应用的发展正呈现出多样性的趋势,给软件编程、性能优化等工作带来新的挑战,华为的愿景是希望实现融合CPU计算+异构计算+通信+访存/IO的统一运行时自动、半自动化,携即将发布的北冥多样性计算软件栈,与伙伴一起为中国HPC产业做出更大的贡献。
Seagate系统科技部技术顾问张振宇发表希捷数据新径界,构筑中国算力基石主题报告时介绍,作为企业级存储产品领导者,希捷拥有超过40年的硬盘行业专业知识,长期为数据存储头部企业提供先进的企业级存储解决方案,尤其是新一代可自我修复智能数据存储系统,可在提供高容量、高密度存储的同时,有效降低客户服务成本,并能减少电子垃圾。张振宇特别强调,希捷是一家注册于爱尔兰的科技公司,希望与中国伙伴一起,共同构筑中国算力的基石。
离娄科技(北京)有限公司董事长陈拥权发表图像大数据超算在数字林业领域的应用探索主题报告时,介绍了图像大数据运算在林业应用中面临的挑战,以及通过搭建林业多源数据感知应用架构的服务平台,在森林测绘、森林参数反演、森林蓄积量评估、森林碳汇测算、数字森林孪生体、森林抚育、病虫害监测与防治、森林防火等领域的成功应用。
合肥先进计算中心运营管理有限公司总经理王浩发表算力服务业务的探索与实践主题报告,介绍了合肥先进计算中心携手合作单位联合共建全国一体化算力服务平台,通过在业务、技术和市场等方面的创新实践,推动超算中心从算力中心时代走向算力网络时代,使算力真正成为促进数字经济发展的核心驱动力。
沐曦光启智能研究院研究员韩佳巍发表通用计算系统中的光互连:现状与未来主题报告时介绍,公司专注于多卡互联、智能调度、硬件虚拟化,以及集群能力等领域的GPU系统创新,主要面向于AI推理、训练、数据中心、元宇宙等领域的应用,并且已经在垂直腔发射激光器光纤链路技术、光学PCB技术等光通信技术领域实现了一定的突破。
澎峰(北京)科技有限公司创始人兼CEO张先轶发表异构计算软件栈的国产自主和国际化愿景主题报告时指出,CUDA成就英伟达在加速技术领域地位的成功经验,给国内厂商带来了很大的启发,澎峰科技希望通过开源共建方式,致力于算力基础软件栈技术的研发工作,与合作伙伴一起打造繁荣的计算软件栈生态。
北京天云融创软件技术有限公司 CEO杨立发表如何构建新一代智算中心主题报告,介绍了天云统一融合云管理平台以向下对接主流公有云、自建私有云及专网资源池,实现了前云后算融合模式的优势,以及在工业制造云、国家某先进计算中心等领域的成功应用,指出未来大数据、人工智能、云计算等将在超算领域走向融合,公司愿意与大家携手为中国高性能计算发展贡献力量。
清华大学教授陈文光发表国产超级计算机上的极大规模图计算主题报告时介绍,BFS和SSSP都将面临着数据密集型应用的共同挑战,清华大学提出的5D三层度数感知划分技术,突破了传统图划分技术的局限,并在国产超级计算机上处理了100万亿边量级大图,在大规模图计算通用技术领域达到了世界先进的水平。
继往开来,携手合作伙伴为产业繁荣发展做出更大贡献
大会最后举办了联盟理事会成员新增仪式,并宣布新增李英浩担任中国智能计算产业联盟副秘书长。
中国智能计算产业联盟秘书长安静发表2022中国智能计算产业联盟工作报告时介绍,中国超级算力大会从2018年至今已经成功举办四届,逐步成为智能算力领域极具影响力的行业盛会。
中国智能计算产业联盟旨在推动智能计算产业技术创新链,为智能计算技术在各行业深度融合与落地提供涵盖技术、平台、标准等多方面的服务和支撑体系,联盟立足于智能计算产业,以建立技术创新体系推动产业转型发展为愿景。
目前,中国智能计算产业联盟组织机构有三大业务板块,一是联合各大院校与科研机构的专家学者,推动智能计算相关技术研发、健全产业标准体系,建设智能计算领域人才库,开展智能计算领域的战略和课题研究;二是与各地方政府加强合作,组织算力相关重大活动,促进国内国际合作交流。目前联盟已在济南、福州、南京、青岛等地组织过算力大会,以联盟庞大的会员单位为基础,结合各地方政府的发展需要,搭建合作平台,推动产业落地和发展;三是促进把专家委资源优势和地方发展需要,结合产业资源形成一个闭环,充分发挥好联盟的桥梁和纽带的作用。
尽管受到疫情的影响,中国智能计算产业联盟在2022年成功出版了国家东数西算工程背景下新型算力基础设施发展研究报告,未来将在算力经济、算力网络、算力服务等领域持续推出研究报告,为HPC产业发展不断输出高质量的内容,同时将联合更多伙伴搭建更好的生态合作平台,为更多企业拓展业务,并将结合更多各地方和各平台优势,建设智能计算新体系,推动智能计算产业繁荣发展做出更大的贡献。
(来源:新视线)
责任编辑:孙青扬