中国超级计算机研制反思

来源:期刊VIP网所属分类:计算机信息管理发布时间:2021-09-02浏览:

  摘 要 从1983年中国第一台超级计算机“银河-I”研制成功到如今“天河”“神威”系列超级计算机排名世界第一,40多年的中国超级计算机研制史辉煌亮眼。但是,一些发展中的问题还没有被足够重视,一些研究的不足还需要关注和探讨。对中国超级计算机的自主创新、软硬件、应用、能耗、人才等方面做试探性反思,对中国正由“超算大国”向“超算强国”发展,特别是在中美在该领域竞争白热化的今天具有一定意义和启示。

  关键词 超级计算机 自主创新 银河-I

计算机论文发表

  超级计算机(Supercomputer),又称巨型计算机①,是指在一定的生产工艺条件下,采用最先进技术、工艺设计生产出来的功能最强、运算速度最快、存储容量最大、档次最高、面向科学与工程的电子计算机系统[1]。超级计算机通常由成千上万个处理器(机)组成,具有巨大的数值计算能力和数据处理能力,能计算普通个人计算机和服务器不能完成的大型复杂课题。工业界的普遍标准认为,浮点运算速度为每秒1亿次以上的数字式电子计算机才是超级计算机[2]。超级计算机一向被称为国之重器,是世界各国竞相角逐的科技制高点,也是一个国家科技实力的重要标志之一。

  中国第一台超级计算机是国防科学技术大学于1983年12月研制成功的“银河-I”,这台计算机在国防建设和国民经济发展中发挥了重要作用,中国也成为世界上少数几个能够研制超级计算机的国家之一[3]。此后我国在超级计算机研制方面捷报频传,如国防科大、国家并行计算中心、中科院计算所、联想集团等单位相继推出了“银河”“神威”“曙光”“深腾”等一系列国产超级计算机系统;2010年11月,中国千万亿次超级计算机“天河一号”在世界超级计算机五百强排行榜(TOP500)上首次问鼎冠军,2013-2018年,中国“天河二号”和“神威·太湖之光”超级计算机连续排位第一名,实现世界超算“十连冠”[4]。

  40多年来,中国超级计算机研制从“零的突破”到“世界之巅”,集中地反映了这一国家大型科学工程项目着眼国家战略需求,坚持走中国特色自主创新之路的科研历程。不仅满足了中国尖端技术研究的急需,支援了国民经济建设,也积累了一整套研发高性能计算机的经验,使中国人在掌握计算机科学技术上向前跨越了一大步,成果和效用自不待言。但是,中国超级计算机研制历程的背后,一些发展中的问题还没有被足够重视,一些研究的不足还需要关注和探讨。特别是2018-2020年,美国“顶点”(Summit)和日本“富岳”(Fugaku)等超级计算机先后超越中国的“神威·太湖之光”成为世界最快超级计算机,而中国的新一代超级计算机迟迟未能推出。

  因此,中国超级计算机到今天有必要进行自我总结,对其面临的深层次问题进行一些反思,以期在全球高端科技、尤其是高性能计算机研发领域竞争异常激烈的今天,实现创新驱动发展,为决策者及研究同行提供现实参考。

  一 自主创新路向何方

  “创新”在科技类文章中是一个常用词,大量文献中使用对“创新”概念的阐述均来源于20世纪初美籍奥地利经济学家约瑟夫·熊彼特(J. A. Joseph Alois Schumpeter,1883-1950),他在《经济发展理论》一书中对创新进行了系统的理论研究。熊彼特的研究虽然具有普适性,但严格意义上讲,他对的“创新”的阐释主要还是针对经济领域和社会生产领域,而并非科学技术领域。20世纪90年代,中国学界开始主动借鉴西方创新理论研究,并结合自身特点和实践历程对有关理论进行完善。

  进入21世纪,中国《国家中长期科学和技术发展规划纲要(2006-2020年)》中,对自主创新的定义是“通过拥有自主知识产权的独特的核心技术以及在此基础上实现新产品的价值的过程”[5],主要包括原始创新、集成创新和引进消化吸收再创新三种形式。原始创新指前所未有的科学发现、技术发明、原理性主导技术等创新成果;集成创新指通过对各种现有技术的有效集成,形成有市场竞争力的产品或者新兴产业;引进消化吸收再创新是指在引进国外先进技术的基础上,学习、分析、借鉴,进行再创新,形成具有自主知识产权的新技术。

  由于国外技术封锁和国内技术落后的原因,中国首台超级计算机银河-I在研制之初,就确定了“走一条自力更生、学习与独创相结合,起点跟得上当时国际水平的新路子”[6]。银河-I是以美国第一台可持续性能达到每秒1亿次以上速度的向量超级计算机Cray-1为范本研制的,它在总体方案上瞄准Cray-1,借鉴其成功的设计思想;同时对当时国内没有或是不能保证质量的核心元器件,设法从外国引进。因此,银河-I并不是完全自主创新的成果,而是小部分原始创新和大部分集成创新结合的产物。例如,对于无法洞悉Cary-1究竟如何实现亿次计算,银河-I研制人员通过原始创新,突破了双向量阵列体系结构、改进浮点倒数近似迭代算法、指令链接与流水控制、素数模双总线交叉访问的存储控制等关键技术。而银河-I的整体工程实现,是通过大规模综合集成创新完成的。

  事实证明,当时这样做既为整个工程争取了时间,节约了研制经费,又保证了银河-I系统性能的高水平。20世纪七八十年代,中国与西方发达国家存在较大技术差距,银河-I研制利用改革开放条件,走原始创新和集成创新相结合的路子有较强的现实意义。此后采用同样模式又相继诞生了银河-Ⅱ、银河-Ⅲ等系列超级计算机。同时,机制更为灵活的中国科学院计算机技术研究所、联想集团等单位和企业,采用“引进-消化-吸收-再创新”的方式,研发成功“曙光-1”“深腾-1800”等系列超级计算机,完成了从大规模并行体系结构的实现,到可扩展共享存储并行体系结构的跨越。

  但是,中国超级计算机的自主创新之路并不平坦。2010年11月,当“天河一号”成为世界最快的超级计算机,其核心部件90%以上却依然采用了美国英特尔公司和AMD公司最先进的CPU(中央处理器)和GPU(图形加速器)[7]。连续六次登顶世界超级计算机500强之首的“天河二号”,其硬件系统主要部件的计算阵列全部采用美国商用微处理器[8]。2010年曾排名世界第二的中国“曙光星云”超级计算机,核心部件全部是由国外英特尔和英伟达芯片构建的。在中国已成为世界第二大经济体的今天,国产超级计算机系统核心部件仍大量使用国外进口芯片就不免受到公众的质疑。

  事实上,以集成创新为主的模式最终只能仿制别人、依靠别人,引进消化吸收再创新的模式最后会落入“落后-引进-再落后-再引进”的陷阱。2015年,美国政府禁止了英特尔等企业向中国出口超级计算机有关的设施与技术;2018年,美国商务部又签署了禁购令,要求所有美国公司不得向中国企业出口包括芯片、软件、操作系统等商品。这对从事中国超级计算机研制的一些单位产生了不利影響,使已经运行的某型超级计算机系统未能继续升级,甚至导致某项百亿亿次级计算系统研制进度一再推迟。

  推荐阅读:计算机相关论文发sci4区难吗

期刊VIP网,您身边的高端学术顾问

文章名称: 中国超级计算机研制反思

文章地址: http://www.qikanvip.com/jisuanjixinxiguanli/59332.html