“计算”未来——走进计算机体系结构国家重点实验室

   

  中国工程院院士、计算机体系结构国家重点实验室主任孙凝晖  杨天鹏摄 

   

  计算机体系结构国家重点实验室常务副主任李晓维(右)在检查硬件安全设计

   

  中国开放指令生态联盟成立 

   

  “寒武纪”芯片 

  最近几年,中国工程院院士、中国科学院计算技术研究所所长孙凝晖觉得自己的脾气明显变急了。“计算所历史上做得很不错,我站在巨人的肩膀上,本来也能舒舒服服过日子。可现在,经常走廊那头的同事都能听到我发火。”

  嘴上的急源于心里的急。除了所长,孙凝晖还兼任计算机体系结构国家重点实验室的主任。他很清楚,中国计算机产业很大,但要真正变强,是路漫且艰的。而作为我国在计算机体系结构方向的首个“国字号”实验室,计算机体系结构国家重点实验室从诞生之初,就承担着将中国计算机产业做强的历史重任。

  “我们不会做那种只有一两个用户的技术,也不会去做改良式的创新,这些都不是国家重点实验室的使命。要做,我们就要做对产业有深远影响的工作,国家重点实验室要成为技术创新的源头。”孙凝晖说。

  如何续写“高光时刻” 

  计算机体系结构可以说是中国科学院计算技术研究所(以下简称计算所)的立所之本。从参与成立我国第一个计算机体系结构小组,先后研制成功我国首台通用数字电子计算机、“两弹一星”功勋机109丙机至今,计算所在体系结构前沿基础研究、高端计算和微体系结构核心技术攻关、高性能计算机和微处理器产业化中发挥了重要作用,也逐步培养起一支产学研全链条贯通的创新团队。

  “从计算所的发展历史看,刚建所的30年是我们的‘高光时刻’,体系结构是我们立所的一个学科方向,但在长达半个世纪的时间里,我们都没有重点实验室。这说明我们做的工作里,原创的东西是不够的。”孙凝晖坦言,“如果我们缺乏原创的东西,就会掉入‘科技山寨’‘科技克隆’的陷阱。”

  “当你跑到一定程度,想再往前跑,想学别人已经没得可学了,怎么办?”计算所人扪心自问。

  随着摩尔定律的放缓,计算机和处理器的发展在可靠设计、性能优化、低功耗设计等方面面临越来越严峻的挑战,世界各国都在争取原理上的创新。而我国这方面的研究分散在通信、物理、生物等各个学科,而且大多是从器件层次上着手,缺乏从体系结构层次的整体考虑。另一方面,核心芯片研制能力弱也是我国信息产业的短板,处理器、系统软件等核心技术被个别发达国家控制,导致我国企业在国际产业链中核心竞争力弱、缺乏话语权。

  无论是自身前进的动力,还是国家发展的需要,都意味着计算所这支信息技术领域的“国家队”不能再躺在功劳簿上睡大觉。

  他们必须向改革要明天!

  2006年,中科院计算机系统结构重点实验室成立;2011年,该实验室获批“升格”。至此,带着计算所在体系结构领域近50年深厚的科研积累,我国计算机系统结构领域的首个国家重点实验室——计算机体系结构国家重点实验室应运而生。

  “计算机体系结构属于计算机学科的‘重工业’,成果不仅停留在发表论文,更应高度重视技术发明和原型系统,通过技术转移和技术应用,服务于国家重大需求,引领产业技术发展。”孙凝晖说。

  所以,这支既年轻又资深的队伍,面临的头等大事,就是如何用好国家重点实验室这块“金字招牌”,将中国计算机系统的研发水平再推上一个新的高度。

  系统思维铸就“团魂” 

  计算机体系结构国家重点实验室成立之初,设立了高端计算体系结构、微体系结构、编译与编程、超大规模集成电路与容错计算,以及非传统体系结构等5个研究方向。

  “这5个研究方向的确定有一定的机缘,源于我们有一段时间的反思。”计算机体系结构国家重点实验室常务副主任、计算所研究员李晓维说,“这几个方向,前四个方向涵盖了计算所60年的历史积累,第五个方向则是对领域未来发展的一种把握。我们想通过这种设置,开展基础性、前沿性的研究,为学科可持续发展更好地贡献力量。”

  以李晓维所从事的测试与容错计算为例,芯片的研制很难一次成功,出现问题时就要进行故障诊断,其中最关键的就是定位精度。而一个动辄几十亿个晶体管的芯片出了故障,究竟是定位到10万个晶体管的范围,还是定位到50个晶体管的范围,后续的工作量有数量级的差距,直接决定着芯片的研发速度。

  此前,精确的芯片故障诊断技术主要由三家国外公司掌握,前段时间,这些公司先后宣布对中国某企业实施封锁,导致该企业遇到了难题,该企业找到了计算机体系结构国家重点实验室寻求帮助。

  幸运的是,他们找对了人。李晓维团队在故障诊断领域有着长期的积累,技术虽然没有商业化,但在实验室的支持下,他们一直在不断地精进,目前定位精度已经达到国际公开报道的最高水平,一举让企业突破了瓶颈。

  这个“备胎一夜转正”的故事让李晓维深刻地感受到国家重点实验室体制的优势。“如果是遇到了问题再从零开始,那我们肯定做不到现在这样。但实验室始终面向世界科技前沿、面向国家战略需求做事,所以才能持续支持我们这个团队。”

  在计算机体系结构国家重点实验室副主任、计算所研究员冯晓兵看来,有了国家重点实验室,原先不同的课题组“各人自扫门前雪”的问题就不存在了,大家可以真正把目光放长远,从顶层设计入手,成体系地去做一些科研上的合作。“原来主要是你跟谁比较熟,就合作多,现在都在一个实验室,大家平时的交流多了,能够在更高层面上发现科学问题,一些工作就能够更早地开展合作。”

  在计算机体系结构国家重点实验室工作,这样的系统思维是必不可少的。实际上,这也正是孙凝晖作为实验室主任所期望看到的。在他的构想中,国家重点实验室理应为国家构建一个完整的技术体系。

  “原来我们是‘1+1’模式,一项技术或者一个设备,加上一个公司,就成了,过去计算所已经把这个模式做透了。可是有了国家重点实验室,我们的使命就不一样了,我们要去探索‘n+m’模式,也就是用实验室成系列的n个技术,去联合m家高科技企业,共同构建中国未来信息基础设施的技术体系。只有这样,我们才能真正把技术演进的主导权掌握在自己手里,才能在国际竞争中立于不败之地。”他说。

  青年才俊“分兵把守” 

  在计算机体系结构国家重点实验室,除了“大牛”,还有不少“网红”,计算所研究员陈云霁就是一个。他与弟弟陈天石研制了国际上首个深度学习处理器芯片——“寒武纪”,被《科学》杂志评价为该方向的“先驱”和“领导者”。

  退回几年前,陈云霁只是一个初出茅庐的“毛头小子”,这个“80后”当时想做人工智能与芯片设计的交叉研究,但他也没想清楚,这个交叉研究到底能“叉”出些什么东西来。

  “当时这还是一个全新的方向,在国际学术界是不太受到认可的,也基本上没有相关的论文,申请科研经费更是不容易。”陈云霁说。

  他非常理解,如果仅仅从KPI(关键绩效指标)的角度考虑,没有一个实验室会支持他做这样的事,毕竟他在做的事“既不能产钱,也不能产论文”。

  但计算机体系结构国家重点实验室偏偏支持了。在“种子”阶段,年轻人申请不到课题,实验室就从运行经费里拿出钱来,支持他们开展探索性的研究;孙凝晖还带着陈云霁去各个相关单位争取相关资源,就这样一步步帮着他发展起来。国家重点实验室的研究还吸引了Olivier Temam等国外学者的参与,拓展了陈云霁等人的国际视野。

  在开始的五六年里,陈云霁的成果的确不多,可是,厚积终于迎来了薄发——2020年6月2日,陈天石创立的寒武纪公司在科创板上市的申请得到批准,成为中国人工智能芯片的第一股。如今的“寒武纪”,已经从昔日的“非主流”,成长为全球智能芯片领域的先行者。

  “我们实验室选择支持什么样的课题,一是看科研人员发自内心的驱动,再由实验室领导去判断它的长远价值,而并不是看国家有没有立项,或者是不是国际热点,不是跟着这样任何一个指挥棒。”陈云霁感慨,“只有在这种宽松的土壤里,才可能有‘寒武纪’的诞生。”

  “计算机科学本身就是一个年轻的学科,所以我们也派年轻人去分兵把守,每人把守一个重要的路口。”孙凝晖坦言,计算机体系结构国家重点实验室自成立之日,就把“宝”押在年轻人身上,先后重用了一批像陈云霁这样的年轻人,也先后冒出了寒武纪芯片、开源芯片、高通量芯片、工业互联网芯片等有前景的新方向。

  2017年,刚刚成立数年的计算机体系结构国家重点实验室参加了首次评估,就获得了“优秀”的好成绩,更成为近20年来信息领域唯一一家首次评估就获得优秀的实验室。

  “做科研有时候就像打仗,讲究体系化作战。国家重点实验室不是一个步兵连,而是一个‘混成旅’,既要有坦克营,又要有步兵连,更要有直升机团,这样我们才能集中力量办成大事。这就是我们国家重点实验室也是中科院最大的优势。”

  正如孙凝晖所说的那样,未来,计算机体系结构国家重点实验室还将谱写新篇,不断点燃科技创新的星星之火,形成产业革命的燎原之势。

附件: