财新传媒 财新传媒

阅读:0
听报道

最近看到不少国家级媒体都在报道中国的“天河二号”超级计算机取得了Top500全球第一的成绩,全国上下无处不欢欣鼓舞,确实,超级计算机多用于国家高科技领域和尖端技术研究,是国家科技发展水平和综合国力的重要标志,如今早已成为世界各国经济和国防方面的竞争利器。并且我国在超算领域的研究起步较晚,但经过我国科研工作者数十年的努力得到了大幅飞跃,由最初与其他国家数十年的技术差距发展到如今世界领先级水平,可以说是科研工作人员的努力让着几十年的差距在数年之内得以迎头赶上并且超越其他国家。这种表面现象的欣欣向荣下面却有许多难言之隐。

 泡沫化的世界第一

首先,超算是标杆还是工厂?纵观全球超算产业的发展,超算中心的搭建其实只是整个超算中心投入的1/4甚至更少,超算中心在真正运转起来时候需要大量人力物力进行维护和调试。所以在发达国家中搭建超算中心的必须流程一定是:先有项目,再有超算,例如美国之前的“红杉”项目,主要就是进行模拟核试验等研究工作,通过理论物理模拟减少真正的实验花费,得到了美国政府的财务支持,还有“美洲虎”也是服务于受控核聚变以及DNA解码等项目;而我国在搭建超算中心时,我猜测首要考虑的问题是这个超算中心一定要打破记录,而不是首先考虑应用的情况,所以我们每一代天河系统均采用了当时刚推出的新技术,配套应用均等建成后再慢慢开发,可以说每一代天河都成为了新技术的试验场。天河项目研发至今已经有三代系统,分别是天河1号、天河1A以及天河二号,三个系统的共同点是都采用了加速器架构。也就是说系统主要的计算能力不是来自于CPU,而是来自于加速器。不过,三套系统分别采用了三个公司的加速器,天河1号是AMD HD4870X2, 天河1ANVIDIA公司的Tesla,而天河2号是Intel公司的Xeon Phi。这三种加速器架构技术各不相同,互不兼容,而且每一套推出的时候都是这种加速器技术刚刚出来的时候,毫无成熟性和实用性可言。

 

天河1号算是一个试验性的系统,算是为加速器架构进行试水,我们似乎不必苛求。而真正的部署系统是天河1A

 

天河1A推出的时候夺得了Top 500第一,但是其采用的NVIDIA Fermi架构的Tesla才刚刚推出,基于NVIDIA CUDA并行计算技术还刚刚处于初级阶段,当时实际可以运行在加速器上的应用寥寥无几,在其后较长一段时间内加速器利用率都相当低,几乎就是在干耗电的状况。天津超算中心花了很多人力物力进行软件的移植以及新软件的开发,据最新的报道,情况似乎有了比较大的进展,如果按照这个技术路线走下去,似乎还说得过去,至少付出了学费,还有点收获。在这个时候,天河2号又发布了。

 

而刚刚发布的天河2号采用了Intel刚刚发布的Xeon PhiXeopn Phi的架构和以前采用的NVIDIA GPU架构迥然不同,相当于将之前的一切都要推倒重来。Xeon Phi虽说采用了X86的指令集,但是它主要产生性能的部件并非X86本身,而是一个512位向量处理器,所有的程序都需要修改重新编译才能够获得勉强过得去的加速(如果要获得充分地加速,则需要类似于汇编的办法进行手工优化),而且这个处理器刚刚才发布,几乎谈不上任何有价值的应用可言。虽说Intel一再说Xeon Phi程序移植更容易,但是根据我和一些业界人士交谈,Xeon Phi类似于SSE的架构使得性能的充分挖掘十分困难。软件的移植也许会碰上更大的问题和花费更多的人力物力。

 

因此我们有充分的理由怀疑研制相关部门是抱着玩票的心理和单纯追求世界第一的心理在研制这几个超级计算机,而不是首先考虑到应用的需求。纵观国外 的超算中心,总体来说都是首先需要有应用的需求,之后根据这些应用开发相对应的超算机型,是不是争得世界第一只是正餐外的甜点罢了。如果仅仅是玩票,对于自筹经费的项目当然无所谓,而天河这样国家对于国家重金投入的超级计算机,国家信息重大技术装备,这个成本是不是太高?我们有多少资源可以每一次都仅仅追求Linkpack(超算的基准测试软件)世界第一?

 

我们当然要承认,天河系统也有一些自己的技术在里面,包括少量(相对于总的CPU数量)的飞腾CPU和互连的技术等,但是无可否认的的核心计算能力都是由Intel的处理器提供,我们有理由怀疑增加了我国机密信息流失的风险。天河2号将会安装在国家超级计算中心广州中心,算是国家级的重大信息技术项目和国家级的信息技术基础装备项目,预计会承担很多重要的国家级任务。如此重要的项目,其核心技术建构在Intel的技术产品基础上甚是不妥。最近曝光的棱镜事件已经为我国 敲响了机密安全的警钟,国外反华势力不断通过各种各样的渗透计划窃取着不法信息,威胁着国家的安全。而天河2号在设备搭建、维护甚至是软件移植过程中均会有国外第三方参与,也就是说稍有管理不善,国家的机密信息将完全暴露在第三方面前 。更进一步,若假设中美关系一旦交恶,天河2号也将面临无任何后期硬件维护、软件技术支持的局面发生。从历史上看,英特尔对于中国政府推出的技术始终不友好,处于垄断或者政治方面的原因,在WAPI等国家标准的制定和推行中就起到了极不光彩的角色。目前,计算技术其实有很多的选择,难道就只有Intel一家的产品和技术可以选择?选择一家历史上对中国政府不友好的公司的产品和技术架构国家基础信息技术装备难道就没有任何危险?

 

最后一点,国家核高基重大专项实施多年,其实也有些成果慢慢出来,虽然在CPU领域存在着技术分散(有多个不同指令集的CPU项目)等问题,但是无论如何也有些成果出来,不管是龙芯,飞腾,申威,以及一些公司正在搞的ARM架构的处理器,虽说这些项目都有一些这样那样的问题,但是至少我们有些CPU出来可以用了,某些处理器诸如申威1600等还有不错的性能和性能功耗比,也已经用在了实际的大系统中。不过现状是。这些CPU中,除了ARM处理器可以用在移动终端上以外,大部分这些项目都存在一个应用不足的状态,在此情况下,没有国家的支持,很难成为大的气候。在国家投入的超极计算机中,本来是国产CPU可以起到重要的作用,对推广壮大自己CPU的生态环境是一个很好的机会,因为借机可以有大量的软件会有机会移植并且部署到采用这些CPU的系统中去,但是天河2号除了其中采用了少数飞腾处理器外,承担主要计算能力的还是国外厂商的处理器。这是一个很悲哀的事情,自己的 CPU在自己的关键设备上不使用,估计就很难有出头之日,在另一方面,大量的资源投入进行软件的开发却是为Intel做嫁衣。国家投入的大型装备是个很好的机会,可以让自己的CPU在应用等方面借机获得很大的提升,同时对于CPU产业也是一个很好的示范机会,这样的机会显然是我们自我放弃了。

无论如何,这次我们又拿到了世界第一,不过相比天河1A时候的盛况似乎冷清了不少。这中间的缘由,我相信有习以为常的原因,也许还有许多人特别是业界的人心怀疑虑的因素在里面。我希望我们国家今后类似的世界第一都是实实在在的世界第一,真正能够给人民生活,科技实力等带来进步的世界第一,而不是泡沫化的世界第一。

话题:



0

推荐

刘兴亮

刘兴亮

1299篇文章 17天前更新

DCCI互联网研究院院长,闪聚创始人,新媒体天使会创始人兼合伙人。资深互联网人士,知名营销、传播专家。多家上市公司顾问。计算机学会委员,中国电子商务协会委员。西南交通大学计算机硕士。IT名博,访问量超过千万。主要著作有《智胜江湖:创业取舍经》、《第三浪-互联网未来与中国转型》等。曾任大度咨询副总裁、互联网实验室总裁、红麦软件(soften.cn)总裁等。 【速写】 刘兴亮,山西吕梁人氏,现定居北京。 性情如家乡的黄土般纯朴, 性格若家乡的枣树般坚韧, 经历像家乡的黄河般沧桑。 好酒,三杯两杯不醉; 喜友,十个八个不少。 无它,性情耳! 【素描】 年未六十,貌似六十,心态逾六十。 心智呢?时而六十,时而十六。 【联系】 QQ:27739831 MSN:htdsd@msn.com Email:xlliu@vip.163.com

文章