“因为运用了一种领先而复杂的水冷系统,‘神威蓝光’超算中心在国内外的超算中心群体中算是最省电的。但我们研发了一项国家专利奖技术,在此基础上再降耗12%,由此完成一项世界纪录。”2月22日,一见科技日报记者,山东省计算中心(国家超算济南中心)党委书记、副主任谭安辉便忙不迭的展示他们的“神奇”技术。
谭安辉和同事们运用无线传感器采集“神威蓝光”机柜内外的温度、湿度、风速等情况,将收集的数据按照一套复杂的算法计算出机柜内外每个布点既能省电,又最舒适的“最佳温度”,然后自动远程调节系统并消除局部热点,从而实现了最省电指标。
作为千万亿次超级计算机,能耗、能效是核心指标。相对于其他超算中心用风扇降温的风冷模式,水冷系统本身的功耗要降低40%。谭安辉说,通常,一台千万亿次级超级计算机每年大约要消耗一个中型核电站的发电量,比如美国最快的超级计算机“美洲豹”约为7兆瓦,我国的“天河一号”也接近4兆瓦。但“神威蓝光”功耗极低,只有1兆瓦(100万瓦),如果按照时下的电价,大概需要每天6万元电费。
世界超级计算机TOP500项目领导者、美国田纳西大学计算机科学家杰克·唐加拉曾表示,相对风冷,“神威蓝光”展示了一种复杂的水冷系统,它让济南的冷冽、纯净泉水在主板之间封闭循环流动,实现CPU、内存、元器件的冷却并带走热量,几乎不损耗水且无噪音,先进环保,“就像三明治夹心,水冷板被紧紧地夹在两块CPU板中间,无缝同步散热,所以尽管CPU高速运行,却听不见风扇的噪音。”他认为这是超级计算机设计上的一项重大进步。
刚刚获得2016年中国专利奖优秀奖的这项技术学术名是“基于物联网技术的数据中心动力环境监测系统所采用的方法”,济南超算中心智能感知与控制创新团队负责人吴晓明博士告诉科技日报记者,该技术采用超低功耗的无线数据采集技术、三维建模及虚拟仿真技术、智能分析技术,针对机房内哪些地方有热点,哪些地方出现功耗特别大的地方,该技术自动采集信息并分析,乃至给出最佳解决方案,从而消除局部热点,实现超算中心安全稳定和节能。
实际上,电力成本几乎是全世界各大超算中心和数据中心最大的运营支出项目。仅2015年,谷歌母公司Alphabet就消耗了5.2太瓦时的电力,几乎与整个旧金山市持平。为此谷歌表示,2017年,包括所有13个数据中心及其所有的办公室在内,其全球运营网络的供电将完全基于可再生能源。但诸如风能、太阳能等可再生能源同样面临巨额投入问题。
降低耗电量只是该技术的“杀手锏”之一。当前,国内各个企业单位的数据中心面临着一个相同的难题:支撑数据中心的是后台庞大的服务器,但是大量数据的处理,往往会导致局部温度非常高,服务器有可能出现宕机现象,就像人“中暑”了一般。这就意味着系统无法从一个系统错误中恢复过来,或系统硬件层面出问题,以致系统长时间无响应,而不得不重启动系统,问题是大量的数据可能在重启中丢失造成损失。对银行、气象、超算中心等敏感部门来说,这是不可承受之重。
“到2015年,全国的数据中心的年耗电量就远远超过三峡电站的年发电量。而我们的这项技术虽然源于超算中心的省电实践,但已经推广到国内部分省市的数据中心,第一解决耗电问题,第二解决宕机现象。”谭安辉说,这项技术已经在国内部分数据中心推广并产生4000万的经济效益,帮助用户节约了34587万成本。
精彩评论