台灣清潔工程交流論壇
標題:
探秘百度阳泉云计算中心:8大機房模组、16万台服務器、20倍交付效率
[打印本頁]
作者:
admin
時間:
2022-10-4 23:10
標題:
探秘百度阳泉云计算中心:8大機房模组、16万台服務器、20倍交付效率
智工具(公家号:zhidxcom)
文 | Lina
6月15日,智工具等数家媒體遭到baidu约请,前去其位于山西省阳泉市的云计较中間举行观光访問,先容了有關baidu阳泉云计较中間的收拾運营状态、從供電到散热的浩繁节能技能、各种baidu自研的辦事器(“北极”、“冰山”、“鲲鹏”、“X-Man”等)和baidu是若何利用人工智能對该中間举行展望與调控,做到智能节制、智能運行。
值得一提的是,山西阳泉恰是baidu開創人李彦宏的故乡。阳泉云计较中間位于阳泉經濟開辟區东區,從室内坐大巴必要约20分钟达到。
按照事情职員先容,baidu阳泉云计较中間從2012年8月19日奠定動工(那時項目规划投資47.08亿元)2014年起頭投入利用,截止至笔者發稿日已平安事情了1082天了。当初规划了四期工程,8個機房模组,今朝已完成為了三期6個機房的投運,最後一期也在严重扶植,行将投入利用。
阳泉云计较中間修建面积有12万平米,具有400+項專利技能,設計容纳16万台辦事器,是今朝為止是亚洲建成投運的最大数据中間之一,也是baidu在天下几十個大型数据中間中范围最巨大的一個。
同時,阳泉云计较中間依照T3+尺度設計建照,可用性為99.99%+——這句话是甚麼意思呢?那就是整年不成历時間不克不及跨越52分钟。年均PUE1.11(数值越靠近1,能效比越高)。并且,固然位于煤炭大省山西,但阳泉云计较中間的干净能源利用比例很是高,今朝利用太阳能、風能等干净能源的占比到达了20%。
從大門進去,起首要過安检并举行挂号,阳泉云计较中間的平安品级比力高。起首映入眼帘的是位于園區中間的一栋椭圆柱形修建,這就是阳泉云计较中間的ECC监控中間,外围环抱着编号為D01-D08的8座方形修建,這就是上文提到的8個機房模组。
在園區里走着,一個最大也是最较着的感受就是——没人。因為数据中間全数采纳先辈的主動化、智能化节制技能,必要巡查、保护、调控职員少少,每一個班组2-3人便可以完成2個模组约3万平米7*24小時運营。是以诺大一個12万平米的園區修建里,根基上很丢脸到人。
進入中心大楼的ECC监控中間後,可以看到這是一栋宽阔豁亮的4层修建,以黄白色调為主,在baidu率领大师观光的此中一個节制室里,咱们可以看到各個機房的及時参数、监控视频等信息,触及秘密這里就不上圖了~
好了,接下来就是本次观光先容的重頭戏,機房观光。
在阳泉云计较中間安装8個機房模组的辦事器中,包含了各种baidu自研的辦事器:如“北极”、“冰山”、“鲲鹏”、“X-Man”等,此中90%以上都是“北极”整機柜辦事器。
“北极”(天蝎)自研整機柜辦事器
——采纳同享電源、同享電扇架構,部件全数尺度化、模块化、一體化,支撑40摄氏度情况温度持久運行。总具有本钱(TCO)低落15%,交付效力晋升20倍——這句话更直观地换算過来甚麼意思呢?那就是本来必要1個月上線的辦事器,如今只必要1天。
“冰山”自研高密度存储辦事器
——立异的高密度存储解决方案,支撑贮存池化設計和分层存储,单台辦事器可存储180TB数据,有力地支撑了baidu的私有云、公有云营業。
“鲲鹏”自研高温辦事器
——業界初次范围商用的高温辦事器(一般辦事器送風温度是22-24度,鲲鹏可以支撑送風温度到达45度)同時具有耐腐化性,與IDC强耦合,完全实現全天然新風冷却。
“X-Man”自研AI辦事器
——業界首個基于PCIe Fabric架構的16卡GPU辦事器,兼容支撑FPGA。支撑异構计较資本池化,可扩大到64GPU以上,供给1000TOPS量级计较能力,可以或许遍及利用于语音、圖象、NLP、搜刮、無人車加快计较場景。
在供電方面,阳泉云计较中間去除傳统的UPS,初次采纳 HVDC offline(高压直流浪線)技能、散布式锂電池(BBS)供電技能,把供電效力從90%晋升到99.5%。阳泉云计较中間同時也是海内首個采纳太阳能光伏發電的数据中間,在顶楼铺設太阳能光伏面板直接并網發電,直接给辦事器利用,节能的同時還削减污染物排放。
交友app
,
不外,操纵太阳能光伏面板發電的電量占的仍是用電量的少数,阳泉云计较中間在2017年與電厂签约的2600万度風力發電,使得干净能源的占比到达20%。
在散热方面,阳泉云计较中間96%的時候可使用室外冷氛围实現免费冷却,换算過来一年里有14.6天才必要全数開冷水機组制冷,從而节流了大量的能源。
一方面,云计较是AI的底层能力之一,baidu阳泉云计较中間所供给的计较能力可觉得用户供给AI-ena
百家樂預測
,ble收集,此中包含基于cookie呆板進修模子的IP地舆定位、基于交互機日记的妨碍展望、营業收集质量的丈量與感知、基于呆板進修的進犯流量监测體系等等
現金板
,。
而另外一方面,AI也被利用在了云计较中間的智能节制、智能運行上。經由過程收集情况参数、装备功耗、運行模式、動作状况等参数,再将它们利用AI算法举行计较優化(此处的AI包含HPC、呆板進修、深度進修等,解决分歧問题會用分歧模子,但大部門练习都是用baidu的PaddlePaddle開源平台)。
經由過程baidu的人工智能技能,阳泉云计较中間現在做到智能预警、智能调剂、智能運维——而這也是上文提到的園區員工很少的缘由之一。预警、调剂、運维包含很多方面,如下是工程师先容的此中三點:
1)主動運营:大幅收缩電力切换時候。当突遇停電時,傳统备用發機電電源切换要15分钟,但如今經由過程電力监控體系全主動切换,可以到达分钟级此外切换速率,最快只必要30秒。
2)智能调剂。凡是数据中間用電是有颠簸的,辦事器存在闲時忙時,波峰波谷。為了提高辦事器及機房的操纵率,經由過程AI技能展望對在線营業需求举行展望,經由過程在線营業及离線营業混布,闲時调剂更多离線营業,跑离線计较、练习模子。
3)智能展望:果断收集流量是不是异样。用AI模子举行计较、果断某個流量究竟是用户的
素描
,正常操作举動仍是歹意進犯流量。
在各种科技、IT主题的美剧中(好比《硅谷》),辦事
生髪推薦
,器機房一向是個被人拿来讥讽的处所。就连本年苹果的WWDC的開場视频也拿一名刚入职的科技宅男坐在辦事器機房里,偶然中碰掉了供電插頭而激發一場骚乱的
当下跟着人工智能與万物互联的普及,接入收集的装备愈来愈多,数据计较量也愈来愈大,云辦事、云计较已渐渐酿成智能期間的基层修建,成為如供水、供電、收集通讯等咱们平常糊口中不成或缺的根本举措措施。
今朝,不管是外洋的亚马逊云、微软云、仍是海内的阿里云、baidu云等等,都纷繁继续着對云计较数据中間的投入扶植,如baidu一般,很多公司都是從几年前就起頭结構扶植,在比年陸续投建利用,為企業的人工智能與万物互联供给云辦事與云计较能力。
歡迎光臨 台灣清潔工程交流論壇 (https://onecl.com.tw/)
Powered by Discuz! X3.3