北京2022年12月19日 /美通社/ -- 计算是智慧时代一个永恒的话题。那边厢云计算已是热火朝天,这边厢边缘计算已呈燎原之势。
有人形容,边缘计算是“人工智能的最后一公里”,“物联网的最后一公里”,“打通用户的最后一公里”……边缘计算看似不起眼,却将承载起边缘侧海量的数据计算处理。但“最后一公里”恰恰是最为艰难的一公里,需求的多样化和差异化,让边缘计算产业化受到一定程度的制约。
如何打破这种局面,让边缘计算不再“边缘”,在更多业务场景中加速走向落地?浪潮信息的研发团队走遍了大江南北,深入到海南太阳暴晒的路口、东北寒冷偏僻的油井现场、西北大山深处的煤矿等地进行多方位需求调研,提出边缘服务器要适应零下40~70摄氏度的严苛环境,并且创新性地发明了三明治散热架构、低温热启动装置,大幅提升边缘计算设备环境适用性。
这些实践无疑证明当前边缘计算落地关键所在:即边缘计算产品的研发与边缘场景需求必须深入对接,既需要深入业务场景去了解真实需求,也要在产品研发上打破常规进行大胆创新,只有这样方能真正引领边缘计算走向落地。
上山下海,才敢提挑战零下40~70摄氏度极限
如今,在5G、大数据、AI、物联网等技术的驱动下,边缘场景在各大行业中迅速兴起。Gartner预测,到2025年将有30%的数据会运行在边缘,边缘场景将会成为数据产生、智能应用的主阵地之一。
与数据中心等相对稳定的环境和专业的运维团队不同,边缘场景的环境可谓是千差万别,更没有专业团队负责日常的运维与管理,这就让边缘设备的研发遇到两大挑战:其一,温度、湿度、粉尘等环境因行业而异,不同行业的需求复杂多样,对于边缘设备的适应性提出极高挑战;其二,边缘场景尚未成熟,有着巨大的需求空间尚待探索,用户需求也不明确,厂商没有标准来参考开发边缘设备与方案。
一切都需要以用户为中心,去真实场景中探索详细需求。例如,在室外一些智慧交通路口、智慧电网智能运维等场景中,用户对于设备的环境适应性、运行稳定性要求很高。
针对边缘计算设备部署环境这个最大的挑战,浪潮信息的产品团队大胆提出了“零下40~70摄氏度”的部署环境温度极限值。做出这个决定,产品团队并不是拍脑门和想当然。从2020年浪潮信息成立专门的边缘计算事业部起,产品团队在两年时间里进行了大量的用户走访与需求调研,得出“零下40~70摄氏度”温度极限值的产品研发需求。
但这却给产品研发团队提出了一个极大挑战。因为一般环境限制,边缘计算设备会采用无风扇的设计,高温散热是极大考验,“零下40~70摄氏度”远超市面其他产品的需求是在挑战设计的极限。尤其是无风环境下要达到70摄氏度,远超一般通信类设备行业规范和标准。
但“零下40~70摄氏度”极限值需求是用户真实存在且必须满足的,边缘计算应用环境的复杂性超乎想象,边缘计算技术要想获得规模化地应用,就必须克服这个难题。
一块三明治的启发
众所周知,散热是边缘计算设备稳定运行的关键因素和最大难点。
这是因为如今的边缘计算设备早已不是简单的执行控制程序,还需要进行大量的数据流处理、AI模型推理等,对于算力的需求大幅提升,也让CPU的运行往往处于较为饱和的状态,CPU一旦高速运转,温度最高可达90摄氏度,加上像交通信号柜等边缘场景往往是封闭的铁皮箱,环境温度在夏天往往达到60~70摄氏度,让边缘计算设备的散热更加困难。
前期浪潮信息研发方向致力于在散热上盖和热源之间增加高导热系数的导热材料,让热量快速传递出去。但尝试了很多次,连60摄氏度的散热极限的都无法满足。
由于没有行业内的先例可以参考,研发团队对此只能重新根据需求,把关键点、矛盾点逐一列举出来,利用思维导图将问题点按照大小级别进行分类,以求寻找到关键的突破口。正当研发团队再次陷入僵局,一块加班中用来充饥的三明治引发了研发团队的灵感。
三明治各种食材层层叠加的形状,让研发工程师们意识到可以借鉴到边缘计算设备的散热上,散热上盖底部压铸出导热凸台,通过导热凸台与导热界面材料、热源部件依次贴合的结构,可以排出热源上方的空气,大大消除内部界面热阻。
“三明治”散热架构就此诞生,散热盖、凸台、界面材料、热源从上到下就类似一块三明治。不仅如此,研发团队还针对边缘服务器百变的配置需求,设计了不同形状上盖,让导热凸台、界面材料的位置、大小随着内部器件的变化而变化,实现产品的灵活百变和高效散热。
研发团队前前后后做了七版方案,终于经过不断努力,寻找到最为合理的方案。
有了整体的方案之后,接下来就是细心打磨、不断优化的阶段。例如,三明治的多层食材中,每一层食材的不同、食材的多少都会决定三明治的口感;同理,在“三明治”散热架构中,每一层材料的区别是否也会带来散热效果的不同?为此,研发人员进行了仔细研究发现,界面材料厚度的微小差异,都会影响散热的效率,材料厚度缩小0.6毫米,CPU的温度就可以降低2.1摄氏度。因此,研发团队需要在CPU、内存等等部件凸台最小结构公差下,设计出最小厚度的界面材料。
经过多次仿真和实测,研发人员最终采用高导热和高压缩性的界面材料和凸台填充在热源与散热外壳之间,导热效率达到10W/m·K,是空气导热效率的435倍,让服务器适应的极限环温从原来的60摄氏度提升到67摄氏度。
67摄氏度已经超越了很多边缘设备的极限值,但这还不够,离最终需求还差3摄氏度。真所谓行百里者半九十,最后这3摄氏度最为接近极限需求,那么,还能有继续优化的空间么?其实,把CPU散热这个最大难点解决了,等于大幅提升了内部热传导效率,相当于成功了一大半。接下来,可以从边缘计算设备整体散热的角度去优化考虑,从机箱结构、每个部件等方面做到最优。”
为此,研发团队从“设备与环境之间如何进行高效导热”的角度出发,利用热仿真软件对多组参数组合进行对比分析,并绘制响应面优化曲线,最终确定出一组关于鳍片厚度、间隙和高度的最优组合,在有限体积内形成超过3000平方厘米的散热面积,达到了最佳散热能力。同时,为了进一步让上盖均匀的将热量扩散出去,消除局部热点,散热上盖中设计了2D热管网络,热管走向经过反复优化仿真,精准布局,有效规避局部热点的产生,提升整机均温能力。
终于,浪潮边缘微服务器EIS 800这台能够在无风条件下、70摄氏度极限环境也能高效、稳定运行的边缘计算设备横空出世。
浪潮边缘微服务器EIS 800已经获得2022年度德国红点设计大奖,并且在制造、交通、能源、水利、零售等多个行业用户的环境中通过了POC验证,未来将在各个边缘场景中发挥重要作用,进一步推动边缘计算产业走向落地。
模块化设计应需而变:一切为了边缘计算
边缘计算设备的产品设计与规划,并不会围绕某个部件的迭代而展开,而是会从实际需求的角度进行迭代。
不过,边缘场景需求的差异化、多样化,的确又是横跨在边缘计算设备走向规模化的一大难题。差异化和多样化意味着大量需求彼此互斥,需要单独设计,产品通用性差,后期的维护、保障也会遇到各种问题。如何改变这种局面,真正让边缘计算走向落地?
在经历了大量调研和反复论证之后,浪潮信息提出了解耦模块化设计的思路。这种思路类似乐高搭积木,形成核心计算模组、AI模组、通信模组、管理模组、散热模块等核心模块,统一不同模块的接口标准,再根据边缘场景的差异化需求进行拆解和组合,灵活满足不同边缘场景的产品需求。
例如,智慧路口场景中,摄像头从几路到十几路,边缘计算设备的算力需要阶梯式布局;又如,在工业场景,需要更加灵活的通信方式,需要兼容有和无线不同网络通信;而针对油井、矿山等环境会出现的边缘设备低温启动难的问题,浪潮信息研发团队还为系统设计了远程运维模块,低温热启动装置,可以在环境温度零下40摄氏度的环境下,远程或自动调动系统来加热边缘计算设备,让设备每部每个组件满足温度要求后再启动运行。
从模块组件解耦到根据需求进行灵活组合,既考验边缘设备研发团队的整体设计能力,又对于模块之间组合后的产品效果提出挑战。为此,浪潮信息不断摸索,推出了边缘模块化设计架构ECOM(Edge Computing Optional Module),并且对各个模块之间通信进行优化。目前,浪潮信息已经将边缘计算模块化设计标准ECOM贡献给全球开放计算组织ODCC。
与传统服务器清晰统一的设计方式、理念不同,边缘计算依然处于探索期,更加需要有意识地去完善标准,从而更好地推动落地。
星空不问赶路人,岁月不负有心人。作为中国边缘服务器市场第一的厂商,浪潮信息会持续以客户为中心,贴近用户场景需求,携手生态伙伴共同推动边缘计算加速落地。
原创文章,作者:,如若转载,请注明出处:https://knewsmart.com/archives/98654