AI芯片热得发烫,掀起散热“冷革命”
作者:东宇阳电子科技苏州有限公司芯片散热问题一直困扰着工业界。指甲盖大小的芯片却是个300瓦的热源,但实际上,芯片远远不到这个功耗时便已经烫得不行。
一颗小小的芯片,为何会产生这么大热量?芯片的小型化和高度集成化,会导致局部热流密度大幅上升。算力的提升、速度的提高带来巨大的功耗和发热量。制约高算力芯片发展的主要因素之一就是散热能力。未来,人工智能行业会因为算力散热问题被“卡脖子”吗?
“以功耗换性能”怪圈
近期,有海外网友统计了英伟达和AMD两家过去数代产品的性能和功耗。统计结果显示,近年来,显卡性能虽然不断提升,但最底层的晶体管结构设计和计算架构设计上却在退步。
台积电发布的一份报告显示,未来一些面积大于500平方毫米的“大芯片”,其目标设计功耗可能会高达2000瓦以上。
尽管芯片工艺尺寸不断减小,但是功耗密度却在不断增加。“半导体工艺一旦进入2nm,芯片的晶体管数量和算力自然会高倍数提升。AI算力‘飚升’的场景对超高功率芯片的解热及散热将持续带来巨大挑战。最终真正能确保高算力IC芯片发挥其设计极致功能的将是针对这些IC推出的超高功率解热及散热技术。”目前来看,芯片设计和半导体制程确实走入了瓶颈。尽管半导体厂商总说,摩尔定律从未失效,但无论是从产品设计思路、功耗数据,还是从真实的能效比测试结果来看,目前整个消费电子芯片产业,实际上已经走入一个“性能大幅提高、功耗快速上涨”的怪圈,呈现出一种“以功耗换性能”的趋势。
电信巨头入局液冷
ChatGPT掀起全球人工智能热潮,其中涉及的各种CPU、GPU、存储芯片、AI芯片、交换机芯片和光模块等功耗都非常大,如果它们产生的热量不能传导出去,那么芯片就会被烧坏。
“超过55%的芯片失效,都是源于热量传不出去,或是由温度升高而引起。芯片在70℃以上时,温度每升高10℃,其可靠性就会降低50%。”
芯片液冷技术由此变得更受关注。近期,中国电信等国内三大运营商联合发布了《电信运营商液冷技术白皮书》,规划到2025年开展规模应用,50%以上数据中心项目将应用液冷技术。东方证券发布的研报显示,目前,数据中心冷却仍以风冷为主。但随着数据中心数量增加、大型机架占比提升,以及人工智能应用爆发带来的高算力需求,数据中心高耗电的问题已不容忽视,液冷正逐步成为冷却可选方案之一。以对散热比较刚需的服务器为例,当前,全球服务器全年出货量大概为2000多万台,若每台需要3个芯片散热器,那么服务器市场规模约为180亿元。
芯片设计需权衡,矛盾差距加大
在液冷技术逐渐受到重视的同时,芯片自身散热问题也成为关注的焦点。
芯片制造商比以往任何时候都更关注导热材料和其他能够带走多余热量的技术。芯片散热需要做到“内外兼修”,在降低能耗的同时,还需保障组件的稳定性和寿命。
90%以上的热量通过封装从芯片的顶部散发到散热器。热量实际上要经过硅晶片-内部导热材料-CPU金属盖-外部导热材料(导热硅脂)的几重传导,才能传递到散热器上。在芯片和封装之间,具有高导热性的热界面材料(TIM)可以帮助传递热量。对于高密度系统来说,芯片和封装之间的热界面材料的热阻对封装模块整体热阻影响至关重要。Keysight Technologies的内存解决方案项目经理Randy White说:“在封装方式不变的情况下,如果将芯片尺寸面积缩小1/4,速度就会加快。那么,如何在一个足够小的空间里消耗更多能量?这是另一个需要研究的关键参数。”据了解,台积电实验了几种不同的“片上水冷”设计:▪ 一种设计是直接在芯片表面的硅覆盖层上蚀刻了许多凹槽,让导热液体从这些凹槽中流过,从而带走热量。
▪ 另一种设计是在芯片制造的过程中,在光滑的、带有覆盖层的硅晶片表面再加一层有水路蚀刻的硅材料,使得芯片在出厂时顶部就自带散热水路。台积电的“片上水冷”方案原理,是将芯片表层做得更薄,让芯片发热部位与散热结构之间的距离更近,同时通过直接在芯片生产步骤中加入更高级、更薄的导热材质,让热量能够从芯片内部传导到表面、传达至散热结构上。
散热已经成为电子信息领域发展的最大痛点。“当前,海量数据正推动芯片面积和数量迸发式增长,同时,芯片工艺微缩产生的功耗也在持续增加,这进一步加剧了行业供给侧和需求侧的差距与矛盾。”
洗牌大变局或不可避免
“人工智能的竞争追根究底是算力竞争,而制约高算力芯片的瓶颈是‘热’。”陈振贤称,以往散热产业只能算是芯片产业附庸,地位不高、竞争激烈。但ChatGPT的出现,不仅推动了高算力芯片快速发展,也将催生产顶尖的散热技术公司。目前国内整体市场状况如何?国内散热产业起步比较晚,相应热分析的工业软件尚在“襁褓期”,产、学、研、用等方面都未形成系统化、规模化产业效应,如应用侧没有引起足够重视,同时,国内在通用化和标准化上的经验积累和相关专家不多。但在AI和数据中心推动下,这一短板问题也在逐渐改善和加强。业界要抓住散热技术发展的趋势破局,就需要从以前的经验式散热技术转变为以工业软件建模、计算为指导并贯穿于热设计的整体环节;从新结构、新材料两个方向进行技术突破,从而实现最优化的散热设计。基于此,在各类新型技术的开发和利用过程中,才能让高效、便捷、环保的散热技术成为企业产品的竞争力以及“准入门槛”。
散热逐步进入千瓦功耗时代,一场洗牌大变局或不可避免,原有市场格局将受到前所未有的冲击,一些创新公司或新兴技术有望走向舞台中央,其中,破局之道就在于通过创造性、颠覆性的技术探寻出最优解决方案。
页:
[1]