我爱免费 发表于 2026-2-23 01:54

AI芯片战

作者:微信文章
       有人说:“科技竞争,道高一尺魔高一丈。”这话放到今天的AI芯片战场,再合适不过。

       就在刚刚过去的2025年,来自加拿大的一家初创公司特拉斯(Teras),只有20几个人,却推出了一个颠覆性的AI推理芯片。他们给出的核心数据更是炸裂:相比英伟达H100,性能提升了50倍,成本只有1/20,功耗更是只有1/10。

       听起来很神奇对吧?甚至很多人以为这是华为或者美国高薪聘请的专家团队研发出来的。那么这样的芯片是如何做到的呢?

       原来呀,特拉斯的芯片放弃了通用人工智能芯片的设计思路,转而采用了“模型固化”的架构。换句话说,就是把一个AI模型直接做进去了,就像培养一个超级专业的“专科医生”,只解决一个问题。这就跟我们熟悉的英伟达的通用人工智能芯片这个“全科医生”彻底分道扬镳了。

       所以,特拉斯的芯片不需要考虑不同模型之间的切换,也不需要考虑数据传输的问题,只需要专注于一个问题,自然就能发挥出超越英伟达等通用人工智能芯片的性能。

       我拿到了他们的芯片,也做了实际测试。确实,特拉斯芯片的反应速度非常快,只要把问题放进去,几乎就是瞬间,2000字的回答就生成完毕了。而同样的问题,使用英伟达的芯片可能需要几十秒钟的时间。

       但是,特拉斯也有缺点。因为它的模型是固化到芯片当中的,所以它使用的一定是一个固定的模型版本。这也意味着,特拉斯的产品从诞生的那一天开始,就不能得到任何的迭代和升级。因此,特拉斯也会面临各种老旧人工智能模型所产生的问题,例如逻辑混乱、答案错误等等。

       所以,这种类型的芯片其实更加适合那些不需要进行任何性能提升的设备。比如现在已经被全面复刻的任天堂经典红白游戏机,就可以完美地适配特拉斯的芯片。

       特拉斯的首席执行官拉贾·塔雷克(Raja Tareq)表示,他们希望专注于那些只需要最低计算能力且没有迭代需求的领域,比如工业设备或消费电子产品。

       换句话说,特拉斯已经看准了未来的“端侧AI”。这里的端侧,可以是一台电脑、一部手机,也可以是一个智能门铃、一个汽车车灯。

       2025年被称为“端侧AI元年”,各大厂商都在发力布局端侧AI的能力。而在端侧AI时代,芯片战场的竞争重点也从单纯的算力转变为能效比。华为去年发布的昇腾310P,其能效比就达到了惊人的48TOPS/W。

       但是,专用化程度越高,通用性就越差。就像特拉斯一样,为了追求极致的效率,就必须放弃灵活的支持不同的模型。这也是为什么目前大热的开源AI平台社区如此重要的原因,因为他们提供的是通用的人工智能能力,并且开放给所有人去使用和开发。

       而对应的专用化与通用化的斗争,也将继续在未来很长一段时间内持续下去。而且,越是专用化的产品,对于客户的选择就会越少,市场风险也就越大。

       总结一句话:未来的AI芯片市场会进一步加速分化,而端侧AI的专用化将成为各大厂商争夺的关键突破口。
页: [1]
查看完整版本: AI芯片战