AI 新闻资讯 12月18日
作者:微信文章AI News
AI 新闻资讯
关注前沿行业资讯
今日AI产业脉冲聚焦“三件事”:超大融资与云算力绑定、算力调度进入软件栈争夺、国内模型以“降本+多模态+Agent”加速渗透。
资本与供给侧在重排座次:云厂商把模型、芯片、组织与生态捆成一条链,争夺“下一轮默认平台”。
总体判断:AI正从“拼训练规模”转向“拼推理效率与制度边界”,产业进入再对齐周期。
12月18日资讯
OpenAI拟洽谈最高1000亿美元融资,估值约7500亿美元
据外媒披露,OpenAI正与投资人进行初步讨论,计划融资规模最高可达1000亿美元,目标估值约7500亿美元;同时市场也在评估其在2026年下半年提交IPO文件的可能性。结构上看,这不是“资金更充裕”那么简单,而是对AI竞争范式的再确认:当训练、推理与部署被算力成本锁死,融资能力就等价于“可持续迭代速度”。更关键的是,资本将以更强方式介入“算力采购—芯片议价—云合作”的合约网络,头部模型公司可能进一步从软件公司演化为“算力组织者”。融资若落地,行业估值锚将从“收入倍数”进一步迁移到“算力可得性与锁定年限”。
来源|综合自路透社等|2025年12月18日
亚马逊重组AI组织:模型、芯片与量子统一进新架构
亚马逊宣布对AI业务进行组织级调整:由AWS基础设施老将Peter DeSantis统筹新的前沿技术单元,覆盖自研模型、Trainium/Graviton等定制芯片与量子计算;原AGI相关负责人将离任,机器人与前沿模型研究也同步换帅。其结构意图清晰:把“模型能力”与“算力供给”放在同一条管理链上,以缩短从硬件、平台到产品化的决策回路,并在与微软、谷歌的云端竞赛中重建节奏优势。云巨头的AI竞争已从单点模型比拼转入“组织形态+供给体系”的系统战,谁能把芯片、调度、模型迭代与客户交付压成一个闭环,谁就更可能成为默认入口。
来源|综合自路透社、FT等|2025年12月18日
英伟达收购SchedMD,把Slurm纳入AI基础设施版图
英伟达宣布收购AI软件公司SchedMD,其核心资产是开源作业调度系统Slurm(广泛用于HPC与大规模AI训练/推理集群)。交易表面是“补软件”,本质是向算力运营的关键控制面延伸:当推理负载碎片化、集群多租户化成为常态,调度系统决定GPU利用率、任务排队与成本曲线,也决定云厂商与AI工厂的交付能力。英伟达强调将继续保持Slurm开源分发,既稳住生态,也为自家硬件与网络产品提供更深的默认适配层。CUDA之外,英伟达正在把优势从“编程平台”扩展到“集群运营平台”,算力竞争的上游正在被软件栈重新定价。
来源|综合自路透社、NVIDIA官方|2025年12月18日
火山引擎发布豆包大模型1.8:多模态与Agent强化,调用量再抬升
在FORCE原动力大会上,火山引擎宣布豆包大模型升级至1.8版本,强调更强的Agent能力与多模态理解,并披露豆包日均tokens调用量已超过50万亿、发布以来实现数百倍增长。行业信号在于:国内大模型竞争正在从“榜单参数”转向“调用结构与成本运营”,通过更精细化的上下文管理与调度策略,把企业最常用区间的推理成本压到可规模化采购的水平,从而换取更大的生态调用与开发者黏性。当“调用量—数据回流—工具链—行业模板”形成飞轮,模型平台就会从API供应商升级为企业流程的“新中间件”,价格与调度能力将成为同等重要的武器。
来源|综合自新浪科技等|2025年12月18日
小米开源MiMo-V2-Flash:以MoE与长上下文抢占推理效率赛道
小米发布并开源MiMo-V2-Flash,定位为面向推理、编码与Agent场景的高效率模型。其工程取向明确:采用MoE结构(总参数大、激活参数小)并支持超长上下文窗口,意图在“可用成本”与“可部署性”上取得更优折中,服务手机/IoT/车载等端云协同场景。与传统“训练堆规模”不同,这一路线更贴近2026年的主战场——推理吞吐、延迟与单位token成本。终端厂商下场开源,代表国内AI入口之争开始从“应用层”回到“基础模型与工具链”,未来竞争关键不只是谁模型更强,而是谁能把模型变成系统级能力,嵌入人、车、家的常驻交互。
来源|综合自小米官方、SCMP等|2025年12月18日
美国行政令瞄准“州级AI监管”:监管权上收引发争议
美国总统签署行政令,试图以联邦层面的“统一框架”对冲各州分别立法造成的监管碎片化,并授权相关机构对州级AI法律发起挑战。支持者认为这将降低合规摩擦、利于产业扩张;反对者则担忧对消费者保护与反歧视治理形成削弱,并可能引发新的司法争议。结构上看,这是AI治理从“地方实验”向“联邦集权”的一次硬切换:一旦成形,合规门槛将更像“单一大市场规则”,也更利于头部平台集中资源跑通商业化。2026年的AI竞争将同时发生在算力与制度上,监管边界本身正在成为产业要素之一。
来源|综合自白宫官网、Politico等|2025年12月18日
趋势总结
一条主线正在清晰:推理时代全面到来。英伟达把Slurm纳入版图、火山引擎强调调用量与调度、小米押注MoE与长上下文,本质都是在争夺“更高GPU利用率与更低单位token成本”。 另一条主线是云与资本的绑定加深:OpenAI的超大融资与亚马逊组织重组,都在把模型、芯片、云合同与研发节奏锁进更强的资本结构里,行业由此进入“平台化集中”。
制度面则出现“再集中”倾向,美国试图上收州级监管权;同时,亚太多地推进“主权AI”与基础设施建设,技术与治理正同步进入国家竞争变量。
2026的胜负手不再是“谁训练得更大”,而是“谁把推理成本压下去、把生态锁进来、把规则谈下来”。
企业与投资决策应优先盯住三张表:推理TCO、调度与工具链黏性、以及合规边界变化,这三者将共同决定下一轮份额迁移。
页:
[1]