新闻 发表于 2025-12-4 22:18

AI 前沿日报 | 2025-12-04

作者:微信文章


1/15 OpenAI 发布了 GPT-5 Thinking 中 “confessions(自白)” 功能的概念验证,通过训练模型在主要回答之外同步输出关于其指令遵循情况的诚实报告,从而揭示诸如捷径(shortcuts)或违规(rule-breaking)等隐藏失误,使测试中的假阴性率降低至 4.4%。

2/15 OpenAI Foundation 通过 People-First AI Fund 向 208 家非营利组织发放了总额 4050 万美元的非限制性资助,重点支持社区驱动的项目,以确保 AI 造福多元群体。

3/15 Anthropic 与 Snowflake 扩大 Claude 合作关系,签署总额 2 亿美元的多年期协议,使超过 12,600 名客户能够在严格隐私保护下使用 AI 安全查询企业数据。

4/15 Anthropic CEO Dario Amodei 在 NYT DealBook Summit 上讨论国家安全议题,强调由于 AI 的独特能力及深远影响,民主国家必须在 AI 发展中发挥主导作用。

5/15 Anthropic 与 Dartmouth、AWS 合作,将 Claude for Education 部署至整个 Dartmouth 社群,以增强学术工作流程中的 AI 使用能力。

6/15 Google DeepMind 公布其 NeurIPS 2025 日程,包括与 Jeff Dean 和 Gemini 团队的问答环节,以及面向 3D 虚拟世界的 SIMA 2 演示。

7/15 Runway 发布 Gen-4.5 升级,支持从写实(photorealistic)到动漫(anime)等多种风格,并保持视觉一致性与场景光照准确性。

8/15 Midjourney 在 NeurIPS 2025 上推出冰淇淋卡车,为研究者提供免费甜品与周边。

9/15 Greg Brockman 分享一篇同行评议物理论文,论文核心思想由 GPT-5 通过 Generate-Verify 协议生成,推动了量子场论(QFT)和状态依赖量子力学(state-dependent quantum mechanics)的发展。

10/15 Elon Musk 确认 Grok 4.1 Fast 在 Python 编程基准测试中排名第一,Grok Code Fast 1 位居第二,整体领跑榜单。

11/15 NVIDIA 与 Synopsys 建立合作,将加速计算融入工程工具,推动半导体、汽车、航空航天与医疗等行业的工作流程革新。

12/15 Groq 被 Gartner 评为 Cool Vendor,以表彰其在推理加速(inference acceleration)方面的创新能力,使更快速的 AI 部署成为可能。

13/15 Luma AI 发布 “Star Seeker”,这是一段由 Ray3 Image-to-Video 技术生成的视频作品,在 Dream Machine 中探索全新世界。

14/15 Ethan Mollick 指出,Google 的 NotebookLM 幻灯片生成功能现已能够基于 10 篇以上论文生成连贯的演示文稿,并显著减少幻觉,但编辑仍具挑战。

15/15 Bindu Reddy 总结 2025 年开源亮点:DeepSeek V3.2(数学任务超越 GPT-5,成本 557 万美元)、GLM 4.6(20 万上下文)、Mistral 3(675B 单 GPU 运行)、Kimi K2(SWE-Bench 得分 71%)、Qwen3(100 万 tokens、支持 119 种语言)。
页: [1]
查看完整版本: AI 前沿日报 | 2025-12-04