我爱免费 发表于 2025-6-17 23:48

AI 日报|2025.06.17 巨头混战新高潮:推理模型卷效率、多模态拼开源、AR眼镜亮参数!

作者:微信文章
🔮 一、MiniMax开源推理模型M1:100万Token上下文,成本暴降90%

- 超长文本处理:支持100万Token输入(Gemini 2.5 Pro同级),可解析整本《三体》级文本。

- 极致性价比:推理算力仅为DeepSeek-R1的25%-30%,强化学习训练成本仅53.7万美元(行业1/10)。

- 性能对标国际:在软件工程、工具调用等复杂任务中超越国内闭源模型,接近GPT-4o水平。

> 💡 开发者福音:API价格与豆包1.6持平(输入0.8元/百万Token),App/Web端免费不限量。



💻 二、OpenAI升级Codex:一次生成多方案,编程效率翻倍

- 多方案生成:单任务可一次性输出多个代码版本,无需重复请求。

- 操作优化:新增快捷键系统(如Mac按`⌘+/`快速唤醒),支持取消任务与进度实时显示。

- 专业级支持:脚本运行时长延至20分钟,适配复杂项目调试。

> 🚀 适用场景:企业级开发、自动化测试、依赖包管理。

👓 三、XREAL Project Aura眼镜参数公开:双芯驱动,延迟仅3ms!

- 硬件配置:高通骁龙XR芯片 + 自研X1S空间计算芯片,性能提升25%。

- 光学突破:70°视场角(等效4米外215英寸巨幕),镜片体积缩减44%。

- 系统生态:运行Android XR系统,兼容Moohan应用,支持6DOF空间追踪。

> 🌐 战略意义:谷歌联合XREAL打造安卓XR生态“铁三角”,对标苹果Vision Pro。

📚 四、哈佛开源史上最大图书数据集:98.3万本公共领域著作

- 数据规模:涵盖245种语言、2420亿Token,40%为19-20世纪英文书籍。

- 版权合规:严格标注元数据,仅纳入美国公共领域内容,建立反馈机制处理争议。

- 未来计划:纳入波士顿图书馆数百万份历史报纸,推动学术AI训练规范化。

> 🏛️ 项目地址:

🌈 五、蚂蚁开源“Ming-Omni”:首个多模态GPT-4o级开源模型

- 全模态支持:统一处理文本、图像、音频、视频输入,端到端生成语音与图像。

- 性能碾压竞品:在语音理解、图像生成任务中超越Qwen2.5-Omni,FID指标达4.85(优于SDXL)。

- 方言黑科技:理解方言输入并克隆语音输出,适配多语言场景。

> ⚡ 开源承诺:代码与模型权重全部公开,GitHub已可下载。

🛠️ 六、微软推出Code Researcher:Linux内核崩溃解决率58%

- 深度分析:通过语义分析+提交历史追踪,自动定位系统级代码漏洞。

- 工业级表现:在Linux内核测试中解决率58%(远超SWE-agent的37.5%),平均排查10个关联文件。

- 多场景验证:成功修复FFmpeg等开源项目崩溃问题,推动复杂系统维护自动化。

> 🤖 技术革命:AI调试从“辅助工具”升级为“自主研究员”。
页: [1]
查看完整版本: AI 日报|2025.06.17 巨头混战新高潮:推理模型卷效率、多模态拼开源、AR眼镜亮参数!