AI前沿速递:人工智能最新动态(0623)
作者:微信文章Kimi 推出革命性 AI 研究助手,万字报告溯源一键完成!
月之暗面旗下 Kimi 智能助手 6 月 20 日宣布,首个 Agent 产品 Kimi-Researcher 启动小范围灰度测试。该模型基于端到端自主强化学习技术,可生成带 26 + 可溯源信源的万字深度报告,支持动态可视化交互,在 HLE 测试中 Pass@1 准确率达 26.9%,超越 Claude 4 等竞品。其创新点包括:自动规划研究流程、跨维度数据关联(如专利 + 财报 + 行业数据)、动态假设修正机制,以及全链路可追溯的 “来源卡片” 设计。内测用户反馈显示,其效率较人类团队提升 400%,已接近 5 年经验分析师水平,目前可通过官网申请体验,未来将逐步开源核心模型。
马斯克放言用 Grok 3.5 重构人类知识体系,AI 或将成为 “终极知识审核员”
埃隆・马斯克于 6 月 22 日宣布,将利用具备高级推理能力的 Grok 3.5 模型重编人类知识库,删除错误内容并填补缺失信息,随后基于 “纯净版” 数据重新训练模型。他强调现有 AI 因依赖未经校正的数据存在大量 “垃圾信息”,而 Grok 3.5 将从第一性原理出发,通过逻辑推理生成原创答案,尤其在火箭发动机、电化学等专业领域展现突破性能力。此举引发争议,有批评者认为这可能导致知识审查,类似《1984》中的场景。目前,Grok 3.5 的早期测试版已向订阅用户开放,其算力规模较前代提升 2.75 倍,目标是成为人类知识的 “审核员” 与 “补全者”。
央视重拳出击 AI 聊天软件乱象:擦边内容泛滥,未成年人安全防线亟待筑牢
央视新闻近日曝光多款 AI 智能体聊天软件暗藏行业乱象,部分平台通过 "校霸"" 性感人妻 "等擦边角色设定,诱导未成年人进行包含性暗示、暴力元素的对话。实测发现,软件普遍存在青少年模式形同虚设问题,用户仅需手机号即可注册,跳过年龄验证接触" 出轨对象 ""病娇养兄" 等极端内容。部分软件还通过充值机制诱导未成年人消费,单次充值金额可达上千元。上海市网信办已约谈涉事企业,中央网信办 "清朗" 专项行动第一阶段累计处置违规 AI 产品 3500 余款,清理违法信息 96 万条。专家警告,此类软件利用 "拟人论" 心理机制引发成瘾风险,可能触碰传播淫秽物品罪、侵犯公民个人信息罪等法律红线。
GitHub 紧急通知!7 月起停用 GPT-4.5,开发者速迁新模型避免代码中断!
GitHub 官方宣布,自 2025 年 7 月起将逐步弃用 GPT-4.5、o1、o3-mini 和 GPT-4o 等模型。其中,GPT-4.5 和 o1 将于 7 月 7 日停止服务,推荐迁移至 GPT-4.1 和 o3;o3-mini 和 GPT-4o 分别于 7 月 18 日和 8 月 6 日停用,替代方案为 o4-mini 和 GPT-4.1。此次调整旨在优化 AI 辅助编程工具的效能与兼容性,新模型在编程能力、响应速度和成本控制上显著提升 —— 例如 GPT-4.1 在 SWE-bench Verified 基准测试中得分达 54.6%,较 GPT-4o 提高 21.4%。GitHub 提醒开发者需在截止日期前调整工作流,企业用户需通过模型策略启用新模型访问权限。这一变化反映了 AI 技术在软件开发领域的快速迭代,开发者需及时适应以避免服务中断。
Manus AI Windows 桌面应用重磅上线!无需邀请码,微软商店直接下载,开启 AI 办公新时代!
2025 年 6 月 20 日,Manus AI 正式推出 Windows 桌面应用,用户无需邀请码即可在 Microsoft Store 免费下载。该应用集成智能任务管理、数据分析、代码生成等功能,支持本地计算与离线处理,可自动执行网页操作、文件处理等复杂任务,且与 Windows 生态深度整合。新用户可获一次性 1000 积分奖励及每日 300 免费积分,付费订阅则提供更多算力与多任务并行能力。应用需 Windows 7 及以上系统,安装便捷,标志着 AI 代理从云端迈向本地设备的重要突破。
谷歌 Gemini AI 重磅升级!免费逐帧解析视频,开启 AI 多模态交互新时代
谷歌于 2025 年 6 月推出 Gemini 客户端重大更新,新增免费视频逐帧分析功能,用户更新至 iOS 1.2025.2362302 或安卓 16.24 版本即可使用,无需订阅会员。该功能基于 Gemini 2.5 Flash/Pro 模型,可根据用户提示词对视频内容进行逐帧解析,例如结合时间码和环境信息精准定位监控视频拍摄时间。技术上采用稀疏混合专家(MoE)架构,原生支持多模态输入,能处理长达 3 小时的视频并生成交互式应用。目前功能正逐步上线,覆盖安防监控、教育、内容创作等场景,标志着 AI 从辅助工具向智能决策层的跨越。
上海实验室重磅发布 OWMM-Agent!家庭机器人零样本动作成功率达 90%,家务管理迈入智能新纪元!
2025 年 6 月,上海人工智能实验室联合多机构推出 OWMM-Agent 具身智能体,专为开放世界移动操作设计。其多模态架构实现全局场景理解、机器人状态跟踪与动作生成的统一建模,突破传统家庭机器人依赖预建地图的局限。真实环境测试中,零样本单步动作预测成功率达 90%,在 Fetch 机器人上完成 “移豆奶盒” 等复杂任务,为老龄化社会的通用家庭助手奠定技术基础。该成果标志着家庭服务机器人从 “指令执行” 向 “自主决策” 的跨越。
Google Gemini 2.5 Flash-Lite 横空出世!点击生成 UI,重新定义交互未来
谷歌于 6 月 18 日推出 Gemini 2.5 Flash-Lite 预览版,这是其速度最快、性价比最高的模型。它支持 100 万 token 超长上下文和多模态输入,可实时生成操作系统界面等动态内容,点击瞬间完成 UI 构建。相比前代,速度提升 1.5 倍且成本更低,在编码、数学、翻译等高吞吐量任务中延迟显著优化。开发者可通过 API 灵活控制 “思考预算”,兼顾效率与准确性。该模型已在 Vertex AI 等平台上线,助力企业实现自动化测试、文档交互等场景的效率革命。
月之暗面开源 Kimi-2506:多模态智能体视觉能力突破,开启 AI 多场景应用新纪元
月之暗面科技近日开源 Kimi-2506 多模态智能体,其视觉理解能力实现重大升级。该模型通过创新的跨模态融合架构,在图像分类、目标检测等任务中达到 SOTA 水平,支持实时视频分析与多模态交互。Kimi-2506 基于端到端强化学习训练,可处理超 200 万 token 长上下文,并集成自主搜索、网页交互等工具,在医疗影像、自动驾驶等领域验证了实用性。开源代码将推动 AI 研究与产业应用的进一步发展,为多模态智能体技术树立新标杆。
蚂蚁开源革命性轻量级 MoE 模型 Ring-lite:推理效率飙升,全链路透明化开启 AI 新范式
蚂蚁技术团队宣布开源轻量级 MoE 推理模型 Ring-lite,基于 Ling-lite-1.5 优化,总参数 168 亿但激活参数仅 27.5 亿。该模型通过独创的 C3PO 强化学习训练方法,解决了 RL 训练中回复长度波动导致的优化难题,在 AIME24/25、LiveCodeBench 等多项推理榜单上达到 SOTA 水平,表现比肩 3 倍激活参数的 10B 以下 Dense 模型。
快手 OneRec 横空出世!端到端生成式推荐系统如何让内容分发效率暴涨 10 倍?
快手正式推出端到端生成式推荐系统 OneRec,采用 Encoder-Decoder 架构与多模态分词技术,实现推荐效果与成本的双重突破:有效计算量提升 10 倍,训练 / 推理算力利用率达 23.7%/28.8%,运营成本仅为传统方案的 10.6%。该系统已覆盖双端 25% 流量,带动主站 / 极速版停留时长提升 0.54%/1.24%,本地生活场景 GMV 暴涨 21.01%。通过强化学习偏好对齐与极致性能优化,OneRec 打破传统级联架构瓶颈,成为首个工业级端到端生成式推荐方案,标志着智能推荐进入 "端到端生成式觉醒" 新纪元。
页:
[1]