我爱免费 发表于 2025-6-13 22:42

AI 日报|2025.6.13

作者:微信文章
技术革新加速,虚拟与现实边界再突破!



💃 阿里开源Mnn3dAvatar:手机秒变3D数字人工作室

阿里巴巴正式开源Mnn3dAvatar框架,支持实时面部捕捉与3D虚拟角色动画映射!基于轻量级推理引擎MNN,可在移动端离线运行,实现高达90FPS的流畅交互。

- 亮点:

- 多模态驱动:结合语音识别(ASR)、大模型(LLM)、表情生成(A2BS),打造沉浸式交互体验。

- 零门槛创作:开发者可快速生成3D虚拟角色,无需复杂建模经验。

- 场景:虚拟客服、直播带货、个人助理,隐私数据全留本地。

> 📌 GitHub已开放源码,iOS版即将上线!

⚡ AMD ROCm 7发布:DeepSeek-R1推理性能飙升3.8倍!

AMD推出新一代AI软件栈ROCm 7,大幅提升大模型推理效率:

- 性能突破:

- Llama 3.1-70B性能提升3.2倍,DeepSeek-R1提升3.8倍。

- 支持FP4/FP6低精度计算,降低显存占用。

- 生态扩展:首次兼容Windows系统及Radeon显卡,本地AI部署门槛再降低。

> 💡开发者可免费试用25小时MI300X算力!

🎬 微软Clipchamp上新:AI转录颠覆视频剪辑

微软视频编辑工具Clipchamp新增AI转录功能,用文本剪辑视频时代来临:

- 操作革命:

上传视频→AI生成文本→删除段落→自动剪掉对应片段,告别时间轴逐帧调整!

- 场景适配:会议录像剪掉跑题内容、播客删除口误片段,效率提升超80%。

> ✨现已上线Microsoft 365 Insider测试版。

🌍 Meta V-JEPA 2发布:自训百万小时,打造AI“世界模型”

Meta推出视频理解模型V-JEPA 2,通过自监督学习构建物理世界认知:

- 技术突破:

- 训练超100万小时视频,学习物体运动、人际交互等物理规律。

- 支持零样本机器人控制:陌生环境中抓取/放置物体成功率高达80%。

- 未来应用:辅助视障人士、自动驾驶、家庭机器人。

> 🧠三大物理推理基准测试同步开源!

🎨 Meta AI视频编辑:50种风格一键切换

Meta上线生成式AI视频编辑功能,预设提示词玩转创意:

- 魔法时刻:

- 输入视频→选择“复古漫画/电子游戏/梦幻光影”等风格→AI自动转换场景与服装。

- 10秒片段免费编辑,支持直发Instagram、Facebook。

- 背后技术:扩散模型+多模态生成,从画面色调到音效全面改造。

> 🆓限时免费开放12国用户!

🔍早报结语

从3D数字人“飞入寻常手机”,到视频剪辑告别时间轴;从大模型推理提速近4倍,到AI学会预测物理规律——技术正以更轻量化、更懂需求的方式,重塑创作、开发与交互的每个角落。

技术无虚招,落地见真章 🚀
页: [1]
查看完整版本: AI 日报|2025.6.13