AI 日报|2025.6.13
作者:微信文章技术革新加速,虚拟与现实边界再突破!
💃 阿里开源Mnn3dAvatar:手机秒变3D数字人工作室
阿里巴巴正式开源Mnn3dAvatar框架,支持实时面部捕捉与3D虚拟角色动画映射!基于轻量级推理引擎MNN,可在移动端离线运行,实现高达90FPS的流畅交互。
- 亮点:
- 多模态驱动:结合语音识别(ASR)、大模型(LLM)、表情生成(A2BS),打造沉浸式交互体验。
- 零门槛创作:开发者可快速生成3D虚拟角色,无需复杂建模经验。
- 场景:虚拟客服、直播带货、个人助理,隐私数据全留本地。
> 📌 GitHub已开放源码,iOS版即将上线!
⚡ AMD ROCm 7发布:DeepSeek-R1推理性能飙升3.8倍!
AMD推出新一代AI软件栈ROCm 7,大幅提升大模型推理效率:
- 性能突破:
- Llama 3.1-70B性能提升3.2倍,DeepSeek-R1提升3.8倍。
- 支持FP4/FP6低精度计算,降低显存占用。
- 生态扩展:首次兼容Windows系统及Radeon显卡,本地AI部署门槛再降低。
> 💡开发者可免费试用25小时MI300X算力!
🎬 微软Clipchamp上新:AI转录颠覆视频剪辑
微软视频编辑工具Clipchamp新增AI转录功能,用文本剪辑视频时代来临:
- 操作革命:
上传视频→AI生成文本→删除段落→自动剪掉对应片段,告别时间轴逐帧调整!
- 场景适配:会议录像剪掉跑题内容、播客删除口误片段,效率提升超80%。
> ✨现已上线Microsoft 365 Insider测试版。
🌍 Meta V-JEPA 2发布:自训百万小时,打造AI“世界模型”
Meta推出视频理解模型V-JEPA 2,通过自监督学习构建物理世界认知:
- 技术突破:
- 训练超100万小时视频,学习物体运动、人际交互等物理规律。
- 支持零样本机器人控制:陌生环境中抓取/放置物体成功率高达80%。
- 未来应用:辅助视障人士、自动驾驶、家庭机器人。
> 🧠三大物理推理基准测试同步开源!
🎨 Meta AI视频编辑:50种风格一键切换
Meta上线生成式AI视频编辑功能,预设提示词玩转创意:
- 魔法时刻:
- 输入视频→选择“复古漫画/电子游戏/梦幻光影”等风格→AI自动转换场景与服装。
- 10秒片段免费编辑,支持直发Instagram、Facebook。
- 背后技术:扩散模型+多模态生成,从画面色调到音效全面改造。
> 🆓限时免费开放12国用户!
🔍早报结语
从3D数字人“飞入寻常手机”,到视频剪辑告别时间轴;从大模型推理提速近4倍,到AI学会预测物理规律——技术正以更轻量化、更懂需求的方式,重塑创作、开发与交互的每个角落。
技术无虚招,落地见真章 🚀
页:
[1]