AI热点周报-第一期:AIPPT政企版,AI让手办动起来
作者:微信文章一、AI工具与应用
DeepSeek - V3:自研MoE模型,拥有671B参数,经过14.8T token预训练,在知识类任务、长文本生成、代码生成和数学问题解决方面表现出色。生成速度提升3倍达60 TPS,已开源FP8权重,支持多种推理方式并有优惠API服务价格体验期。Gemini 2.0:相比Claude 3.5上下文长度相差5倍达1M,可将整个项目输入,目前免费,适合AI编程。AiPPT政企版:具有体验更好、内容更精准、内容更合规、数据更安全的四大优势。寻光AI:有十大功能,目前开放五大功能(口型控制、表情控制、运镜控制、目标消除、风格变换)。可上传图片或视频进行操作,每天有100积分,每次生成耗费10点,体验版免费。Traini宠物沟通APP:由中国连续创业者在美国硅谷创办。冷启动有20万iOS注册用户,浏览量超百万次。可将人类语言翻译成狗语并理解狗的叫声、表情和行为,通过收集狗狗多模态数据训练模型。通义灵码AI程序员:全球首个同时支持VS Code、JetBrains IDEs的AI程序员产品。底层模型升级至Qwen2.5 - coder,代码生成准确率和速度达世界前列。支持多文件代码修改、快照功能回退重新提问等操作。WeWalk Smart Cane2智能手杖:结合ChatGPT语音助手,具备导航和障碍物检测功能,亮相2025国际消费电子展(CES2025),为视障人士提供便利。通义万相2.1视频生成模型:在阿里云推出,在复杂运动、物理规律遵循、艺术表现等方面全面提升,在VBench评测榜单登顶。已全面开放,可在官网免费使用,个人和企业用户可在阿里云百炼调用API创造AI工具和应用。
二、AI创新与应用场景
手办圈中的AI技术应用:图生视频功能让手办活过来并能做各种动作,有新意、有IP且有情绪价值。Aria - UI:港大联合Rhymes AI推出的大规模多模态模型(LMM)。实现“看到即会操作”的自然交互范式,在AndroidWorld榜单排名第一,OSWorld榜单排名第三。SuperWrite智能体:支持开题报告、论文选题等20 + 功能,如风格仿写、去AI味、学术降重等。
三、AI新工具与技术
Motion Prompting:由Google DeepMind联合密歇根大学和布朗大学推出。通过运动轨迹控制视频内容生成,可实现动态图像编辑。核心技术包括点轨迹表示,可设计“运动提示”激发视频模型不同能力.智元机器人4D世界模型EnerVerse:通过自回归扩散模型结合稀疏记忆机制和自由锚定视角(FAV)。在复杂任务中未来空间生成能力和动作规划性能卓越,解决模态对齐和数据稀缺挑战。英伟达Cosmos平台:生成式世界基础模型平台,用于加速物理AI系统发展(特别是自动驾驶和机器人领域)。接受文本、图像或视频提示生成高度仿真虚拟世界状态,提供独特视频输出。集成多种组件,开发者可微调模型创建定制化AI模型,还有安全防护机制确保数据安全合规。
页:
[1]