新闻 发表于 2025-1-17 11:40

AI商业洞察 | 达美航空宣布在移动应用中推出AI助手

作者:微信文章




https://mmbiz.qpic.cn/mmbiz_svg/FiaIW3HsXzg7Jyc79dmmlSKbvMRickKGd70MYOqxnKQhfRBXfibYtFpADXgiazNSbGiarOrP0eicdXyAsicZJ5WvMK6YAc51Wz8wkKm/640?wx_fmt=svg&from=appmsg

01

AI+技术

AI商业洞察

用游戏的方法提高AI智能体在陌生任务中的表现

近日,北京邮电大学的研究人员推出了一种名为AgentRefine的新方法,旨在提高AI智能体的适应性和自我纠错能力,使其能够在陌生环境中表现更好。以前,传统的训练方法往往限制智能体,让其只在特定的任务和环境中表现,而无法适应新的任务或工作流程。AgentRefine的目标是创建更通用的智能体训练数据集,使智能体能够从错误中学习并进行自我修正,从而提高其在新环境中的表现。

研究人员借鉴了桌面角色扮演游戏《龙与地下城》的结构,设计了智能体的角色、脚本和挑战,模拟了不同的环境和任务。在训练过程中,智能体不仅作为玩家参与,还扮演“地下城主”角色,评估自己的行动并进行自我修正。通过这种方法,智能体能够在遇到不利情境时探索更多可行的行动,从而提高其适应性和决策能力。

实验表明,使用AgentRefine训练的智能体在处理陌生任务时表现更好,能够自我纠正并避免重复错误,从而提升了其在新场景中的适应性。这一方法为企业培养更加灵活和高效的AI智能体提供了新的思路。

02

AI+商业

AI商业洞察

Salesforce推出ProVision框架,通过图像场景图加速多模态AI训练

随着企业加大AI项目投入,高质量训练数据的获取已成为主要瓶颈。为了应对这一挑战,Salesforce推出了ProVision框架,旨在通过图像场景图系统地生成视觉指令数据,从而加速多模态语言模型(MLM)的训练。这一创新方法有助于缓解对有限或标注不一致数据集的依赖,推动了训练效率和准确性。

ProVision通过图像场景图来结构化表示图像中的对象及其属性,利用Python和文本模板生成训练数据。这些数据生成器能够自动合成问题和答案,以便为AI训练提供详细的视觉指令数据。例如,通过给定街道图像,ProVision可以生成“行人与汽车之间的关系是什么?”等问题。

Salesforce已发布ProVision-10M数据集,其中包含超过1000万个独特的指令数据点。该数据集已经被证明在多模态AI的微调阶段取得了显著的性能提升。ProVision框架不仅为数据生成过程提供了可控性和可解释性,还减少了手动标注或黑箱模型的需求,为企业提供了一种更高效的数据生成方法。

达美航空宣布在移动应用中推出AI助手

在今年拉斯维加斯举行的CES 2025大会上,达美航空宣布推出多个新功能,其中包括一款AI助手“Delta Concierge”和升级的机上娱乐系统。

AI助手Delta Concierge将在今年逐步推出,用户可以通过语音或文本与其互动。该助手的目标是为旅客提供主动的建议和指导,初步功能包括提醒护照即将过期、签证要求等信息,并根据目的地提供当地天气等通知。此外,Delta Concierge还将为乘客提供行李托运、达美Sky Clubs贵宾室和登机口的引导服务。

除了AI助手,达美航空还宣布了对机上娱乐系统的重大升级。新的娱乐系统被称为“首个云连接的机上娱乐系统”,计划于2026年开始投入使用。系统配备4K HDR QLED显示屏、蓝牙连接以及96TB的机载存储空间,可以存储电影、电视节目、音乐等内容。对于频繁旅行的乘客来说,这将是一次重要的改进,但相较于已经具备类似功能的竞争对手,如联合航空,达美的更新似乎有些赶超之感。

此外,达美航空还宣布将与空中客车合作,参与“fello’fly”项目的下一阶段飞行测试。该项目的目标是模拟候鸟飞行的方式,让飞机在空中结队飞行,以节省能源。然而,由于需要大量的监管变革,预计这一概念短期内难以实现。

英伟达CEO称其AI芯片进展超越摩尔定律

近日,英伟达CEO黄仁勋表示,英伟达公司AI芯片的性能进步速度远超摩尔定律。摩尔定律是由英特尔创始人戈登·摩尔于1965年提出的理论,预示着每两年计算机芯片上的晶体管数量将大约翻倍,从而提升计算机性能。尽管近年来摩尔定律的进展有所放缓,黄仁勋则认为,英伟达的AI芯片正在以更快的速度前进。

黄仁勋指出,英伟达最新的数据中心超级芯片比上一代芯片在运行AI推理工作负载时要快30倍以上。他强调,英伟达通过在架构、芯片、系统、库和算法方面的同步创新,使得其芯片的进步速度超过了摩尔定律。

这项声明发布之际,许多人开始质疑AI的进展是否放缓。作为全球最有价值的公司之一,英伟达在AI芯片领域的突破可能推动AI模型能力的进一步发展。黄仁勋还提出,AI领域目前正处于三个主动的扩展法则——预训练、后训练和推理阶段之下。他认为,随着推理性能的提升,AI推理的成本将下降,进一步推动AI技术的普及。

英伟达的AI芯片,特别是H100系列,长期以来是全球科技公司训练AI模型的首选。而在推理阶段的计算成本逐渐成为关注焦点时,黄仁勋相信,英伟达的最新技术将使AI推理模型的运行成本大幅降低。

谷歌DeepMind推出新基准测试,减少LLM幻觉

大型语言模型(LLM)的幻觉问题,即生成事实不准确的回答,依然困扰着这一领域的研究人员。尤其是在面对复杂任务或需要详细回应时,模型往往会出现问题。为了解决这一难题,谷歌DeepMind的研究人员近日推出了一个新的基准测试——FACTS Grounding,旨在评估LLM基于长篇文档生成事实准确性响应的能力。

FACTS Grounding测试不仅关注回答的准确性,还评估回应是否足够详细,能否为用户提供相关的、有用的回答。研究人员还发布了FACTS排行榜,供Kaggle数据科学社区使用。截至目前,Gemini 2.0 Flash以83.6%的准确率排名第一,谷歌的Gemini 1.0 Flash和Gemini 1.5 Pro,以及Anthropic的Clade 3.5 Sonnet和Claude 3.5 Haiku等模型排名前十。

FACTS Grounding数据集包含1,719个示例,涵盖金融、科技、零售、医学和法律等领域。研究人员指出,确保LLM回答的事实准确性非常具有挑战性,因为模型的架构、训练和推理等因素都会影响其表现。通过不断更新和维护排行榜,研究人员希望推动LLM技术向更高准确性和可用性发展。



编辑 | 钱丽娜

排版 | 杨一萍

校对 | 袁海鸣

中经传媒智库闭门会两周聚焦:

AI、金融科技、组织变革、出海、ESG等,共探未来趋势与战略。欢迎关注!



















▲左右滑动查看更多▲



|中经传媒智库CBJTHINKTANK原创文章|

往期推荐

AI商业洞察 | 人工智能将大幅提升对动物语言的理解能力




你有在看吗↓
页: [1]
查看完整版本: AI商业洞察 | 达美航空宣布在移动应用中推出AI助手