新闻 发表于 2025-4-3 08:09

【YZLM快讯】AI模型在新的人工通用智能测试中表现不佳

作者:微信文章


随着人工智能技术的飞速发展,人们对其达到人工通用智能(AGI)的能力充满期待。AGI被定义为能够执行人类所能执行的任何认知任务的AI。然而,现有的AI模型在新的ARC-AGI-2基准测试中表现不佳,这一测试专门设计来评估AI在实现AGI方面的进展。

ARC-AGI-2测试与之前的ARC-AGI-1不同,它不关注AI模型是否能达到博士级别的专业表现,而是聚焦于AI完成对人类看似简单、但需要基础认知能力的任务的水平。例如,它要求AI根据符号示例推理并生成符合新图像变化的答案,这类任务需要符号解释、逻辑迁移等能力。

ARC-AGI-2测试的推出标志着AI评估领域的一个重要转变。首先,它强调了效率在AI发展中的重要性,促使开发者在追求性能提升的同时,也要关注模型的资源消耗和成本效益。这种平衡对于解决AI模型日益增长的能源消耗问题具有重要意义。其次,这一测试结果提醒我们,当前的AI技术距离真正的AGI还有很长的路要走,需要在多个方面进行创新和改进。最后,ARC-AGI-2测试可能会引发更多关于AGI定义和评估标准的讨论,推动AI研究向更加全面和实际的方向发展。



阅读原文:https://www.newscientist.com/article/2473622-leading-ai-models-fail-new-test-of-artificial-general-intelligence/   

【YZLM快讯,供稿:钱振兴、李晟】
页: [1]
查看完整版本: 【YZLM快讯】AI模型在新的人工通用智能测试中表现不佳