【【YZLM快讯】AI模型在新的人工通用智能测试中表现不佳】萍聚社区-德国热线-德国实用信息网人工智能

新闻发表于 2025-4-3 08:09

【YZLM快讯】AI模型在新的人工通用智能测试中表现不佳

作者：微信文章

随着人工智能技术的飞速发展，人们对其达到人工通用智能（AGI）的能力充满期待。AGI被定义为能够执行人类所能执行的任何认知任务的AI。然而，现有的AI模型在新的ARC-AGI-2基准测试中表现不佳，这一测试专门设计来评估AI在实现AGI方面的进展。

ARC-AGI-2测试与之前的ARC-AGI-1不同，它不关注AI模型是否能达到博士级别的专业表现，而是聚焦于AI完成对人类看似简单、但需要基础认知能力的任务的水平。例如，它要求AI根据符号示例推理并生成符合新图像变化的答案，这类任务需要符号解释、逻辑迁移等能力。

ARC-AGI-2测试的推出标志着AI评估领域的一个重要转变。首先，它强调了效率在AI发展中的重要性，促使开发者在追求性能提升的同时，也要关注模型的资源消耗和成本效益。这种平衡对于解决AI模型日益增长的能源消耗问题具有重要意义。其次，这一测试结果提醒我们，当前的AI技术距离真正的AGI还有很长的路要走，需要在多个方面进行创新和改进。最后，ARC-AGI-2测试可能会引发更多关于AGI定义和评估标准的讨论，推动AI研究向更加全面和实际的方向发展。

阅读原文：https://www.newscientist.com/article/2473622-leading-ai-models-fail-new-test-of-artificial-general-intelligence/

【YZLM快讯，供稿：钱振兴、李晟】

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

【YZLM快讯】AI模型在新的人工通用智能测试中表现不佳