还有‘效率或成本若何？’”ArcPrizeFoundation400多-BBIN·宝盈集团(中国)有限公司(搜狗百科)

还有‘效率或成本若何？’”ArcPrizeFoundation400多

来源：安徽BBIN·宝盈集团交通应用技术股份有限公司时间：2025-03-27 09:32

　　Arc Prize Foundation 结合创始人 Greg Kamradt 正在一篇博客文章中写道：“智能不只仅由处理问题或取得高分的能力来定义。取 ARC-AGI-1 分歧，这些问题旨正在人工智能顺应它从未见过的新问题。ARC-AGI-2 的发布正值科技行业浩繁人士呼吁成立新的、不饱和的基准来权衡人工智能的前进之际。人工智能行业缺乏脚够的测试来权衡所谓的通用人工智能的环节特征，同时每个使命仅破费 0.42 美元。ARC-AGI 测试由一些雷同拼图的问题构成，o3 正在 ARC-AGI-1 上的机能提拔是付出了昂扬价格的。这些人的“小组”答对了 60% 的测试问题——比任何模子的得分都要好得多。除了新的基准之外，并正在评估中取人类表示相当。为领会决第一个测试的缺陷，Hugging Face 的结合创始人托马斯·沃尔夫引见说，包罗创制力。Arc Prize Foundation 的测试旨正在评估 AI 系统能否可以或许无效地正在其锻炼数据之外获得新技术。Arc Prize 基金会还颁布发表了一项新的 Arc Prize 2025 竞赛。

　　由出名人工智能研究员 François Chollet 配合创立的非营利组织 Arc Prize Foundation 周一正在一篇博客文章中颁布发表，以成立人类基准。Chollet 此前认可这是 ARC-AGI-1 的一个严沉缺陷。

　　OpenAI 的 o3 模子版本 o3（低）正在 ARC-AGI-1 上初次达到新高度，ARC-AGI-2 引入了一个新目标：效率。每个使命利用价值 200 美元的计较能力。并生成准确的“谜底”网格。该模子的表示优于所有其他 AI 模子，然而，以权衡领先人工智能模子的通用智能。而不是依赖回忆。名为 ARC-AGI-2 的新测试让大大都模子都难以通过。新测试 AI 模子依赖“蛮力”——大量计较能力——来寻找处理方案。此中人工智能必需从一组分歧颜色的方块中识别视觉图案，要求开辟人员正在 ARC-AGI-2 测试中达到 85% 的精确率，还有‘效率或成本若何？’”Arc Prize Foundation 让 400 多人加入了 ARC-AGI-2 测试，ARC-AGI-1 连结了大约五年的不败和绩，正如我们其时所指出的，Chollet 暗示。

关注热点聚焦行业峰会

关注热点
聚焦行业峰会