在许多人的印象中,数学和计算是AI的基座,因此AI做数学题理应“信手拈来”,但从今年阿里巴巴全球数学竞赛的情况来看,AI队伍距离摘下“人类智慧皇冠上最灿烂的明珠”,还有很长一段路要走。
6月13日,2024阿里巴巴全球数学竞赛(简称“阿里数赛”)公布决赛名单,801人成功晋级。值得关注的是,这次比赛不仅只有人类选手参赛,还吸引了来自全球知名高校院所与企业的563支队伍报名,遗憾的是,所有的AI队伍均未能达到决赛入围分数线。
今年阿里数赛首创AI挑战赛,500多支AI队伍各显神通,使用模型调优、AI Agent、提示词工程等多种方式,试图推动AI构建更强大的数学能力。统计显示,参赛AI队伍的平均分已达到了人类选手平均水平,但离数学高手仍有较大差距。AI最高分仅为34分,无缘决赛。
据介绍,AI成绩不佳,核心还是由于基础模型的数学能力有限。虽然在面对解答题和证明题时,AI可以通过知识检索等方式拿到基础分,但一旦涉及到后续的深入分析,AI就开始出现“知识幻觉”。尤其在面临选择题时,多数AI出现了“蒙题”的现象。
不过,也有案例显示,提示词工程能在一定幅度内提升AI的数学潜能,有选手请AI扮演一名数学竞赛大师,并许诺“想出更好回答奖励30万美元”,经比对验证,该方法可提高20%的得分率。阿里数赛组委会成员、达摩院决策智能实验室负责人印卧涛表示,尊龙凯时公司官网“数学是人类智慧的皇冠,AI挑战赛是一项积极的尝试,有助于我们持续突破AI的能力上限,带来更多可能。”
公告显示,今年共有801名人类选手挺进决赛,遍布全球17个国家与地区,平均年龄22岁,主要来自北大、清华、麻省理工、剑桥等知名高校。江苏省涟水中等专业学校服装设计专业的17岁女生姜萍表现亮眼,从一众名校生中突围,拿到了93分的好成绩,全球排名12,秒杀了一众数学专业的选手。她是阿里数赛举办以来首位打进决赛的中专在读生,也是前30名里唯一的女生。
姜萍的专业是服装设计,却对数学十分着迷,凭借手机翻译软件和一本英汉小词典,自学《高等数学》《数学分析》《偏微分方程》等高等数学内容,已达到了数学专业本科三、四年级水平。预选赛的两天里,姜萍除了吃饭、睡觉都在答题,只为证明“女生学数学也可以挺棒的”。
据悉,由阿里巴巴公益、达摩院举办的阿里数赛,以不设报名门槛、趣味十足著称,已连续举办六届,全民参与是该项赛事一大特色。今年的大众选手来自千行百业,如监狱警察、医生、快递小哥等,虽每天为不同工作而奔波,但他们都将数学视为心中的秘密花园。
今年阿里数赛的决赛将于北京时间6月22日(周六)0:00至24:00举行,选手可在周期内选择任意连续的8小时作答,获奖者最终将分享400多万元奖金。