AAAI 2024竞赛:大模型数学推理突破创新

【HowToTech科技】10月12日消息,近日,国际先进AI协会(AAAI)宣布,由学而思领衔,与谷歌、暨南大学等多家科技企业和高校的专家学者合作,将联袂举办AAA
2024全球大模型数学推理竞赛。

这项竞赛分为中文数学解题和英文数学解题两个方向,竞赛所需的中英文数据集TAL-SAQ7K-CN和TAL-SAQ6K-EN由学而思提供,据悉,这些数据集包含了来自国内外多个中小学数学竞赛的真题。

据HowToTech科技了解,这次竞赛将是全球首个数学大模型解题竞赛,主办方为参赛者提供了三个参考评估基准:GPT-3.5、GPT-4和好未来自研数学大模型MathGPT。

在竞赛期间,参赛者需要运用这些大模型来生成数学题目的推理步骤和答案。主办方将通过比较参赛模型生成的答案与正确答案之间的准确率来排名。主办方强调,他们期望参赛者使用大型语言模型来解决K-12(指学前教育至高中教育)的数学问题。

据介绍,目前大型语言模型存在一些“天生缺陷”,如缺乏复杂推理能力和数值计算的不准确性。如果这些模型能够克服这些问题,成功应对数学推理的挑战,那么AI领域将迎来一个全新的时代。

竞赛日程如下:

– 2023年10月10日:竞赛开始

– 2023年12月31日:最终提交截止日期

– 2024年1月10日:公布最终竞赛结果

奖项设置如下:

两个方向的前三名将获得现金奖励,一等奖1000美元,二等奖600美元,三等奖300美元。

此外,两个方向的前三名还将获得正式证书,并受邀在2024年AAAI国际大会期间发表口头报告。此次竞赛的前三名团队的第一作者还将被邀请撰写竞赛综述论文。

大鱼的头像

这个人很懒,什么都没有留下~

延伸阅读:

OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens

【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...

大鱼的头像
大鱼
2024 年 8 月 1 日
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战

7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...

大鱼的头像
大鱼
2024 年 7 月 31 日
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型

“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...

大鱼的头像
大鱼
2024 年 7 月 31 日
阿里通义免费开放奥运AI大模型

7月31日,阿里通义宣布免费开放奥运AI大模型,具备最强奥运专业知识,并集合同声传译级别的中法互译功能。即日起,用户可以...

大鱼的头像
大鱼
2024 年 7 月 31 日
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式

【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...

大鱼的头像
大鱼
2024 年 7 月 31 日