成都机器人将挑战中国高考数学卷:解题容易读题难

成都晚报

举世瞩目的围棋世界冠军柯洁与谷歌AlphaGo的三番棋大战,以AlphaGo3∶0完胜告终。机器人做高考题又会怎样?

据《成都晚报》6月2日报道,本月7日,2017全国高考将举行,当日下午5时许,在成都将举行一场特别的考试:“准星数学高考机器人” AI-MATHS,将在公证机构和媒体的见证下,挑战2017年高考数学题。

而这将是国内首次由机器人应试高考题。

另据新加坡《联合早报》报道,AI-MATHS是我国863计划中的“超脑计划”牵头研制的机器人。据成都准星云学科技有限公司CEO、清华大学苏州研究院大数据中心主任林辉介绍,该公司核心团队参与并主导了国家863课题《基于大数据的类人智能关键技术与系统》中的子课题《初等数学问题求解关键技术系统》(即数学高考机器人)。

高考机器人AI-MATHS诞生于2014年。2016年5月,其研发团队宣布AI-MATHS将参加2017年高考。

考场:断网答题 公证机构和媒体“监考”

成都晚报记者从研发单位了解到,与多数人对机器人的印象不同,即将参考的AI-MATHS其“身体”并非模仿人类的样子,而是10余台服务器,其“大脑”就是服务器上承载的人工智能系统。“考场”设在成都天府新谷10号楼的一个会议室里,届时入场答题的实际上就是这些服务器。像考生会被切断与外界的联系一样,这些服务器也会被切断网络连接。由公证机构和媒体出任“监考老师”。这场特殊的“高考”只设置数学科目,将在7日下午5时之后,也就是高考数学结束之后进行,不会影响正常高考的进行。

AI-MATHS具体将挑战哪套试卷?林辉表示,高考数学结束后,公司将立即从相关部门、网络等多渠道争取试卷,“目前拟争取全国卷、北京卷等几套,但是最终能拿到哪几套,具体几点钟拿到还不确定。如果拿到多套试卷,AI-MATHS将在2小时内同时作答多套试卷。”

届时,如果考题是AI-MATHS都会答的,它将会以大概20分钟一套的速度作答,如果有它不会的考题,它将先跳过这些题目,把会答的都答完,再返回来争取突破剩下的难题,直到解出答案或者考试时间结束。

预测:目标110分 今年模拟考得了93分

“成都造”高考机器人到底是什么来头?为啥要“高考”?林辉介绍,AI-MATHS诞生于2014年,是依托清华大学大数据、人工智能、自然语言识别等前沿技术,研发的一款以自动解题技术为核心的人工智能系统。本次挑战是对研发成效的一次阶段性检验,挑战结果将运用到该公司对AI-MATHS的技术验证中。

在此之前,AI-MATHS也像普通高考考生一样,大量“刷题”,目前已训练500套、约1.2万道题了。对于AI-MATHS能在7日取得什么样的“高考”成绩,林辉在昨日接受记者采访时,并未预测分数。

不过,去年5月,在宣布这款高考机器人参加考试时,团队设定的目标是110分,当时其已在模拟考中取得过115分的成绩。但在今年2月的一次模拟考中,AI-MATHS得到的分数是93分。为何AI-MATHS练题增多,成绩却出现下降?林辉表示,研发团队经分析发现,问题出现在AI-MATHS对题意的理解环节,“题目中出现了AI-MATHS从未‘学习’过的生词,如:投资、理财,它以前做的练习题没出现过这些词,它不懂这些词的意思,就卡在那儿了。”

分析:最大难点 准确理解题干意思

作为人工智能,AI-MATHS与谷歌阿法狗(AlphaGo)的主要区别在哪儿?

林辉表示,阿法狗专攻围棋,AI-MATHS专攻数学。研发围棋机器人,用计算机语言描述围棋规则相对容易,难在要让系统在极短时间内算出每次落子后的几十步甚至几百步的不同局面。而研发高考机器人最大的难点在于,首先要让系统准确理解人类语言,后面做题的步骤反而不多。人类的语言千变万化,而且还在不断创新,几乎是学不完的。遇到没学过的生词,人类会联系上下文去推测词义,猜对是比较容易的事;而机器人却会卡壳。比如,正切(tangent)的缩写,近年来的教材和试题里面都用的是“tan”,但早些年用过“tg”。团队在训练AI-MATHS用的题都是“tan”,最近突然让它做了一道“tg”的题,它就懵了。

对此,研发团队除了让AI-MATHS练更多题,让它理解更多词汇的意思外,还对系统的答题程序设置进行了一些修改,让它在不能给出完整答案的情况下,也给出部分答案,争取“步骤分”。

不过,人工智能虽然在运算、推理、存储等方面都具备超强的能力,但突破在于具备了自我深度学习、自我优化能力。

林辉介绍AI-MATHS是通过综合逻辑推理平台来解题,而非学习储存题库。“它可以学习小学到高中的7000多个考点,运算量可达2的800次方。”

目前,该公司已申报发明专利40多项,基于相关技术研发的一些产品目前已经投入市场应用。