写问题
彻底服!新加坡小学题居然这么难!连火遍全球的ChatGPT都做不出来~
狮城椰子 · 02月07日 14:07:16
阅读 559

 

 
 
这些年,人工智能成为了人类主要研究发展的对象。
 
在去年年底,一款新型人工智能机器人程序ChatGPT横空出世,颠覆人类的认知,横扫人类社会!
 
 
在推出两个月后,ChatGPT的用户数量就突破1亿,堪称人类科技史上的又一新贵。
 
上至深刻的哲学探讨,下至代码编程,它几乎有求必应,有问必答。很多人用过ChatGPT之后,都对其出色的算法啧啧称奇。
 
 
不过,在新加坡ChatGPT似乎持续遇冷中,社会对它的讨论相当寥寥。
 
究其原因,可能还是它真的“不太好用”,连新加坡小六会考PSLE的数学题都不能做对!
 
最火AI败给新加坡小学题
它真的有传说中那么神吗?
 
众所周知,在新加坡多次集中会考里,小六会考的重要性可以算是最高的。毕竟,这个考试几乎决定了孩子未来的教育走向(当然O水准后也还有机会)。
 
因此,小六会考对于很多学生来说都相当难,甚至在媒体上都能时不时看到类似报告。
 
 
在所有考试科目中,数学被认为是最难的学科。
 
2021年的PSLE数学考试就非常难,据报道一些学生在考完后因为担忧,甚至还在考场外哭得泣不成声。
 
‘无话可说’:一些家长和孩子对艰难的PSLE数学考试感到沮丧,来源:海峡时报
 
本体媒体Coconuts Singapore利用ChatGPT,尝试用人工智能解决新加坡PSLE里的数学难题。结果发现,图样图森破!
 
难题一:
Ivan and Helen’s coins
 
 
题目翻译:
 
已知Ivan和Helen有同样数目的硬币。Ivan有104枚两角钱硬币及一些五角钱硬币。Helen有64枚两角钱硬币及一些五角钱硬币。Helen拥有硬币重量加起来为1.134千克。
 
求a)谁拥有的硬币更值钱,又多了多少钱?
 
b)如果每一枚五角钱硬币比两角钱硬币重2.7克,以千克为单位计算Ivan拥有硬币的重量。
 
仔细一看,这个问题似乎对于小六学生来说可能有些困难。就有人利用ChatGPT求解,结果显示如下:
 
 
ChatCPT得出的答案是:
 
a)Ivan比Helen拥有的硬币数量更多,且总值多了8新币;
b)Ivan所拥有的硬币总重量为1.83768千克;
 
很明显的,ChatCPT在两个问题上都回答错误。
 
针对第一问,ChatGPT忽略了已知信息里的“Ivan和Helen拥有同样数目的硬币”这个关键信息,因此计算失误。实际上,根据下图可以清楚算出,Helen所持有的硬币总价值,比Ivan多了足足12新币!
 
图源:FB@Ming Hui
 
至于第二问,因为在第一问中ChatCPT计算出Ivan拥有硬币数量比Helen更多,并运用这个逻辑做出了回答,因此也是错误的。
 
正确答案和推导逻辑可参照下图:
 
图源:FB@Ming Hui
 
两个问题无一个答对,且解题基本逻辑有误,可以说ChatGPT在2021新加坡小六会考“最难”数学题上翻了大车......
 
即使是换成相对简单的数学题,ChatCPT也不一定能做对,不然我们就看看2021年新加坡小六会考这道数学题
 
“难题”二:
Yellow Bean Percentage
 
 
题目翻译:一个盒子里装着一些棕色和绿色珠子,绿色珠子占据总数目的40%。再加入一些黄色珠子后,绿色珠子的占比降到了26%。那黄色珠子的占比是多少?
 
ChatGPT在略微“思索”了片刻后,给出了黄色珠子占比33.33%的答案:
 
 
不过根据Cocnut Singapore的计算,这一次ChatGPT又错了。它在推导过程中逐渐忘记了棕色珠子的存在。
 
实际上,通过棕色与绿色珠子的原始比例,可以轻易地得出棕色珠子对比绿色珠子的数量比为3:2,因此再加入黄色珠子后,棕色珠子的占比应为26 x (3/2) = 39%。
 
100% – (39% 棕色珠子 +26% 绿色珠子) = 35%,因此这道题的正确答案是35%。
 
不过,虽然在新加坡,ChatGPT目前似乎并没有引起太大反响,但其席卷全球之势似乎还是无法阻挡,更是吸引了众多投资者的目光。新闻网站Semafor上个月报道称,微软将向制作出ChatCPT的OpenAI投资100亿美(82 亿英镑),为旗下搜索引擎提供新新动力。
 
 
此外,另一科技巨头谷歌也因感到ChatGPT的威胁而全力开发自己的人工智能,以保持自己市场领头羊的地位。
 
另一方面,ChatGPT也带动了各类AI股票的上涨。英伟达和安霸(Ambarella)等提供半导体的供应商股票也在1月飙升。不仅仅局限于美国股市,它也在A股中大放异彩。
 
 
甚至,“股神”巴菲特还利用它做出下一步的投资提供建议。值得一提的是,它建议的微软、辉瑞和联合利华等公司股票,都曾经在巴菲特的意向清单或已投资名单中......
 
不过,虽然ChatGPT已经看起来是下一个将广泛运用到人类社会的新科技,但其本身的开放性,却对学术界带来了剧烈冲击,让很多学者都难以接受。
 
ChatGPT让大学教授崩溃!
学生用它写论文、参加考试
 
自从ChatGPT横空出世以来,它就让很多大学教授“饱受摧残”。
 
用它摸出门道写一篇论文,居然还能拿到A+的成绩。关键是,很多教授根本看不出来!
 
 
不久前,美国北密歇根大学的哲学教授Antony Aumann在为自己任教的一门世界宗教课程评分时,惊喜地读到了一篇“全班最好的论文”。
 
论文作者以简洁的段落、恰当的举例和严谨的论据,探讨了罩袍禁令的道德意义,让自己这名大学教授都读得如痴如醉......
 
不过,或许是对学生的水平有个基本判断,因此他还是就这篇论文质问了学生,得到的回答是:这是用ChatGPT写出来的文章。
 
Antony Aumann本人
 
倍感震惊之余,这名教授在思索如何摆脱ChatGPT对学术上带来的麻烦。
 
最终他决定,在自己的这门课上,所有的学生都必须在监控下,且在限制上网的浏览器中,撰写论文初稿。并且,论文草稿中今后如有改动,学生也必须解释理由。
 
在以后的教学中,他考虑可能抛弃论文考核的方式,而是选用其他方式进行评分。
 
图源:凤凰网
 
ChatGPT对学术界和教育界的颠覆,也不单单是在高等教育方面。
 
不少人用它来写情书、诗歌、同人小说,只要稍微给点提示,原本思路阻滞的自己就能妙笔生花地“写出”一篇“传世经典”。
 
利用ChatGPT写出的一封情书
 
在欧美的学校里,老师们现在除了日常教学外还有了个大工作:仔细辨别学生上交的作业是否是由ChatGPTT完成的。
 
这给老师增加了很多额外的负担及烦恼,因此,纽约和西雅图的公立学校系统,学校的Wi-Fi网络和设备上已经全面禁止了ChatGPT。
 
然而,总有人能绕过这项禁令。很多人对此忧心忡忡,Nature上也收录了一名作者对于ChatGPTCPT的讨论,警告其可能带来的副作用。
 
 
当然,制造出ChatCPT的的OpenAI对这些批评和担忧也不是完全无动于衷。
 
一位发言人称,实验室已经认识到ChatGPT可能会被用来造成误导。对此,他们正在开发新的技术,帮人们识别ChatGPT生成的文本。
 
不过,届时会不会有其他绕过审查的方式,也没人可以知道。ChatCPT给学术圈带来的颠覆性冲击还要持续多久,至今仍是个谜团。
 
图源:shutterstock
 
虽然ChatCPT的这股“改革风”还没完全吹到新加坡,但已经有一些学者对此表示出了关注。
 
一些人表示,要用更积极的眼光看待ChatCPT。它虽然会带来冲击,但也可以稍加引导成为人类进步的助力。
 
新加坡学者:ChatCPT利弊皆有
应用起来需仔细分析考虑
 
在ChatCPT成为世界热点后,新加坡本地媒体《联合早报》,采访了本地高等学府的一些教授询问看法。
 
其中,国大计算机学院梁永立副教授就表示,只是单单禁用ChatCPT根本不能阻止作弊,在看待它时理应多分析它的利弊,再做决定。
 
图源:福布斯
 
他补充说道,在ChatCPT还没上线时,他和其他同事每个学期都要和作弊作斗争,也每次都能捉到学生作弊的证据。
 
没有了ChatCPT,学生也可以利用谷歌搜索等其他工具作弊,他认为:
 
“ChatGPT是相当神奇的工具,但我觉得它是一种进化,而非变革。它是一个新工具,可善用,也会被滥用,但我觉得它的利多于弊。会作弊的人就会作弊,但最终吃亏的会是他们。精通技能是须下苦功的,只会依赖科技代做作业,不懂得如何学习的学生是无法达到精通的水平。”
 
 
除了他以外,新加坡国立教育学院副教授陈英泰博士也认为,贸然禁止ChatGPT不太明智。
 
随着科技不断日新月异,像ChatCPT一样的人工智能程序出现是迟早的事。与其禁止学生使用,不如多加探索这个新工具,看看如何能将它应用到教育上才是更重要的。
 
 
国大数理中学校长苏丽玲则表示,学术诚信是学生求学们都必须要恪守的品德,学校只是应该加强监管,引导学生妥当使用学习方面的科技工具。
 
当然,在某些必要的场合,校方也会加强反作弊机制,确保学生只依靠自身水平完成测试。
 
 
总的来说,新加坡教育界人士对于ChatCPT的前景依然信心满满。
 
在他们看来,采用像美国、法国与澳大利亚等地有学府全面禁止使用ChatCPT的做法不值得认同。
 
说起来,虽然ChatCPT现在大火,但其仍有部分局限性:无法分解太复杂的题、解答内容也很可能有误。
 
图灵奖得主Yann LeCun,最近就在推特上对ChatCPT开炮,认为其“满嘴胡诌,你们却对它如此宽容”,对自己制造出的Galactica被骂到下线的遭遇相当愤愤不平。
 
 
看来,不管是科学界还是教育界,对ChatGPT的讨论还会持续一阵子。
 
至于我们,应该还是静观其变为好......
 
 
#关注我们#
新加坡狮城椰子
视频号 | 小程序 | 公众号
关注【新加坡狮城椰子·视频号
带你了解新加坡大小新鲜事
大家赶紧先关注起来
 
关注【新加坡狮城椰子·小程序】
进入椰子社区
了解新加坡疫情最新消息
爆料、准证、玩乐、遛娃、交友
 
 
 
更多精彩文章
进入【新加坡狮城椰子公众号】看看

 

 
 
 
 
 

THE END
参与评论
登录 后参与评论 匿名
全部评论
关注狮城椰子
1
3