云朵课堂

什么!机器在阅读理解方面的表现优于人类

教育最新动态 云朵在线 10个月前 (11-21) 0 174

今年3月30日,我国国人工智能公司科大讯飞提出了一种算法,该算法在阅读理解方面表现优于人类。让我再说一遍,一台机器在阅读理解方面的挑战超越了人类。这对教育意味着什么?如果您是全世界数亿试图入读大学的学生之一,并且您要么每天拼命学习以获取入学资格,要么可以支付一笔费用让一台机器为你服务,你怎么选?

什么!机器在阅读理解方面的表现优于人类  第1张

SQuAD(斯坦福问题解答数据集)是一种AI机器阅读理解测试,旨在查看机器是否能比人类阅读得更好,而不仅仅是阅读得更快。这些问题基于一组Wikipedia文章,“每个问题的答案是相应阅读文章的一段文本或跨度,否则该问题可能无法回答。”
“SQuAD2.0将SQuAD1.1中的100,000个问题与超过50,000个新的,无法回答的问题(由群众进行对抗,将其与可回答的问题相结合...”)要在SQuAD2.0上做到出色,系统不仅必须在可能的情况下回答问题,但也要确定该段落何时不支持任何答案,并放弃回答……我们很乐观,这个新的数据集将鼓励发展了解他们不知道的阅读理解系统。”(换句话说,官员试图确保算法实际上很聪明,不能简单地猜测)。
团队输入的方式是创建一个机器学习算法,并根据测试数据集对该算法进行“培训”。“训练”一个AI通常会告诉它使用人工算法或其他算法得出的答案是对还是错。团队准备就绪后,便将其提交给官员,官员进行测试并提供结果。
认为这是一个简单的测试?在这里查询有关“简单”主题的一些问题,例如政府间气候变化专门委员会:
联合国要稳定什么?在Hoesung Lee之前谁是IPCC的主席?(注意机器的技巧问题)IPCC研究有哪些重大错误值得怀疑?
为了确保挑战者不作弊,挑战者将其“模型”(程序)借给审查员,审查员运行该程序并提供官方成绩。测试集没有公开以避免作弊。

什么!机器在阅读理解方面的表现优于人类  第2张AI在线教育
为什么这很重要?
我不确定这是个什么情况,但是当机器可以为我填写表格时我会感到舒畅,当机器可以为我完成英语作业时,我就感到更舒服。
这实际上意味着惊人的结果。恰好9个月前,完成测试的人员的最高评分为86.8%,而完成测试的最佳AI得分为63.3%。
团队只用了7 1/2个月就将63.3%的得分提高到87.14%,超过了最佳人选。那是37.7%的改善!
这对教育意味着什么?
如果您是全世界数亿试图入读大学的学生之一,并且您要么每天拼命学习以获取入学资格,要么可以支付一笔费用让一台机器为您服务,你怎么选?
现在,有很多闭门考试可能会阻止这种公然的作弊行为,但它对学术评估世界提出了质疑。考官将如何保持这种技术的领先地位?
在电子计算器出现之前,有“人类计算器”(还记得那部惊人的电影《隐藏的数字》吗?)大学是否禁止计算器进行数学考试?否。那么,为什么人类学生应该尝试通过测试,证明机器可以在短短几分钟内完成更好的测试,那么这代表这什么?值得深思,当人类AI技术,5G将彻底改变人类的认知方式。


云朵网校详细介绍

取消评论你是访客,请填写下个人信息吧

暂时还没有回答,开始 写第一个答案吧
本月热门
云朵课堂官方咨询
最新答案