从攥“红笔”到握“鼠标”,高考阅卷背后的技术革命 -1929cc威尼斯
今日起,全国多个省份高考成绩相继出炉,各地高考阅卷工作也基本接近尾声。据北京教育考试院副院长李鸿江介绍,北京 2022 年高考阅卷将于 6 月 24 日结束,会严格按照《国家教育考试网上评卷管理规范》要求,加强阅卷工作规范管理和质量监控。作为一场影响千万人命运的大考,高考在阅卷环节更需严谨认真,容不得半点草率马虎。那么,经过近半个世纪的演变,高考阅卷如今发展到怎样的阶段,背后有哪些技术变革作为支撑,未来前进发展的方向又是哪里呢?
01
从红笔到鼠标,高考阅卷简史
自从 1977 年底国家正式恢复高考以来,这项关乎人生命运的制度已经走过了 45 个年头,背后的阅卷环节也在不断发生变迁。这四十五年间,高考阅卷历经了从单纯依靠人力手工批阅到使用计算机简单介入,再到利用人工智能高效辅助的过程。阅卷教师手中掌握考生“生杀大权”的工具也一点点由“红笔”变为了“鼠标”。
1. 阅卷“1.0时代”——人工撑起一片天
1977 年,全国恢复了中断十年的高考制度。彼时的高考,保密意识和阅卷制度都尚不完善,考试结束后,试卷经过基础信息遮挡、简单装订就被装进密封袋,送到阅卷组。等到开始阅卷的时候,再发放到阅卷教师手中。
在阅卷时,阅卷教师拿到答题纸后,直接在上面进行批阅核分。并没有我们现在熟知的“双批”“三批”乃至“四批”的要求。且试卷一般只交由一位阅卷教师手工批阅核分,就决定了考生的命运。据那一时期的阅卷人员回忆,当时阅卷能否做到公平公正,基本全凭自己的责任感和良心。
一直到 20 世纪 90 年代之前,我国高考阅卷的各个环节包括试卷的运输、装订、分发、批阅、复核等,基本都交由人工全权负责完成。但随着时代的变革、技术的创新,人工阅卷模式很快迎来了挑战。由于程序上的繁琐,效率低下成为了其硬伤。再加上当时高考命题多使用主观开放性题型,间接放大了阅卷教师批阅时主观思维的影响,产生误差的情况在所难免,结果易遭人质疑诟病。因此,建立一个更高效、更标准的高考阅卷制度迫在眉睫。
2. 阅卷2.0时代——光标阅读机助力客观题批阅
将阅卷教师从繁重工作中解放出来的曙光,出现在 1985 年。这一年,国家出台了一系列高考政策和试验方案,其中,推进标准化考试就是一项重大举措;次年,广东、山东、辽宁、广西四省联合试验高考标准化考试;到了 1988 年,全国已有 16 个省份参加高考标准化试验。
时间来到 1989 年,经过此前多地试点探索后,国家教委颁发了《普通高等学校招生全国统一考试标准化实施规划》,规定从 1991 年起所有高考科目实行标准化考试,即将高考试卷被分成客观题和主观题两部分,前者将答案写在特制的答题卡上,后者则继续在试卷上作答。
高考命题的日趋标准化,使得计算机在阅卷环节有了施展拳脚的机会。1988 年,山东大学和重庆大学联合研制的国产光标阅读机推出,并应用于当年高考阅卷领域。其能通过光学扫描和石墨感应技术,识别答题卡上的客观题答案,自动给考生批阅核分。此后的十年时光中,光标阅读机迅速普及开来,广泛应用于高考等各类标准化考试当中。
毫无疑问,光标阅读机的出现,有效为阅卷教师分担了压力,减少了无谓的消耗。但值得注意的是,这一时期,虽然客观题可以借助计算机实现“人卷分离”批阅,但主观题部分依然需要阅卷教师在纸上进行批阅,仍不可避免人为因素掺杂其中。
3. 阅卷3.0时代——高速扫描仪实现无纸化阅卷
前文提到,光标阅读机虽存在优势,却只能处理客观题,主观题依然十分有赖于人工。且由于考生数量的逐年增加,读取速度也愈发疲软。于是,更先进的高速扫描仪便登上历史舞台。
其工作原理是先对试卷进行整张扫描,再由计算机对图像进行切割。其中,客观题直接由计算机评分,主观题则分成小份由系统发送给阅卷教师批阅。扫描后的试卷会以照片形式存档,试卷的分发、批阅、核分等各个环节均在网上完成,降低繁重运输成本的同时,也让阅卷教师无法直接接触考生试卷,实现无纸化、零接触阅卷。
1999 年,广西率先在高考英语科目上试点网上无纸化阅卷。第二年,又把试点范围从英语进一步扩大到语文。此外,云南、江西、辽宁等省份也开始推行,在保送生能力测试等考试中尝试网上无纸化阅卷。
到了 2013 年,全国各地都已实现高考网上无纸化阅卷,主客观题答题卡也合二为一,除部分科目外基本都由一张 a3 尺寸的纸张构成。这种由“高速扫描仪 网上阅卷软件”组成的阅卷模式,也被各地教育考试院一直沿用至今,成为当下主流。
02
人工智能辅助,阅卷迈入4.0时代
在教育领域,人工智能技术正在全面、深刻地影响着教育理念、教学模式和考试方式。随着图像文字转写识别、自然语言处理、深度学习和评分算法等核心技术的发展,使计算机运用人工智能技术完成诸如语文作文、英语作文、英语听说、数学证明等智能辅助阅卷已经成为可能。
[1] 人工智能阅卷实施主要流程步骤
当下,高考阅卷所用的智能阅卷技术,主要分为英语听说测试以及全学科的纸笔辅助阅卷两个大类。其中,英语听说阅卷相关的研发工作早在 2005 年就启动了。到了 2012 年,科大讯飞已研发构建了广东省高考英语听说考试和智能评测系统,并首次在广东高考中验证成功实用。该系统通过人工智能技术的应用,可实现自动化考试和评分,现已推广到全国 20 多个省市的中高考英语口语考试中使用。
2015 年,科大讯飞率先在安徽、湖南等地的多项作文考试中,利用人工智能辅助完成评分质检工作;2016 年,又对安徽、江苏两地高考考生的语文作文和英语作文进行了后台离线智能评分;到了 2017 年,阿里 ai 又在浙江外国语学院的一次考试中,利用人工智能辅助,准确指出学生在作文写作中出现的多词、缺词、错词等错误。
[2] 高考网上阅卷系统和人工智能辅助评分系统融合示意图
经过多方努力探索,去年年初,教育部教育考试院已将智能评分技术纳入网评暂行标准。再把目光聚焦到刚刚结束不久的高考,据悉,科大讯飞今年将承担 119 个省市区的中高考扫描阅卷工作,同时还会在安徽、江苏、广西、天津、广东、上海等十余个省市范围内,进行高考智能阅卷的辅助评分应用。
某种意义上看,高考阅卷 4.0 时代或许只是 3.0 时代的延续,它并未打破既有的阅卷模式和体系,只是在以往“人工 计算机”的基础上更进一步,加大了计算机的介入比重。但长远而言,其产生的影响不容小觑。过往,计算机在主观题上往往捉襟见肘,现在却能运用先进的人工智能技术,在中英作文、几何证明等题型上崭露头角,帮助阅卷教师更快速准确地批阅。
根据对上述科目及题型的探索验证和经验积累,未来,人工智能完全有可能在更大范围内建立起科学的阅卷模型,实现对具有确定答案的填空题、改错题、文科类简答题以及包含公式和解题过程的数学、物理、化学、生物等特定题型的智能批阅,将智能阅卷成果向纵深扩展。并且,伴随更多企业参与到教育考试及阅卷工作中来,势必将对现有网上阅卷技术服务商提出更多更高的要求,给行业更多发展想象的空间。
03
“人机协作”是必然,但也要拎清其中利害
其实,自人工智能技术诞生以来,关于计算机会不会完全取代人工的探讨就一直未曾停息,高考阅卷领域同样如此。科大讯飞考试与语言学习产品线副总经理竺博认为,未来在学业水平考试、自学考试及社会化考试等相对低利害的考试中,人工智能阅卷替代一评或部分替代人力是发展方向,人机协作的智能阅卷组织管理模式,也将成为未来考试阅卷智能化应用的潮流。
[3] 人机协作阅卷的智能评分流程
他表示,“人机协作”阅卷模式的技术特点可以总结归纳为 3 点:一是高融合性。将智能评分参与一评独立部署,通过增加数据接口,扩充“阅卷辅助平台”应用功能,保持与网上阅卷系统之间的密切联系。在网上阅卷系统中增加验标集专家评分功能模块,使智能评分参与一评成为替代一评的标准流程,既保证人工正式阅卷流程的顺畅,又确保各系统独立运行和相互之间的数据安全性。
二是高可用性。“网上阅卷系统”支持随时在“人一评” “机一评” “人二评”模式和“人工双评”模式之间的切换,智能评分系统支持在“机一评”模式和“智能评分辅助网评质量监控”模式之间的切换,能够切实降低智能评分参与一评的风险,确保阅卷进度和质量。
三是可追溯性。单独部署的“验标集专家评分系统”、用于人工阅卷的“网上阅卷系统”和“智能评分系统”3 个系统之间数据独立运行、独立存储,通过“阅卷辅助平台”进行数据交换,完成在线实时对接,并形成操作日志,关键节点均可实现可追溯、可审计、可恢复的设计目标。
人工智能辅助阅卷发展方向及核心能力
与此同时,竺博强调,人工智能阅卷不会完全取代人工,尤其在高考这种高利害性的考试中,其扮演的是工具、帮手的角色,是为了更好地服务阅卷工作,而非为了把人比下去。他表示,计算机智能阅卷更准确的表达应该为数字化考试。这点上看,教育考试领域中,以人工智能为代表的新型基础设施建设刚刚处于起步阶段,有着广阔的应用前景和上升空间。
通过业内人士观点不难看出,随着人工智能技术、5g 高速网络、数据中心、数字孪生等一批新型基础设施建设的规划与落地,教育考试业务中的信息化与数字化也将进入新阶段。未来,对行业各大厂商而言,“抓手”可能会由做好信息技术的单点应用,发展为新基建与教育考试业务各环节的全面协同;由信息技术满足部分考试业务需求,转变为新基建赋能教育考试业务;由单一的技术补缺,转变为助力教育考试业务变革升级。
高考作为举国关注的大考,不仅是对广大高三学子的一次检验,更是对背后阅卷各个环节的一场考核。经过近半个世纪的演变,从“攥红笔”到“握鼠标”,从“翻试卷”到“看屏幕”,我们有幸领略技术在高考阅卷上的推力,也很欣慰成为这个特殊时代的见证者。但无论技术怎样发展变革,我们应始终秉承“人本位”的理念,让技术服务于人,而非束缚于人。
参考资料及部分文献引用:
1. [1][3]何屹松, 孙媛媛, 汪张龙, 竺博. 人工智能评测技术在大规模中英文作文阅卷中的应用探索[j]. 中国考试, 2018(6):9.
2. [2]何屹松, 徐飞, 刘惠, 孙媛媛, 竺博, 储林林. 新一代智能网上评卷系统的技术实现及在高考网评中的应用实例分析[j]. 中国考试, 2019, 000(001):57-65.
3. 何屹松, 孙媛媛, 江光贤, 张凯. 人工智能评分参与高考网评一评的应用实践[j]. 中国考试, 2021(9):7.
4. 杨景治. 给1078万考生批卷的,可能不是个人[ol]. 果壳硬科技, 2021-06-07
5. 制造的小助理. 给1193万高考生判卷,究竟有多难?[ol]. 了不起的中国制造, 2022-06-09