大数据揭秘高考化学(一)
——运用大数据的思想研究高考化学
双流棠湖中学
近年来,汹涌袭来的大数据正渗透于各行各业之中,正如《大数据时代》的作者维克托•迈尔•舍恩伯格所说:“如果你拒绝大数据的话,可能会失去生命,如果一个国家拒绝大数据时代的话,可能失去这个国家的未来,失去一代人的未来”。在这场变革之中,用大数据研究考试并进行考试评价也不例外;例如:科大讯飞公司开发了面向学校日常考试的教育质量监测云服务平台,并运用动态大数据采集分析和评价,挖掘校园考试价值;百度公司凭借占有海量试卷信息的数据资源和精准分析的技术优势,开展了对高考命题和命题方向的探索,在2014年高考前夕,预测了高考作文的六大命题方向;百度文库通过对近五年来全国各省市高考数学试卷的详尽分析,整理出了各地区考卷的核心考点及其相应分值,并于2015年5月首次以官方身份发布了当年北京高考数学的预测卷。
用大数据的方法如何来研究高考?它与传统的高考研究的方法有何不同?在高考复习教学中如何采用大数据策略等问题?在公开的文献中还没有相关介绍,现将作者近年来课题研究的成果和教学实践的体会分享出来,形成《大数据揭秘高考化学》三篇系列文章,以揭开大数据研究高考的神秘面纱。
一、大数据带来认识事物的思想和研究方法上的变革
维克托•迈尔•舍恩伯格认为:这种变革就是人们应该从对于“因果关系”的追求中解脱出来,转而将注意力放在“相关关系”的发现和使用上[1]。为了让读者理解因果关系和相关关系是两种研究问题的不同方法,现以考试后确定答案为例来说明这两种方法的异同。
把没有标准答案的试卷用于正规考试,对教师来说总是一件烦心的事,老师自己做答案的准确度往往受老师的专业水平、对命题意图的准确把握,以及做题时的认真程度等因素影响,难免百密一疏,这就体现出了前因后果的关系。
我们是否可以用其他的方法来给出答案呢?下表1是成都市2016年某校“三诊”考试后计算机对选择题选项的统计。
表1 成都市2016年某校“三诊”考试选择题统计
选项 1 2 3 4 5 6 7
A 13 239 813 63 33 20 51
B 29 682 19 19 44 44 784
C 74 19 73 796 43 841 59
D 842 18 55 77 839 54 66
以前,我们是把这个统计表作为学生目标达成情况的信息反馈表。现在,我们是否可以改变一个角度把这个统计表作为这次考试选择题“答案”的生成表呢?我相信老师们已经意识到了,选择率最高的选项最有可能是答案!实际结论也是这样。于是,这就产生了一个有趣的现象,不懂化学的机器,怎么能够做出化学考试的正确答案呢?这就是大数据的奇妙之处!通过数据分析和数据解释得出正确的结论,对考试的数据解释体现在标准化考试应遵循的四个质量指标:即难度,区分度,信度和效度上。
如果我们再对这些选择题全部都正确的同学进行预测,他们的二卷平均分,也一定会比总平均分高得多,这就是大数据的另一个奇妙之处,趋势判断。实际上也正是如此,统计结果见表2。
表2成都市2016年某校“三诊”选择题全对同学的平均分与总平均分对照
选择题平均分 二卷平均分 总平均分
选择题全对的同学 42.0 38.0 80.0
全部参考同学 34.9 34.2 69.1
这种方法对于“信度”很差或“难度”极大的个别试题,仍有可能得不到正确答案,这种题目对确定考生的真实水平已经没有多少实际价值。在这种研究方法中,用到了数据信息、相关规则、趋势判断等方法。
上面例子中,第一种就是“因果关系”的研究方法,体现出研究深入、复杂和精确的特点,结果能够清楚地解释“为什么”是这个答案,即所谓“前因后果”,这种方法也是当今研究问题和