面向在线智慧学习的教育数据挖掘-《电子制作》杂志社

关于我们

《电子制作》杂志是经中国新闻出版总署批准，北京市工商局备案，国内外公开发行的科技类优秀期刊。《电子制作》杂志主管单位为中国商业联合会、主办单位为中国家用电器服务维修协会，办刊尊旨：作为一份综合性的科技类学术刊物，《电子制作》杂志旨在推广电子科技、信息技术在社会各领域的应用和发展，关注科技传播与公民科学文化素质的提升。《电子制作》杂志提倡社会各界在学术研究过程...>>更多

常见问题

应用技术
您的位置：首页 > 应用技术

面向在线智慧学习的教育数据挖掘

信息来源：《电子制作》杂志社发表时间： 2022/3/28 阅读数：572

面向在线智慧学习的教育数据挖掘

目前，相关学者已研究多项针对MOOC平台和的数据分析与挖掘方法[9-10]．Yudelson等[11]根据课程设置、参考书目和在线检测研究学生在MOOC平台中的行为模式挖掘与激励．Chakor[12]根据学生在课程周期中的行为特征进行学生退课预测．Bruff等[13]根据学生影响力(在线论坛、讨论组、测试成绩等)的知识传播建模与引导研究知识传播问题．朱天宇等[14]和Kongsakun等[15]研究在线学习平台中的个性化信息过滤问题，如课程、论坛专家文章推荐、学生分组、学友推荐等．这些已有的研究成果可以帮助学生更便捷地使用在线教育平台中的资源．

此外，学者们针对在线学习的试题库和学习系统书籍进行分析与挖掘．delaTorre[16]根据学生的学习情况记录进行认知诊断分析，了解学生的学习状态、知识点掌握情况和粗心程度等．Midgley[17]研究学生个性化教学与辅导，为每个学生提供个性化的试题推荐和学习策略．Lü等[18]根据在线学习平台试题库中试题依赖关系、学习顺序等构建知识图谱．Hudak等[19]研究试题内容自动标识等问题．这些工作可以更好地帮助研究人员了解学生的学习过程以及当前的学习状态，为每位学生智能定制更个性化的学习方案．

然而，在线智慧教育领域仍存在许多问题需要进一步解决．例如，由于从在线教育平台获得的数据具有海量、稀疏、高噪等特点，因此现有的智能辅助模型很难对试题特征和学生学业水平进行准确分析[1]．其次，现有模型较少考虑学生、教师的个性化需求，难以对每位学生进行个性化分析与推荐[20]．为此，本文针对在线学习涉及到的试题表示、学生学习和教师教辅等，综述和讨论教育数据挖掘技术研究与应用的部分工作．

本文研究基本框架如图1所示:1)面向试题，介绍基于试题表征的难度预测相关研究工作;2)面向学生，介绍学生认知诊断分析和学生心理建模方法等;3)面向教学，介绍面向自适应学习的个性化推荐、协同分组等的探索工作．下面详细介绍各方面的具体进展，以及部分技术的应用场景和依托的应用平台———科大讯飞在线教育系统“智学网”．

1 面向在线智慧学习的教育数据挖掘

本节从在线学习相关的3方面入手，分别介绍教育数据挖掘在面向试题、学生、教学辅助等方面的研究工作实例，并介绍部分技术的应用场景和所依托的科大讯飞在线教育系统“智学网”．

1.1 试题分析

试题作为教育中的一类重要的学习资源，在传统教育和在线教育中都发挥重要作用，针对试题分析的相关研究吸引许多研究人员的注意.目前，许多在线学习网站都提供在线题库供学生使用、学习[2]，智学网、猿题库等学习平台更是搭建以试题练习为主的在线学习环境.因此，在线学习系统需要提供针对海量试题的收集、整理、存储，并提供试题下载或在线答题等服务.

1.1.1 试题分析研究现状

图2为智学网中的试题样例，包含试题类型、题面、知识点等一系列的试题信息．如何有效地对试题题面、知识点及学生在试题上的答题记录等信息进行表征，并使用试题的数据表征进行试题难度预测、相似试题判定或试题知识点识别，是在线教育中面向试题研万究方的数重据要内容．本文着重介绍基于试题表征方法的难度预测研究．

试题难度是试题的一项重要特征，测试试题难度的预估对教学的各方面都具有一定的现实意义[21]．首先，对试题难度的准确估计和标注可以帮助系统构造更合理的试题库．其次，做好试题难度估计和标注工作可以辅助教师自动组卷，在减少人工工作量的同时，提高组卷的科学性和合理性．最后，准确的试题难度估计可以帮助在线学习系统为每个学生筛选合适的练习题．

教育心理学中的经典测量理论(ClassicalTestTheory，CTT)认为，试题的难度可由一道试题被错误回答的比率表示，即对一道试题，答错的学生越多，那么该试题就越难[22]．然而，在某些实际情况下，需要在学生对试题进行作答之前，进行试题难度的预测和评估．例如，对于标准化测试(如TOEFL，GRE等)，每个学生可以多次参加考试，并选择最高分数作为最终分数用于学校申请等工作[23]．因此，多次考试的试题难度应当一致，以保障考试成绩的公平性;对于一些大型的考试(如中国的普通高等学校招生全国统一考试，简称高考)，对试题的难度预测可以保证测试的质量．

传统的试题难度预测方法可以基于专家经验对试题难度进行人工评估或使用教育心理学中的简单回归模型[24]．然而，前者存在专家主观性强、费时费力的问题，后者存在难以使用海量样本、对试题文本特征等利用不足的问题．Huang等[25]提出基于试题文本的难度预测框架(Test-AwareAttention-BasedConvolutionalNeuralNetwork，TACNN)，用于自动完成试题的难度预测任务．

1.1.2 基于试题表征方法的难度预测

TACNN框架示意图．具体地，以英语阅读理解试题为例，TACNN通过使用试题文本信息及学生在试题上的历史答题记录，预测新的考试中出现的英语阅读理解试题的难度(答错率)．

可以看出，TACNN主要由4部分组成，分别是输入层、句子卷积神经网络层、注意力层、预测层．输入层包含英语阅读理解选择题Qi的各部分信息:阅读文本张量TDi、问题矩阵TQi、选项矩阵TOi.TACNN的第2层，基于卷积神经网络(Con-volutionalNeuralNetwork，CNN)对试题中的每个句子进行表征，将每句话表示为一个固定长度的向量.第3层注意力层结合学生的阅读习惯处理试题，包括本文每个句子对试题难度的贡献DAi及每个选项的难度贡献DOi.在最终的预测层中，TACNN根据文本难度贡献DAi、选项难度贡献DOi及问题的形式化表征设计考试范围依赖的偏序训练目标，消除不同考试的误差，预测试题难度～Pi.Fig．3TACNNFramework。

关于我们

常见问题

应用技术您的位置：首页 > 应用技术

应用技术
您的位置：首页 > 应用技术