博士生毕业因素的关联规则挖掘:群像特征与类型差异
王婷,耿有权,黄亚继
摘要:博士生教育以培养具有学术创新能力的高层次人才为目标,肩负着知识生产和促进经济社会发展的重任。在大数据背景下,利用博士生培养过程的教育数据,深度挖掘博士生毕业时间与培养各环节的关联规则,发现博士生延期毕业的主要原因,探析不同时间毕业的博士生群体特征,可为高校加强博士生培养管理、提高博士生毕业率提供科学指导。基于某高校研究生管理大数据系统,获取学生入学信息、导师基础信息、综合素质表现、校园行为情况、科研学习情况5类数据,处理整合形成数据集,并进行特征提取和标签体系构建,采用FP-Growth算法挖掘所有标签与博士生毕业因素的关联规则,最终刻画出按期毕业、延期毕业和超期毕业3类博士生的群体画像,并对比分析3类群像呈现的差异性特征。研究发现:博士生入学方式、课程成绩、开题情况、科研成果数量和完成时间、在读期间是否获得奖学金和荣誉表彰、毕业论文送审时间与博士生毕业时间存在强关联性;博士生入学年龄、入学前院校是不是“双一流”高校、导师年龄、导师任博导年限、导师指导学生人数、校园行为习惯与博士生毕业时间关联性不强;按期毕业和超期毕业博士生分别对应一种典型群体画像,延期毕业博士生包含3种典型画像;3类博士生群体画像在学术志趣、学术基础和学术能力3个方面呈现明显差异。为提升博士生培养质量,提高博士生毕业率,需打破刚性限制与隐性歧视,确保优秀生源选拔的有效性;强化过程监督与分流退出,确保培养过程管理的科学性;重视课程供给与基础培养,保障科研实践衔接的流畅性;呵护博士生学术志趣和身心健康,激发其科研探索和创新的积极性。
王婷,等:博士生毕业因素的关联规则挖掘:群像特征与类型差异.pdf