友情提示:本站提供全国400多所高等院校招收硕士、博士研究生入学考试历年考研真题、考博真题、答案,部分学校更新至2012年,2013年;均提供收费下载。 下载流程: 考研真题 点击“考研试卷””下载; 考博真题 点击“考博试卷库” 下载
国防科技大学2020年博士研究生入学考试自命题科目考试大纲
科目代码:3601 科目名称:数据挖掘
一. 考试要求
主要考查学生对数据挖掘基本概念的理解与掌握;对数据挖掘常用算法关联分析、分类、聚类等主要思想和主要方法的理解与掌握;以及运用数据挖掘算法解决问题的能力。
二、考试内容
1.数据挖掘概述
数据挖掘的概念、性质、分类以及数据挖掘的基本原理。数据挖掘的基本步骤。数据库、数据仓库、事务数据等基本概念。
2.认识数据
数据对象与属性类型,数据的基本统计描述,以及度量数据的相似性和相异性计算方法等。
3.数据预处理
数据清理方法、数据集成方法、数据规约方法、以及数据变换与数据离散化方法,具体包括:缺失值和噪声数据的处理、实体识别问题、冗余和相关性分析、元组重复、数据值冲突的检测与处理、主成分分析、直方图、抽样、规范化数据变换、分箱离散化、直方图离散化等。
4.关联分析
频繁模式基本概念,频繁项集、闭项集、关联规则,频繁项挖掘方法,Apriori以及改进方法、模式增长方法、垂直数据格式频繁项挖掘,挖掘闭模式和极大模式。
5.分类
分类基本概念,决策树归纳,贝叶斯分类方法,最近邻分类器,支持向量机,神经网络分类器,模型的评估与选择,评估分类器性能的度量、保持方法和随机二次抽样、交叉验证、自助法、使用统计显著性检验选择模型、基于成本效益和ROC曲线比较分类器,提高分类准确率的技术,组合分类方法、袋装、提升和AdaBoost,随机森林、提高类不平衡数据分类的准确率。
6.聚类
聚类基本概念,k-均值、k-中心点、层次方法、基于密度的方法、谱聚类、基于概率模型的聚类,聚类评估方法。
7.离群点检测
离群的基本概念,离群点检测方法,统计学方法,基于近邻性的方法,基于聚类的方法,基于分类的方法,挖掘情境离群点和集体离群点。
三、考试形式
考试形式为闭卷、笔试,考试时间为3小时,满分100分。
题型包括:选择题、判断题、简答题、分析应用题等。
四、参考书目
1.《数据挖掘概念与技术》. Jiawei Han(范明,孟小峰译). 北京:机械工业出版社,2012年,第3版.
免责声明:本文系转载自网络,如有侵犯,请联系我们立即删除,另:本文仅代表作者个人观点,与本网站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。