【问题 1】 (8分) 常见的反规范化设计包括增加冗余列、增加派生列、重新组表和表分割。为解决题干所述需求,王工采用的是哪种方法?请用300字以内的文字解释说明该方法,并指出其优缺点。 【问题2】 (8 分) 物理数据分区技术一般分为水平分区和垂直分区,数据库中常见的是水平分区。水平分区分为范围分区、哈希分区、列表分区等。请阅读下表,在(1)~(8) 中填写不同分区方法在数据值、数据管理能力、实施难度与可维护性、数据分布等方面的特点。【问题 3】(9 分) 根据需求,李工宜选择物理水平分区中的哪种分区方法?请用300字以内的文字分别解释说明该方法的优缺点。
Ⅰ.关联规划挖掘
Ⅱ.规范化挖掘
Ⅲ.分类分
Ⅳ.聚类分析
A.Ⅰ,Ⅱ和Ⅲ
B.Ⅰ,Ⅲ和Ⅳ
C.Ⅱ,Ⅲ和Ⅳ
D.Ⅰ,Ⅱ和Ⅳ
系统分析师在收集、分析、处理数据时常会遇到零星异常数据(野点、离群点),即大大偏离其他数据值的数据。关于异常数据的叙述,不正确的是(56)。
A.异常数据属于不良数据,应尽快找出来,修正它或删除它
B.处理大批数据时,其统计量中位数不易受零星异常数据的影响
C.用最小二乘法进行线性拟合时,零星异常数据可能导致拟合结果完全失真
D.测量误差、输入错误、程序运行错误等都可能产生异常数据
A.测量误差、输入错误、程序运行错误等都可能产生异常数据
B.处理大批数据时,其统计量中位数不易受零星异常数据的影响
C.异常数据属于不良数据,应尽快找出来,修正它或删除它
D.算术平均值容易受异常数据的影响
(56)
A. 异常数据属于不良数据,应尽快找出来,修正它或删除它
B. 处理大批数据时,其统计量中位数不易受零星异常数据的影响
C. 用最小二乘法进行线性拟合时,零星异常数据可能导致拟合结果完全失真
D. 测量误差、输入错误、程序运行错误等都可能产生异常数据
A.数据集市、联机事务处理服务器
B.数据建模、数据挖掘
C.数据净化、数据挖掘
D.数据的存储与管理、联机分析处理服务器
数据挖掘的分类方法很多。根据不同挖掘方法,可将其分为(47)。
A.分类或预测模型发现,数据归纳、聚类、关联规则发现,序列模式发现,依赖关系或依赖模型发现,异常和趋势发现等等
B.机器学习法、统计方法、神经网络方法和数据库方法
C.归纳学习方法(决策树、规则归纳等)、基于范例学习、遗传算法等
D.回归分析、判别分析、聚类分析、探索性分析等