测试章节

测试

1、单选题:
​什么是KDD?‎
选项:
A: 数据挖掘与知识发现
B: 领域知识发现
C: 文档知识发现
D: 动态知识发现
答案: 【 数据挖掘与知识发现

2、单选题:
‌“8,000”和“10,000”表示:‎
选项:
A: 数据
B: 信息
C: 知识
D: 智慧 
答案: 【 数据

3、单选题:
​人从出生到长大的过程中,是如何认识事物的? ‌​‌
选项:
A: 聚类过程
B: 分类过程
C: 先分类,后聚类
D: 先聚类,后分类
答案: 【 先聚类,后分类

4、单选题:
‌“8,000米是飞机飞行最大高度”与“10,000米的高山”表示:‎‌    ‎
选项:
A: 数据    
B: 信息
C: 知识
D: 智慧
答案: 【 信息

5、单选题:
‌“飞机无法飞过高山”表示:‏‌‏
选项:
A: 数据
B: 信息
C: 知识
D:  智慧
答案: 【 知识

6、单选题:
‌下面哪个不属于数据的属性类型:‌‌‌
选项:
A: 标称
B: 序数
C: 区间
D: 相异 
答案: 【 相异 

7、单选题:
‏只有非零值才重要的二元属性被称作:​
选项:
A: 计数属性
B: 离散属性
C: 非对称的二元属性
D: 对称属性
答案: 【 非对称的二元属性

8、单选题:
‍一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:‎
选项:
A:  一年级
B: 二年级
C: 三年级
D:  四年级
答案: 【  一年级

9、单选题:
‍所谓高维数据,指的是‌
选项:
A: 数据对象很多
B: 数据属性很多
C: 数据数值很大
D: 数据内容很多
答案: 【 数据属性很多

10、单选题:
​假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:‌
选项:
A: 0.821
B:  1.224
C:  1.458
D: 0.716
答案: 【 0.716

11、单选题:
‎假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?‌
选项:
A:  第一个
B:  第二个
C: 第三个
D: 第四个
答案: 【  第二个

12、单选题:
‍考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为‎
选项:
A: 0.75
B: 0.35
C: 0.4678
D:  0.5738
答案: 【 0.4678

13、单选题:
‎朴素贝叶斯分类器的朴素之处在于:‎
选项:
A: 只能处理低维属性 
B: 只能处理离散型属性
C: 分类效果一般  
D: 属性之间的条件独立性假设
答案: 【 属性之间的条件独立性假设

14、单选题:
‌决策树中不包含一下哪种结点‏
选项:
A: 根结点(root node)
B: 内部结点(internal node)    
C: 外部结点(external node)
D: 叶结点(leaf node)
答案: 【 外部结点(external node)

15、单选题:
‏以下哪些算法是分类算法‏
选项:
A: DBSCAN
B: ID3
C: K-Means
D: EM
答案: 【 ID3

16、单选题:
‌决策树的父节点和子节点的熵的大小关系是什么?‍
选项:
A: 决策树的父节点更大
B: 子节点的熵更大
C: 两者相等
D: 根据具体情况而定 
答案: 【 子节点的熵更大

17、单选题:
​当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?‎​‎
选项:
A: 分类     
B: 聚类
C: 关联分析
D: 隐马尔可夫链
答案: 【 聚类

18、单选题:
‌简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作‍
选项:
A: 层次聚类
B: 划分聚类
C: 非互斥聚类
D: 模糊聚类
答案: 【 划分聚类

19、单选题:
‍关于k-means算法,正确的描述是:‌
选项:
A: 能找到任意形状的聚类
B: 初始值不同,最终结果可能不同
C: 每次迭代的时间复杂度是O(n^2),其中n是样本数量    
D: 不能使用核函数(kernel function)
答案: 【 初始值不同,最终结果可能不同

20、单选题:
​K-Means算法中的初始中心点:‏
选项:
A: 可随意设置 
B: 必须在每个簇的真实中心点的附近
C: 必须足够分散     
D: 直接影响算法的收敛结果
答案: 【 直接影响算法的收敛结果

21、单选题:
‍logistic回归是否对噪声敏感‏
选项:
A: 是
B: 否
C:
D:
答案: 【 是

22、单选题:
‏某超市研究销售纪录

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注