第1章绪论

第1章 单元测验

1、多选题:
‎机器学习与数据挖掘之间的关系和区别为(   )(多选题)‍
选项:
A: 数据挖掘可以视为机器学习和数据库的交叉。
B: 数据挖掘主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据。
C: 机器学习偏理论,数据挖掘偏应用。
D: 两者是相互独立的两种数据处理技术。
答案: 【 数据挖掘可以视为机器学习和数据库的交叉。;
数据挖掘主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据。;
机器学习偏理论,数据挖掘偏应用。

第2章模型评估

第2章 单元测验

1、单选题:
‌通常(   )误差作为泛化误差的近似。(单选)‏
选项:
A: 训练
B: 经验
C: 测试
D: 以上都可以
答案: 【 测试

2、单选题:
‍将数据集划分成训练集S和测试集T的常见方法有(   )。(单选)​
选项:
A: 留出法
B: 交叉验证法
C: 自助法
D: 以上均正确
答案: 【 以上均正确

3、多选题:
‌在类不平衡数据集中,(    )和(   )通常作为更合适的性能度量。(多选)‏
选项:
A: 准确率
B: 错误率
C: 查准率
D: 查全率
答案: 【 查准率;
查全率

4、多选题:
‎(   )和(   )是分类任务中最常用的两种评估指标。(多选)‌
选项:
A: 错误率
B: 准确率(精度)
C: 查准率
D: 查全率
答案: 【 错误率;
准确率(精度)

5、填空题:
​测试集应该尽可能与训练集(   ),即测试样本尽量不在训练集中出现、未在训练过程中使用过。(填空)‎
答案: 【 互斥

第3章线性学习

第3章 单元测验

1、单选题:
‎在逻辑斯蒂(对数几率)回归中将输出y视为样本x属于正例的概率。给定训练数据集,通常采用(    ) 来估计参数w和b,最大化样本属于其真实类标记的概率的对数,即最大化对数似然。(单选)‎
选项:
A: 最小二乘法
B: 留出法
C: 极大似然法
D: 交叉验证法
答案: 【 极大似然法

2、多选题:
‌在多分类学习中,经典的拆分策略有(   )。(多选)‎
选项:
A: 一对一(One vs. One,简称OvO)
B: 一对其余(One vs. Rest,简称OvR)
C: 多对多(Many vs. Many,简称MvM)
D: 二对二(Two vs. Two,简称TvT)
答案: 【 一对一(One vs. One,简称OvO);
一对其余(One vs. Rest,简称OvR);
多对多(Many vs. Many,简称MvM)

3、判断题:
‌回归预测的目标函数是离散值,分类预测的目标函数是连续值。(判断

剩余75%内容付费后可查看

发表评论

电子邮件地址不会被公开。 必填项已用*标注