机器学习课后练习题（期末复习题目附答案）

2023年6月30日下午9:55 • 人工智能 • 阅读 92

此为第六章贝叶斯分类

一. 单选题
1. ‍假设会开车的本科生比例是15%,会开车的研究生比例是23%。若在某大学研究生占学生比例是20%,则会开车的学生是研究生的概率是多少?

A. 80%
B. 27.7%
C. 16.6%
D. 23%

正确答案: B

下列关于朴素贝叶斯的特点说法错误的是()
A. 朴素贝叶斯处理过程简单,分类速度快
B. 朴素贝叶斯模型无需假设特征条件独立
C. 朴素贝叶斯模型发源于古典数学理论,数学基础坚实
D. 朴素贝叶斯对小规模数据表现较好

正确答案: B

以下算法不属于生成模型 ( )
A. 支持向量机
B. 朴素贝叶斯模型
C. 隐马尔科夫模型
D. 混合高斯模型

正确答案: A

关于拉普拉斯平滑说法正确的是()
A. 会使得最终结果可能大于1
B. 加上拉普拉斯平滑有助于提高学习性能
C. 以上说法都不对
D. 避免了出现概率为0的情况

正确答案: D

假设X和Y都服从正态分布,那么P(X

正确答案: C

以下算法属于判别模型的是( )
A. 线性回归
B. 朴素贝叶斯模型
C. 深度信念网络
D. 隐马尔科夫模型

正确答案: A

市场上某商品来自两个工厂,它们市场占有率分别为60%和40%,有两人各自买一件,则买到的来自不同工厂之概率为( )。
A. 0.3
B. 0.48
C. 0.5
D. 0.24

正确答案: B

以A表示事件”甲种产品畅销,乙种产品滞销”,则其对立事件A为( )
A. 甲,乙两种产品均畅销
B. 甲种产品滞销
C. 甲种产品滞销,乙种产品畅销
D. 甲种产品滞销或乙种产品畅销

正确答案: D

关于朴素贝叶斯,下列说法错误的是:( )
A. 朴素的意义在于它的一个天真的假设:所有特征之间是相互独立的
B. 它是一个分类算法
C. 它实际上是将多条件下的条件概率转换成了单一条件下的条件概率,简化了计算
D. 朴素贝叶斯不需要使用联合概率

正确答案: D

掷二枚骰子,事件A为出现的点数之和等于3的概率为( )
A. 都不对
B. 1/18
C. 1/11
D. 1/6

正确答案: B

二. 判断题
11. ‍朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性相关性较小时,朴素贝叶斯性能良好。而在属性个数比较多或者属性之间相关性较大时,分类效果不好。
A. 对
B. 错

正确答案: 对

逻辑回归是生成模型,朴素贝叶斯是判别模型
A. 对
B. 错

正确答案: 错

逻辑回归和朴素贝叶斯都有对属性特征独立的要求
A. 对
B. 错

正确答案: 错

朴素贝叶斯法的基本假设是条件独立性。
A. 对
B. 错

正确答案: 对

此为第七章KNN

一. 单选题
1. ‍下列哪个距离度量不在KNN算法中体现:( )。
A. 曼哈顿距离
B. 欧氏距离
C. 切比雪夫距离
D. 余弦相似度

正确答案: D

‍下列选项中,关于KNN算法说法不正确是:( )。
A. 效率很高
B. 实现过程相对简单,但是可解释性不强
C. 默认使用欧氏距离度量
D. 能找出与待预测样本相近的K个样本

正确答案: A

‍以下距离度量方法中,在城市道路里,要从一个十字路口开车到另外一个十字路口的距离是: ( )。
A. 欧氏距离
B. 夹角余弦
C. 切比雪夫距离
D. 曼哈顿距离

正确答案: D

以下哪项是KNN算法的缺点?( )
A. 对异常值不敏感
B. 低精度
C. 计算成本高
D. 需要的内存非常少

正确答案: C

关于余弦相似度,不正确的是( )。
A. 余弦相似度的结果和向量的长度无关
B. 余弦相似度的范围为[-1,1]
C. 余弦相似度为1的时候,两个向量完全相关
D. 余弦相似度为-1时候,两个向量完全不相关

正确答案: D

‍KD树(K-Dimension Tree)的描述中,不正确的是( )。
A. KD树可以用更高的效率来对空间进行划分
B. KD树是二叉树
C. KD树切分时,从方差小的维度开始切分
D. KD树的结构非常适合寻找最近邻居和碰撞检测

正确答案: C

假设有 6 个二维数据点:D={(2,3),(5,7),(9,6),(4,5),(6,4),(7,2)},第一次切分时候,切分线为( )。
A. x=5
B. x=6
C. y=5
D. y=6

正确答案: B

‍KNN算法在什么情况下效果较好?( )
A. 样本较少但典型性好
B. 样本呈团状分布
C. 样本较多但典型性不好
D. 样本呈链状分布

正确答案: A

‍两个向量的长度分别为1和2,两者之间的夹角为60度,则以下选项错误的是( )。
A. 余弦相似度为正
B. 余弦相似度为0.5
C. 余弦相似度的值与向量的长度无关,只和向量之间的夹角有关
D. 余弦相似度没法计算,因为没给出具体坐标值

正确答案: D

二. 多选题
10. ‍影响KNN算法效果的主要因素包括( )。
A. 最邻近数据的距离
B. 距离度量方式
C. 决策规则
D. K的值

正确答案: BCD

‍以下关于KNN说法正确的是 ( )。
A. 可解释性好
B. 对异常值不敏感
C. 计算复杂度低
D. 对数据没有假设

正确答案: BCD

KNN算法的缺点包括以下几点?( )
A. 计算复杂性高;空间复杂性高,尤其是特征数非常多的时候
B. 可解释性差,无法给出决策树那样的规则
C. 对异常值敏感
D. 对训练数据依赖度特别大,当样本不平衡的时候,对少数类的预测准确率低

正确答案: ABD

三. 判断题
13. 两个向量的余弦相似度越接近1,说明两者越相似。
A. 对
B. 错

正确答案: 对

k近邻法(k-Nearest Neighbor,kNN)是一种比较成熟也是最简单的机器学习算法,可以用于分类,但不能用于回归方法。
A. 对
B. 错

正确答案: 错

‍ ‎KNN没有显式的训练过程,它在训练阶段只是把数据保存下来,训练时间开销为0,等收到测试样本后进行处理。
A. 对
B. 错

正确答案: 对

‍KNN分类的时候,对新的样本,根据其k个最近邻的训练样本的类别,通过多数表决等方式进行预测。
A. 对
B. 错

正确答案: 对

Original: https://blog.csdn.net/m0_50962679/article/details/124707045
Author: 打算改个好听的名字
Title: 机器学习课后练习题（期末复习题目附答案）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/662134/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【机器学习】K-means算法Python实现教程

阅读须知：阅读本文需要有一定的Python及Numpy基础本文将介绍： K-means算法实现步骤使用Python实现K-means算法借助Numpy的向量计算提升计算速度…

人工智能 2023年6月19日
0082
WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))

没想到换个地方配置环境还能解锁新的报错！不愧是你Anaconda！ WARNING: Retrying (Retry(total=4, connect=None, read=Non…

人工智能 2023年5月25日
00222
回归模型–由浅入深

5.1 回归思想的起源 “回归”是由英国著名生物学家兼统计学家高尔顿(Francis Galton,1822～1911.生物学家达尔文的表弟)在研究人类遗传…

人工智能 2023年7月2日
00107
Maven安装与配置教程

文章目录 * – 1 什么是Maven – + * 1.1 Maven概述 * 1.2 Maven的常用命令 – 2 怎么安装Maven &#8…

人工智能 2023年7月31日
0082
为什么平方损失函数不适应于分类问题？——从概率论的角度

为什么平方损失函数不适用于分类问题？邱锡鹏教授《神经网络与深度学习》的课后习题特别经典，并且书中并没有解答，非常值得我们思考，今天的这个问题就是出自此书的第二章的习题，想来和大家…

人工智能 2023年7月3日
0063
深度学习（PyTorch）——flatten函数的用法及其与reshape函数的区别

Flatten层用来将输入”压平”，即把多维的输入一维化，常用在从卷积层到全连接层的过渡。Flatten不影响batch的大小。就是把高纬度的数组按照ｘ…

人工智能 2023年6月24日
0096
如何在M1 MacOS上面搭建Hadoop集群

本文主要介绍如何在M1芯片的MacOS上面搭建Hadoop虚拟机集群。前期准备需要准备的前期工作有： 1）准备安装了Centos的虚拟机； 2）准备ARM架构的JDK环境； 3…

人工智能 2023年6月4日
0099
[Pytorch] 学习记录（七）MNIST多分类问题

在处理多分类问题的时候会用到一个叫做 softmax的分类器，是用来将输出结果划归到[0,1]的，本讲将主要从softmax分类器入手来实现多分类问题。在前一章我们对糖尿病模型进…

人工智能 2023年7月1日
0087
深度学习之目标检测

算法的设计往往&#…

人工智能 2023年6月17日
00110
【数字图像处理】Python实现图像变换/沃尔什哈达玛变换(WHT，Walsh-Hadamard Transform)

其实已经有人用Python做出来，不过要钱，一点互联网精神都没有，所以这里我就自己想办法捣鼓了一些内容（我才不掏钱买代码呢），代码写的不好，请见谅，后面可能会更新，可能吧。非常感…

人工智能 2023年6月20日
0088
第2关：Pandas创建透视表和交叉表

任务描述本关任务：使用Pandas加载tip.csv文件中的数据集，分别用透视表和交叉表统计顾客在每种用餐时间、每个星期下的小费总和情况。相关知识透视表透视表是各种电子表格程序和…

人工智能 2023年7月16日
0068
spark dataframe方法解释

DataFrame 的函数 Action 操作 1、 collect() ,返回值是一个数组，返回dataframe集合所有的行 2、 collectAsList() 返回值是一个…

人工智能 2023年6月2日
00128
[论文][表情识别]Relative Uncertainty Learning for Facial Expression Recognition

论文基本情况发表时间及刊物/会议：2021 NeurIPS发表单位：Beijing University of Posts and Telecommunications 问题背景…

人工智能 2023年6月6日
0086
基于PreSCAN& Matlab/Simulink的智能驾驶联合仿真【详细图文】

在自动驾驶竞争日益激烈的趋势下，自动驾驶功能不断更新迭代，但任何功能的商业化推出之前，测试是必然的前提，如软件测试、仿真测试、道路测试，尽管在我国政策的支持情况下（如颁发道路测试牌…

人工智能 2023年6月10日
0091
史上最全架构师知识图谱（纯干货）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月10日
0076
吊打面试官，笑对 2022 金三银四，2022年最全面试真题大汇总

为什么要公开这些面试题？原因一：身边从事 Java 开发的人员越来越多，很多朋友们，每次问我要相同的面试复习材料，已经让我疲于应付，索性整理出来，直接发链接给他们。原因二：节…

人工智能 2023年6月29日
0082

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习课后练习题（期末复习题目附答案）

大家都在看