24机器学习-试题回忆¶
文档信息
编者: Egopposer(line2345)
日期: 2024/12/13
前言及试题概览¶
说明
斜体为记忆模糊的题目,不保证可信度
黑体为我认为需要关注的点
试题概览¶
主观评价较多,仅供娱乐
| 评价项 | 评分/说明 |
|---|---|
| 题量 | 特大(取决于计算器质量) |
| 难易度(软院专业课中) | 8+1(计算量)/10 |
| 送分题占比 | 20% |
| 背诵记忆占比 | 5%(几乎没有硬背内容,都是需要理解才能写出来的) |
- pdf下载链接: 机器学习-试题回忆 PDF
一、选择题(2×15=30分)¶
题目特点
质量很高的选择题,完全不是选词填空的硬背就行的情况。对问题的理解和各章节的综合理解有要求,也有送分题
-
下列算法中不能直接对图像数据进行分类的是( )
- A. CART
- B. SVM
- C. logistic
- D. LDA
-
对下列线性样本使用"留一法"进行数据集划分,得到的均方误差为( )
x y 1 0 3 1 2 2 -
预测股市价格走向属于下列哪类任务( )
- A. 回归
- B. 分类
- C. 表征
-
给定软间隔支持向量机定义,当约束变量 \(\xi_i\) 大于零小于一时,该样本点位于( )
-
当(且仅当?)一个向量为支持向量时,下列选项成立的是( )
注意
选项仅供参考,可能就没有正确的,正确的我记得好像是约束生效的形式变了一下?忘了
- A. \(1-y_i(\omega x_i+b)=0\)
- B. \(\lambda_i\ne 0\)
- C. \(\lambda_i y_i x_i =0\)
- D. \(x_i(\hat{y_i}-y_i) \geq 0\)
-
给定PCA的结果图像,指出其中的第一主成分( )
-
好的聚类结果具有的特征是( )
- A. 簇内相似度高,簇间相似度低
- B. 簇内相似度低,簇间相似度低
- C. 簇内相似度高,簇间相似度高
- D. 簇内相似度低,簇间相似度高
二、判断题(2×10=20分)¶
题目特点
和选择一样,30%左右的题对理解有一定要求
-
逻辑回归算法只能做分类任务( )
-
机器学习中的经验(E)指的是数据( )
-
信息增益率比信息增益更不偏好样本类别少的数据( )
-
剪枝是解决决策树过拟合的有效手段( )
-
深度学习不能解决回归问题( )
-
反向传播算法中应用了链式求导法则( )
三、简答题(4+4+6+6=20分)¶
题目特点
和软院其他简答题大不相同了,不需要怎么背
1. M-P神经元(4分)¶
画出M-P神经元的工作图,并简述其工作流程。
2. 拉格朗日函数(6分)¶
关于优化目标 \(\max f(x)\) 和约束条件 \(g(x)-n(x+k)\geq C\),\(乱七八糟的一坨\leq 另一坨\),写出其拉格朗日函数。
3. Logistic推导(6分)¶
填空题:Logistic的推导过程
- \(p_0=P(y_i=0)=\)
- \(p_1=P(y_i=1)=\)
- 化简到最简,优化目标为 \(\min\)
4. PCA算法(4分)¶
简述PCA算法的工作流程。
四、综合题(6+7+8+10=31分)¶
计算量警告
卡西欧991cnx拼尽全力无法战胜
1. K-means聚类(6分)¶
给定下列数据集,初始化3和5作为聚类的初始中心点,使用k-means算法,给出Lloyd算法前两次迭代的中心点和聚类结果。
| 编号 | 花萼长度 | 花萼宽度 | 花瓣长度 | 花瓣宽度 | 种类 |
|---|---|---|---|---|---|
| 1 | A | ||||
| 2 | A | ||||
| 3 | A | ||||
| 4 | A | ||||
| 5 | B | ||||
| 6 | B | ||||
| 7 | B | ||||
| 8 | B |
吐槽
初见端倪,8×4的样本,还非整数
你不会指望我把数据集给你背下来吧(˘•ω•˘)
2. LDA散度矩阵(7分)¶
使用上一题的数据集,计算其LDA中的类间散度矩阵和类内散度矩阵。
3. 分类评估指标(8分)¶
给出下列二分类结果,给出其混淆矩阵、精度、召回率、F1值、TPR、FPR。
| 样本属性 | □ | ○ | □ | □ | □ | □ | ○ | ○ | ○ | ○ |
|---|---|---|---|---|---|---|---|---|---|---|
| 预测结果 | ○ | □ | ○ | □ | □ | ○ | □ | ○ | □ | ○ |
4. SVM分类超平面(10分)¶
对于正样例 \((x_1,y_1)\),负样例 \((x_2,y_2)\),\((x_3,y_3)\),使用SVM计算其分类超平面。
提示
课件原题微调,并且直接给出了优化目标