Skip to content

24机器学习-试题回忆

文档信息

编者: Egopposer(line2345)
日期: 2024/12/13

前言及试题概览

说明

斜体为记忆模糊的题目,不保证可信度
黑体为我认为需要关注的点

试题概览

主观评价较多,仅供娱乐

评价项 评分/说明
题量 特大(取决于计算器质量)
难易度(软院专业课中) 8+1(计算量)/10
送分题占比 20%
背诵记忆占比 5%(几乎没有硬背内容,都是需要理解才能写出来的)


一、选择题(2×15=30分)

题目特点

质量很高的选择题,完全不是选词填空的硬背就行的情况。对问题的理解和各章节的综合理解有要求,也有送分题

  1. 下列算法中不能直接对图像数据进行分类的是( )

    • A. CART
    • B. SVM
    • C. logistic
    • D. LDA
  2. 对下列线性样本使用"留一法"进行数据集划分,得到的均方误差为( )

    x y
    1 0
    3 1
    2 2
  3. 预测股市价格走向属于下列哪类任务( )

    • A. 回归
    • B. 分类
    • C. 表征
  4. 给定软间隔支持向量机定义,当约束变量 \(\xi_i\) 大于零小于一时,该样本点位于( )

  5. 当(且仅当?)一个向量为支持向量时,下列选项成立的是( )

    注意

    选项仅供参考,可能就没有正确的,正确的我记得好像是约束生效的形式变了一下?忘了

    • A. \(1-y_i(\omega x_i+b)=0\)
    • B. \(\lambda_i\ne 0\)
    • C. \(\lambda_i y_i x_i =0\)
    • D. \(x_i(\hat{y_i}-y_i) \geq 0\)
  6. 给定PCA的结果图像,指出其中的第一主成分( )

  7. 好的聚类结果具有的特征是( )

    • A. 簇内相似度高,簇间相似度低
    • B. 簇内相似度低,簇间相似度低
    • C. 簇内相似度高,簇间相似度高
    • D. 簇内相似度低,簇间相似度高

二、判断题(2×10=20分)

题目特点

和选择一样,30%左右的题对理解有一定要求

  1. 逻辑回归算法只能做分类任务( )

  2. 机器学习中的经验(E)指的是数据( )

  3. 信息增益率比信息增益更不偏好样本类别少的数据( )

  4. 剪枝是解决决策树过拟合的有效手段( )

  5. 深度学习不能解决回归问题( )

  6. 反向传播算法中应用了链式求导法则( )


三、简答题(4+4+6+6=20分)

题目特点

和软院其他简答题大不相同了,不需要怎么背

1. M-P神经元(4分)

画出M-P神经元的工作图,并简述其工作流程。

2. 拉格朗日函数(6分)

关于优化目标 \(\max f(x)\) 和约束条件 \(g(x)-n(x+k)\geq C\)\(乱七八糟的一坨\leq 另一坨\),写出其拉格朗日函数。

3. Logistic推导(6分)

填空题:Logistic的推导过程

  • \(p_0=P(y_i=0)=\)
  • \(p_1=P(y_i=1)=\)
  • 化简到最简,优化目标为 \(\min\)

4. PCA算法(4分)

简述PCA算法的工作流程。


四、综合题(6+7+8+10=31分)

计算量警告

卡西欧991cnx拼尽全力无法战胜

1. K-means聚类(6分)

给定下列数据集,初始化3和5作为聚类的初始中心点,使用k-means算法,给出Lloyd算法前两次迭代的中心点和聚类结果。

编号 花萼长度 花萼宽度 花瓣长度 花瓣宽度 种类
1 A
2 A
3 A
4 A
5 B
6 B
7 B
8 B

吐槽

初见端倪,8×4的样本,还非整数
你不会指望我把数据集给你背下来吧(˘•ω•˘)

2. LDA散度矩阵(7分)

使用上一题的数据集,计算其LDA中的类间散度矩阵和类内散度矩阵。

3. 分类评估指标(8分)

给出下列二分类结果,给出其混淆矩阵、精度、召回率、F1值、TPR、FPR。

样本属性
预测结果

4. SVM分类超平面(10分)

对于正样例 \((x_1,y_1)\),负样例 \((x_2,y_2)\)\((x_3,y_3)\),使用SVM计算其分类超平面。

提示

课件原题微调,并且直接给出了优化目标