1. 在回归模型中,下列哪一项在权衡欠拟合(under-fitting)和过拟
合(over-fitting)中影响最大?
A. 多项式阶数
B. 更新权重 w 时,使用的是矩阵求逆还是梯度下降
C. 使用常数项
答案:A
解析:选择合适的多项式阶数非常重要。如果阶数过大,模型就会更加
复杂,容易发生过拟合;如果阶数较小,模型就会过于简单,容易发生
欠拟合。如果有对过拟合和欠拟合概念不清楚的,见下图所示:

2. 假设你有以下数据:输入和输出都只有一个变量。使用线性回归模型
(y=wx+b)来拟合数据。那么使用留一法(Leave-One Out)交叉验
证得到的均方误差是多少?
A. 10/27
B. 39/27
C. 49/27
D. 55/27
答案:C
解析:留一法,简单来说就是假设有 N 个样本,将每一个样本作为测试
样本,其它 N-1 个样本作为训练样本。这样得到 N 个分类器,N
测试结果。用这 N 个结果的平均值来衡量模型的性能。
对于该题,我们先画出 3 个样本点的坐标:

countifs函数为何总为零
使用两个点进行线性拟合,分
成三种情况,如下图所示:
第一种情况下,回归模型是 y = 2,误差 E1 = 1。
第二种情况下,回归模型是 y = -x + 4,误差 E2 = 2。
第三种情况下,回归模型是 y = -1/3x + 2,误差 E3 = 2/3。
则总的均方误差为:
3. 下列关于极大似然估计(Maximum Likelihood Estimate,
MLE),说法正确的是(多选)?
A. MLE 可能并不存在
B. MLE 总是存在

C. 如果 MLE 存在,那么它的解可能不是唯一的
D. 如果 MLE 存在,那么它的解一定是唯一的
答案:AC
解析:如果极大似然函数 L(θ) 在极大值处不连续,一阶导数不存在,
MLE 不存在,如下图所示:
另一种情况是 MLE 并不唯一,极大值对应两个 θ。如下图所示:

4. 如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差
为零),则下面哪个说法是正确的?
A. 测试样本误差始终为零
B. 测试样本误差不可能为零
C. 以上答案都不对
答案:C
解析:根据训练样本误差为零,无法推断测试样本误差是否为零。值得
一提是,如果测试样本样本很大,则很可能发生过拟合,模型不具备很
好的泛化能力!

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。