数据挖掘的主要功能包括概念描述、趋势分析、孤立点分析、( )等方面。
A、关联分析
B、分类和预测分析
C、聚类分析
D、偏差分析
E、
下列关于L1和L2范数的描述正确的有( )。
A、L1范数为x向量各个元素绝对值之和
B、L2范数为x向量各个元素平方和的1/2次方,L2范数又称Euclidean范数或Frobenius 范数
C、L1范数可以使权值稀疏,方便特征提取
D、L2范数可以防止过拟合,提升模型的泛化能力
E、
特征选择方法有( )。
A、AIC赤池信息准则
B、LARS嵌入式特征选择方法
C、LVW包裹式特征选择方法
D、Relief过滤式特征选择方法
E、
在正则化公式中,λ为正则化参数。下列关于λ的描述正确的有( )。
A、若正则化参数λ过大,可能会导致出现欠拟合现象
B、若λ太大,则梯度下降可能不收敛
C、取一个合理的λ,可以更好地应用正则化
D、如果令λ很大的话,为了使CostFunction尽可能的小,所有θ(不包括θ0)都会在一定程度上减小
E、
下列关于相关与线性关系的说法正确的有( )。
A、相关不一定是线性关系,可能是非线性关系
B、相关一定是线性关系,不可能是非线性关系
C、相关时若有相关系数为0,说明两个变量之间不存在线性关系,仍可能存在非线性关系
D、相关系数为0是两个变量独立的必要不充分条件
E、
线性模型的基本形式有( )。
A、线性回归
B、对数几率回归(二分类问题)
C、线性判别分析(Fisher判别分析)
D、多分类学习
E、
常用的代价函数有( )。
A、均方误差
B、均方根误差
C、平均绝对误差
D、交叉嫡
E、
可以帮助解决训练集在特征空间中线性不可分的问题的方法有( )o
A、硬间隔
B、软间隔
C、核函数
D、拉格朗日乘子法
E、"
许多功能更为强大的非线性模型可在线性模型基础上通过引入( )而得。
A、层级结构
B、高维映射
C、降维
D、分类
E、
针对维数灾难,主要采用的降维方法有( )。
A、多维缩放
B、主成分分析
C、核化线性降维
D、流形学习
E、度量学习