下列属于机器学习生成式模型的有( )。
A、朴素贝叶斯
B、隐马尔科夫模型
C、线性回归模型
D、深度信念网络
E、
关于特征向量的缺失值处理方式如下:缺失值较多,直接将该特征舍弃掉,否则可能会带入较大的noise,对结果造成不良影响;缺失值较少,其余的特征缺失值都在10%以内,可以采取的处理方式有( )。
A、把NaN直接作为一个特征,假设用0表示
B、用均值填充
C、用随机森林等算法预测填充
D、以上选项都不正确
E、
随机森林的随机性主要体现在( )。
A、决策树选择的随机性
B、数据集的随机性
C、待选特征的随机性
D、参数选择的随机性
E、
集成学习中增强多样性的常见做法有( )。
A、数据样本扰动
B、输入属性扰动
C、输出表示扰动
D、算法参数扰动
E、
下列不属于聚类性能度量内部指标的有( )0
A、DB指数
B、Dunn指数
C、Jaccard 系数
D、FM 系数
E、
重新划分样本到正例类和反例类。下列说法正确的有( )。
A、增加阈值不会提高召回率
B、增加阈值会提高召回率
C、增加阈值不会降低查准率
D、增加阈值会降低查准率
E、
下列与图像处理相关的有( )。
A、图像识别
B、人脸识别
C、视频分析
D、自然语言处理
E、
下列属于汉语未登录词类型的有( )。
A、存在于词典但出现频率较少的词
B、新出现的普通词汇
C、专有名词
D、专业名词和研究领域名称
E、
下列可用于处理由于光照不均带来的影响的图像处理方法有( )。
A、同态滤波
B、顶帽变换
C、基于移动平均的局部阈值处理
D、拉普拉斯算子
E、
下列算法可用于图像分割的有( )。
A、霍夫曼编码
B、分水岭算法
C、K-means
D、区域生长
E、