假设目标遍历的类别非常不平衡,即主要类别占据了训练数据的99%,假设现在模型在训练集上表现为99%的准确度,那么下列说法正确的有( )。
A、准确度并不适合衡量不平衡类别问题
B、准确度适合衡量不平衡类别问题
C、精确度和召回率适合于衡量不平衡类别问题
D、精确度和召回率不适合衡量不平衡类别问题
E、
下列算法可用于图像分割的有( )。
A、霍夫曼编码
B、分水岭算法
C、K-means
D、区域生长
E、
下列属于关键词提取算法的有( )。
A、TF-IDF算法
B、TextRank算法
C、LSA(潜在语义分析)
D、LDA
E、"
下列属于自然语言处理范畴的有( )。
A、情感倾向分析
B、评论观点抽取
C、文章分类
D、新闻摘要抽取
E、
下列关于范数规则化的描述正确的有( )。
A、L0是指向量中0的元素的个数
B、L1范数是指向量中各个元素绝对值之和
C、L2范数向量元素绝对值的平方和再开平方
D、L0是指向量中非0的元素的个数
E、
下列方法是TF-IDF的变种的有( )。
A、TFC
B、EWC
C、ITC
D、IG
E、
下列属于数据统计分析工具的有( )
A、Weka
B、SAS
C、SPSS
D、Matlab
E、
数据从产生到终结共包含的环节有( )
A、数据产生
B、数据传输
C、数据使用
D、数据共享
E、数据销毁
Web内容挖掘实现技术包括( )。
A、文本总结
B、文本分类
C、文本机器学习
D、关联规则
E、
HIS表色系的三属性包含( )。
A、色调
B、饱和度
C、亮度
D、
E、