下列关于CSV文件的描述正确的有(____)
A、CSV文件可用于不同工具间进行数据交换
B、CSV文件格式是一种通用的、相对简单的文件格式,应用于程序之间转移表格数据
C、CSV文件通过多种编码表示字符
D、CSV文件的每一行是一维数据,可以使用 Python 中的列表类型表 示
E、
下列集合操作结果正确的有(____)
A、name ={'d','s'}nameadd ('sd'), name 值为{'sd' , 'd' , 's'}
B、name =('sd', 'd','s'}nameremove ('s'), name 值为 ('sd', 'd'}
C、name={'sd', 'd','s'} nameclear), name 值为{}
D、name={'sd', 'd','s'} nameupdate('df'), name值为{'sd', 'd', 'f','s','j'}
E、
下列关于数据组织的维度的描述正确的有(____)
A、数据组织存在维度,字典类型用于表示一维和二维数据
B、高维数据有键值对类型的数据构成,采用对象方式组织
C、二维数据采用表格方式组织,对应于数学中的矩阵
D、一维数据采用线性方式组织,对应于数学中的数组和集合等概念
E、
下列函数属于二元通用函数 ( binary universal functions ) 的有(____)
A、add
B、substract
C、multiply
D、power
E、
下列关于神经网络的说法正确的有( )。
A、增加网络层数,可能会增加测试集分类错误率
B、增加网络层数,一定会增加训练集分类错误率
C、减少网络层数,可能会减少测试集分类错误率
D、减少网络层数,一定会减少训练集分类错误率
E、
下列属于数据挖掘与分析工具的有( )。
A、Tableau
B、Python
C、SPSS
D、Alteyx
E、
一个回归模型存在多重共线问题,在不损失过多信息的情况下,可采取的措施有( )。
A、剔除所有的共线性变量
B、剔除共线性变量中的一个
C、通过计算方差膨胀因子(variance inflation factor, VIF )来检查共线性程度,并采取相应措施
D、删除相关变量可能会有信息损失,我们可以不删除相关变量,而使用一些正则化方法来解决多重共线性问题,例如Ridge或Lasso回归
E、"
下列属于数据挖掘方法的有( )。
A、聚类
B、回归分析
C、神经网络
D、决策树算法
E、
特征向量的归一化方法有()。
A、线性函数转换
B、对数函数转换
C、反余切函数转换
D、减去均值,除以方差
E、
数据再利用的意义有( )。
A、挖掘数据的潜在价值
B、提高社会效益,优化社会管理
C、实现数据重组的创新价值
D、优化存储设备,降低设备成本
E、利用数据可拓展性拓宽业务领域