下列关于分析学习和归纳学习的比较的说法正确的有( )
A、归纳学习拟合数据假设.分析学习拟合领域理论的假设
B、归纳学习论证方式为统计推理.分析学习为演绎推理
C、归纳学习不需要先验知识
D、训练数据不足时归纳学习可能会失败
E、
下列描述中属于特征选择的优点有( )
A、解决模型自身的缺陷
B、减少过拟合
C、提升模型的性能
D、增强模型的泛化能力
E、
EDA (探索性数据分析)方法与传统统计学的验证性分析方法的区别有( )
A、EDA需要事先提出假设.而验证性分析不需要
B、EDA中采用的方法往往比验证性分析简单
C、在一般数据科学项目中.探索性分析在先.验证性分析在后
D、EDA更为简单、易学和易用
E、
下列描述中正确的有( )
A、统计学是数据科学的理论基础之一
B、Python语言是统计学家发明的语言
C、机器学习是数据科学的理论基础之一
D、数据科学是统计学的一个分支领域(子学科)
E、
下列描述中属于Analytics2.0主要特点的有( )
A、侧重嵌入式分析
B、重视非结构化数据的分析
C、以决策支持为主要目的
D、注重解释性分析和预测性分析
E、
下列关于数据流转和应用的说法正确的有( )
A、数据流转和应用过程中应确保可追溯、可复查
B、前序环节应保证数据的真实、完整
C、前序环节应及时传递到后序环节
D、前后环节数据应保持衔接一致
E、
NoSQL数据库常用的数据模型包括( )
A、Key-Value
B、Key-Document
C、Key-Column
D、图存储
E、
大数据偏见包括( )
A、数据源的选择偏见
B、算法与模型偏见
C、结果解读方法的偏见
D、数据呈现方式的偏见
E、
列式数据库(如BigTable和HBase )以表的形式存储数据.表结构包含的元素有( )
A、关键字
B、时间戳
C、列簇
D、数据类型
E、
参数估计可以分为( )
A、点估计
B、一致估计
C、区间估计
D、无偏估计
E、