在数据科学中.计算模式发生了根本性的变化——从集中式计算、分布式计算、网格计算等传统计算过渡至云计算.有一定的代表性的是Google云计算三大技术. 这三大技术包括( )
A、HadoopYRN资源管理器
B、GFS分布式存储系统
C、MapRedue分布式处理技术
D、BigTable分布式数据库
E、
假设一个随机变量服从正态分布.则与随机变量的概率分布有关的有( )
A、众数
B、频数
C、平均值
D、方差
E、
下列关于CAP理论说法正确的有( )
A、一个分布式系统不能同时满足一致性、可用性和分区容错性等需求
B、一致性主要指强一致性
C、一致性、可用性和分区容错性中的任何两个特征的保证(争取)可能导致另一个 特征的损失(放弃)
D、可用性指每个操作总是在给定时间之内得到返回所需要的结果
E、
下列关于降维说法正确的有( )
A、PA是^•据方差这一属性降维的
B、降维可以防止模型过拟合
C、降维降低了数据集特征的维度
D、降维方法有PLA等
E、
参数估计可以分为( )
A、点估计
B、一致估计
C、区间估计
D、无偏估计
E、
下列关于分析学习和归纳学习的比较的说法正确的有( )
A、归纳学习拟合数据假设.分析学习拟合领域理论的假设
B、归纳学习论证方式为统计推理.分析学习为演绎推理
C、归纳学习不需要先验知识
D、训练数据不足时归纳学习可能会失败
E、
EDA (探索性数据分析)方法与传统统计学的验证性分析方法的区别有( )
A、EDA需要事先提出假设.而验证性分析不需要
B、EDA中采用的方法往往比验证性分析简单
C、在一般数据科学项目中.探索性分析在先.验证性分析在后
D、EDA更为简单、易学和易用
E、
下列描述中属于Analytics2.0主要特点的有( )
A、侧重嵌入式分析
B、重视非结构化数据的分析
C、以决策支持为主要目的
D、注重解释性分析和预测性分析
E、
假设检验中.首先需要提出零假设和备择假设.下列关于零假设和备择假设的描述正确的有( )
A、零假设是只有出现的概率大于阈值才会被拒绝的;备择假设是只有零假设出现的 概率大于阈值才会被承认的
B、零假设是希望推翻的结论;备择假设是希望证明的结论
C、零假设是只有出现的概率小于阈值才会被拒绝的;备择假设是只有零假设出现的 概率小于阈值才会被承认的
D、零假设是希望证明的结论;备择假设是希望推翻的结论
E、
大数据偏见包括( )
A、数据源的选择偏见
B、算法与模型偏见
C、结果解读方法的偏见
D、数据呈现方式的偏见
E、