在网络爬虫的爬行策略中.应用最为常见的有( )
A、深度优先遍历策略
B、广度优先遍历策
C、高度优先遍历策略
D、大站优先策略
E、
数据来源和目标用户已定的情况下.不同视觉通道的表现力不同。视觉通道的表现 力的评价指标包括( )
A、精确性
B、可辨认性
C、可分离性
D、视觉突出性
E、
在建立模型时.需要用到的数据有( )
A、训练数据
B、测试数据
C、原始数据
D、验证数据
E、
下列关于单样本t检验的说法错误的有( )
A、当单样本t检验的自由度越来越大时.正态分布越来越趋向于t分布
B、单样本.检验适用于样本量比较多(〃>30)的情况
C、分布的不确定性比正态分布小.其原因是样本数量比较小
D、单样本t检验通常也被叫作学生f检验
E、
下列关于数据产品研发的说法错误的有( )
A、从加工程度看.可以将数据分为一次数据、二次数据和三次数据
B、—次数据中往往存在缺失值、噪声、错误或虚假数据等质量问题
C、二次数据是对一次数据进行深度处理或分析后得到的增值数据
D、三次数据是对二次数据进行洞察与分析后得到的、可以直接用于决策支持的洞见 数据
E、
下列关于随机变量及其概率分布的说法正确的有( )
A、随机变量可以分为离散型随机变量和连续型随机变量
B、随机变量的概率分布指的是一个随机变量所有取值的可能性
C、扔5次硬币.正面朝上次数的可能取值是0、1、2、3、4、5.其中正面朝上次 数为0与正面朝上次数为5的概率是一样的
D、扔5次硬币.正面朝上次数的可能取值是0、1、2、3、4、5.其中正面朝上次 数为5的概率是最大的
E、
已测量级(Measured Level)的主要特点包括( )
A、已构建了关键过程矩阵
B、已定义了变革管理的正式流程
C、已实现用定量化方式计算关键过程的质量和效率
D、关键过程的质量和效率的管理涉及整个生命周期
E、
主要面向或关注过去的数据分析过程有( )
A、描述性分析
B、诊断性分析
C、预测性分析
D、规范性分析
E、
数据安全不仅包括数据保密性.还包括( )
A、完整性
B、可用性
C、不可否认性
D、可审计性
E、
在数据缺失严重时.会对分析结果造成较大的影响.因此对于剔除的异常值和缺失 值.要采用合理的方法进行填补。常用的填补方法有()
A、平均值填充
B、K最近邻距离法
C、回归法
D、极大似然估计
E、多重插补法