在网络爬虫的爬行策略中.应用最为常见的有( )
A、深度优先遍历策略
B、广度优先遍历策
C、高度优先遍历策略
D、大站优先策略
E、
下列关于数据维度的描述正确的有( )
A、采用列表表示一维数据.不同数据类型的元素是可以的
B、JSON格式可以表示比二维数据还复杂的高维数据
C、二维数据可以看成是一维数据的组合形式
D、字典不可以表示二维以上的高维数据
E、
异常值的检测方法有( )
A、直接通过数据可视化进行观察
B、通过统计分布进行判断
C、通过相对距离进行度量
D、通过相对密度进行度量
E、
在数据缺失严重时.会对分析结果造成较大的影响.因此对于剔除的异常值和缺失 值.要采用合理的方法进行填补。常用的填补方法有()
A、平均值填充
B、K最近邻距离法
C、回归法
D、极大似然估计
E、多重插补法
在建立模型时.需要用到的数据有( )
A、训练数据
B、测试数据
C、原始数据
D、验证数据
E、
下列关于单样本t检验的说法错误的有( )
A、当单样本t检验的自由度越来越大时.正态分布越来越趋向于t分布
B、单样本.检验适用于样本量比较多(〃>30)的情况
C、分布的不确定性比正态分布小.其原因是样本数量比较小
D、单样本t检验通常也被叫作学生f检验
E、
在假设检验中.当原假设为伪.但数据分析人员没有拒绝它时犯的错误叫( )
A、α错误
B、β顶错误
C、取伪错误
D、弃真错误
E、
下列关于单样本Z检验的说法正确的有( )
A、在Python中.单样本Z检验可以使scipy.stats.ttest_lsamp ()实现
B、单样本Z检验适用于样本量较大的情况
C、单样本Z检验假设要检验的统计量(近似)满足正态分布
D、单样本Z检验常用于检验总体平均值是否等于某个常量
E、
下列关于连续型随机变量以及连续型概率密度函数的说法正确的有()
A、一个客服一天可能接听到多少个电话是一个连续型随机变量
B、正态分布是一种连续型随机变量的概率分布
C、可以使用概率密度函数来描述连续型随机变量的概率分布
D、连续型概率密度函数曲线下方的面积之和为1
E、
数据安全不仅包括数据保密性.还包括( )
A、完整性
B、可用性
C、不可否认性
D、可审计性
E、