下列可以用于实现爬虫功能的有(____)
A、BeautifulSoup 库
B、re模块
C、Scrapy框架
D、urllibrequest库
E、
常用的爬虫技巧有(____)
A、更改header,伪装成浏览器进行爬取
B、设置爬取的时间间隔
C、应用神经网络算法识别网站验证码
D、通过代理服务器进行爬取
E、
面向对象技术的特征包含(____)
A、封装
B、继承
C、多态
D、分布性
E、
在Python中查看关键字,需要在pyhon解释器中执行(____)两条命令
A、list keyword
B、import keyword
C、keyword
D、import.kwlist
E、
下列属于数据挖掘与分析工具的有( )。
A、Tableau
B、Python
C、SPSS
D、Alteyx
E、
下列属于数据挖掘方法的有( )。
A、聚类
B、回归分析
C、神经网络
D、决策树算法
E、
一个回归模型存在多重共线问题,在不损失过多信息的情况下,可采取的措施有( )。
A、剔除所有的共线性变量
B、剔除共线性变量中的一个
C、通过计算方差膨胀因子(variance inflation factor, VIF )来检查共线性程度,并采取相应措施
D、删除相关变量可能会有信息损失,我们可以不删除相关变量,而使用一些正则化方法来解决多重共线性问题,例如Ridge或Lasso回归
E、"
数据再利用的意义有( )。
A、挖掘数据的潜在价值
B、提高社会效益,优化社会管理
C、实现数据重组的创新价值
D、优化存储设备,降低设备成本
E、利用数据可拓展性拓宽业务领域
下列关于神经网络的说法正确的有( )。
A、增加网络层数,可能会增加测试集分类错误率
B、增加网络层数,一定会增加训练集分类错误率
C、减少网络层数,可能会减少测试集分类错误率
D、减少网络层数,一定会减少训练集分类错误率
E、
特征向量的归一化方法有()。
A、线性函数转换
B、对数函数转换
C、反余切函数转换
D、减去均值,除以方差
E、