2019智慧树(知到)《大数据工具应用》答案_单元答案_期末答案_知到智慧树答案

大学生都在用的搜题微信公众号:一刻师兄
向它发送题目,秒得答案(支持期末考试答案查询)

2019智慧树(知到)搜题公众号
2019智慧树(知到)《大数据工具应用》答案_单元答案_期末答案_知到智慧树答案 - 2019智慧树(知到)答案 - 课查查

体验大数据的无穷价值领略妙算法的智慧火花掌握酷工具的炫丽应用


2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和( )能力的数据集。
用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和( )。
大数据分析四个方面的工作主要是:数据分类、( )、关联规则挖掘和时间序列预测。
新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。
目前的大数据处理技术只能处理结构化数据。
我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是( )。
大多数日志文件的后缀名是( )。
本课程重点介绍的weka软件的专有文件格式是( )。
数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和( )。
八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个( )来作为采集的目标。
八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是( )。
Excel可以通过“数据有效性”按钮操作来规范数据输入的范围。
Excel不能导入txt或csv格式的文件。
八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。
八爪鱼软件进行自定义采集时,需要了解对网页的页面结构。
使用DBSCAN算法对鸢尾花数据集( )进行聚类,将epsilon参数设置为0.2, minPoints参数设置为5,忽略class属性,那么将形成( )个簇。
使用EM算法对天气数据集( )进行聚类,将numClusters设置为4,即簇数为4,其他参数保持默认值,忽略class属性,从结果中可知,下列选项中,( )是错误的。
使用SimpleKMeans算法对天气数据集( )进行聚类,保持默认参数,即3个簇以及欧氏距离。选择play属性为忽略属性,从结果中可知,下列选项中,( )是错误。
使用线性回归( )分类器和用M5P分类器对cpu.arff分别进行分类,由其输出的误差指标可知( )。
删去cpu.arff数据文件中的CACH属性后,使用M5P分类器构建方案,在结果中,到达LM2的实例数有( )个。
根据J48分类器训练weather.nominal.arff所生产的决策树,当outlook=sunny;temperature=cool;humidity =high;windy=TRUE时,分类的结果是( )。
根据J48分类器训练iris.arff所生产的决策树,当sepallength=4.4;sepalwidth=3.0;petallength=1.3;petalwidth=0.2时,分类的结果是( )。
关于Weka离散化说明正确的是( )。
以下( )不是Weka的数据类型。
关于Weka的文件类型描述错误的是( )。
以下属于关联分析的是( )。
大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下( )算法直接挖掘。
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的( )问题。
在进行自动选择属性时,必须设立两个对象,其中确定使用什么方法为每个属性子集分配一个评估值的对象是下面的( )。
以下属于属性空间的搜索方法的是( )。
在weka软件探索者界面中,利用Visualize标签页通过更改各个参数来进行数据集的可视化属性设置后,需要单击以下( )按钮,所有更改才会生效。
给定关联规则AB,意味着:若A发生,B也会发生。
支持度是衡量关联规则重要性的一个指标。
Ranker方法既可以用于单个属性评估器,又可以用于属性子集评估器。
利用weka软件进行数据可视化时,用户可以选择类别属性对数据点着色,如果类别属性是标称型,则显示为彩色条。
贝叶斯网络中的节点代表( )。
贝叶斯网络中,节点需给出概率分布描述,对于离散型随机变量而言,可以用( )的形式表示。
贝叶斯网络中节点之间的边代表( )。
贝叶斯网络保存的文件格式是(   )。
下面( )不是反向传播神经网络的结构。
神经网络中的节点代表( )。
下列( )不是常见的激励函数。
在贝叶斯网络编辑界面时,如果节点的名称没法完全显示,需要从( )菜单项进行调整。
WEKA中选择神经网络分类器操作时,应该选择( )。
下面关于Package Manager安装后的目录说明不正确的是( )。
Tableau是一款定位于数据可视化敏捷开发和实现( )展现工具。Tableau 连续第 6 年在 Gartner 分析和商业智能魔力象限中蝉联领导者殊荣。
以下( )不是Tableau的数据类型?
Tableau可以用来实现交互的、( )的分析和仪表板应用,从而帮助我们快速地认识和理解数据。
下列说法错误的是( )。
度量往往是( )字段,度量是我们的指标。度量常常是连续的,连续的字段在图表中形成轴.将其拖放到功能区时,Tableau默认会进行( )。
关于数据分层描述错误的是( )。
以下不属于集的创建方式的是( )。
Tableau右边数据目录栏中,不能单击右键创建参数的纬度是( )。
以下不是创建计算字段时的运算逻辑的是( )。
仪表板版面大小设计选项,( )不属于大小设计选项。
Logistic函数的定义域是( )。
下列叙述错误的是( )。
使用IBk分类器和SMO分类器对vote.arff分别进行分类,由其输出的结果可知( )。
图片10.png
以下描述错误的是( )。
线性支持向量机的最大化间隔正确的描述是( )。
以下计算距离的公式中,计算欧氏距离的是( )。
一般情况下在作图时先不添加( )区。
连续性单变量图不包括( )。
两个定性变量可选择的作图不包括( )。
堆叠条形图和马赛克图可以在图形属性中直接转换。
定性变量作定量变量的相应图形也是有意义的。
多维度数据图形一般还是以二维的形式展示,只通过形状、颜色等要素扩展维度信息。
制作统计图有两个基本要求:一是正确,二是简洁。

相关答案