2019超星尔雅(学习通)大数据算法答案大全_超星尔雅(学习通)大数据算法课程最新课后单元章节答案、期末考试答案

2019超星尔雅(学习通)搜题公众号
2019超星尔雅(学习通)大数据算法答案大全_超星尔雅(学习通)大数据算法课程最新课后单元章节答案、期末考试答案 - 2019超星尔雅(学习通)答案 - 课查查

大数据算法是大数据应用的基础,其综合了多种算法的设计理念和技术,本课程讲授大数据算法设计与分析所必需的基础知识和技术。经过本课程中较严格的大数据算法设计与分析训练,学生可初步掌握根据数据量和资源设计与分析大数据算法的能力,在算法设计与分析素养方面具备从事大数据研发和应用方面工作的条件。

【判断题】在经典的水库抽样中,要求空间复杂性为O(k),是指与抽样大小有关,而与整个数据的数据量无关。
【判断题】水库抽样算法的采样是均匀的。
【单选题】在内存中的二分搜索树中,通常使用()来维护树的平衡。()
【判断题】二叉搜索树是在n个元素之间搜索的标准方法,一般把元素保存在根处。()
【判断题】为更快地保存外部搜索树,可采取按BFS的顺序将其分割。()
【单选题】采用把大连通分量划分成高度连接的小连通分量基本思路的方法是()
【多选题】用机器完成众包的优势有()。
【判断题】目前众包技术完全由计算机来完成。()
【判断题】基于簇的HIT生成问题的优化目标是生成最小数目基于簇的HIT。()
【单选题】如果T是一个(a,b)-树(a≧2且b≧2a-1),其根结点的度在()之间。
【判断题】在(a,b)-树中,a和b表示的是每个节点当中键值的上限和下限。()
【判断题】B-树中右边的指针指向的是键值小于最右键值的子数。()
【单选题】众包算法是用来解决()。
【单选题】大数据算法存在很多难题,对于访问全部数据时间过长的问题,采用的解决方案是()。
【多选题】大数据算法的()特点,使其与大数据算法密切相关的。
【判断题】为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技术会涉及到时间亚线性算法。
【判断题】在迭代MapReduce中,reduce的输出必须和map的输入兼容。()
【判断题】“推荐好友”是图算法在社交网络中的一种实际用例。()
【单选题】元素都在叶子中的B-树有时被称为()。
【判断题】关于(a,b)—树的删除操作,删除操作出现问题的情形是:从叶子v删除元素后,v的儿子小于a-1个。()
【判断题】关于(a,b)-树的插入,插入涉及到的结点最多到树高+1。()
【单选题】在外排序的快速排序中,分割元素的选择非常重要。
【单选题】为数T的每个结点标上子树大小的I/O复杂度为()。
【单选题】前序计数的I/O复杂度为()。
【单选题】对给定顶点邻接链表T,其一个欧拉回路可以以()IO复杂性求得。
【判断题】外存算法最坏情况的I/O数位Ω(N)。()
【判断题】图中的独立集是指图当中点的集合,其任意两点之间不存在边。()
【单选题】大数据算法涉及到外存的时候,通常要分析()。
【多选题】下列选项中,属于智能仿生算法的是()。
【判断题】在线算法/数据流算法是面向大数据速度快的特点提出的。()
【判断题】对于数据流算法或在线算法,经常要分析结果的近似比。()
【判断题】随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。()
【判断题】大部分时候reducer不能用作combiner。()
【判断题】combiner的运行次数可能有多次。
【多选题】缓存迭代的方法是()。
【判断题】MapReduce是一种非递归描述性语言的通用运行平台。()
【判断题】Reducer输入缓存的条件是使用静态划分方法,即意味着没有新的结点。()
【多选题】在判定问题的近似中,对于近似解需要区分的是()。
【判断题】全0数组判定的近似算法的证据引理是:如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于1/2。
【判断题】判定问题的近似解是指:输入满足某种性质或近似满足某种性质。
【单选题】在repartition join的改进中,说法错误的是()。
【多选题】用MR进行多重集相似连接算法的常见计算包括()。
【判断题】自然连接是从两个关系的笛卡尔积中选取给定属性间满足一定条件的元组。()
【判断题】等值连接不必在结果中去掉重复的属性。()
【判断题】Zipf原则是指典型的频率分布是高度偏斜的,存在很多频繁元素。()
【判断题】在数据流模型中,从数据流中可以计算简单的函数,如最大值、最小值、求和等,且处理这些函数时通常使用单个寄存器s。()
【判断题】数据流模型中,数据流是指来自某个域中的元素序列。()
【判断题】在数据流模型中,内存远远大于数据的规模。()
【多选题】关于单词共现矩阵的计算,说法正确的是()。
【多选题】用单词共现矩阵解决大规模计数问题的基本方法是()。
【多选题】“条纹法”的优点有()。
【判断题】在“词对法”中,每个mapper处理一个句子。()
【判断题】“词对法”的缺点是不易实现,排序和洗牌代价高。()
【判断题】f(B|A)词对法必须确定所有a被传递到同一个combiner。()
【单选题】KD树在()层使用水平线。
【单选题】KdB-树的插入可以使用()的方法。
【单选题】构建KDB-树时,完成网格建立之后,计算每个网格中点的个数,并且存储在()中。
【判断题】基于位置的查找实际上是一种三维空间的查找。()
【判断题】KD树可以看成是两个二叉树的交叠。()
【单选题】关于并行节点计算,下列选项中关于节点叙述不准确的是()。
【单选题】Pregel系统中Master的作用不包括()。
【多选题】并行结点计算的终止条件是()。
【多选题】用Pregel计算子图同构问题,其三个步骤是()。
【判断题】Pregel的编程形式,在执行计算的机器上每一阶段都利用整个图的全部状态。()
【单选题】人脸识别是利用众包改进图像()的例子。
【多选题】下列属于众包应用的例子有()。
【判断题】众包技术应用于广告中的情形之一是区分关键词与广告的相关程度。()
【判断题】目前众包技术已经可以判断两幅画在艺术风格上是否一致。()
【单选题】以下关于大数据的特点,叙述错误的是()。
【单选题】在《法华经》中,“那由他”描写的“大”的数量级是()。
【多选题】以下选项中,大数据涉及的领域中包括()。
【多选题】大数据的应用包括()。
【判断题】目前,关于大数据已有公认的确定定义。
【判断题】大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。()
【单选题】对于输入n个数的数组(x1,x2,x3,……,xn),输出:这个数组是否有序。ℇ远离意味着必须删除大于()个元素才能保证剩下的元素有序。
【判断题】如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于3/4。
【判断题】关于证明如果输入ℇ远离有序,则存在大于ℇn个“坏索引”的问题,可以采用证明其逆否命题的方法。
【多选题】资源约束包括()。
【多选题】大数据算法可以不是()。
【判断题】大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生成满足给定约束结果的算法。
【判断题】MapReduce是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。
【判断题】大数据算法是仅在电子计算机上运行的算法。
【单选题】下列选项中叙述正确的是()。
【判断题】对于大数据而言,标准计算理论模型失效的原因之一是内存是有限的,无法存储所有的内存。()
【判断题】当内存不够或者算法设计不好时,如果数据量达到一定规模以上,运行时间会急剧增加。
【判断题】现代计算机有复杂的存储层次,存储单元的访问是以块为单位的数据移动。()
【单选题】计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下,进行精确计算最少需要访问()个顶点。
【多选题】亚线性是指()等的消耗是输入规模o。()
【判断题】性质检测算法属于亚线性空间算法的一类。()
【单选题】众包中质量控制/数据质量要考虑的问题不包括()。
【多选题】众包中的参与者包括()。
【多选题】在人机交互中从用户获取输入的方式有()。
【判断题】众包中工人的回报是多样的。()
【判断题】难以核实主观任务是资格测试的缺点之一。()
【判断题】任务分配的拉方法是指系统采取完全的控制将制定的任务分配给工人。()
【单选题】查找规模为N的表L中,每个独立集(MIS)的大小至少为()。
【单选题】时间前向的处理方法是按照()来访问边。
【判断题】求最大独立集的基本思想是使用贪心法。()
【单选题】MapReduce是由()开发的分布式编程模型。
【单选题】在实现MapReduce程序时,需要注意的事项不包括()。
【多选题】MapReduce的执行框架处理的内容包括()。
【多选题】理想的可扩展性有()。
【判断题】Map()和Reduce()两个函数不能够并行运行。()
【单选题】大数据求解计算问题过程的第三步一般是()。
【多选题】在大数据求解计算问题中,判断是否为能行可计算的因素包括()。
【判断题】大数据求解计算问题过程的第一步是确定该问题是否可计算。
【判断题】大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。
【单选题】找到一个稠密图的最小生成树的算法易于并行化的原因是每个子图的()可以被并行计算。
【单选题】基于路径的算法的例子不包括()。
【多选题】在基于路径的算法中,边的标记包括()。
【判断题】Dijkstra算法需要并行化。()
【单选题】以下()不是衡量分析近似解代价与优化解代价差距的方法。
【单选题】利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。
【单选题】采用平面图的直径近似算法的动机是无法在要求的时间内得到()。
【判断题】在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在i、j、k三个点中,i到j的距离加上j到k的距离小于i到k的距离。
【判断题】近似算法能给出一个优化问题的优化解。
【判断题】Ratio Bound越大,则近似解越坏。()
【单选题】频繁元素计算算法又称为()算法。
【单选题】频繁元素计算算法有效的原因是源于()。
【判断题】在频繁元素计算算法中,计数器x减少的次数依赖于有几个减少计数器的步骤。()
【判断题】在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差的最多值时,可以得到频繁项一个好的估计。
【单选题】图算法包含三种计数,其中将图问题表示为有向无环图的估值问题的是()。
【单选题】半外存算法是假设()。
【判断题】图的连通性算法可扩增为求图G最小生成树(MST)的算法。()
【判断题】在求最小生成树时,压缩后图中某条边的权值等于该边代表的所有边的权值最大值。()
【单选题】外存归并排序,以()为单位进行调度。
【判断题】排序分为内部排序和外部排序,外部排序是因排序的数据很大,一次不能容纳全部的排序内容,在排序过程中需要访问外存。()
【单选题】时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。
【单选题】求最小生成树是一个贪心法,可以用()算法来解决。
【判断题】对联通分量个数的估计可以利用随机化方法。
【单选题】在版本1的字数统计中,在Map里使用了一个数组H,其作用是为每一个出现的单词作()。
【单选题】众包通过一系列的机制和方法来指导和协调()的行为,从而达到目的。
【判断题】外包与众包的区别在于众包的参与者数量大且不固定的。()
【判断题】Wikipedia是众包案例的一种最成功的应用之一。()
【判断题】众包极大程度地使用了人本计算,因此它基本上等同于人本计算。()

相关答案

随机答案