《Hadoop与Spark大数据架构》综合测试题含答案.pdf
上传人:金启****富来 上传时间:2024-09-10 格式:PDF 页数:5 大小:368KB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

《Hadoop与Spark大数据架构》综合测试题含答案.pdf

《Hadoop与Spark大数据架构》综合测试题含答案.pdf

预览

在线预览结束,喜欢就下载吧,查找使用更方便

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

《Hadoop与Spark大数据架构》综合测试题含答案1.Spar计算模型中作为数据处理单元的是?革选题]*A.SplitB.RDD正确答案)C.TupleD.Partition2.和MapReduce相比较,Spark编程模型更加适合处理以下哪种计算模式单选题]*A.迭代计算正确答案)B.批处理C.流计算D.高性能计算3.Spar在以下哪一种模式下无法运行?单选题]*A.本地模式B.ApacheMesosC.Hadoop1.正确答案)D.Hadoop2.04.以下哪种数据库适合处理半结构化数据?单选题]*A.OracleB.MySQLC.SQLServerD.HBase正确答案)5.以下哪种场景不适合流计算引擎进行处理?革选题]*A.Web应用用户点击行为实时统计B.电子商务应用的实时推荐C.大量文件的词频分析正确答案)D.数据从采集系统经过转换存入HDFS6.MapReduce程序中的Map任务主要用来执行以下哪种操作?单选题]*A.数据提取正确答案)B.全局归并C.数据传输D.事务处理7.以下哪个组件是HDFS用来进行目录结构和修改日志管理的组件?革选题]*A.ResourceManagerB.NodeManagerC.DataNodeD.NameNode正确答案)8.分布式文件系统HDFS为了提供数据的可靠性。采用副本方式通过资源冗余保证数据可靠性,在常用的工程实践中,数据在分布式存储系统中保存时一共保存几份?革选题]*A、2B、3正确答案)C、4D、59.以下哪个组件是Spark中用来提供机器学习算法库的组件?革选题]*A.HiveB.SparkSQLC.MLli正确答案)D.Mahout10.以下哪个组件是YARN用来进行资源管理和调度任务执行的组件?革选题]*A.ResourceManage正确答案)B.NodeManagerC.JobTrackerD.TaskTracker11.使用Hive进行SQL分析时,以下哪个组件是Hive用来保存数据库、表模式等信息的?革选题]*A.DriverB.ParserC.OptimizerD.Metasto正确答案)12.MapReduce程序通常包括map、本地的归并(localgroup)y,shufl和reduce四步操作。判断题]*对正确答案)错13.Spar支持的操作可以分为Transformatic和Action两种,其中Transformation用于变换RDD。判断题]*对正确答案)错14.Hiv是基于Spark实现的SQL查询引擎,可以接收SQL语句对数据表进行关联查询分析。判断题]*对错正确答案)15.Hiv对数据进行查询时,如果经常需要对个别字段做聚合计算,应该使用行存储格式,从而可以提升效率。判断题]*对错正确答案)16.Spar分布式计算框架可以支持多种计算模式,包括批处理、流处理和SQL查询判断题]*对正确答案)错17.Hadoop2.软件框架中ResourceManager不仅需要管理资源,还需要对分析程序的执行过程进行监控和管理。判断题]*对错正确答案)18.MapReduce和Spark分布式计算框架都具有shuffl操作。判断题]*对正确答案)错19.Hiv可以用于在MapReduce平台上进行SQL分析和查询,而且Hive可以支持对数据进行事务操作。判断题]*对错正确答案)20.HDFS是大数据底层的分布式存储系统,用来保存需要分析的数据,GB级别的大文件和KB级别的小文件都适合直接保存在HDFS上进行分析。判断题]*对错正确答案)