《Hadoop与Spark大数据架构》综合测试题含答案-第一文库 | 海量文档资源下载与分享平台

在线预览结束，喜欢就下载吧，查找使用更方便

10 金币

下载此文档

/ 5

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

《Hadoop与Spark大数据架构》综合测试题含答案1.Spar计算模型中作为数据处理单元的是？革选题］*A.SplitB.RDD正确答案）C.TupleD.Partition2.和MapReduce相比较，Spark编程模型更加适合处理以下哪种计算模式单选题］*A.迭代计算正确答案）B.批处理C.流计算D.高性能计算3.Spar在以下哪一种模式下无法运行？单选题］*A.本地模式B.ApacheMesosC.Hadoop1.正确答案）D.Hadoop2.04.以下哪种数据库适合处理半结构化数据？单选题］*A.OracleB.MySQLC.SQLServerD.HBase正确答案）5.以下哪种场景不适合流计算引擎进行处理？革选题］*A.Web应用用户点击行为实时统计B.电子商务应用的实时推荐C.大量文件的词频分析正确答案）D.数据从采集系统经过转换存入HDFS6.MapReduce程序中的Map任务主要用来执行以下哪种操作？单选题］*A.数据提取正确答案）B.全局归并C.数据传输D.事务处理7.以下哪个组件是HDFS用来进行目录结构和修改日志管理的组件？革选题］*A.ResourceManagerB.NodeManagerC.DataNodeD.NameNode正确答案）8.分布式文件系统HDFS为了提供数据的可靠性。采用副本方式通过资源冗余保证数据可靠性，在常用的工程实践中，数据在分布式存储系统中保存时一共保存几份？革选题］*A、2B、3正确答案）C、4D、59.以下哪个组件是Spark中用来提供机器学习算法库的组件？革选题］*A.HiveB.SparkSQLC.MLli正确答案）D.Mahout10.以下哪个组件是YARN用来进行资源管理和调度任务执行的组件？革选题］*A.ResourceManage正确答案）B.NodeManagerC.JobTrackerD.TaskTracker11.使用Hive进行SQL分析时，以下哪个组件是Hive用来保存数据库、表模式等信息的？革选题］*A.DriverB.ParserC.OptimizerD.Metasto正确答案）12.MapReduce程序通常包括map、本地的归并(localgroup)y,shufl和reduce四步操作。判断题］*对正确答案）错13.Spar支持的操作可以分为Transformatic和Action两种，其中Transformation用于变换RDD。判断题］*对正确答案）错14.Hiv是基于Spark实现的SQL查询引擎，可以接收SQL语句对数据表进行关联查询分析。判断题］*对错正确答案）15.Hiv对数据进行查询时，如果经常需要对个别字段做聚合计算，应该使用行存储格式，从而可以提升效率。判断题］*对错正确答案）16.Spar分布式计算框架可以支持多种计算模式，包括批处理、流处理和SQL查询判断题］*对正确答案）错17.Hadoop2.软件框架中ResourceManager不仅需要管理资源，还需要对分析程序的执行过程进行监控和管理。判断题］*对错正确答案）18.MapReduce和Spark分布式计算框架都具有shuffl操作。判断题］*对正确答案）错19.Hiv可以用于在MapReduce平台上进行SQL分析和查询，而且Hive可以支持对数据进行事务操作。判断题］*对错正确答案）20.HDFS是大数据底层的分布式存储系统，用来保存需要分析的数据，GB级别的大文件和KB级别的小文件都适合直接保存在HDFS上进行分析。判断题］*对错正确答案）