关于MapReduce特点描述正确的是()。
A.自动实现分布式并行计算
B.提供状态监控工具
C.容错性高
D.模型抽象简洁,程序员易用
A.自动实现分布式并行计算
B.提供状态监控工具
C.容错性高
D.模型抽象简洁,程序员易用
A.MPI适用于数据相关性强,迭代次数多的计算
B.MapReduce适用于大规模数据处理,节点失效对系统无影响
C.MPI设计前提是计算相关性强,硬件容易坏
D.MapReduce设计前提是数据全局性弱,硬件是容易坏的
A.所有HQL都会转化为MapReduce任务执行
B.DDL语句不提交任务到MapReduce,而是直接操作元数据
C.对于selectcount(*)fromtable操作,一定会启动reduce任务
D.对于selece*fromtable语句不会启MapReduce
A.MapReduce采用“ 分而治之”策略
B.MapReduce设计的一个理念就是“ 计算向数据靠拢”
C.MapReduce框架采用了Master/Slave架构
D.MapReduce应用程序只能用Java来写
A.MapReduce是处理大量半结构化数据集合的编程模型
B.MapReduce和Hadoop是相互独立的
C.MapReduce使用一种集合语言执行查询
D.MapReduce是Map和Reduce的两部分用户程序组成
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
A.两者不可缺少,MapReduce是HBase可以正常运行的保证
B.两者不是强关联关系,没有MapReduce,HBase可以正常运行
C.MapReduce可以直接访问HBase
D.它们之间没有任何关系
A.Job是个静态的概念,被提交到系统开始执行时,该Job就拥有一个Instance
B.工作流描述了Job中各个Instance之间的依赖关系和运行约束,本质是个DAG(有向无环图)
C.单个SQLquery、命令或者MapReduce程序统称为一个Task
D.Instance是个动态概念,每个Instance只能运行一次