A.分布式文件存储系统(HDFS)
B.分布式计算框架(MapReduce)
C.分布式资源调度系统(Yarn)
D.数据处理方法(DPW)
A.计算资源标签调度是yarm的特征,存储资源调度是HDFS的特征
B.通过存储资源标签,可以将在线应用数据存储在SAS盘节点的HDFS目录下,而离线应用数据存储在SATA盘节点对应的HDFS目录下
C.通过计算资源标签,可以将spark作业调度到大内存节点上运行,而MR作业调度在标配内存节点上运行
D.计算资源和存储资源的标签通常配合使用,是为了将指定的应用跨节点访问计算和数据资源
A.非结构化与半结构化数据的处理是一项重要的课题
B.传统的统计理论与技术能很好地实现大数据知识发现
C.大数据复杂性,不确定性特征描述的方法及大数据的系统建模是实现大数据知识发现的前提与关键
D.大数据处理问题复杂多样,难以用一种单一的计算模式涵盖