关于数据仓库和数据湖的主要差别,以下哪项描述是不正确的()。
A.存储数据类型和数据结构化流程不同
B.主要提供的服务不同
C.面向主要用户不同
D.应用侧重点不同
A.存储数据类型和数据结构化流程不同
B.主要提供的服务不同
C.面向主要用户不同
D.应用侧重点不同
A.订单办理
B.数据仓库
C.杜交网络分析
D.用户画像
A.该场景下对CPU性能和内存容量要求都很高
B.该场景下数据类型为热数据,数据高可用一般采用多副本技术
C.该场景下采用华为GaussDB200分布式MPP架构数据仓库,支持在海量数据中,多个租户共享数据的离线数据处理和在线交互查询
D.该场景下数据类型为冷数据,数据高可用一般也采用EC(纠删码)技术
A.Hive是基于Hadoop的数据仓库工具
B.Hive可以将结构化的数据文件映射为一张数据库表
C.最初,Hive由Google开源,用于解决海量结构化日志数据统计问题
D.Hive的主要应用场景是离线分析
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
A.数据科学家已经找到了分析数据和从数据中获取价值的新方法
B.大数据使用不同种类的数据源,实现预测能力、基于模型的实时分析能力,能够为组织未来的发展方向提供更深刻的洞察能力
C.大多数数据仓库依赖于ELT(提取、转换和加载)的概念。大数据解决方案,如数据湖,则依赖于ETL的概念——先加载后转换
D.数据的生产速度和容量带来了挑战,需要在数据管理的各个关键领域中采用不同的方法,如集成、元数据管理和数据质量评估
A.数据准备区从交易系统数据层中获取原始的、粗粒度的数据,存放业务源数据的快照
B.为后续数据加工提供便利
C.数据准备区对于数据仓库最终用户是不可见的,仅作为数据集成过程的一部分存在
D.存放所有分析相关的数据