hive数据仓库默认在hdfs中存放数据的路径()。
A./hive/warehouse
B./user/hive/warehouse
C./usr/hive/warehouse
D./usr/hive/
A./hive/warehouse
B./user/hive/warehouse
C./usr/hive/warehouse
D./usr/hive/
A.Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,二传统数据仓库数据应用单一,灵活性低
B.Hive基于HDFS存储,理论上存储可以无限扩容,而传统数据仓库存储量有上限
C.由于Hive的数据存储在HDFS上,所以可以保证数据的高容错,高可靠
D.由于Hive基于大数据平台,所以查询效率比传统数据仓库快
A.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
B.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌Big Table的开源实现
C.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
A.当需要从多个源采集日志数据,然后聚合、写入HDFS时
B.可以用于消息持久化,且需要支持可扩展和并行数据处理时
C.可以用于在ApacheHadoop和结构化数据仓库之间高效传输批量数据时
D.可以用于大数据集的批处理
A.1.7PB
B.3.9PB
C.5.0PB
D.2.8PB
A.查看此Reducertask的HDFS_BYTES_WRITTEN值是否比正常Reducertask大很多
B.查看此Reducertask输出到hdfs文件大小是否比正常Reducertask大很多
C.查看此task的FILE_BYTES_READ值是否比正常Reducertask大很多
D.查看此task的HDFS_BYTES_READ值是否比正常Reducertask大很多
A.HIVE构建于HDFS和MapReduce之上
B.HIVE使用类SQL的HQL语言作为查询接口
C.HIVE的并行执行主要依赖MapReduce来实现
D.HIVE不能运行在Spark上
A.hadoop的文件API不是通用的,只用于HDFS文件系统
B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础
C.FileStatus对象存储文件和目录的元数据
D.FSDataInputStream是java、io、DataInputStream的子类