关于Lustre和HDFS描述正确的是()。
A.Lustre设计前提是硬件不容易坏
B.Lustre中节点失效后部分数据不能访问
C.HDFS设计前提是硬件容易坏
D.HDFS中节点失效后不需要人工干预
A.Lustre设计前提是硬件不容易坏
B.Lustre中节点失效后部分数据不能访问
C.HDFS设计前提是硬件容易坏
D.HDFS中节点失效后不需要人工干预
A.大文件分割成多个block存储
B.不支持一次写入、多次读取的访问模式
C.存储大文件,百MB,GB级文件
D.支持一次写入、多次读取的访问模式
A.应用在FusionInsightHD的上层应用
B.HFS封装了HBase与HDFS的接口
C.为上层应用提供文件的存储.读取.删除等功能
D.HFS是HBase的独立模块
A.HDFSErasureCoding针对hdfs目录进行设置,可根据不同目录重要级别用途设置不同EC策略或不设置EC策略
B.现有目录上设置EC策略不会影响群集中的现有数据
C.提高HDFS存储效率,同时可以提供与基于副本相同水平的容错能力和数据持久性
D.EC策略将忽略逻辑机架感应设置,数据单元和校验单元不会按逻辑机架感应的逻辑来存储
A.hadoop的文件API不是通用的,只用于HDFS文件系统
B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础
C.FileStatus对象存储文件和目录的元数据
D.FSDataInputStream是java、io、DataInputStream的子类
A.BlockSize是不可以修改的
B.如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作
C.SecondaryNameNode应与NameNode部署到一个节点
D.以上都不对
A.HIVE构建于HDFS和MapReduce之上
B.HIVE使用类SQL的HQL语言作为查询接口
C.HIVE的并行执行主要依赖MapReduce来实现
D.HIVE不能运行在Spark上
A.edits 并不会立刻更改硬盘上的fsimage
B.fsimage里保存了文件系统目录树信息
C.对文件进行写操作(包括新建或移动)的时候,立刻会更改内存中的数据
D.edits保存文件系统的更改记录(JournalNodes)
E.fsimage里保存了文件和块的对应关系
试题二(共25分)
阅读以下关于分布式存储系统设计的叙述,回答问题1至问题3。
某软件公司开发基于云计算的分布式文档协作平台(DDCP),系统部分需求如下所示:
(1)实现文档的分布式存储,客户端可随时随地上传和下载文档;
(2)支持多客户端并发编辑同一文档,某个客户端所做修改会实时显示在其他客户端;
(3)要求系统具有自我修复机制,当系统中某个节点失效时,无需人工干预能够自动实现节点替换并恢复到一致状态。
项目组经过讨论,决定采用现有的分布式文件系统作为基础架构,但在具体选用哪种设计方案时产生了分歧。王工建议采用Hadoop分布式文件系统HDFS作为系统参考架构,但张工认为Google分布式文件系统GFS更适合该系统需求。最后经过更为详细
的分析和讨论,同意了张工的建议,采用GFS作为分布式文档协作平台的文件系统架构。
【问题1】(12分)
请用300字以内的文字说明GFS和HDFS有何异同,并针对系统需求,用200字以内的文字说明选择GFS的原因。
【问题2】(8分)
针对图2-1所示DDCP基础架构,请分别说明一次数据读操作和一次并发写操作的过程。
【问题3】(5分)
请分别叙述采用GFS和HDFS架构,单点失效问题是如何解决的。
B.hdfsdfs-mkdir /hadoo
C.hadoop fsmkdir hadoo
D.hadoop fs -mkdir /hadoo