A.分布式文件系统B.分布式数据库系统C.关系型数据库系统D.非结构化数据分析系统
A.数据采集
B.数据管理
C.数据存储
D.数据分析与挖掘
区分一个系统是若干集中式数据库的简单连网还是分布式数据库系统的关键在于上(57)。
A.数据是否存储在不同的场地
B.系统是否支持全局应用
C.是否是面向处理、面向应用的
D.数据独立性程度的高低
A.分布式文件系统
B.分布式数据库系统
C.关系式数据库系统
D.非结构化数据分析
试题二(共25分)
阅读以下关于分布式存储系统设计的叙述,回答问题1至问题3。
某软件公司开发基于云计算的分布式文档协作平台(DDCP),系统部分需求如下所示:
(1)实现文档的分布式存储,客户端可随时随地上传和下载文档;
(2)支持多客户端并发编辑同一文档,某个客户端所做修改会实时显示在其他客户端;
(3)要求系统具有自我修复机制,当系统中某个节点失效时,无需人工干预能够自动实现节点替换并恢复到一致状态。
项目组经过讨论,决定采用现有的分布式文件系统作为基础架构,但在具体选用哪种设计方案时产生了分歧。王工建议采用Hadoop分布式文件系统HDFS作为系统参考架构,但张工认为Google分布式文件系统GFS更适合该系统需求。最后经过更为详细
的分析和讨论,同意了张工的建议,采用GFS作为分布式文档协作平台的文件系统架构。
【问题1】(12分)
请用300字以内的文字说明GFS和HDFS有何异同,并针对系统需求,用200字以内的文字说明选择GFS的原因。
【问题2】(8分)
针对图2-1所示DDCP基础架构,请分别说明一次数据读操作和一次并发写操作的过程。
【问题3】(5分)
请分别叙述采用GFS和HDFS架构,单点失效问题是如何解决的。
A.采用分布式消息服务有效应对流量洪峰
B.采用分布式缓存服务实现热点数据缓存加速,减小数据库压力
C.采用CDN服务使用户可以就近获得所需的内容
D.通过弹性伸缩和云监控满足高峰期弹性扩容,避免资源浪费
数据备份是容错的基础,是指为防止系统出现操作失误或系统故障导致(1) ,而将全部或部分数据集合从应用主机的硬盘或阵列 (2) 到其他的存储介质的过程。传统的数据备份主要是采用(3) 的磁带机进行冷备份。但是这种方式只能防止操作失误等人为故障,而且其恢复时间也很长。随着技术的不断发展,数据的海量增加,不少的企业开始采用(5) 。网络备份一般通过专业的 (5) 结合相应的硬件和存储设备来实现。