Hadoop分布式文件系统架构和设计

  1. 引言

Hadoop 分布式文件系统 (HDFS) 是一个设计用于在普通硬件上运行的分布式文件系统。它与现有的分布式文件系统有许多相似之处。然而,HDFS 与其他分布式文件系统的差异是显著的。HDFS具有高度的容错能力,并且设计用于在低成本硬件上部署。HDFS 提供高吞吐量的数据访问,适合处理大型数据集的应用程序。HDFS放宽了一些 POSIX规范,以支持对文件系统数据的流式访问。HDFS 最初是作为 Apache Nutch 网络搜索引擎项目的基础设施构建的。HDFS是Apache Hadoop 核心项目的一部分。项目网址是,http://hadoop.apache.org/core/

  1. 假设与目标

2.1 硬件故障

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部