第一篇HDFS 分布式文件系统
一: The Design of HDFS
二: HDFS Concepts
三:应用程序示例
四:Data Flow
第二篇 MapReduce
一 :MapReduce基础
二:MapReduce数据流
三:MapReduce工作原理
第三篇 Hbase简单介绍
一 :简介
二:数据模型
三:行、列、时间戳、API
Very large files
大数据集合为目标数
以千万计的文件
典型文件大小一般都在千兆至T字节
Streaming data access
write-one-read-many访问模型
文件创建、写,关闭之后不需要改变简化数据一致性
适合MapReduce框架,或者web crawler
Commodity hardware
错误检测和快速、自动的恢复是HDFS的核心架构目标