hadoop

Hadoop

  • 分布式系统基础结构
  • 海量数据存储,海量数据计算
  • Hadoop指的是Hadoop生态圈

Google=》Hadoop

  • GFS->HDFS
  • Map-Reduce->MR
  • BigTable->HBase

Hadoop发行版本

  • Apache:最基础
  • Cloudera:大型互联网企业
  • Hortonworks:文档较好

Hadoop特点

  • 高可靠性:有多个数据副本
  • 高扩展性:可扩展节点
  • 高效性:(MapReduce)并行工作
  • 高容错性:重新分配失败的任务

相关推荐