Hadoop学习

Hadoop基本原理介绍:

http://wangwei.cao.blog.163.com/blog/static/10236252620130253346928/

Hadoop体系架构

http://blog.sina.com.cn/s/blog_a94476040101c9qo.html

http://www.open-open.com/lib/view/open1329835694186.htmlHadoop应用场景

http://www.open-open.com/bbs/view/1342075659562

Hadoop的起源、解决的问题

http://developer.51cto.com/art/201006/203510.htm

Hadoop生态系统:

当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。

1.这一切,都起源自Web数据爆炸时代的来临

2.数据抓取系统-Nutch

3.海量数据怎么存,当然是用分布式文件系统-HDFS

4.数据怎么用呢,分析,处理

5.MapReduce框架,让你编写代码来实现对大数据的分析工作

6.非结构化数据(日志)收集处理-fuse,webdav,chukwa,flume,Scribe

7.数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了-Hiho,sqoop

8.MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据–Pig,Hive,Jaql

9.让你的数据可见-drilldown,Intellicus

10.用高级语言管理你的任务流–oozie,Cascading

11.Hadoop当然也有自己的监控管理工具–Hue,karmasphere,eclipseplugin,cacti,ganglia

12.数据序列化处理与任务调度–Avro,Zookeeper

13.更多构建在Hadoop上层的服务–Mahout,ElasticmapReduce

14.OLTP存储系统–Hbase

HDFS实战-JavaAPI使用

http://blog.csdn.net/zhangzhaokun/article/details/5597433

相关推荐