对象存储系统 vs Hadoop 云存储怎么选？

zwb

2015-03-04

选择多如牛毛，为你的应用选择最佳的云存储系统并非易事。但是对象存储系统是一个选择，尤其是如果你的应用要求访问控制。而那些使用云进行大数据分析的则要考虑Hadoop。

对象存储系统，比如AWS S3、微软Azure Blob和谷歌云存储，可以在一个持久稳固且高度可用的系统中存储任意的对象，且独立于虚拟机实例之外。应用和用户可以在对象存储中使用简单的API访问数据；这些通常都基于表属性状态转移（REST）架构，但是也有面向编程语言的界面。

对象存储提供了数据上受限操作的访问控制。数据管理员可以在bucket层级上（类似于目录）或者对象层级上（类似目录中的文件）应用访问控制。存储对象的授权/认证通过云提供商的身份认证管理系统或者你的目录服务来管理。通过后者，你可能有一个本地的目录，同基于云的目录服务同步，巩固所有的访问控制角色和进入单一注册库的特权。

提及存储，对于那些使用云进行大数据分析的还有额外的选择考虑。比如AWS提供了弹性Map Reduce (EMR)，这是一项Hadoop服务。Hadoop旨在同期文件系统工作，以HDFS著称。

当用户用EMR创建了一个Hadoop集群，他们可以从AWS S3或者一些其他的数据存储复制数据到集群上的HDFS，或者也可以直接从S3访问数据。HDFS使用本地存储，而且通常提供了比从S3恢复更好的性能，但是在运行Hadoop工作之前，也需要时间从S3复制数据到HDFS。如果EMR集群要运行一段时间，且针对多项工作使用相同的数据，可能值得额外的启动时间来从S3复制数据到HDFS。

云存储选择适用于广泛的需求，但是要针对你的需求找到正确的存储类型，也意味着要找到延迟、易用性、数据完整性和成本之间的合适的平衡点。

控制归档成本

hadoop 对象存储系统云存储 hdfs 访问控制 s3

安科网

对象存储系统 vs Hadoop 云存储怎么选？

zwb

zwb

相关推荐

hadoop伪分布式环境搭建

hadoop框架三大组件hdfs、mapreduce、yarn 内容

hdfs、hive、hbase的搭建总结

hadoop集群的启动与停止

hadoop创建目录

[AWS][大数据][Hadoop] 使用EMR做大数据分析

Hadoop

大数据期末复习重点

Hadoop之hadoop fs和hdfs dfs、hdfs fs三者区别

hadoop两个namenode都是standby问题

Hadoop之HDFS入门实战

hadoop 数据处理总结

Hadoop简介

hadoop hdfs csv导入hive表

Hadoop3.2.0集群搭建常见注意事项

为什么Java仍将是未来的主流语言？

_服役新节点，退役旧节点，多目录配置。+_HDFS2.x的新特性

Hadoop（一）安装

第四周练习

Hadoop小练习

zwb