Hadoop 2.4.0 全球发布

Hadoop 2.4.0 全球发布

By jonrawlinson

   
   

最新消息

[2014年6月30日]  我们很高兴地宣布 Hadoop 2.4.0 今天全球发布。Hadoop-2.4.0, the *General Availability GA* release of  Hadoop 2.x series!!

[2014年2月20日]  我们很高兴地宣布 Hadoop 2.3.0 今天全球发布。Hadoop-2.3.0, the *General Availability GA* release of  Hadoop 2.x series!!

[2013年10月15日]  我们很高兴地宣布 Hadoop 2.2.0 今天全球发布。Hadoop-2.2.0, the *General Availability GA* release of  Hadoop 2.x series!!

Hadoop 2.2 相比 Hadoop 1.x 的显着亮点:

  • YARN - 通用资源管理系统,为 MapReduce和其他数据处理框架 服务。
  • HDFS High Availability 高可用性 Hadoop 高可用性提供了在同一个集群运行两个冗余 NameNodes,主动/被动配置热备用的选项允许快速切换到一个新的NameNode。
  • HDFS Federation 联邦 为 了扩大名称服务,联邦使用多个独立 Namenodes。 独立的Namenodes,并不需要相互协调。Datanode被用作普通的储存块,每个Datanode 在所有 Namenodes 注册。 DataNode 会定期发送 Haertbeat 和 块报告至 Namenodes的命令。主要优点是:
    • Namespace Scalability Namespace 可扩展性   增加更多的Namenodes集群 可以使用更大量的小文件,大型部署受益于扩大的命名空间。
    • Performance 性能 - 将更多Namenodes添加到群集的文件系统,扩展读/写操作的吞吐量。
    • Isolation 隔离 - 随着多个扩展 Namenodes,不同类别的应用程序和用户可以命名隔离不同的空间。
  • HDFS的快照 Snapshotx:HDFS 快照是文件系统 按时间点的副本。快照可以是文件系统的子树或整个文件系统。一些常见的快照用例是数据备份,防止用户错误和灾难恢复。
  • NFSv3 access to data in HDFS NFSv3访问HDFS中的数据
  • Support for running Hadoop on Windows
  • Binary Compatibility for MapReduce applications built on hadoop-1.x  与Hadoop 1.x 的 MapReduce 应用兼容性

我们鼓励用户立即迁移到2.2.0,因为这个版本明显更稳定,并保证兼容API。
 
注:升级至 hadoop-2.2.0 的注意事项:
    HDFS - 符号链接功能 (symlinks feature) 推到未来的2.3.0版本,目前已停用。
    YARN/MapReduce的用户需要改变ShuffleHandler的服务名称 : mapreduce.shuffle  改为 mapreduce_shuffle

   
   

如果您有任何疑问,请随时 联系我们

PostgreSQL, Open Source, database, Oracle, SQLServer, MYSQL