HBase

HBase

By  digitalART2

Hadoop 是大数据的业界标准 The De Facto Standard, HBase 是 Hadoop 的大数据库

   
   

HBase 简 介

传统的数据库局限用户只能使用限定的数据结构,其目的是减少耗用磁盘,当用户需要更大的逻辑数据视图(bigger logical view) ,数据表将再次合并(table join)。在大数据世界,这样的操作会导致严重的运算瓶颈问题,特别是如果数据表太大,数据表根本无法存储和合并,即使使用分片数据库,可扩展性仍然有终极的限制 !

另一方面,Hbase 允许终极的开放式数据结构,任何HBase 的列没有类型和长度边界限制也没有列数限制,这意味着你可以在HBase存储任何数据,不管大小! HBase 提供随机存取,自动故障转移,自动版本,自动分片,终极的可扩展性,以及数据更新严格一致!

关键的特点:

  • 来自 Hadoop 的大数据库 : Hadoop 集成
  • 开放式数据结构 Open data structure: 没有类型和长度边界限制,也没有列数限制
  • 终极的可扩展性 Extreme Scalability: HBase 可以从单节点扩展至数千数万节点
  • 自动负载平衡 Automatic Load-Balancing通过自动分片自动分割大表并重新分配它们 
  • 高容错 Highly Fault Tolerance磁盘或服务器出现故障是不是第一优的维护任务!自动故障转移
  • 数据更新严格一致 Strict Consistency:  每个用户看到最新更新的数据状态(没有数据不一致的情况) ,内置自动版本
  • 支持大规模并行处理 Supports massively parallelized processing (MPP)
  • 无死锁相关的暂停 No deadlocks-related pauses
   

今天您可能没有以 Petabytes 计的数据,不过,像Fac​​ebook,雅虎以及世界上其他大量公司的成功实证,证明 HBase 和 Hadoop 能够出色地管理大量数据。大规模实证证明 HBase 和 Hadoop 真正具有支持业务增长的能力。 Hadoop 和 HBase 的用户群体是全球性的和多样化的,包括金融服务,电信,零售,社交网络,媒体,医疗保健和其他行业。欲了解更多信息,请阅读: Who uses HBase and Hadoop.

   

如何启动您的 HBase/Hadoop 项目

以数据为本的决策和应用可以创造巨大的价值,成功启动HBase项目有3个关键步骤:

  • 明确定义当前的业务挑战和问题及业务应用领域:点算业务挑战和目标,专注研究能够提供最高回报的应用领域。。
  • 明确定义技术要求确定数据的量,质,品种, 增速,识别HBase和Hadoop如何存储和处理大数据
  • 规划大数据项目:构建可衡量的具体目标,商业价值,预期结果。 计划项目的实施方式,成本措施,资源,里程碑,项目任务和时间。

如果您有任何疑问请随时 与我们联系 .

PostgreSQL, Open Source, database, Oracle, SQLServer, MYSQL