Hadoop 的价值

Hadoop 的价值

By Frank.Vassen

Hadoop 是大数据的业界标准 The de facto standard

   

仅仅依靠传统软件是无法处理大数据的,大数据的挑战包括 :

  • 存储,搜索,共享,传递,分析和可视化

Hadoop 可以让您以极具成本效益的方式来回应这些挑战。大数据需要特殊的技术,Hadoop 以全新的方式存储数据和处理海量数据,它提供了两个重要的服务 : 能够存储任何类型任何来源任何大小的数据 + 完整的大数据分析工具集 

Hadoop 产品系列的价值:

  • The Exact Code Used in Production Systems of Large and Successful Companies  Hadoop 来自大型成功公司的 Production Systems !  雅虎把他们的生产系统 (Production System) 使用的 完全一样的代码 贡献到 Hadoop 。 Facebook 开发了 Hadoop 的数据仓库系统,名为 Hive,Facebook 把他們的生產系統 (Production System) 使用的 完全一样的代码 贡献到 Hive 和 Hadoop 。
    您可以放心使用 Hadoop 因为 Hadoop 来自大型成功公司的 Production Systems ! 
  • Proven at Scale 大规模证明  Hadoop 已经在全球大量公司广泛使用。 例如,雅虎 是Hadoop的最大用户之一,拥有超过 40,000 台Hadoop服务器 (超过10万个CPU),也是最大的 Hadoop QA场地之一,运行非常大的集群,多年来运行各种巨大的运算负载(见 http://www.slideshare.net/ydn/hadoop-yahoo-internet-scale-data-processing).
  • Extremely cost effective to handle Big Data 具成本效益   Hadoop 使用业界标准硬件,这意味着每 TB 的存储和处理的成本远低于其他系统。它支持可插拔压缩算法有效地利用磁盘空间,添加或移除存储服务器也很简单。
    你并不需要找到新硬件去实验! 
  • You Can Work with All Your data  Hodoop 没有数据类型的边界,没有数据大小的边界 。 
    更重要的是,您现在可以及时处理大数据  !
  • No Need for R&D and No License Fee  无需要 R&D 没有许可费 公司可以节省很大的资本购买更好更大数量的Hadoop的服务器。
  • Flexible Support Option 灵活的技术支持 (flexible eco-support system )  客户可以灵活选择专业服务,从社区支持到
    专业支援服务满足特定的业务需求。
   

Hadoop 应用如下 (但不限于):

  • Archive platform 大图片库,大文档库
  • Natural Language processing 自然语言处理
  • Recommendation Engine 推荐引擎 - 企业如何能预测顾客的喜好呢?
  • Customer Churn Analysis 客户流失分析 - 如何赢得更多的客户,并避免真的失去客户?先进的数据挖掘
  • AD Targeting 广告定位 - 企业如何才能提高作战效能?营销自动化,商业智能
  • Point-of-sales Transaction Analysis 销售点交易分析
  • Analyzing Network Data to Predict - 网络数据分析预测 -
  • Threat Analysis 威胁分析 - 企业如何才能检测到的威胁和欺诈活动?
  • Trade Surveillance 贸易管制 - 检测流氓交易?
  • Search Quality 搜索质量 - 你在搜索什么呢?
  • Data Sandbox 数据沙箱 / 数据测试实验室
  • GIS - 3D 地图,空间应用
  • Real-time Customer Segmentation 实时客户细分 - 市场分析
   

如何启动您的 Hadoop / HBase 项目

在今天的互联网世界,企业正面临着越来越多大数据的挑战,当现在的传统软件无法处理大数据时,Hadoop 以数据为本的决策应用可以创造巨大的价值,成功启动的Hadoop/ HBase的项目有3个关键步骤:

  • 明确定义当前的业务挑战和问题及业务应用领域:点算业务挑战和目标, 专注研究Haddop能够提供最高回报的应用领域。
  • 明确定义技术要求:确定数据的量,质,品种,增速,识别 Hadoop 和 HBase 如何存储和处理大数据
  • 规划大数据项目:构建可衡量的具体目标,商业价值,预期结果。计划项目的实施方式,成本措施,资源,里程碑,项目任务和时间。
   

如果您有任何疑问,请随时 与我们联系.

PostgreSQL, Open Source, database, Oracle, SQLServer, MYSQL