Hadoop 香港和中国

Hadoop 香港和中国

By  Santiago Ron

[Hadoop 香港和中国] 

Big data 大数据 的数据如此庞大而复杂,它变得难以使用传统系统进行数据处理。这些挑战包括

  • 收集
  • 策展
  • 存储
  • 搜索
  • 共享
  • 传递
  • 分析和可视化

大数据处理需要特殊有效的技术。

   

"对于一些机构,第一次面对几十或数百TB的数据,可能需要重新考虑数据管理选项。" - Jimmy Guterman

   
   

Hadoop 是大数据处理 事实上的标准框架 (de facto standard framework ),它能够处理所有传统系统不能处理的数据集,使所有数据变为可用数据,Hadoop 让你看到之前被隐藏数据珍宝。

   

Hadoop 的应用案例:

  • Alibaba 阿里巴巴 
  •     •   处理各种业务数据。   Processing sorts of business data dumped out of database and joining them together.
  •     •   这些数据将被送入 iSearch
  • Facebook 面书
  •     •  使用 Hadoop 来存储内部日志和数据源, 分析和机器学习。
  •     •  目前有2个主要的集群:
  •             8800 核心和原始存储约12 PB机集群。
  •             A 300机集群与2400内核和大约3 PB原始数据。
  •             每个节点有8个内核和12 TB的存储容量
  •     • 内置更高级别的数据仓库框架
  • Yahoo 雅虎! 
  •     •  超过10万 CPU, 超过 4万台计算机 运行Hadoop  
  •     •  最大的集群:4,500个节点,用于支持广告系统和Web搜索的研究
  •  
  • 更多应用案例 ......
   

Hadoop 几个关键的优势:

  • Extremely Cost Effective 极具成本效益地处理大数据   
  • Use with confidence 放心使用  
  • Proven at scale 规模证明 
  • High Availability 高可用性
  • Big Data Random Access and Flexible Secondary Indexes 大数据的随机存取和灵活的辅助索引
  • Store anything and NO information is lost  存储任何东西,没有信息丢失
  • Complete Big Data Analysis Tool Set 完整大数据分析工具    

如果您有任何疑问,请随时 联系我们

PostgreSQL, Open Source, database, Oracle, SQLServer, MYSQL