律师名片

当前位置: 广州律师网 > 成功案例 >

HBase使用场景和成功案例

正文 字体大小: 中

HBase使用场景和成功案例 (2012-12-25 10:34:25)

标签: 在线服务 例子 广告服务 目的 不需要

1.2 HBase 使用场景和成功案例

有时候了解软件产品的最好方法是看看它是怎么用的。它可以解决什么问题和这些解决方案如何适用于大型应用架构,能够告诉你很多。因为

 

注意:不要自我限制,认为HBase只能解决这些使用场景。它是一个初生的技术,根据使用场景进行创新正驱动着系统的发展。如果你有新想法,认为可以受益于HBase提供的功能,试试吧。社区很乐于帮助你,也会从你的经验中学习。这正是开源软件精神。

 

 

搜索是一个定位你所关心的信息的行为:例如,搜索一本书的页码,其中含有你想读的主题,或者网页,其中含有你想找的信息。搜索含有特定词语的文档,需要查找索引,该索引提供了特定词语和包含该词语的所有文档的映射。为了能够搜索,首先必须建立索引。Google和其他搜索引擎正是这么做的。他们的文档库是整个互联网;搜索的特定词语就是你在搜索框里敲入的任何东西。

通过

 

建立互联网索引

1 爬虫持续不断地抓取新页面,这些页面每页一行地存储到BigTable里。

2 MapReduce计算作业运行在整张表上,生成索引,为网络搜索应用做准备。

搜索互联网

3 用户发起网络搜索请求。

4 网络搜索应用查询建立好的索引,或者直接从BigTable直接得到单个文档。

5 搜索结果提交给用户。

 

在这个领域,HBase有三种主要使用场景,但不限于这些。为了保持本节简单明了,我们这里介绍主要的使用场景。

1.2.2 捕获增量数据

数据通常是细水长流,累加到已有数据库以备将来使用,例如分析,处理和服务。许多

 

捕获监控参数:OPENTSDB

服务于数百万用户的

StumbleUpon 创建了一个开源框架,用来收集服务器的各种监控参数。按照时间收集参数一般称之为时间序列数据:也就是说,按照时间顺序收集和记录数据。StumbleUpon 的开源框架叫做OpenTSDB,其含义是开放时间序列数据库 Open Time Series Database 。这个框架使用 使用

 

捕获用户交互数据:

捕获监控数据是一种使用方式。还有一种是捕获用户交互数据。如何跟踪数百万用户在网站上的活动?怎么知道哪一个网站功能是最受欢迎的?怎样使得这一次的网页浏览直接影响到下一次?例如,谁看了什么?某个按钮被点击了多少次?还记得 里的 里的+1 按钮吗?是不是听起来像是一个计数问题?每次用户Like一个特定主题计数器增加一次。

StumbleUpon 在开始阶段采用 选择HBase上做了一些小的开发改动,后来这些开发工作贡献回了项目社区。

为此创建了一个叫Facebook Insight 可以很方便地横向扩展服务规模,提供给数百万用户,也可以继续使用他们已有的运行大规模HBase机群的经验。该系统每天处理数百亿条事件,记录数百个参数。

 

TREND MICRO

Copyright © 2009-2013 广州律师网 版权所有 All rights reserved.

地址:广州市天河区天河路385号太古汇一座31楼 联系电话:13322804716