2009-12-18

数据为王,又一次胜利了

收购了,等于拿到了源

而这次,12.14 宣布支持在上同步rss更新的时候,也就是提供与twitterfeed 等一些网站功能完全一致的服务的时候

我就知道 又要胜利了

由于当时已经是韩国时间12.15了 我要准备去首尔,所以没怎么来得及测试

只是匆匆的把其中一个博客评论监控的功能加了一下,就闪人了

后来17号在首尔看到,这个的发布功能,要比twitterfeed快2个小时。这个时候我才真真正正的明白,的服务器力量是强大的

当然 这项原创的技术自己在自己的服务上应用起来也是得心应手的

新开启的短域名服务http://goo.gl  则也是完全的市场布局

 

的高效服务,会把大家从twitterfeed或者的应用上拉走 造成的后果

1.用户的增加

2.很多原生的rss本来在twitterfeed, 上是可以直接用的,而这里就不得不先要burn下才可以使用了,增加了收集的信息量

3.短域名服务http://goo.gl 对于连接点击的跟踪,从而也可以更加好的进行

 

把数据都掌握在自己手中,依然是的一贯风格,而广大消费者,面对着这高速的服务,基本上无间隔就会post到上的高效,都会忍不住转到来。这也许是大家双赢的结局。而最终悲惨出局的,还是twitterfeed和等这些小型服务提供商。。

Tags: ,,,,,,,,.
2009-10-23

论文出处: http://netdb09.cis.upenn.edu/netdb09papers/netdb09-final3.pdf

The abstract:

() face serious scalability challenges due to their rapid growth and popularity. To address this issue we present a novel approach to scale up called One Hop Replication (OHR). Our system combines partitioning and replication in a middleware to transparently scale up a centralized design, and therefore, avoid the application to undergo the costly transition to a fully distributed system to meet its scalability needs.

OHR exploits some of the structural characteristics of : 1) most of the information is one-hop away, and 2) the topology of the network of connections among people displays a strong community structure. We evaluate our system and its potential benefits and overheads using data from real OSNs: and Orkut. We show that OHR has the potential to provide out-of-the-box transparent scalability while maintaining the replication overhead costs in check.

 

image

论文中这个图,做的很直观,很清晰的给出了传统的DB和目前流行的分散DB的区别..

The OHR system is composed of two components: the controller and the middleware.

基本上就是这2个东西起了作用,不过什么时候这个controller能够更加人工智能就好了.具体太细节的东西,文章也没说多少。

分析结果就是拿了2个data-sets来分析的,和orkut的数据

……………………

最终实验平台,好像是在Amazon的EC2上进行的,在韩国这边不是太了解这个EC2,感觉应该是在美国非常的流行了。之前有看到EC2针对教育行业有个discount的消息,其实这个实验在EC2上能够顺利的进行的话,也就不用自己再单独购买机器了。这也是的优势之一……

^^^^^^^^^^^^^

最后再推荐一个ppt

http://www.cs.cornell.edu/projects/ladis2009/talks/dean-keynote-ladis2009.pdf

的又一篇ppt长达73页,可以看到在达拉斯的machine farm均当30个机柜的存储能力

Tags: ,,,,,,,,.