数据为王,google又一次胜利了
收购了feedburner,等于拿到了源
而这次,12.14 feedburner宣布支持在twitter上同步rss更新的时候,也就是提供与twitterfeed rss2twitter 等一些网站功能完全一致的服务的时候
我就知道google 又要胜利了
由于当时已经是韩国时间12.15了 我要准备去首尔,所以没怎么来得及测试
只是匆匆的把其中一个博客评论监控的功能加了一下,就闪人了
后来17号在首尔看到,这个feedburner的发布twitter功能,要比twitterfeed快2个小时。这个时候我才真真正正的明白,google的服务器力量是强大的
当然pubsubhubbub 这项google原创的技术google自己在自己的服务上应用起来也是得心应手的
而google新开启的短域名服务http://goo.gl 则也是完全的市场布局
feedburner的高效服务,会把大家从twitterfeed或者rss2twitter的应用上拉走 造成的后果
1.feedburner用户的增加
2.很多原生的rss本来在twitterfeed, rss2twitter上是可以直接用的,而这里就不得不先要burn下才可以使用了,增加了google收集的信息量
3.短域名服务http://goo.gl 对于连接点击的跟踪,从而也可以更加好的进行 web analysis
把数据都掌握在自己手中,依然是google的一贯风格,而广大消费者,面对着这高速的服务,基本上无间隔就会post到twitter上的高效,都会忍不住转到feedburner来。这也许是大家双赢的结局。而最终悲惨出局的,还是twitterfeed和rss2twitter等这些小型服务提供商。。
Tags: feedburner,Google,pubsubhubbub,Rss2twitter,short url,Social,Twitter,Twitterfead,web analysis.
论文出处: http://netdb09.cis.upenn.edu/netdb09papers/netdb09-final3.pdf
The abstract:
Online Social Networks (OSN) face serious scalability challenges due to their rapid growth and popularity. To address this issue we present a novel approach to scale up OSN called One Hop Replication (OHR). Our system combines partitioning and replication in a middleware to transparently scale up a centralized OSN design, and therefore, avoid the OSN application to undergo the costly transition to a fully distributed system to meet its scalability needs.
OHR exploits some of the structural characteristics of Social Networks: 1) most of the information is one-hop away, and 2) the topology of the network of connections among people displays a strong community structure. We evaluate our system and its potential benefits and overheads using data from real OSNs: Twitter and Orkut. We show that OHR has the potential to provide out-of-the-box transparent scalability while maintaining the replication overhead costs in check.
论文中这个图,做的很直观,很清晰的给出了传统的DB和目前流行的分散DB的区别..
The OHR system is composed of two components: the controller and the middleware.
基本上就是这2个东西起了作用,不过什么时候这个controller能够更加人工智能就好了.具体太细节的东西,文章也没说多少。
分析结果就是拿了2个data-sets来分析的,twitter和orkut的数据
……………………
最终实验平台,好像是在Amazon的EC2上进行的,在韩国这边不是太了解这个EC2,感觉应该是在美国非常的流行了。之前有看到EC2针对教育行业有个discount的消息,其实这个实验在EC2上能够顺利的进行的话,也就不用自己再单独购买机器了。这也是cloud computing的优势之一……
^^^^^^^^^^^^^
最后再推荐一个ppt
http://www.cs.cornell.edu/projects/ladis2009/talks/dean-keynote-ladis2009.pdf
Jeff Dean的又一篇ppt长达73页,可以看到google在达拉斯的machine farm均当30个机柜的存储能力
Tags: cloud computing,Google,Jeff Dean,Networks,Online,OSN,Paper,Scaling,Social.