搜搜脱离Google技术整装待发?
最近一段时间似乎一直是百度大抢风头,又是百度日文正式版,又是进军C2C,现在还打起了IM软件的主意。但是互联网另一巨头腾讯却一直悄无声息,除了珊瑚虫那个官司让人还记得腾讯的存在之外,不知道腾讯在不声不响的做什么事情。不过也正好符合了老马的性格,低调稳重。
前面的是一堆屁话,接下来才是正题。不知道SEO同仁有没有发现一个现象。我最近观察weblog,发现了一个新的spider异常活跃,叫做Sosospider,从它的命名规则上来看,立即想到应该是腾讯soso的spider。日志上是这样写的:
124.115.0.19 - - [15/Mar/2008:00:31:14 -0700] “GET /seo-tech/baidu-utf8-url.html HTTP/1.1″ 200 7379 “http://www.starow.net/seo-tech/baidu-utf8-url.html” “Sosospider+(+http://help.soso.com/webspider.htm)”
124.115.0.19 - - [15/Mar/2008:00:31:20 -0700] “GET /wp-content/plugins/coolcode/coolcode.js HTTP/1.1″ 200 586 “http://www.starow.net/wp-content/plugins/coolcode/coolcode.js” “Sosospider+(+http://help.soso.com/webspider.htm)”
124.115.0.27 - - [15/Mar/2008:00:31:21 -0700] “GET /wp-content/themes/grid_focus_public/style.css HTTP/1.1″ 200 7920 “http://www.starow.net/wp-content/themes/grid_focus_public/style.css” “Sosospider+(+http://help.soso.com/webspider.htm)”
这是三段最有意思的日志,从这上面看Sosospider不仅是爬网页,而且连js、css也顺便都爬了。观察3月15号的log,做了一下几个搜索引擎来爬的次数对比:
Baiduspider:5692次。Googlebot:118次。yahoo:685次。YodaoBot:301次。Sogou web spider:49次。Sosospider:2772次。
从爬网页的次数上来说,Sosospider仅仅次于百度,排在第二位。而我的博客页面总数也就不超过300页。可见Sosospider不可谓不疯狂。
目前腾讯的搜搜使用的google的技术,所以一直没见腾讯有特别大的动作去推广,但是搜搜目前的市场占有率可是跟雅虎差不多级别的。如果我没记错 的话,腾讯搜搜与google之间的合作似乎是今年结束。相信腾讯早已投入了大量的人力物力去做自己的搜索技术研发,从Sosospider的疯狂抓取频 率上来说,soso已经开始在大规模的往数据中心里充实内容了。
我们再来看去年还没有的soso相关帮助页,一个是关于sosospider介绍的:
http://help.soso.com/webspider.shtml
或者
http://help.soso.com/webspider.htm
还有一个值得关注的是,soso的站长指南已经比较详细了,充实了一些关于sosospider以及抓取相关的解答信息:
http://service.qq.com/cate/soso
看来腾讯搜搜抛弃google自己自立门户的时间应该不远了,百度推出IM软件进入即时通信,腾讯绝对会向搜索市场强力出击,今后的互联网格局又多了一个看点和变数,想必两位互联网巨头一定会带来精彩刺激的对攻战。期待早日见到腾讯搜搜自己搜索技术的庐山真面目:)











