无觅网:将“搜索”变成“发现”

来源:岁月联盟 编辑:猪头三 时间:2011-01-02

  今天是2011年的第一天,也把我的第一篇文章写给无觅网(www.wumii.com),大部分人知道无觅网可能是因为它的相关文章插件,这个插件很受独立博客主的欢迎,不仅可以解决显示相关文章的问题,与其它相比,它有很多优越性,比如说以缩略图显示,文章相关度高,装了插件之后,会把自己博客上的文章分享到无觅网上,从而获得流量。

  或许是因为插件的流行而忽略了无觅网最大的特色,那就是个性化推荐功能,它能自动推荐你感兴趣的文章,用一句浅显易懂的话来说,只要你打开无觅网,不用你输入,就知道你想要看什么,并且时时推荐更多惊喜给你。当然,这个前提是你使用无觅网,并且时间越长推荐的越准。

  你上网时是不是会遇到以下问题:

  (1)你可以通过百度或谷歌搜索到你想要的信息,如果你问一个问题,却不知道如何描述呢?

  (2)你订阅了很多博客,那是不是你对它的每篇文章都感兴趣呢?

  (3)互联网上不是有大量的重复信息?一篇文章被反复转载N次?

  (4)如果你用手机上网,是不是觉得输入很麻烦,找到你想要的信息也很麻烦?

  那么这些问题无觅网都可以帮你解决,而解决的方法就是利用合理的推荐机制,把“搜索变成发现”,搜索是你明确地知道自己要找什么东西时所做的事情,而发现是你并不明确地知道这些东西存在于什么地方,而让它们主动找到了你。这里有个推荐引擎的概念,推荐引擎利用特殊的信息过滤(IF,Information Filtering)技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣的用户。通常情况下,推荐引擎的实现是通过将用户的个人喜好与特定的参考特征进行比较,并试图预测用户对一些未评分项目的喜好程度。参考特征的选取可能是从项目本身的信息中提取的,或是基于用户所在的社会或社团环境。

  推荐引擎的用很广,无觅网现在主要做内容方面的推荐,像社会化推荐与分享应用在了很多方面,最早的莫过于电子商务网站上,当你购买一件东西以后,它又会推荐一些东西给你,产生再次消费,你推荐的越准,购买的可能性也就越大,如果我在淘宝上买件东西,或许我还想要另一件东西,只要你能猜得出来,呵呵。(我的博客:www.liuya.org)

  在无觅网不仅可以看,还可以评论,和同样喜欢这篇文章的参与读者讨论,在我最开始接触无觅网的时候,我就不太喜欢用“猜”这个功能,因为它猜不到我想看的东西,经常推荐些莫名其妙的文章给我,而现在,我能连续地点“猜”,说明经过努力,无觅网在推荐这方面取得了一定的成功,我看完一篇,然后点下“猜”,就这样,我有时可以点一个小时以上。把“喜欢”这个概念量化,比如说,你浏览的文章中多次出现“网络推广”这个词,这说明你喜欢它,你经常在这个页面上停留的时间越长,说明也你也是喜欢。

  无觅网推荐的内容来自哪里?

  先用相关文章插件打开无觅网的名气,并且利用插件,将单独的一个个网站,独立博客等连接起来,并且相互之间还可以进行流量交换,组成一个庞大的无觅网络,获取信息与内容,有了内容之后,就在此基础上进行个性化的推荐和社会化分享,并且无觅网能读取到新浪网,网易,腾讯等门户网站上的信息,有了足够的内容,才能做推荐。同时,在阅读推荐文章时,你可以点击“没兴趣”告诉它我不喜欢这篇文章,也可以点“喜欢”。当恰好推荐了你喜欢的文章时,你就会有一种满足和兴奋感,然后你就会想:“这正是我想看的。”

  无觅网是怎样推荐的?

  无觅网目前主要只是针对内容的推荐,严格的来说,它不能算是真正意义上的协同过滤,它有一个好处就是不需要算出用户的相似度,也没有冷开始和稀疏性问题,它可以从文本当中直接提取信息,不比一首歌,或是一种产品,它有一个关注的功能,你可以通过关注你的朋友来获取他们的推荐信息。个人感觉目前还存在一个发散型的问题,因为它总是推荐差不多一样的东西给我,虽然也是我感兴趣的,但希望在阅读的过程中,能突破一下,找到我隐藏的兴趣点。以下是无觅网主要的推荐方式:

  (1)分析用户的历史行为来推荐。

  (2)根据标签,关键字。这个比较常见。

  (3)根据相似用户,比如说,有相同爱好的朋友喜欢了这篇文章,他们推荐给我,我也可能喜欢。

  (4)随机,根据以前三种情况而产生的结合推荐。

  无觅网所面对的挑战:

  (1)搜索引擎的参与。无觅网在内容推荐方面目前在国内是做的比较出色的,但也是极有可能被超越的,当然,一般人是不大可能的,这不比做网站,它需要强大的技术支持,主要是国内主流的搜索引擎,还有就是在这方面比较出色的电子商务网站,因为它们存了我们很多资料,也有足够的数据,现在的互联网创意有很多,每一个都有成功的可能,也存在被淹没的可能。

  (2)技术上的突破。用户越多,积累的数据越多,分析起来就会越麻烦。处理百万级信息和亿级信息,估计不是同一个概念,虽然我不是搞技术的,推荐的精准度是决定无觅网成败与否的关键,我相信无觅网在发展中可能会遇到这些瓶颈。

  (3)服务器的压力。所有的计算都是放在服务端上运行的,当用户越来越多时,一个人点一下就是一次运行,再加上相关文章的计算,这个是非常恐怖的,另外,我这里说的不是他们没钱买服务器,而是数据运算。

  无觅网的团队:

  再说说无觅网的团队,他们是留美归来的创业团队,有很强的技术实力,有一种东西会自发的流行,比如Google打入中国市场的时候,根本没花多少心思在宣传上面,因为他们认为技术至上,只要开发出好的产品,它就会靠自身的口碑传播,无觅网的创始人林承仁经常活跃在网站上,认真的听取用户的意见,不断地对网站的功能和体验进行改善,这会让网站得到更好的发展,另外,无觅网的团队需要更多的优秀人士参与进来,对此项目有兴趣的,可以联系他们。

  无觅网在个性化推荐技术上还是需要依赖分析大量的数据,人工智能推荐还有很多的发展空间,我希望有一天,我告诉你我喜欢一本书的名字,你能够分析出我会喜欢什么颜色的衣服,呵呵,期待吧。我的QQ群:61221872,本文来自柳亚的博客:http://www.liuya.org/2011/01/01/964