海量数据如何挖掘长尾

以下是我阅读《长尾理论2.0》后的读书笔记,这本书给我很大启发。原来以为海量数据就是把数据弄得足够多,现在才知道,仅仅数据多还不足以形成长尾,还要有好的数据挖掘机制,将热门之外的内容展现出来,满足用户的不足需要,这才叫长尾。数据仅仅是呆在数据库中,展示的机会少之又少,这不叫长尾。根据这个思路,我总结了海量数据网站可以用的挖掘长尾的方法,备忘如下:

1 搜索

搜索仍然是最主要的方式,高级搜索要配合各种过滤器和排序。

2 同类内容

同主分类;同子分类

3 同作者内容

4 同出版社/厂商内容

5 相关内容(按关键字搜索)

6 将出现最多的内容关键字给出推荐列表,方便搜索

7 将最常搜索的内容关键字给出推荐列表,方便搜索

8 各种排行榜

按周期:总、年、月、周排行榜;按类型:价格排行榜、关注度(浏览)排行榜、评论排行昂、评价排行榜

9 最新动作:

最新更新的内容、刚刚发表的评论、刚刚注册的用户

10 随机推荐(随便转转)

11 分类列表:这是最常规的一种列表

12 上一篇、下一篇

13 各种专题分区(特价区、限时抢购区、一折区、5元以下区、双倍积分区)

14 结合热门事件的专题区(韩寒方舟子专区)

15 用户数据挖掘

某用户评论、某用户评论过的商品

16 RSS输出最新内容、按栏目输出

17 猜你喜欢

通过用户访问记录、关注的好友、兴趣爱好、评论等等信息,通过复杂算法,猜用户可能会喜欢的内容,难度较大

18 作者或者题目按照首字母A-Z索引

 评论
  这些好像都见过,就是没做到

  很强大,买本来看看。http://www.guisay.com

  不错,总结的很全!!就是通过不同的方法把数据展现出来,而不是放着数据库里! 还可以理解为 让搜索引擎收录更多的内容数据。

  不错
 发表评论
姓   名: