• 微博那点事(1)


    最近一直在做新浪微博的项目,主要是:微博爬取,微博热点预测,突发事件检测等工作。这里不谈微博分析的技术知识,从业务产品角度,说下对新浪微博的个人观点吧。

    Twitter是首家成功的社交及微博客网站,于2006年上线。饭否是中国大陆地区第一家提供微博服务的网站,可谓是微博鼻祖,于2007年正式退出,这里看出王兴的“抄袭”功底,从facebook能创建校内网,从groupon能创建美团网,从Twitter能创建饭否,王兴的眼见很广、商业敏感度敏锐,着实令人佩服。中国互联网原创的确实很少,抄袭不是错,关键是有多少企业抄袭都不会,会抄的还不一定能抄好…2009年上半年,饭否的用户数从年初的30万左右激增到了百万。此后便引起了有关部分的注意,网站被迫关闭,2010年末再次开饭。新浪网于2009年7月开始着手新浪微博的创建,由于言论的自由,信息丰富的特征迅速成为中国第一大微博客,目前用户过6亿,每天微博发布量过1亿(转发为主)。可以说新浪微博的高速发展赶上了饭否关闭的绝佳机遇,后续网易、腾讯开始涉及微博领域,不得不说,微博在一定程度上改变了我们的生活(当然它本可以改变的更多)。

    PS:饭否被称为Twitter在中国的唯一精神继承者,我感觉除了名字差点,用户体验都非常好,如果新浪微博按照饭否的思路发展,今天的微博会真正地影响我们交流方式、改变信息的传播途径。微博只是在一定程度上增加了信息的丰富的、促进了消息流通,但你怎么看,它就是一个改版的BBS,大V、名人认证这些后期的改进进一步把它带向了论坛的深渊。新浪在很大程度上把做博客的思路运用到了微博上。

    1、新浪微博无法查看完整关注、粉丝列表的真相

    如果你尝试查看某个用户10页以后的粉丝列表,现在你会看到:

    image

    这是新浪2013年7月左右新添加的限制。真相是:别人(关注你的、与你互粉的、你单向关注的、单向关注你的、与你互不关注的,只要不是你自己)的粉丝列表都只能看前10页。而别人的关注列表,只要未关注你的用户(包括与你互不关注的,你单向关注的),查看关注列表就只能查看前10页;关注你的(包括与你互粉的,单向关注你的),你才能查看其完整列表。

    这里的原因应该是数据保护。信息时代,大数据就意味着机遇、意味着人民币,微博作为社交媒体,最显然的数据就是人与人之间的关系,有了人与人的关系,就可以做好友系统推荐(你的好友做了什么?买了什么?关注了什么?),这种关系是新浪辛辛苦苦发展得到的,它不希望这一手信息被别人用爬虫爬了去,所以加密了。虽然现在基于这部分数据,新浪可能刚开始挣钱,但无论怎样,从商业战略角度,新浪这样做是预料之中的。开放10页应该也是折中考虑了用户需求了。

    目前,我们的爬虫不能获得用户完整的关注列表和粉丝列表。未来这种限制可能会更多。与关注、粉丝列表相似的就是:转发列表和评论列表以及用户历史微博列表(所有微博)

    (1)先看历史微博

    目前新浪还是全部开放的,以李开复为例,我们可以查看他以前发布的所有公开微博。最早是2009-8-27 15:11

    clipboard[15]

    我们可以查看用户所有的公开微博(1~314页),而不是最近的10页。这维护了新浪微博社交性,我可以了解某用户(感兴趣的人)的任何时间的信息。商业价值:可能基于这些数据研究用户的心情(乐观词汇)曲线、发微博的时间分布、总体数据量变化等。目前主要是研究价值,商业价值还不是很显著。

    (2)转发列表

    转发列表记录了谁在什么时间转发了这条微博以及各个用户的微博被转发的总数。目前主要用这部分数据研究微博对应事件事件的发展趋势,比如热门微博榜、实验室研究等。这部分数据一般还要和其他数据(粉丝信息、粉丝数、微博内容等)结合起来进行合理的预测,用这部分数据衍生了热门微博榜这样的功能,但这些数据主要还是用于实验室的舆情研究,商业价值还未挖掘。商业价值:根据这部分数据,提供事件的预测,给用户推送预热点事件(热门微博的升级版)等

    clipboard[17]

    (3)评论列表

    评论列表的目的主要是增加微博的社交性,大家一起来讨论某件事。而且评论内容良莠不齐,大多是“呵呵”,内容比较乱,商业和科研价值目前都不明朗。可参见“微博那点事(2):评论对微博重要吗?

    clipboard[19]

    其实,微博内容才是用户最关心的东西,用户群才是新浪最核心的东西。目前新浪限制的功能都不会严重损害媒体的社交性,不会竭泽而渔的。

  • 相关阅读:
    peudoclass与pseudo的相同点与不同点
    第一个页面
    自我介绍
    Virtual IP Address 学习记录
    OpenStack 学习记录
    Dubbo学习记录 MAC
    售前 银行
    log4j2 学习记录 Pattern Layout
    Zookeeper学习记录 mac下安装部署
    P2695 骑士的工作
  • 原文地址:https://www.cnblogs.com/houkai/p/3461809.html
Copyright © 2020-2023  润新知