微博用户影响力分析

1)类PageRank算法

    PageRank算法核心在于一个假设,质量高的网页所指向的网页的质量必定也高。对于微博影响力同样有:影响力高的用户关注的用户的影响力必定也高。

    首先构建微博关系网,那么类PageRank算法如下:

    a)赋予所有用户相同的影响力权重。

    c)将每个用户的影响力权重按照其关注的人数等量分配。

    d)对每个用户来说,其影响力等于其粉丝分配给他的权重之和。

    e)第2步和第3步迭代,直到权重不再发生大的变化为止。


2)响应频率算法

    用户的影响力除了他的微博关系之外,还与用户的活跃度、微文的质量等有关。用户的活跃度可以使用其发表微博的频度来衡量,微文的质量用其被转发的数目、被回复的数目得到。这里,我们考虑用户之间的回复关系、转发关系、@关系:

影响力越高的用户回复的微博的影响力越高,从而使该微博主人的影响力变高。

影响力越高的用户转发的微博的影响力越高,从而使该微博原创作者的影响力变高。

影响力越高的用户倾向于在其微博中@影响力高的用户。

    构建转发网络、回复网络、@网络,借鉴PageRank算法,得到另外三种影响力结果。将它们与微博关系网的影响力结果进行(加权、或其他复杂方法)融合,就可以最终的影响力结果。


    找到话题对应的微文与用户之后,运行影响力计算算法,就可以得到该话题中影响力较大的用户了。这也是舆情监测、社会热点监控的一个方面。

    对于标签传播算法得到的结果,对同一标签下的用户运行影响力计算算法,可以得到该标签下的影响力排名,即 领域内影响力排名




参考:

http://blog.csdn.net/stdcoutzyx/article/details/18814627

你可能感兴趣的:(机器学习——文本挖掘)