Ⅰ 「社交网络分析」是门怎样的学科
我们知道每个用户的活动时间序列,知道用户之间的联系,但显然不能简单地认为谁粉丝多谁就值钱,因为有些人粉丝质量高。那最简单的办法就是咱们来个page rank,至少我能知道谁相对谁更值钱。这样我至少能在一定程度上量化影响力了,然后再根据其他的feature做一些调整。
但这个方法还是有问题。因为pagerank没有考虑时间序列。影响力估计的不准。那再进一步,做一个generative model,每个user都以一定的概率(可以简单的时变)观看,转发,点赞他们关注的人的post,为了减少参数,再引入一些隐含变量声明用户分多少多少类。做一个agent based model。然后把这个model 放进data 里面,做参数估计。最后user的粉丝的点赞的期望,可能可以作为影响力的量化。