Ⅰ 「社交網路分析」是門怎樣的學科
我們知道每個用戶的活動時間序列,知道用戶之間的聯系,但顯然不能簡單地認為誰粉絲多誰就值錢,因為有些人粉絲質量高。那最簡單的辦法就是咱們來個page rank,至少我能知道誰相對誰更值錢。這樣我至少能在一定程度上量化影響力了,然後再根據其他的feature做一些調整。
但這個方法還是有問題。因為pagerank沒有考慮時間序列。影響力估計的不準。那再進一步,做一個generative model,每個user都以一定的概率(可以簡單的時變)觀看,轉發,點贊他們關注的人的post,為了減少參數,再引入一些隱含變數聲明用戶分多少多少類。做一個agent based model。然後把這個model 放進data 裡面,做參數估計。最後user的粉絲的點贊的期望,可能可以作為影響力的量化。