『壹』 數據挖掘類的國際頂尖會議有哪些
頂級:SIGKDD
二流:ICDM,SDM ,EDBT等
上面是專門的數據挖掘會議,其他像SIGMOD,VLDB,ICDE等資料庫類會議都會有專門的數據挖掘session ,下面是有人專門總結的,引用一下:
一流的:資料庫三大頂級會議SIGMOD,VLDB,ICDE,數據挖掘KDD,實際相關的還有機器學習ICML,還有信息檢索的SIGIR;資料庫的理論會議PODS,但它是理論的會議所以和咱們就不大相關了
二流的:EDBT,ICDT,CIKM,SDM,ICDM,PKDD,還有ECML歐洲的機器學習會議(這個應該是1.5檔的,比一般的二流好)
SIGMOD:97分,資料庫的最高會議,涉及范圍廣泛,稍偏應用(因為理論文章有PODS)。沒說的,景仰如滔滔江水。這個會議不僅是double-blind review,而且有rebuttal procere,可謂獨樹一幟,與眾不同。
VLDB:95分,非常好的資料庫會議。與SIGMOD類似,涉及范圍廣泛,稍偏應用。
從文章的質量來說,SIGMOD和VLDB難分伯仲,沒有說誰比誰更高。他們的范圍也幾乎一樣。
不少牛人都認為,今年的rebuttal procere其實並不怎麼成功。投稿太多,很難做到每一
篇都公平公正。很多rebuttal沒人看。
double-blind是把雙刃劍。這幾年來每年都有人冒充牛人的風格來投稿,有的還真進去了。
反而VLDB的審稿質量一直很高。每年的VLDB都有很理論的paper。
一般來說,我感覺大家還是認為SIGMOD要好那麼一點點。根據我個人讀過的文章,也有這樣的感覺。不過這個並不重要了,有差別也是那麼一點。
PODS:95分。是「資料庫理論的最好會議,也是一個很好的理論會議」。每年總是co-located with SIGMOD。感覺其中演算法背景的人佔主流(你可以數數PODS文章中有多少來自Motwani group),也有一部分AI背景的人(畢竟SIGART也是主辦者之一)。它的影響力遠不及SIGMOD,然而其中文章的質量比較整齊,variance小於SIGMOD(以及其他任何資料庫會議)。有一位牛人說:「PODS never had a really bad paper,」這是它值得驕傲的地方。
KDD::full paper 95分,poster/short paper 90分。數據挖掘的最高會議。由於歷史積累不足以及領域圈子較小,勿用諱言KDD目前比SIGMOD尚有所不如。我覺得我們可以這樣類比:KDD:SIGMOD=CRYPTO:STOC。回顧密碼學的歷史,真正最牛的文章一般發在STOC/FOCS而非C
RYPTO/EUROCRYPT,這和今天的數據挖掘何等類似!然而你看看今天的密碼學文章,已經有頂級的密碼學家(恕我不便寫出名字)不再往STOC/FOCS投稿。我覺得同樣的事情在不久的將來也會發生在數據挖掘中,讓我們拭目以待。
這幾年來KDD的質量都很高。其full paper的質量高於SIGMOD/VLDB中數據挖掘方面的paper的質量。原因是SIGMOD/VLDB審稿人中數據挖掘的人很少,審稿標准不一定能掌握得很好。
這幾年好幾篇SIGMOD/VLDB的數據挖掘paper都follow一些KDD的paper。而在KDD,要拿一篇full paper真難。去年復旦拿了一篇,實屬難能可貴。今年他們又拿了一個SIGMOD demo,說明工作的確很扎實。
聽說在很多地方,如果能有一篇SIGMOD/VLDB/KDD,就能博士畢業,能有兩篇就能找到不錯的工作。「革命尚未成功,同志仍需努力!」
ICDE:92分。很好的資料庫會議,也是一個大雜燴。好處是覆蓋面廣、包容性強,壞處是文章水平參差不齊。
EDBT:88分,不錯的資料庫會議,錄取率很低然而歷史積累不足,影響還明顯不及ICDE。
ICDT:88分,PODS的歐洲版,資料庫理論第二會議。
和SIGMOD/VLDB一樣,ICDE和EDBT在質量和影響上都不相上下。
其它的如CIKM,ICDM,SDM,SSDBM,PKDD等等都比以上的會議差一截。
CIKM:85分。
SDM:full paper 90分,poster/short paper 85分。SIAM的數據挖掘會議,與ICDM並列為數據挖掘領域的第二位,比KDD有明顯差距。好像其中統計背景的人比較多,也有一部分機器學習背景的人,比較iversified。
ICDM:full paper 90分,poster/short paper 85分。IEEE的數據挖掘會議,與SDM並列為數據挖掘領域的第二位,比KDD有明顯差距。
PKDD:83分(因為poster/short paper數量很少,所以不予區分)。好像是KDD的歐洲版,但與KDD差距很大。