① MSRA副院長周明認為中國NLP如何躋身世界頂尖水平
近期中國計算機學會(CCF)舉辦的第六屆自然語言處理及中文計算大會(NLPCC 2017)在大連成功舉辦。作為國內NLP 領域首個面向國際的大會,NLPCC 無論從會議的形式、參會的人數、還是報告的質量,都展現出了一副朝氣蓬勃的氣象,欲有引領中國NLP 走向國際之勢。
為深入了解中國當前NLP 的發展狀況及前景、CCF 在NLP 方向的努力,以及NLPCC 會議的發展情況,雷鋒網對CCF 中文信息技術專委會主任、微軟亞洲研究院副院長周明(同時他也是中國中文信息學會(CIPS)的常務理事和國際計算語言學會ACL 的候任主席)和CCF 中文信息技術專委會秘書長、北京大學趙東岩教授(雷鋒網將隨後報道)進行了專訪。
雷鋒網註:AI 科技評論公眾號(ID:aitechtalk)某篇代表性的AI 文章的閱讀分布,西部地區常常呈兩位數(甚至個位數)的狀態。這某種程度上也反映了國內AI 工作者的分布情況。
第三,拔尖人才的吸引和培養。首先,吸引國際拔尖人才到中國來,通過回國參加會議或者合作,了解中國的發展現狀,加強和國內高校和企業的交流,最終希望能有一部分人才被國內的發展機會吸引從而留下來。另外更加重要的是,通過學校的學位培養模式,同時利用公司的實習渠道,來培養更多具備扎實的理論基礎和實戰經驗的優秀人才,甚至高水平的領軍人才。
第四,促進我們中國的研究走向國際化。包括CCF 辦的NLPCC。過去幾年都是在中國舉辦,未來我們也會考慮到新加坡、日本、韓國,甚至美國去開會,把我們中國原生的研究帶到全世界去,尤其是要引領在國際中文計算領域的潮流。
第五,加強創新。包括1)理論創新。例如發展無監督的機器學習演算法,利用上下文和用戶畫像來增強NLP 任務建模,綜合知識和數據來提升NLP 系統的能力等等;2)開辟學科交叉的新領域,比如NLP 和圖像和視頻的交叉。還有深入研究NLP 在重要的垂直領域的廣泛應用;3)產品創新,通過軟硬體結合,結合具體場景,提升用戶體驗。
第六,要注重數據和工具共享,注重評測。CCF 以及我們的中文計算專委會目前已經專門成立了數據工作組,把數據分享給大家來使用,做訓練、做評測等。比如NLPCC2017 所組織的詞彙語音關系識別、短文本分類、單文檔文摘、問答和用戶畫像吸引了很多學校和公司參加。
第七,促進產學研大協作。通過CCF 以及其他一些平台,吸引工業界的人士加入到我們的研究過程中,通過各種合作來促進公司的產業發展,也同時促進高校的學術發展。
最後,就是中國要考慮在國際會議和組織中發揮更大的影響力。包括多組織和承辦國際一流會議,多爭取擔任國際一流學會的執委會委員、大會主席,程序委員會主席和領域主席,把中國的影響力更多地發揮出來。
需要指出的是,雖然中國NLP 發展勢頭良好,但是我們還面臨很多困難。需要政府、學校、科研機構、公司、有關學會還有社會各界人士繼續努力。尤其是加強理論創新、探索學科交叉和垂直領域的新機會,才能逐步從跟隨者到引領著過渡。我相信,如果所有這些措施都能夠很好地落實,下一步中國的NLP 一定會穩步地向更高的目標發展,最終一定會躋身於世界NLP 的頂尖水平。