① MSRA副院长周明认为中国NLP如何跻身世界顶尖水平
近期中国计算机学会(CCF)举办的第六届自然语言处理及中文计算大会(NLPCC 2017)在大连成功举办。作为国内NLP 领域首个面向国际的大会,NLPCC 无论从会议的形式、参会的人数、还是报告的质量,都展现出了一副朝气蓬勃的气象,欲有引领中国NLP 走向国际之势。
为深入了解中国当前NLP 的发展状况及前景、CCF 在NLP 方向的努力,以及NLPCC 会议的发展情况,雷锋网对CCF 中文信息技术专委会主任、微软亚洲研究院副院长周明(同时他也是中国中文信息学会(CIPS)的常务理事和国际计算语言学会ACL 的候任主席)和CCF 中文信息技术专委会秘书长、北京大学赵东岩教授(雷锋网将随后报道)进行了专访。
雷锋网注:AI 科技评论公众号(ID:aitechtalk)某篇代表性的AI 文章的阅读分布,西部地区常常呈两位数(甚至个位数)的状态。这某种程度上也反映了国内AI 工作者的分布情况。
第三,拔尖人才的吸引和培养。首先,吸引国际拔尖人才到中国来,通过回国参加会议或者合作,了解中国的发展现状,加强和国内高校和企业的交流,最终希望能有一部分人才被国内的发展机会吸引从而留下来。另外更加重要的是,通过学校的学位培养模式,同时利用公司的实习渠道,来培养更多具备扎实的理论基础和实战经验的优秀人才,甚至高水平的领军人才。
第四,促进我们中国的研究走向国际化。包括CCF 办的NLPCC。过去几年都是在中国举办,未来我们也会考虑到新加坡、日本、韩国,甚至美国去开会,把我们中国原生的研究带到全世界去,尤其是要引领在国际中文计算领域的潮流。
第五,加强创新。包括1)理论创新。例如发展无监督的机器学习算法,利用上下文和用户画像来增强NLP 任务建模,综合知识和数据来提升NLP 系统的能力等等;2)开辟学科交叉的新领域,比如NLP 和图像和视频的交叉。还有深入研究NLP 在重要的垂直领域的广泛应用;3)产品创新,通过软硬件结合,结合具体场景,提升用户体验。
第六,要注重数据和工具共享,注重评测。CCF 以及我们的中文计算专委会目前已经专门成立了数据工作组,把数据分享给大家来使用,做训练、做评测等。比如NLPCC2017 所组织的词汇语音关系识别、短文本分类、单文档文摘、问答和用户画像吸引了很多学校和公司参加。
第七,促进产学研大协作。通过CCF 以及其他一些平台,吸引工业界的人士加入到我们的研究过程中,通过各种合作来促进公司的产业发展,也同时促进高校的学术发展。
最后,就是中国要考虑在国际会议和组织中发挥更大的影响力。包括多组织和承办国际一流会议,多争取担任国际一流学会的执委会委员、大会主席,程序委员会主席和领域主席,把中国的影响力更多地发挥出来。
需要指出的是,虽然中国NLP 发展势头良好,但是我们还面临很多困难。需要政府、学校、科研机构、公司、有关学会还有社会各界人士继续努力。尤其是加强理论创新、探索学科交叉和垂直领域的新机会,才能逐步从跟随者到引领着过渡。我相信,如果所有这些措施都能够很好地落实,下一步中国的NLP 一定会稳步地向更高的目标发展,最终一定会跻身于世界NLP 的顶尖水平。