导航:首页 > 网络数据 > 复旦大学大数据王鑫

复旦大学大数据王鑫

发布时间:2023-05-03 04:46:02

大数据时代,人类生活面临颠覆

大数据时代,人类生活面临颠覆

对于IT领域来说,最近有很多非常新的概念,比如云计算、物联网,当大家刚刚对这些概念开始有清晰的认知时,又一个全新概念出现了——大数据。什么是大数据?大数据概念究竟指向何方,大数据背后能怎样改变我们生活?会不会给我们的生活和工作带来困扰?

本报与第一财经头脑风暴节目合作探讨大数据时代下的问题。参与这次讨论的嘉宾有大数据概念的提出者、牛津大学教授维克托·迈尔·舍恩伯格,微软亚太研发集团、云计算操作系统首席架构师徐明强,上海市信息化专家、专业委员会专家、复旦大学计算机学院院长王晓阳,科尔尼管理咨询全球合伙人孙健,复旦大学现代哲学研究所所长俞吾金,启明创投合伙人童士豪,著名财经评论员石述思。

1 到底什么是大数据?

维克托:我认为它就是新黄金,我觉得是21世纪最主要的资源,这种资源对社会、企业、个人是否能成功,还是会受苦受难有着很重要的作用。解释一下,虽然此前我们都有数据,可把它们整理在一起然后分析是非常昂贵的,因此我们更多的注意力都放在了实体资源上,就是真正的黄金、金块,像劳动力这种资源。但只有最近我们才靠人的知识、创新来创造财富,更靠前一步,我们可以根据数据来进行,因为数据收集以及分析,成本上升的程度都已经改变了,然后我们的数据就可以达到一定规模。最后,大家所寻求的不管你是一个人、一个公司、一个组织,还是这个社会,无外乎就是这种所谓的新黄金。

为什么最近黄金的价值会跌得很厉害?因为老黄金不值钱了,没有新黄金有价值。

童士豪:我的观点有点类似,第一个是云,第二个是关系,第三个是未来。像刚才维克托先生提到的,因为云时代到了,储存的大量数据的成本非常低,所以能让大家去利用大数据做工作分析,最近由于很多事情的关系,有更多的关系被理解,所以能去预测未来状况。用自己的话说,就是在聆听上花很多时间,看了很多朋友,大家寻找工作机会也好或者是认识对工作有帮助的合作伙伴也好,在这么大的信息里,这么多人把他自己的信息放在上面,就是做了一件事,就是分析。如果你40岁想当创意公司的CEO,你现在20岁,未来20年该怎么规划?这就是非常有意思的一件事。

最后可能有不同的可能性,最后会不会给你找到一个最好的方法,那是自己决定的。可能性放在面前,是机会率最高的,怎么选还是个人决定,所以大数据并没有抹杀个人的意识。

石述思:大数据首先改变的是我们看待世界的方法,它会对这个时代的很多的价值观产生剧烈冲击。举例来说,因为过去我们东方人特别喜欢一个词叫因果,我们认为善有善报、恶有恶报,其实根据交管部门调查的数据,在街头遭遇横祸的人其实跟道德无关,秦桧的寿命是岳飞的两倍半,很多贪官在发现之前,那过的确实是令人无限羡慕的生活。因此,通过大数据我们能用一种全新的观念来看待这个世界,这个世界是有关联来建构的一个新型的关系,只有科技发展到一定水平,才能达到这样的高度。

与此同时,在大数据时代,我们该恪守的底线还是要恪守,但它的确在告诉我们真相,因为科学就是在告诉我们真相。我有一个愿望,就是刚才讲的大数据是新的黄金,我希望它更多地用于社会公益事业,比如,去挽救地震局。这样能避免很多人道主义的灾难和财产的损失,结论是我们过去认为上帝是哲学家或者叫哲人,现在发现他老人家是个老顽童。

2 大数据究竟有没有对各领域的工作和生活产生影响?

王晓阳:大数据影响了智慧。怎么理解呢?大数据本身的概念是数据采集和处理,到了一定的程度使我们的社会也好,管理者也好,都能获益——从城市来讲,一个管理者可以聚集这些数据和处理方式,使得我们能用智慧来管理城市,可以从交通管理、公共卫生,还有其他各个方面来管理,这管理是需要数据,数据产生了智慧,然后反过头来能管理我们的模式。

比如,在公共卫生方面,采集数据到了目前为止其实已经进行了好多年,它的数据采集原来并不是为了大数据来做的,其实是为了一个方便——方便大家去看病。而且你的电子病例等,让你看病更人性化,或者对医生来讲能更快、更方便地去熟悉病情,但在这种情况下,这个数据一旦采集起来使得我们对整个城市的健康状况就能进一步了解,所以,刚才讲的看病的数据其实是原本的用意,大数据一来其实我们就能看见原来看不见的问题。比如一些比较大趋势方面的问题,流行病在哪个地方比较多,或者它怎样流传的,等等。这些事情我们原来是看不到的,这种情况就是大数据对我们的帮助。

徐明强:先举个例子,有一个球和一只蚂蚁,球跟蚂蚁说,做三维世界的事物太好了,你看这条线上有多少个蚂蚁我一眼就看见了,蚂蚁说我真的不信,我得按照这条线爬,爬到头计数器没有出故障我才知道有多少蚂蚁。这能看到三维和二维差了一维,就差了这么大,所以大数据首先它不是数据大,不是同样的数据多了就变成大数据,而是在原有的二维、原有的数据库基础上,再建立一维,给它一个全新的看点。举例说明,你如果在美国,你是欠了债的,除了债主对你感兴趣,还有人会对你感兴趣——如果你欠了债,突然你可以还债了,那么银行会对你感兴趣。在11年前,美国资本一号就发明了一种大数据的应用,它可以找到哪些人是欠了银行的钱、欠了信用卡的钱,然后它就会观察你的消费数据,当它发现你可以开始还的时候,他立刻把你再买过来,从此以后他就吃上了你的利息。资本一号这个公司在2001年时,每个季度的增长率是20%,就是因为它大数据的程序,它可以高命中率地发现这个,它是从哪里找来的数据呢?从沃尔玛、从各种各样的消费数据中找到的。从这个实例我们可以看出,大数据这个原有的数据分析商务智能上加了一层,商务智能不能告诉我们别人将要并且能做什么。

关于我们公司对奥斯卡颁奖的预测,除了对李安的预测没对,其他都对了。其实,我们的预测是把所有人员都做了一个概率,所以做了19个预测对的,是我们放在第一概率的获奖人,下面还有4个是第二概率,所以李安导演我们放在第二概率,我们把他放在后面。

这个预测跟大数据很有关系,首先做大数据需要有IQ,智商,就是说,这个模型要非常好。我们公司做IQ的人叫加戴维·罗斯查尔德,是我们研究部门的一个人。还有其他人,我要讲讲,他这个人的IQ有什么差别?他这个人的IQ用了一个非常简单聚合的模式,除了IQ还有什么呢?智商以后还要有勤商,勤奋的勤。勤商就是说,他非常勤奋地去找数据,要找多种数据,还要找非常实际的数据,所以他在网上、社交网上都有找。有一些找不到的数据,怎么办?他找人做调查,然后找人来做,所以他又有智商,又有勤商,够不够呢?还不够,五年前这种事情做不到,为什么?五年前他要做这样大量的数据的话,自己作为一个研究生的小预算是做不到的,但云计算的出现,他就可以做到了。可以延伸这些数据,用很多处理器来处理,现在他就是用了云做这样一个计算,最后成功了。

孙健:我写的是机会加危险,就是危机。我同意维克托的结论,说这是一个新的金矿,或者有说法叫新的机会,但不要忘记那同时会带来很多危险。如果我们不能很好地去处理大数据的话,特别是像在我们日常工作中接触到的很多中国企业,它们大多数甚至在最基础的数据分析方面还比较落后,这就意味着,我们该怎样很快地过渡到大数据时代去,去面对大数据挑战,如果准备不好,那我很担心,这会像以往很多新技术来了以后的情况,很容易造成很多企业邯郸学步——连走路都还没学会,就要学跳,一下子迈到大数据时代,企业不知道怎样真正地让大数据发挥作用。

在我们的行业里,因为大数据而做了很多产品创新。谈到大数据时代的破坏型创新,实际上也是谈了同样的问题,因为在创新的同时,事实上要推导、颠覆原来的很多东西,包括我们咨询行业的很多服务和产品都要做更新,也要跟上时代。比如,我们有一家很大的全球性零售企业,它每天要处理海量数据,那么在海量数据之前,虽然有了技术手段,它仍需找到一个很好的切入点,去解决大数据该怎样应用到业务中,改变业务模式,给业务创新带来价值。因为要把这个大数据加以更好地利用,再便宜还是投资,还是要改变,硬件、软件各方面要做配置,甚至对应的组织要做调整,一个企业要做进一步调整才能适应大数据时代的需求,才能让大数据发挥作用。所以我们做的工作就是帮助企业找到它的价值创造,建立业务模式,来证明在这方面做这样的投资,让大数据发挥作用是值得的。

俞吾金:我想提出不同看法,就是因为人类的思维有一个特点,他把觉悟的东西夸大为全球的。比如你看到三只天鹅是白的,但其实有一千只天鹅都是白的,可在澳大利亚发现了一只黑天鹅,就把一切天鹅都是白的这个原理给推翻了,我觉得大数据这个问题是重要的,但如何正确看待它,不能走极端。大数据反映了人们从数量关系去理解生活的一种思维方法,从古代开始就非常重视,当然古代没有使用大数据这个概念。

数字本身对生活的重要性越来越大。从哲学上看,它有实践性,比如数学中的π,圆周率,它等于3.1415926……它就把所有大数据都囊括进去了,更容易理解的是三分之一,三分之一的另一种写法就是0.333333无限被延伸,所以黑客在逻辑学里就强调,这个无限包容在三分之一这个有限中,有限中包含着无限的一个展开,包含所有数据的展开,这就体现了实践精神。从这个实践角度看这个数据,我认为大数据在当代的变动中有重要地位,但看它要有眼光,不要夸大也不要缩小。

3 怎么理解三分之一就把一生所有数据都概括了?

维克托:我不同意俞老师的观点。数字的历史很悠久,但是,以前我们对这些数字的处理方式非常有限,光有技术是不够的,能对数据进行分析,比如像数字,它对你只是一个数字,这个意义不重要,你也可以用一个汉字或一个字母来表示,那从这个角度来看,大数据不过是一个很长很长的数字,你可以用心记住就可以。

但其实,大数据的价值在于,在整个数据的收集过程中,需要运用分析才可以了解。比如,如何进行预防性的维修,如何能够防止爆发等,我们不是把这个数字简单地记下来或背下来,而是要通过分析,通过数据统计的分析,通过把它进行整理了解之后分析,这不是你背下来一个数字就可以了,这是非常大的区别。

4 大数据时代究竟会给生活带来什么样的颠覆?

维克托:首先从商业来讲,我觉得有三个元素要记住:一个是在商业世界中决策将发生变化,会越来越清楚地证明,要靠数据说话。

在美国,最大的互联网公司大概是谷歌,每天都有30亿搜索请求。有一天他们屏幕上准备用蓝色,然后他们就选了一个特别的蓝色,但他是要测试41种不同的蓝色,来看到底哪一种最受欢迎。他本来想自己来决定:我是首席设计师啊,我就选了一种蓝色。但他的老板说:不行,我需要实证来告诉我们哪一种蓝色最受欢迎。但这个谷歌的首席设计师就辞职了,他说我是首席设计师啊,我是最清楚的。通过很多测试发现,有一种蓝色的蓝是裸眼看到和设计师选的蓝色不太区别得开,但另一种通过测试所产生的蓝色,更受欢迎,有更多点击量。通过实证做出来的决策更有效。类似例子有很多,都说我做这行已经几十年了,我说的肯定没错。这种传统的社会观念和思维方式会受到挑战,我们的决策必须要靠数据说话,这是第一点。

第二,就是在我们出去说话时,我们要注意不能误读数据,错误的数据是不行的。也就是如果原来的材料不对,原料是垃圾,出来的东西肯定也是垃圾,这个公司出这些数据的话都是比较容易理解的,但可能不是你应该熟悉的数据。

第三个是挑战。就是普通产业,尤其是计算机产业,数据会超越它们,这个可能是有一种挑战式的说法。如果没有足够的数据,你也赶不上一个大量数据的比较平庸的模型,也就是为什么说数据会超越那些产业。比如机器翻译这件事,在六七十年代,IBM花了很多钱想用机器翻译,它要弄一些语言的规则输入到机器中,但效果不太好,它就有了一个新想法,它不是把一种语言的语法规则输入机器,而是把加拿大议会中的英法双语的互译输进去,把成千上万的翻译资料输入进去,它就有了大量的累计组织上的数据库,这个效果就好得多。而谷歌又在这个领域有更多数据,一下子这个翻译就更成熟、效果更好。可以说,是这个数据使它超越了这个软件。因为今天这个大数据的力量,可以很容易地获得想要的资讯,但大概在十年前,需要五十万个服务器,大量的储存以及处理数据的模式,你才能开始一个新业务。今天如果要输入业务,用云计算来测试就可以了。比如有一个叫蒂塞德的公司,它有很多产品及价格,它收购一些数据来预测到底一个产品是上架还是下架,虽然他们拥有大量客户,可这个公司的员工只有13个人,因此它的服务器有很多,他们拥有大量的数据。可见,这个舞台不仅可以让大公司来做,而且创新的小公司也能以平等的地位来竞争。

王晓阳:其实讲到改变了我们整个思维方式,所谓的就是实验这个思维,比理论思维更重要,这一点我不是太懂。其实维克托先生刚才举的例子,是在很多情况下,是我们用数据去验证以前想要能够有的东西,有一些智慧确实是在数字里挖掘出来的,这个可能是一个语言来自不同的地方,怎么讲呢?基于在大数据的情况下,其实有一个所谓的循环概念,等于说你有了智慧以后去验证,验证数据里又产生了各种各样的智慧来做这样的理解,所以从这个角度来讲,我觉得是大数据的情况下面,没有颠覆,而是说一个改进,对我们认知世界的改进。就公共卫生这个话题来说,我们举的最多的一个例子就是在谷歌,有一个所谓的趋势预测,它就是用了网民们搜索的词来预测。

所谓的预测流感,怎么做?很简单,就是它去分析了以往的数据,说在流感发生的地域,地域的那个时间大家是用什么词去搜索,这样就可以做统计。做了统计以后,反过头来用这些搜索词来预测这个流感,这种情况下是什么意思?并不见得是说这种数据或大数据的情况就能使我们对这个流感突然有一个新的认识,其实不然,其实是谷歌的那些工程师们有一个想法,认为我们好像流行流感,这和大家有关,而每个人都会用搜索来获取一些跟流感有关的信息,就有了这样的关联。这个关联怎么去发现?这就要用数据去发现,用所谓的大数据的做法,去实现我们已有的一些概念的东西,把它实现了之后,就能做预测。所以从这样的角度讲,并不见得是有了大数据,我们就可以把所有的智慧都丢掉,我们不用IQ了,只要数据就好了,这肯定是不行的。一定是IQ加上数据,然后能让它有个正反的概念,这是大数据所应该干的事情。

童士豪:我有不同想法,我觉得刚才维克托先生讲的一点很有意思,就是对智慧的要求,大数据时代是不一样的。在大数据时代,对智慧的要求可以低一点,都能产生更好的结果,这是一个有意思的事情。他刚才提了一个例子,之前要做翻译是很难的,你的规则必须特别强、精简、完整,才能有60%、70%的准确率。但在大数据时代,我们不用想那些,不用花智慧讲那么复杂的规则和套路,干脆把几亿个已翻译好的文章交给电脑,用统计学的方式找到哪种情况下,翻译的字的另外一个意思是比较对的。这对于智慧的要求其实是降低了,但效果可能会更好。

孙健:可能我们对智慧的理解有歧义。我觉得维克托先生讲的我理解,因为他有另一本书叫《Delete》,里面专门讲了这个三重智慧,谈了取舍问题。因为随着存储技术、因特网的发展,他讲的更多的是知识,知识的要求可以低,但对智慧,我觉得理解不一样。我理解的智慧是,你判断一个事物的根本的、真正的洞察能力。就是,你对一个事物的洞察能力还是需要有,不会因为大数据的存在而削弱或不需要了,而恰恰因为大数据的存在才更需要洞察力。

5 大数据时代到底真正来临了吗?

王晓阳:大数据时代来不来临要看你怎么度量、衡量。现在这个数据的量和种类,以及采集的方式、手段,处理的手段,绝对已经达到了“前无古人,后无来者”的感觉。这个情况下,我们从这个数据采集以及数据处理这个能力方面来讲,我们的大数据时代来临了,但我们使用数据利用数据这个才是刚刚开始,只是刚起步。

而大数据改变我们生活的时代,还没有完全到来,但为这个我们已经做了很多准备,这是城市的管理问题。我们为大数据时代做了很多准备,比如在数据采集方面已经做了很多准备,怎么样利用这个数据来做我们这个智慧城市,这是一个最大的问题。

徐明强:从商业角度来看,我从运用上说,个人认为是来临了。举个例子,墨客这样一个药材公司,他可以根据天气性质,比如如果今天冬天特别冷,很多过敏性动物就会冬眠,四五月份突然转热时,花粉也开始多了,今年有很多人会过敏,等等,它就通过市场进行营销,把比如克敏能这种药材发布出去。

维克托·迈尔·舍恩伯格:美国总统奥巴马曾说,尽管政府也尝试,但他总是落后于企业,落后于社会的其他一些群体。所以说搞这种活动能充分激发数据,提供给大众,而且公司也可以拿这些数据,让公司能利用这些数据有更多创新。这是一个想法,也许有一些做法,比如商业方法,我认为能通过发挥企业的智慧,发挥像微软这样的一些聪明企业的智慧,还是有帮助的,包括和政府的合作来管好社会。

石述思:我有一个感受,当商业巨头面对屌丝谈大数据时,我们都有一种不寒而栗的感觉,因为尽管大数据时代我们每个人都是公平的,我们可以说小公司可以获得公平竞争待遇,但其实掌握大数据的都是一些巨头,他们有得天独厚的优势来抢我们钱包里的钱,我们很难,因为公司的定义就是在法律允许的范畴中唯利是图。但我们倒是渴望政府部门能利用大数据为我们提供普惠性的服务,可就像一些智慧城市没法真正做到智慧管理的案例一样,所以我对大数据来到中国的前途深表忧虑。还有,即使优秀的公司利用大数据,它也要面对一个现实,比如我们像电视台做广告的一样,为什么现在人依然很多,因为中国贫富差距特别大,如果你掌握了所有消费者的数据,而大多数在今天是无效数据,所以你还是有一个有选择的大数据的过程,叫有购买力的大数据,所以各种各样的问题就会出现在我们面前,就是社会本来是我们需要,但它存在很多幕后看不清楚的东西。我们担心被商业巨头利用,来完成对消费者进一步的盘剥。

孙健:我觉得从企业角度来看也是同样的问题。我前面想表达的意思就是,第一我们今天中国很多企业实际上并没有准备好迎接这个大数据,因为我们现在还停留在比较初级的基础数据分析时代,我们很多的基础数据今天都没有被运用,不要说大数据,就是小数据今天也没有很好的利用。还有很多假的数据,是因为对这些数据的输入管理非常不成熟,我自己在工作中接触很多企业,企业今天做的几件事大家都在做,有ERP系统,有数据库,有了数据就往里面存,但我发觉,有很多中国企业兑现的数据管理没有规范化的感觉,更没有很好的利用。这就存在这样的担心:最后大数据时代来了以后,我们本来中国企业在这个数据分析的利用上就不擅长,今天有了大数据以后差距会变得更大,以后国际巨头有一个成熟的数据分析方法,很多健全的商业模式,它会把这个差距变得越来越大。

6 在大数据时代,下一个预言会是什么,下一个判断会是什么?

维克托:接下来怎么能让生活比现在更高效,就是要让城市变得更加智能,这是可行的,为什么?我强调的是,我们有可能改善我们的公共卫生,改善教育,我们有能力收集数据,公共交通的通化能真正满足市民的需求,而不只是政客,而且能源消耗也会得到更好的检测、预测和管理,这样我们的城市就会更加智能,让城市的生活更加好。在150年前,曾有预测如果是在城市生活,寿命会更短;在农村生活则寿命长。而150年之后的今天,寿命更加长了,有了大数据我们会更加美好,可是有一个条件,就是那些决策者,他们一定要使用这些数字才可以。

下一步是专家怎么来做。其实这涉及到在数据时代,数据点是有限的,那么我们收集的数据,只要我们收集足够的数据来解决问题就可以了。因为非常复杂、数据点非常少,所以我们的数据点收集起来必须是要高质量的,现在不是这样的,现在的是更加的多、更加的乱。解释一下什么叫更多更乱,更多就是有数据点,关于我们想要研究的一个现象,我们可以更多的进行数据统计,比如在美国,你有DNA基因图谱,那么只要2000美金就可以知道你的整个基因图谱当中的30亿这个东西是怎么组成的,这样你就可以知道那些30亿个精对,现在如果说有一个基因组成可能会导致什么样的癌症,就可以查基因图谱,说我是不容易生这个病的,这是为什么可以预测是否患癌症的原因。那么有更多的数据便会存在一定的不准确性,所以,我说更多且更乱,所以这里允许一点点的不准确,或者可以乱一点,这个所谓的乱就是指,不是说每一个数据点都要达到最高的准确度,这个结果就是,不是百分之一百完美,但在大数据这样一种方向,或者说,我们在正确的数据点上要知道一个方向。知道方向比晚一点知道完美的数据更有效。比如交通预测,也许当下看到的交通预测比实际运用中要晚了20分钟,可能看起来太晚了,但如果这是预测一个星期的信息,就够了。

王晓阳:大数据时代对我们这个城市更加理解,所谓的理解就是你知道这个城市里发生了什么,这非常重要。在以前,这个城市的管理都是一拍脑袋,有的时候拍脑袋拍出很好的来,拍脑袋也能拍出非常棒的一个城市来,但是有的时候呢?拍脑袋可能太离谱,这种情况下在大数据时代我们怎么样利用好,就是我们所讲的。而为了政绩也可以用大数据来考虑,说这个数字到底对它的政绩有没有好处?就是名义是一个很大的方面,大数据方面不光是理解我们这个城市发生了什么,而且还能了解我们城市里的民众在想什么?这点对城市管理来说非常重要,城市不光是一个硬件设施,不光是地铁和高楼,人在里面非常重要。

以上是小编为大家分享的关于大数据时代,人类生活面临颠覆的相关内容,更多信息可以关注环球青藤分享更多干货

❷ 复旦大学有哪些教授的课是必须要去蹭的

计科狗答一波,首先推荐阚海斌老师的线性代数!(如果是文科生就算了吧。。。)

线性代数一般学校都有的课。如果想从事理工科方面的这门课是非常非常重要的!但由于这个课和高中脱节太大,矩阵的内容太抽象而复杂,很少有老师能够讲的深入浅出,大部分都是上的云里雾里的。但是!阚老师这个课讲得几乎没有半句废话,每当一个新定义出现的时候都会先做好充足铺垫,并且会给你讲一下你学的这个在计算机科学里以后有什么用,比如特征值在人脸识别数据降维里都有什么用,总之强烈推荐。

最后要说一句,学习知识的过程都是枯燥的,所谓的课程有趣也是需要你对老师讲的内容有一些自己的理解看法之后才能产生思想的碰撞,而如果是专业课的话老师一学期16节课基本上课本内容都是刚好讲完,所以还是需要私下对书本有了一定掌握之后再去蹭课啊~

❸ 如何看待复旦大学成立大数据学院和大数据研究院

这是现在的一个新趋势,
就是把计算机统计学科和传统的自然和社会科学结合起来一起研究。
之前传统的诸如计算物理计算化学计算生物,
其实跟主流计算机统计方面差的还是蛮远的。
当然具体这类研究最后会给传统学科带来什么还很难说。
所以这应该还是一个不错的尝试,
但真正的成效要看后面这个学院具体怎么建设怎么管理

❹ 基于大数据的视觉搜索应用与组织模式研究

基于大数据的视觉搜索应用与组织模式研究
当前视觉搜索已成为信息科学领域的前沿课题,主要用于分析和研究现实世界实体属性、行为、事件与视觉大数据资源之间的发展规律,针对视觉大数据资源的获取、组织、描述与利用问题,研究视觉资源及其时空关联信息之间的价值发现与资源整合的内在机理
当前视觉搜索已成为信息科学领域的前沿课题,主要用于分析和研究现实世界实体属性、行为、事件与视觉大数据资源之间的发展规律,针对视觉大数据资源的获取、组织、描述与利用问题,研究视觉资源及其时空关联信息之间的价值发现与资源整合的内在机理,解决其多维关联与协同融合问题,进而实现视觉大数据资源的有效整合、知识发现与实时交互。
基于此,本研究从宏观与中观角度,从信息科学视角下视觉搜索研究的起源着手,对其发展历程、概念与特点进行描述,围绕其理论与应用研究的几个关键问题展开讨论,并简要探讨其最新研究进展及应用。
1、大数据环境下视觉搜索的发展历程及特点
1.1 问题的提出
视觉搜索不是一个新名词,它最早出现于心理学与生理学领域,用于描述人们通过视觉通道在特定区域内检测某特定目标是否出现或出现后确定其位置的行为。如在地图上找某大学所处位置、在食堂内点菜、在书架上找书或在图书馆内找人等。在现实世界中,人们经常需要利用视觉搜索在复杂物理环境中获取有价值的信息,来决定接下来的语言和行为。因此,视觉搜索理论受到心理学家和人因(HumanFactors)学家的广泛关注,大量研究集中在对人类视觉认知、生理反馈机理的理解与表达上,并总结出了许多应用型和理论型知识。正是由于视觉搜索的可用性和有效性,使得许多工作、行业、领域都离不开这一生理行为。
相关基础理论和关键技术的不断发展与完善,促使传统视觉搜索应用不断向信息化、技术化和网络化方向发展,如何将传统视觉搜索行为转换成“所见即所知”式视觉搜索模式,这一难题逐渐摆在了人们面前。与此同时,网络环境、信息技术、计算性能、存储空间、数据规模与软硬件设施等方面的飞速提升,也为客观物理世界与虚拟网络空间之间建立起密不可分的关联关系,使视觉搜索技术的实现成为可能。人们可以方便快捷地采集客观物理世界中的视觉对象,从互联网中获取与之相关的关联信息。
1.2 视觉搜索发展历程及发展趋势
近几年来,随着大数据环境的逐步完善和大数据技术的迅速发展,关于视觉资源整合与视觉搜索研究的呼声越来越大。Nature和Science分别于2008年、2011年出版了大数据专题研究,提出图像、视频与用户交互信息是未来大数据的重要组成部分。2009年,Stanford University的Griod、Chandrasekhar等学者将视觉搜索理论引入到信息检索领域,提出Visual Search、Mobile Visual Search等概念,举办了第一届移动视觉搜索研讨会,并对其体系结构、应用与服务模式等问题进行了探讨。2010年,Google技术研究部前主管Norvig在Nature上发表的专题论文2020Visions中指出,“文本、图像和视频等视觉资源及用户交互信息、传感信息的有机融合,会给搜索引擎带来巨大挑战,如何对视觉搜索结果进行资源深度整合将会成为Google未来10年面临的最大挑战。”同年,北京大学高文、黄铁军与段凌宇等将其引入国内,举办了第二届移动视觉搜索研讨会,并围绕其关键技术、体系结构、视觉资源组织与描述方法、视觉资源标准化与视觉知识库建设等问题展开了研讨。2012年,这一理论与技术迅速被中国计算机学会所接受,认为将视觉搜索与增强现实技术相结合的信息检索模式,将是继搜索引擎之后的新一代互联网服务范式。随后,张兴旺、朱庆华等尝试将其引入数字图书馆领域,并围绕相关理论与应用模式展开了研究。
根据视觉搜索研究的发展轨迹来看,国内关于视觉搜索研究总体仍处于探索与尝试阶段,研究轨迹已基本跨过早期理论性尝试过程,正步入中期技术性和应用性探索阶段。尤其是在我国科学技术部于2011年启动国家重点基础研究发展计划(“973”计划)“面向公共安全的跨媒体计算理论与方法”,对跨媒体视觉资源的统一表示和建模方法、关联推理和深度挖掘、综合搜索和内容合成等关键科学问题进行研究之后,国内相关研究步入快速发展阶段。自2015年以来,视觉搜索理论与应用研究的重要性和必要性更加凸显,国务院2015年9月印发的《促进大数据发展行动纲要》提出,要充分利用大数据,提升领域数据资源的获取和利用能力,推动各类数据融合和资源整合。国务院2015年7月印发的《关于积极推进“互联网+”行动的指导意见》提出“构建包括语音、图像、视频、地图等数据的海量训练资源库,加强人工智能基础资源和公共服务等创新平台建设”。国家自然科学重大研究计划“大数据驱动的管理与决策研究”认为“大数据价值的产生机理和转换规律具有高度的应用领域依赖性”。科技部2016年发布的《关于发布国家重点研发计划精准医学研究等重点专项2016年度项目申报指南的通知》的“云计算和大数据重点专项”中更是明确将“面向大范围场景透彻感知的视觉大数据智能分析关键技术”列为重点研究内容之一,要求对视觉语义建模、视觉对象的时空定位与搜索、跨场景数据关联技术等展开研究。
1.3 视觉搜索研究对象及视觉大数据资源特点
视觉搜索的研究已逐渐发展成为信息检索领域的主要研究趋势,到目前为止,关于视觉搜索的定义尚未形成统一的认识,但从信息检索角度来看,大家对它的普遍理解是指将客观物理世界中的视觉资源作为检索对象,通过互联网去获取关联信息的一种信息检索方式。它是以视觉大数据资源及其关联信息为研究对象,以视觉大数据资源的获取、分析、组织、理解和表达方法为主要研究内容,以信息技术与方法为主要研究手段,以发现视觉大数据资源蕴含的知识价值和拓展其利用能力为主要研究目标的一种综合性的应用型前沿领域。它主要针对的是当前大数据环境下海量、多元异构、动态无序和高速进化的视觉资源的分析和利用问题,重点研究的是如何充分利用当前飞速发展的信息技术来解决视觉大数据资源的理解和表达,如何有效地实现视觉搜索,如何利用视觉搜索技术来从海量视觉大数据资源中发现新的知识。
毫无疑问,未来是一个智慧(或称之为“互联网+”)的时代。智慧地球、智慧城市、智慧图书馆等理论与应用的迅速发展,给视觉搜索理论与应用研究提供了“沃土”。“互联网+”时代所衍生的数据规模的剧增,文本、图像、音视频、用户交互信息与各种传感信息会成为“数据海洋”的主流,而这些数据来源中超过80%来自于人类视觉通道,现阶段把握“互联网+”时代信息检索和知识服务未来发展脉络的最重要手段可能是视觉搜索。
视觉大数据资源因其包含文本、图像、音视频与用户观看记录等复杂无序、动态变化的时空信息,使其成为数字图书馆中内容最丰富的信息载体,并将会成为“互联网+”时代最为重要的信息表达和信息传播媒介。而以视觉大数据资源为研究对象的视觉搜索,由于前者所处知识空间的知识实体与知识价值在时间、空间和属性三个方面的自有特性,使得视觉搜索也呈现出复杂无序、动态变化和时空语义关联等特性,同时也需要对视觉大数据资源的形式化表达、系统化组织、结构化描述与时空关联关系分析方法等进行研究。由此可得知视觉大数据资源主要具有以下特征:
视觉大数据资源包含文本、图像、视频、用户观看信息及用户交互信息等时空信息,并且它所包含的视觉对象、事物内容、事件过程在时间、空间、语义等方面具有时序或时空关联关系。
视觉大数据资源具有时空语义关联、动态变化、数据规模大和结构复杂等特点,这些基于视觉对象、事物内容、事件过程的动态变化可以用时空语义关联进行表达和描述,其获取、组织和描述过程可以用机器语言来进行表达,通过视觉对象、事物内容、事件过程之间的语义关联映射,建立视觉大数据资源的时空语义关联关系。
视觉大数据资源具有数据规模大、结构复杂、类型多元、多维尺度关联和纵深纬度高等特性,可根据视觉大数据资源的时空语义关系建立对应的尺度关联机制。针对不同尺度、纵深纬度的视觉大数据资源的时空关联关系,可实现视觉对象、事物内容、事件过程之间的多维尺度转换和重置,进而实现视觉大数据资源的语义关联关系分析。
视觉大数据资源能提供基于视觉资源内容来理解视觉对象行为,根据视觉对象的时空语义关联关系建立起发展趋势模型,并根据有效组织、理解和描述来预测某特定事物在某特定阶段将可能发生的行为态势。
可针对视觉大数据资源的获取、组织、理解和描述问题,来实现用户与视觉大数据资源之间的实时交互、反馈和视觉对象知识库的构建。根据视觉对象的相似行为特征、时空关联关系和实时交互结果,来帮助人们制作、生产、运营和消费新的视觉资源,满足数字图书馆用户的多元化知识服务需求。
2、大数据环境下视觉搜索的应用与组织模式
视觉大数据资源经过组织、分析、处理和整合,并建立基于特定领域的数字图书馆视觉搜索平台之后,才能为用户提供大数据知识服务。不同学科、领域的视觉搜索模式对视觉大数据资源的获取、组织、处理与整合模式会有所不同。正因如此,当前大部分应用是从知识服务与信息检索角度,建立起领域导向的视觉大数据资源整合平台,通过视觉搜索来对视觉大数据资源进行有效管理与利用,并按照特定学科、专业和领域的知识服务需求来提供服务,从而满足各类大数据知识服务需求。
2.1 基于深度学习的视觉搜索工业应用模式
传统视觉搜索研究主要是先采用人工标注方法对视觉资源的底层特征进行标注后,再采用机器学习方法来解决视觉资源之间的语义鸿沟、异构鸿沟与语义关联之间的问题。基于人工标注的视觉大数据资源整合与利用方法,需要标注者拥有丰富的专业领域知识和工业应用经验,需耗费大量的时间和人力成本,且精确性低。与对视觉资源特征进行人工标注方法不同的是,深度学习一般都是通过对视觉资源特征进行多层神经网络训练后,进行视觉特征学习,进而获取到特征提取更合理、区分性更强的视觉特征理解和描述。大量研究证明通过深度分析方法所提取到的视觉特征在图像分类与识别、视觉场景识别、智能监控、语音识别、知识图谱构建等应用领域都获得过成功。视觉资源的显著性特征提取和分割方法,能够采用模拟人类视觉系统和生理认知体系来提取视觉资源中显著性特征区域。目前,性能相对最好的视觉资源特征提取方法在公开的视觉大数据资源数据集中的显著性特征检测准确率在95%左右,视觉资源前景特征分割准确率将近92%,这一比例在近几年全球性各类大规模视觉资源分析与识别比赛中,仍然在不断增加。比如,Google研究组在大规模视觉识别挑战赛(ILSVRC)中,采用改进的深度卷积网络Google Net将图像识别准确率提升到93%;Google小组在微软图像标题生成挑战赛(MS COCO ICC)中,采用基于深度分析的图像特征提取方法获得冠军;悉尼科技大学与卡耐基梅隆大学、微软亚洲研究院和浙江大学在THUMOS比赛中,均将深度分析方法与视觉对象运动特征结合起来对视觉资源进行动作识别,分别获得前三名。
传统学术研究的理论成果往往需要很长一段时间发展,才能逐渐走向成熟,并进入到实际的工业应用中去。但无论是深度学习,还是视觉搜索,它们都拥有着极强的工程理论模型。一方面,它们在被学术界关注和研究的同时,也被工业领域所密切关注和尝试;另一方面,由于工业领域(如Google、网络、微软等)早就拥有着大规模的视觉大数据资源,且一直活跃在诸多信息科学领域的研究前沿,在很多领域,它们相较于学术界更有优势。如Google的知识图谱Knowledge Graph,Google Now与Google街景地图,微软的语音助手Cortana,爱奇艺的爱奇艺大脑,Facebook的Graph Search等均属于工业界视觉搜索较为经典的应用案例。事实上,国外工业界各大公司,如Google,Facebook,Microsoft等对视觉搜索不仅仅只是开展大量的研究,甚至还在内部成立了专门研究机构,国内的网络、华为、腾讯和阿里巴巴也不例外。
2.2 基于知识计算的视觉搜索知识服务模式
数字图书馆领域对视觉搜索理论与应用展开研究的一个重要目的,就是为高校和科研机构的研究人员提供嵌入式协作化的知识服务,而数字图书馆视觉搜索平台是将海量视觉大数据资源与平台提供的视觉大数据资源的组织、分析和处理功能嵌入到知识服务过程中。
视觉大数据资源整合与利用是当前国内外人工智能、信息检索领域的研究热点,拥有非常广泛的应用与研究前景。事实上,图像搜索作为视觉搜索的一个研究分支方向,近几年来,国内已有很多个人(如中国科学院高科、北京大学高文与黄铁军、南京大学朱庆华)、机构(如浙江大学、清华大学、北京大学、中国科学院计算所等)、企业(如爱奇艺、网络、腾讯、360、搜狗等)正在做与之相关的研究,并且很多已经推出了基于内容的图像搜索平台,为用户提供图像搜索服务。而美国的麻省理工学院、加州大学伯克利分校、伊利诺伊大学和英国的牛津大学等相关研究工作开始得更早,也研发出了相应的基于图像内容的图像搜索系统。
在以上所有相关研究中,它们都具有一个典型的研究特征:研究目的是为了解决视觉搜索的应用问题,而对应的视觉搜索模式大部分是基于知识计算。由于视觉搜索需要组织、分析和处理的对象主要包括文本、图像、视频等各类蕴含大量价值的视觉资源,因此,如何从视觉大数据资源中获取有价值的知识,就成为国外学术界和工业界一直以来的研究热点。以发掘视觉大数据资源中蕴含的丰富的、复杂关联的知识为目的的知识库称之为视觉对象知识库。目前,全球基于文本、图像、音视频等视觉资源的各类知识库有不少于60种,而基于这些视觉对象知识库的具体应用案例和系统平台也有几百种。其中,比较有代表性的应用案例有维基网络的DBpedia(2014版中包含8.7万部电影、12.3万张唱片、45万个物件等)、Google的知识图谱Knowledge Graph(包括地标、城市、人名、建筑、电影、艺术作品等5亿个搜索结果实体与350亿条关联知识条目)、Facebook的Graph Search(包含10亿名用户、2400亿张图像、10000亿次页面访问量等)等。
借助视觉搜索的相关理论与技术,开展对海量、异构、多元的视觉大数据资源的研究,不仅可丰富信息检索的外延和内涵,而且可以有效地解决当前数字图书馆所面临的“大数据、小知识、小服务”的瓶颈,具有一定的应用价值和现实意义。
2.3 基于语义分析的视觉内容关联组织模式
从已有研究来看,视觉搜索的研究对象大部分集中在文本与图像上,其中图像搜索是学者们着力解决的重点方向。视觉搜索研究可分为3个阶段:一是20世纪70年代末期开始的基于文本/元数据的图像搜索。这一方式主要通过人工标注元数据对图像进行描述,来实现对图像的信息检索功能,缺点是元数据标注费时费力,描述标准与反馈内容不完整,且容易有太多主观色彩。二是20世纪90年代开始提出基于视觉内容的图像搜索方法。这一方式其本质是采用人工构造图像底层视觉特征的方式来进行图像相似性比较,进而实现图像搜索,缺点是对图像底层特征和高层语义之间存在的语义鸿沟问题没有得到较好解决。三是21世纪初期提出的基于深度学习的图像搜索方法。社交网络与用户生成内容成为网络数据的主要来源,利用用户标签对图像语义进行组织、表达和理解成为研究主流,深度学习方法由此融入到相关领域。
与图像搜索相比,视频表达和分析则是视觉搜索领域相对较新的研究领域。视频由大量图像帧组成,且图像帧之间有较为紧密的时空与语义关联关系,这对视觉搜索技术要求更高。但由于深度学习在文本与图像搜索领域所取得的成功,学者们开始借助于深度学习框架,对视频进行组织、理解和描述,尤其是在视频特征提取这一关键环节采取了以下几种方法:一是视频静态关键帧特征描述。由于视频是由大量图像帧按时序与语义关联组成,故可采用深度学习方法对静态视频帧(即图像关键帧)进行特征学习。在具体应用中,一旦确定合理的静态关键帧提取和编码方式,也能形成较好的视频描述效果。二是动态视频时序特征描述。有学者曾提出密集轨迹方法对视频进行分析,取得了不错效果。三是前面两种方法的有机结合。牛津大学的Simonyan等提出采用时间和空间深度神经网络来对视频进行分析,时间轴输入的原始视频,用于对视频中的视觉对象进行识别,空间轴输入的时序关联场,用于对视频中视觉对象的动作及其轨迹进行识别。
目前国内外也有大量针对视觉内容分析与表达方面的竞赛,比如2013年美国佛罗里达大学组织开展的THUMOS比赛,就对海量视觉数据集中异构无序的视觉资源进行分析和理解,该项赛事随后每年都会开展相关研究。国内外许多高校、科研机构都积极参与到该项赛事中,如清华大学、浙江大学、香港中文大学、卡耐基梅隆大学、悉尼科技大学等。美国国家标准与技术研究所2011年组织开展的TRECVID比赛,针对大规模视觉数据集中复杂视觉资源中事件监测问题展开研究。近几年来,该项赛事也一直在围绕着这个主题开展相关研究,国内许多高校,如复旦大学、浙江大学、北京理工大学与同济大学等,在这项赛事中也获得了一定成绩。
目前虽然在视觉大数据资源的组织、分析、理解和利用方法上有很多研究成果,但这些成果最终目的是应用于视觉搜索。近年来一系列研究对于视觉搜索及其在各行业、领域的应用与推广工作起到了积极作用,这对于数字图书馆领域而言,是一个积极信号。
3 大数据环境下视觉搜索研究的5个核心问题
尽管视觉搜索已经获得了工业界和学术界(包括数字图书馆领域在内)的高度关注,但目前在国内并未得到广泛应用及推广,主要原因是由于相关技术与应用产品尚未完全成熟,存在着视觉搜索性能不够理想或不够稳定、用户体验质量不佳、应用局限性较强等问题,围绕这些问题,就需要从视觉搜索研究基础理论与技术角度来解决。从数字图书馆视觉搜索模式构建流程[1]来看,视觉搜索研究主要包括5个核心问题,分别描述如下。
视觉大数据资源的获取与组织方法。互联网环境下视觉大数据资源的存在形式是动态无序和异构离散的,视觉资源的生产和发布是动态变化的。视觉资源所蕴含的信息内容都包含多个异构、复杂的信息主题,彼此之间存在语义时空关联关系。而传统基于人工标注的视觉资源标注方法往往不够精确,因此,如何快速获取到所需视觉资源,是视觉搜索应用的关键问题。而对与待搜索视觉对象无关的视觉资源的清洗过滤,以及视觉大数据资源的有效组织是视觉搜索应用的核心问题。
视觉大数据资源的理解与表达方法。为了在海量视觉大数据资源中找到与待搜索对象一致的视觉资源,就需要从符合待搜索视觉资源的特征分析与理解出发,对其视觉内容进行多元化、结构化、多层次的深度理解和表达。
视觉大数据资源整合与交互方法。视觉搜索作为一种信息检索模式,其服务对象是用户。对视觉大数据资源的获取与组织、理解与表达的目的是为了给用户提供智慧化、人性化的知识服务。因此,如何围绕视觉大数据资源整合全生命周期进行多维度分析,从而满足用户对视觉大数据资源的多元化知识服务需求,也是视觉搜索研究能否成为现实的核心问题。
视觉对象知识库建设及标准化问题。视觉搜索依赖于视觉对象知识库的建设。基于高质量的视觉对象知识库,用户可快速将待搜索视觉对象与虚拟信息空间中的视觉大数据资源进行有效关联,从而享受到数字图书馆提供的视觉搜索知识服务。同时,标准化问题也是视觉搜索应用能否顺利应用和推广的关键所在。
视觉搜索体系的安全与可靠性理论。无论在任何时候,网络安全及系统可靠性问题是永远无法回避的难题,视觉搜索亦不例外。在视觉搜索体系中,数据安全性与知识产权、用户隐私权、系统可用性与可靠性等问题亦是视觉搜索能否得到有效推广与应用的核心问题。
4 总结与展望
在“互联网+”时代,信息服务正越来越广泛地深入到用户智慧化、个性化和嵌入式的知识服务需求中去,数字图书馆领域开始呼唤新型的杀手级信息检索模式。视觉搜索是当前信息检索领域发展的一个重要前沿和创新突破口,在充分汲取国内外信息科学领域先进研究成果的基础上,开展数字图书馆视觉搜索基础理论与应用研究,不仅有望从理论上丰富数字图书馆知识服务研究思想与未来发展框架,也有利于揭示数字图书馆中视觉大数据资源价值的产生机理与转换规律。
毫无疑问,人类正在向“‘互联网+’时代”迈进,作为一种技术与理念创新,视觉搜索必然符合一般信息技术生存、发展与成熟基本规律,需要经历技术诞生的萌芽期、飞速进步的发展期、迅速膨胀的高峰期、去泡沫化的低谷期、稳步发展的光明期和实际应用的高峰期6个阶段。目前来看,国内外已有视觉搜索研究正处于发展期,存在着理论与技术交叉之后学科间的不平衡这一问题。当前视觉搜索的理论、方法与技术研究主要集中在商业型视觉搜索应用上,对于产生视觉大数据资源的学术领域则关注较少。实际上,以科学研究、学科服务等学术领域为代表的视觉大数据资源,具有异于商业型应用的丰富内涵与独特特征,只有全面掌握商业应用与学术领域的相关研究,才有助于建立更加科学、系统、合理的视觉搜索理论体系和应用框架。

阅读全文

与复旦大学大数据王鑫相关的资料

热点内容
编程什么水平才能在猿急送上接单 浏览:356
电信卡免费流量的app有哪些 浏览:176
桂林市地形cad文件 浏览:536
为什么网络突然全部消失 浏览:373
iphone怎样安装软件 浏览:189
租婚车去哪个网站 浏览:519
linux批量修改文件权限 浏览:911
初学者学习编程语言从什么开始学 浏览:662
招商银行信用卡买苹果 浏览:200
streamsh头文件在那边找 浏览:395
苹果7p怎么看激活日期 浏览:600
汽车编程是什么工作 浏览:152
电脑显示找不到文件无法删除 浏览:164
叉叉模拟器下载的文件在哪 浏览:764
网络摄像头中up是什么意思 浏览:152
除了晋江还有什么网站有好文 浏览:771
苹果ipaimini系统更新密码 浏览:123
linux下如何debug 浏览:65
excel2003教程视频 浏览:792
联通幸福卡升级版资费 浏览:712

友情链接