❶ 大數據時代,人類生活面臨顛覆
大數據時代,人類生活面臨顛覆
對於IT領域來說,最近有很多非常新的概念,比如雲計算、物聯網,當大家剛剛對這些概念開始有清晰的認知時,又一個全新概念出現了——大數據。什麼是大數據?大數據概念究竟指向何方,大數據背後能怎樣改變我們生活?會不會給我們的生活和工作帶來困擾?
本報與第一財經頭腦風暴節目合作探討大數據時代下的問題。參與這次討論的嘉賓有大數據概念的提出者、牛津大學教授維克托·邁爾·舍恩伯格,微軟亞太研發集團、雲計算操作系統首席架構師徐明強,上海市信息化專家、專業委員會專家、復旦大學計算機學院院長王曉陽,科爾尼管理咨詢全球合夥人孫健,復旦大學現代哲學研究所所長俞吾金,啟明創投合夥人童士豪,著名財經評論員石述思。
1 到底什麼是大數據?
維克托:我認為它就是新黃金,我覺得是21世紀最主要的資源,這種資源對社會、企業、個人是否能成功,還是會受苦受難有著很重要的作用。解釋一下,雖然此前我們都有數據,可把它們整理在一起然後分析是非常昂貴的,因此我們更多的注意力都放在了實體資源上,就是真正的黃金、金塊,像勞動力這種資源。但只有最近我們才靠人的知識、創新來創造財富,更靠前一步,我們可以根據數據來進行,因為數據收集以及分析,成本上升的程度都已經改變了,然後我們的數據就可以達到一定規模。最後,大家所尋求的不管你是一個人、一個公司、一個組織,還是這個社會,無外乎就是這種所謂的新黃金。
為什麼最近黃金的價值會跌得很厲害?因為老黃金不值錢了,沒有新黃金有價值。
童士豪:我的觀點有點類似,第一個是雲,第二個是關系,第三個是未來。像剛才維克托先生提到的,因為雲時代到了,儲存的大量數據的成本非常低,所以能讓大家去利用大數據做工作分析,最近由於很多事情的關系,有更多的關系被理解,所以能去預測未來狀況。用自己的話說,就是在聆聽上花很多時間,看了很多朋友,大家尋找工作機會也好或者是認識對工作有幫助的合作夥伴也好,在這么大的信息里,這么多人把他自己的信息放在上面,就是做了一件事,就是分析。如果你40歲想當創意公司的CEO,你現在20歲,未來20年該怎麼規劃?這就是非常有意思的一件事。
最後可能有不同的可能性,最後會不會給你找到一個最好的方法,那是自己決定的。可能性放在面前,是機會率最高的,怎麼選還是個人決定,所以大數據並沒有抹殺個人的意識。
石述思:大數據首先改變的是我們看待世界的方法,它會對這個時代的很多的價值觀產生劇烈沖擊。舉例來說,因為過去我們東方人特別喜歡一個詞叫因果,我們認為善有善報、惡有惡報,其實根據交管部門調查的數據,在街頭遭遇橫禍的人其實跟道德無關,秦檜的壽命是岳飛的兩倍半,很多貪官在發現之前,那過的確實是令人無限羨慕的生活。因此,通過大數據我們能用一種全新的觀念來看待這個世界,這個世界是有關聯來建構的一個新型的關系,只有科技發展到一定水平,才能達到這樣的高度。
與此同時,在大數據時代,我們該恪守的底線還是要恪守,但它的確在告訴我們真相,因為科學就是在告訴我們真相。我有一個願望,就是剛才講的大數據是新的黃金,我希望它更多地用於社會公益事業,比如,去挽救地震局。這樣能避免很多人道主義的災難和財產的損失,結論是我們過去認為上帝是哲學家或者叫哲人,現在發現他老人家是個老頑童。
2 大數據究竟有沒有對各領域的工作和生活產生影響?
王曉陽:大數據影響了智慧。怎麼理解呢?大數據本身的概念是數據採集和處理,到了一定的程度使我們的社會也好,管理者也好,都能獲益——從城市來講,一個管理者可以聚集這些數據和處理方式,使得我們能用智慧來管理城市,可以從交通管理、公共衛生,還有其他各個方面來管理,這管理是需要數據,數據產生了智慧,然後反過頭來能管理我們的模式。
比如,在公共衛生方面,採集數據到了目前為止其實已經進行了好多年,它的數據採集原來並不是為了大數據來做的,其實是為了一個方便——方便大家去看病。而且你的電子病例等,讓你看病更人性化,或者對醫生來講能更快、更方便地去熟悉病情,但在這種情況下,這個數據一旦採集起來使得我們對整個城市的健康狀況就能進一步了解,所以,剛才講的看病的數據其實是原本的用意,大數據一來其實我們就能看見原來看不見的問題。比如一些比較大趨勢方面的問題,流行病在哪個地方比較多,或者它怎樣流傳的,等等。這些事情我們原來是看不到的,這種情況就是大數據對我們的幫助。
徐明強:先舉個例子,有一個球和一隻螞蟻,球跟螞蟻說,做三維世界的事物太好了,你看這條線上有多少個螞蟻我一眼就看見了,螞蟻說我真的不信,我得按照這條線爬,爬到頭計數器沒有出故障我才知道有多少螞蟻。這能看到三維和二維差了一維,就差了這么大,所以大數據首先它不是數據大,不是同樣的數據多了就變成大數據,而是在原有的二維、原有的資料庫基礎上,再建立一維,給它一個全新的看點。舉例說明,你如果在美國,你是欠了債的,除了債主對你感興趣,還有人會對你感興趣——如果你欠了債,突然你可以還債了,那麼銀行會對你感興趣。在11年前,美國資本一號就發明了一種大數據的應用,它可以找到哪些人是欠了銀行的錢、欠了信用卡的錢,然後它就會觀察你的消費數據,當它發現你可以開始還的時候,他立刻把你再買過來,從此以後他就吃上了你的利息。資本一號這個公司在2001年時,每個季度的增長率是20%,就是因為它大數據的程序,它可以高命中率地發現這個,它是從哪裡找來的數據呢?從沃爾瑪、從各種各樣的消費數據中找到的。從這個實例我們可以看出,大數據這個原有的數據分析商務智能上加了一層,商務智能不能告訴我們別人將要並且能做什麼。
關於我們公司對奧斯卡頒獎的預測,除了對李安的預測沒對,其他都對了。其實,我們的預測是把所有人員都做了一個概率,所以做了19個預測對的,是我們放在第一概率的獲獎人,下面還有4個是第二概率,所以李安導演我們放在第二概率,我們把他放在後面。
這個預測跟大數據很有關系,首先做大數據需要有IQ,智商,就是說,這個模型要非常好。我們公司做IQ的人叫加戴維·羅斯查爾德,是我們研究部門的一個人。還有其他人,我要講講,他這個人的IQ有什麼差別?他這個人的IQ用了一個非常簡單聚合的模式,除了IQ還有什麼呢?智商以後還要有勤商,勤奮的勤。勤商就是說,他非常勤奮地去找數據,要找多種數據,還要找非常實際的數據,所以他在網上、社交網上都有找。有一些找不到的數據,怎麼辦?他找人做調查,然後找人來做,所以他又有智商,又有勤商,夠不夠呢?還不夠,五年前這種事情做不到,為什麼?五年前他要做這樣大量的數據的話,自己作為一個研究生的小預算是做不到的,但雲計算的出現,他就可以做到了。可以延伸這些數據,用很多處理器來處理,現在他就是用了雲做這樣一個計算,最後成功了。
孫健:我寫的是機會加危險,就是危機。我同意維克托的結論,說這是一個新的金礦,或者有說法叫新的機會,但不要忘記那同時會帶來很多危險。如果我們不能很好地去處理大數據的話,特別是像在我們日常工作中接觸到的很多中國企業,它們大多數甚至在最基礎的數據分析方面還比較落後,這就意味著,我們該怎樣很快地過渡到大數據時代去,去面對大數據挑戰,如果准備不好,那我很擔心,這會像以往很多新技術來了以後的情況,很容易造成很多企業邯鄲學步——連走路都還沒學會,就要學跳,一下子邁到大數據時代,企業不知道怎樣真正地讓大數據發揮作用。
在我們的行業里,因為大數據而做了很多產品創新。談到大數據時代的破壞型創新,實際上也是談了同樣的問題,因為在創新的同時,事實上要推導、顛覆原來的很多東西,包括我們咨詢行業的很多服務和產品都要做更新,也要跟上時代。比如,我們有一家很大的全球性零售企業,它每天要處理海量數據,那麼在海量數據之前,雖然有了技術手段,它仍需找到一個很好的切入點,去解決大數據該怎樣應用到業務中,改變業務模式,給業務創新帶來價值。因為要把這個大數據加以更好地利用,再便宜還是投資,還是要改變,硬體、軟體各方面要做配置,甚至對應的組織要做調整,一個企業要做進一步調整才能適應大數據時代的需求,才能讓大數據發揮作用。所以我們做的工作就是幫助企業找到它的價值創造,建立業務模式,來證明在這方面做這樣的投資,讓大數據發揮作用是值得的。
俞吾金:我想提出不同看法,就是因為人類的思維有一個特點,他把覺悟的東西誇大為全球的。比如你看到三隻天鵝是白的,但其實有一千隻天鵝都是白的,可在澳大利亞發現了一隻黑天鵝,就把一切天鵝都是白的這個原理給推翻了,我覺得大數據這個問題是重要的,但如何正確看待它,不能走極端。大數據反映了人們從數量關系去理解生活的一種思維方法,從古代開始就非常重視,當然古代沒有使用大數據這個概念。
數字本身對生活的重要性越來越大。從哲學上看,它有實踐性,比如數學中的π,圓周率,它等於3.1415926……它就把所有大數據都囊括進去了,更容易理解的是三分之一,三分之一的另一種寫法就是0.333333無限被延伸,所以黑客在邏輯學里就強調,這個無限包容在三分之一這個有限中,有限中包含著無限的一個展開,包含所有數據的展開,這就體現了實踐精神。從這個實踐角度看這個數據,我認為大數據在當代的變動中有重要地位,但看它要有眼光,不要誇大也不要縮小。
3 怎麼理解三分之一就把一生所有數據都概括了?
維克托:我不同意俞老師的觀點。數字的歷史很悠久,但是,以前我們對這些數字的處理方式非常有限,光有技術是不夠的,能對數據進行分析,比如像數字,它對你只是一個數字,這個意義不重要,你也可以用一個漢字或一個字母來表示,那從這個角度來看,大數據不過是一個很長很長的數字,你可以用心記住就可以。
但其實,大數據的價值在於,在整個數據的收集過程中,需要運用分析才可以了解。比如,如何進行預防性的維修,如何能夠防止爆發等,我們不是把這個數字簡單地記下來或背下來,而是要通過分析,通過數據統計的分析,通過把它進行整理了解之後分析,這不是你背下來一個數字就可以了,這是非常大的區別。
4 大數據時代究竟會給生活帶來什麼樣的顛覆?
維克托:首先從商業來講,我覺得有三個元素要記住:一個是在商業世界中決策將發生變化,會越來越清楚地證明,要靠數據說話。
在美國,最大的互聯網公司大概是谷歌,每天都有30億搜索請求。有一天他們屏幕上准備用藍色,然後他們就選了一個特別的藍色,但他是要測試41種不同的藍色,來看到底哪一種最受歡迎。他本來想自己來決定:我是首席設計師啊,我就選了一種藍色。但他的老闆說:不行,我需要實證來告訴我們哪一種藍色最受歡迎。但這個谷歌的首席設計師就辭職了,他說我是首席設計師啊,我是最清楚的。通過很多測試發現,有一種藍色的藍是裸眼看到和設計師選的藍色不太區別得開,但另一種通過測試所產生的藍色,更受歡迎,有更多點擊量。通過實證做出來的決策更有效。類似例子有很多,都說我做這行已經幾十年了,我說的肯定沒錯。這種傳統的社會觀念和思維方式會受到挑戰,我們的決策必須要靠數據說話,這是第一點。
第二,就是在我們出去說話時,我們要注意不能誤讀數據,錯誤的數據是不行的。也就是如果原來的材料不對,原料是垃圾,出來的東西肯定也是垃圾,這個公司出這些數據的話都是比較容易理解的,但可能不是你應該熟悉的數據。
第三個是挑戰。就是普通產業,尤其是計算機產業,數據會超越它們,這個可能是有一種挑戰式的說法。如果沒有足夠的數據,你也趕不上一個大量數據的比較平庸的模型,也就是為什麼說數據會超越那些產業。比如機器翻譯這件事,在六七十年代,IBM花了很多錢想用機器翻譯,它要弄一些語言的規則輸入到機器中,但效果不太好,它就有了一個新想法,它不是把一種語言的語法規則輸入機器,而是把加拿大議會中的英法雙語的互譯輸進去,把成千上萬的翻譯資料輸入進去,它就有了大量的累計組織上的資料庫,這個效果就好得多。而谷歌又在這個領域有更多數據,一下子這個翻譯就更成熟、效果更好。可以說,是這個數據使它超越了這個軟體。因為今天這個大數據的力量,可以很容易地獲得想要的資訊,但大概在十年前,需要五十萬個伺服器,大量的儲存以及處理數據的模式,你才能開始一個新業務。今天如果要輸入業務,用雲計算來測試就可以了。比如有一個叫蒂塞德的公司,它有很多產品及價格,它收購一些數據來預測到底一個產品是上架還是下架,雖然他們擁有大量客戶,可這個公司的員工只有13個人,因此它的伺服器有很多,他們擁有大量的數據。可見,這個舞台不僅可以讓大公司來做,而且創新的小公司也能以平等的地位來競爭。
王曉陽:其實講到改變了我們整個思維方式,所謂的就是實驗這個思維,比理論思維更重要,這一點我不是太懂。其實維克托先生剛才舉的例子,是在很多情況下,是我們用數據去驗證以前想要能夠有的東西,有一些智慧確實是在數字里挖掘出來的,這個可能是一個語言來自不同的地方,怎麼講呢?基於在大數據的情況下,其實有一個所謂的循環概念,等於說你有了智慧以後去驗證,驗證數據里又產生了各種各樣的智慧來做這樣的理解,所以從這個角度來講,我覺得是大數據的情況下面,沒有顛覆,而是說一個改進,對我們認知世界的改進。就公共衛生這個話題來說,我們舉的最多的一個例子就是在谷歌,有一個所謂的趨勢預測,它就是用了網民們搜索的詞來預測。
所謂的預測流感,怎麼做?很簡單,就是它去分析了以往的數據,說在流感發生的地域,地域的那個時間大家是用什麼詞去搜索,這樣就可以做統計。做了統計以後,反過頭來用這些搜索詞來預測這個流感,這種情況下是什麼意思?並不見得是說這種數據或大數據的情況就能使我們對這個流感突然有一個新的認識,其實不然,其實是谷歌的那些工程師們有一個想法,認為我們好像流行流感,這和大家有關,而每個人都會用搜索來獲取一些跟流感有關的信息,就有了這樣的關聯。這個關聯怎麼去發現?這就要用數據去發現,用所謂的大數據的做法,去實現我們已有的一些概念的東西,把它實現了之後,就能做預測。所以從這樣的角度講,並不見得是有了大數據,我們就可以把所有的智慧都丟掉,我們不用IQ了,只要數據就好了,這肯定是不行的。一定是IQ加上數據,然後能讓它有個正反的概念,這是大數據所應該乾的事情。
童士豪:我有不同想法,我覺得剛才維克托先生講的一點很有意思,就是對智慧的要求,大數據時代是不一樣的。在大數據時代,對智慧的要求可以低一點,都能產生更好的結果,這是一個有意思的事情。他剛才提了一個例子,之前要做翻譯是很難的,你的規則必須特別強、精簡、完整,才能有60%、70%的准確率。但在大數據時代,我們不用想那些,不用花智慧講那麼復雜的規則和套路,乾脆把幾億個已翻譯好的文章交給電腦,用統計學的方式找到哪種情況下,翻譯的字的另外一個意思是比較對的。這對於智慧的要求其實是降低了,但效果可能會更好。
孫健:可能我們對智慧的理解有歧義。我覺得維克托先生講的我理解,因為他有另一本書叫《Delete》,裡面專門講了這個三重智慧,談了取捨問題。因為隨著存儲技術、網際網路的發展,他講的更多的是知識,知識的要求可以低,但對智慧,我覺得理解不一樣。我理解的智慧是,你判斷一個事物的根本的、真正的洞察能力。就是,你對一個事物的洞察能力還是需要有,不會因為大數據的存在而削弱或不需要了,而恰恰因為大數據的存在才更需要洞察力。
5 大數據時代到底真正來臨了嗎?
王曉陽:大數據時代來不來臨要看你怎麼度量、衡量。現在這個數據的量和種類,以及採集的方式、手段,處理的手段,絕對已經達到了「前無古人,後無來者」的感覺。這個情況下,我們從這個數據採集以及數據處理這個能力方面來講,我們的大數據時代來臨了,但我們使用數據利用數據這個才是剛剛開始,只是剛起步。
而大數據改變我們生活的時代,還沒有完全到來,但為這個我們已經做了很多准備,這是城市的管理問題。我們為大數據時代做了很多准備,比如在數據採集方面已經做了很多准備,怎麼樣利用這個數據來做我們這個智慧城市,這是一個最大的問題。
徐明強:從商業角度來看,我從運用上說,個人認為是來臨了。舉個例子,墨客這樣一個葯材公司,他可以根據天氣性質,比如如果今天冬天特別冷,很多過敏性動物就會冬眠,四五月份突然轉熱時,花粉也開始多了,今年有很多人會過敏,等等,它就通過市場進行營銷,把比如克敏能這種葯材發布出去。
維克托·邁爾·舍恩伯格:美國總統奧巴馬曾說,盡管政府也嘗試,但他總是落後於企業,落後於社會的其他一些群體。所以說搞這種活動能充分激發數據,提供給大眾,而且公司也可以拿這些數據,讓公司能利用這些數據有更多創新。這是一個想法,也許有一些做法,比如商業方法,我認為能通過發揮企業的智慧,發揮像微軟這樣的一些聰明企業的智慧,還是有幫助的,包括和政府的合作來管好社會。
石述思:我有一個感受,當商業巨頭面對屌絲談大數據時,我們都有一種不寒而慄的感覺,因為盡管大數據時代我們每個人都是公平的,我們可以說小公司可以獲得公平競爭待遇,但其實掌握大數據的都是一些巨頭,他們有得天獨厚的優勢來搶我們錢包里的錢,我們很難,因為公司的定義就是在法律允許的范疇中唯利是圖。但我們倒是渴望政府部門能利用大數據為我們提供普惠性的服務,可就像一些智慧城市沒法真正做到智慧管理的案例一樣,所以我對大數據來到中國的前途深表憂慮。還有,即使優秀的公司利用大數據,它也要面對一個現實,比如我們像電視台做廣告的一樣,為什麼現在人依然很多,因為中國貧富差距特別大,如果你掌握了所有消費者的數據,而大多數在今天是無效數據,所以你還是有一個有選擇的大數據的過程,叫有購買力的大數據,所以各種各樣的問題就會出現在我們面前,就是社會本來是我們需要,但它存在很多幕後看不清楚的東西。我們擔心被商業巨頭利用,來完成對消費者進一步的盤剝。
孫健:我覺得從企業角度來看也是同樣的問題。我前面想表達的意思就是,第一我們今天中國很多企業實際上並沒有準備好迎接這個大數據,因為我們現在還停留在比較初級的基礎數據分析時代,我們很多的基礎數據今天都沒有被運用,不要說大數據,就是小數據今天也沒有很好的利用。還有很多假的數據,是因為對這些數據的輸入管理非常不成熟,我自己在工作中接觸很多企業,企業今天做的幾件事大家都在做,有ERP系統,有資料庫,有了數據就往裡面存,但我發覺,有很多中國企業兌現的數據管理沒有規范化的感覺,更沒有很好的利用。這就存在這樣的擔心:最後大數據時代來了以後,我們本來中國企業在這個數據分析的利用上就不擅長,今天有了大數據以後差距會變得更大,以後國際巨頭有一個成熟的數據分析方法,很多健全的商業模式,它會把這個差距變得越來越大。
6 在大數據時代,下一個預言會是什麼,下一個判斷會是什麼?
維克托:接下來怎麼能讓生活比現在更高效,就是要讓城市變得更加智能,這是可行的,為什麼?我強調的是,我們有可能改善我們的公共衛生,改善教育,我們有能力收集數據,公共交通的通化能真正滿足市民的需求,而不只是政客,而且能源消耗也會得到更好的檢測、預測和管理,這樣我們的城市就會更加智能,讓城市的生活更加好。在150年前,曾有預測如果是在城市生活,壽命會更短;在農村生活則壽命長。而150年之後的今天,壽命更加長了,有了大數據我們會更加美好,可是有一個條件,就是那些決策者,他們一定要使用這些數字才可以。
下一步是專家怎麼來做。其實這涉及到在數據時代,數據點是有限的,那麼我們收集的數據,只要我們收集足夠的數據來解決問題就可以了。因為非常復雜、數據點非常少,所以我們的數據點收集起來必須是要高質量的,現在不是這樣的,現在的是更加的多、更加的亂。解釋一下什麼叫更多更亂,更多就是有數據點,關於我們想要研究的一個現象,我們可以更多的進行數據統計,比如在美國,你有DNA基因圖譜,那麼只要2000美金就可以知道你的整個基因圖譜當中的30億這個東西是怎麼組成的,這樣你就可以知道那些30億個精對,現在如果說有一個基因組成可能會導致什麼樣的癌症,就可以查基因圖譜,說我是不容易生這個病的,這是為什麼可以預測是否患癌症的原因。那麼有更多的數據便會存在一定的不準確性,所以,我說更多且更亂,所以這里允許一點點的不準確,或者可以亂一點,這個所謂的亂就是指,不是說每一個數據點都要達到最高的准確度,這個結果就是,不是百分之一百完美,但在大數據這樣一種方向,或者說,我們在正確的數據點上要知道一個方向。知道方向比晚一點知道完美的數據更有效。比如交通預測,也許當下看到的交通預測比實際運用中要晚了20分鍾,可能看起來太晚了,但如果這是預測一個星期的信息,就夠了。
王曉陽:大數據時代對我們這個城市更加理解,所謂的理解就是你知道這個城市裡發生了什麼,這非常重要。在以前,這個城市的管理都是一拍腦袋,有的時候拍腦袋拍出很好的來,拍腦袋也能拍出非常棒的一個城市來,但是有的時候呢?拍腦袋可能太離譜,這種情況下在大數據時代我們怎麼樣利用好,就是我們所講的。而為了政績也可以用大數據來考慮,說這個數字到底對它的政績有沒有好處?就是名義是一個很大的方面,大數據方面不光是理解我們這個城市發生了什麼,而且還能了解我們城市裡的民眾在想什麼?這點對城市管理來說非常重要,城市不光是一個硬體設施,不光是地鐵和高樓,人在裡面非常重要。
以上是小編為大家分享的關於大數據時代,人類生活面臨顛覆的相關內容,更多信息可以關注環球青藤分享更多干貨
❷ 復旦大學有哪些教授的課是必須要去蹭的
計科狗答一波,首先推薦闞海斌老師的線性代數!(如果是文科生就算了吧。。。)
線性代數一般學校都有的課。如果想從事理工科方面的這門課是非常非常重要的!但由於這個課和高中脫節太大,矩陣的內容太抽象而復雜,很少有老師能夠講的深入淺出,大部分都是上的雲里霧里的。但是!闞老師這個課講得幾乎沒有半句廢話,每當一個新定義出現的時候都會先做好充足鋪墊,並且會給你講一下你學的這個在計算機科學里以後有什麼用,比如特徵值在人臉識別數據降維里都有什麼用,總之強烈推薦。
最後要說一句,學習知識的過程都是枯燥的,所謂的課程有趣也是需要你對老師講的內容有一些自己的理解看法之後才能產生思想的碰撞,而如果是專業課的話老師一學期16節課基本上課本內容都是剛好講完,所以還是需要私下對書本有了一定掌握之後再去蹭課啊~
❸ 如何看待復旦大學成立大數據學院和大數據研究院
這是現在的一個新趨勢,
就是把計算機統計學科和傳統的自然和社會科學結合起來一起研究。
之前傳統的諸如計算物理計算化學計算生物,
其實跟主流計算機統計方面差的還是蠻遠的。
當然具體這類研究最後會給傳統學科帶來什麼還很難說。
所以這應該還是一個不錯的嘗試,
但真正的成效要看後面這個學院具體怎麼建設怎麼管理
❹ 基於大數據的視覺搜索應用與組織模式研究
基於大數據的視覺搜索應用與組織模式研究
當前視覺搜索已成為信息科學領域的前沿課題,主要用於分析和研究現實世界實體屬性、行為、事件與視覺大數據資源之間的發展規律,針對視覺大數據資源的獲取、組織、描述與利用問題,研究視覺資源及其時空關聯信息之間的價值發現與資源整合的內在機理
當前視覺搜索已成為信息科學領域的前沿課題,主要用於分析和研究現實世界實體屬性、行為、事件與視覺大數據資源之間的發展規律,針對視覺大數據資源的獲取、組織、描述與利用問題,研究視覺資源及其時空關聯信息之間的價值發現與資源整合的內在機理,解決其多維關聯與協同融合問題,進而實現視覺大數據資源的有效整合、知識發現與實時交互。
基於此,本研究從宏觀與中觀角度,從信息科學視角下視覺搜索研究的起源著手,對其發展歷程、概念與特點進行描述,圍繞其理論與應用研究的幾個關鍵問題展開討論,並簡要探討其最新研究進展及應用。
1、大數據環境下視覺搜索的發展歷程及特點
1.1 問題的提出
視覺搜索不是一個新名詞,它最早出現於心理學與生理學領域,用於描述人們通過視覺通道在特定區域內檢測某特定目標是否出現或出現後確定其位置的行為。如在地圖上找某大學所處位置、在食堂內點菜、在書架上找書或在圖書館內找人等。在現實世界中,人們經常需要利用視覺搜索在復雜物理環境中獲取有價值的信息,來決定接下來的語言和行為。因此,視覺搜索理論受到心理學家和人因(HumanFactors)學家的廣泛關注,大量研究集中在對人類視覺認知、生理反饋機理的理解與表達上,並總結出了許多應用型和理論型知識。正是由於視覺搜索的可用性和有效性,使得許多工作、行業、領域都離不開這一生理行為。
相關基礎理論和關鍵技術的不斷發展與完善,促使傳統視覺搜索應用不斷向信息化、技術化和網路化方向發展,如何將傳統視覺搜索行為轉換成「所見即所知」式視覺搜索模式,這一難題逐漸擺在了人們面前。與此同時,網路環境、信息技術、計算性能、存儲空間、數據規模與軟硬體設施等方面的飛速提升,也為客觀物理世界與虛擬網路空間之間建立起密不可分的關聯關系,使視覺搜索技術的實現成為可能。人們可以方便快捷地採集客觀物理世界中的視覺對象,從互聯網中獲取與之相關的關聯信息。
1.2 視覺搜索發展歷程及發展趨勢
近幾年來,隨著大數據環境的逐步完善和大數據技術的迅速發展,關於視覺資源整合與視覺搜索研究的呼聲越來越大。Nature和Science分別於2008年、2011年出版了大數據專題研究,提出圖像、視頻與用戶交互信息是未來大數據的重要組成部分。2009年,Stanford University的Griod、Chandrasekhar等學者將視覺搜索理論引入到信息檢索領域,提出Visual Search、Mobile Visual Search等概念,舉辦了第一屆移動視覺搜索研討會,並對其體系結構、應用與服務模式等問題進行了探討。2010年,Google技術研究部前主管Norvig在Nature上發表的專題論文2020Visions中指出,「文本、圖像和視頻等視覺資源及用戶交互信息、感測信息的有機融合,會給搜索引擎帶來巨大挑戰,如何對視覺搜索結果進行資源深度整合將會成為Google未來10年面臨的最大挑戰。」同年,北京大學高文、黃鐵軍與段凌宇等將其引入國內,舉辦了第二屆移動視覺搜索研討會,並圍繞其關鍵技術、體系結構、視覺資源組織與描述方法、視覺資源標准化與視覺知識庫建設等問題展開了研討。2012年,這一理論與技術迅速被中國計算機學會所接受,認為將視覺搜索與增強現實技術相結合的信息檢索模式,將是繼搜索引擎之後的新一代互聯網服務範式。隨後,張興旺、朱慶華等嘗試將其引入數字圖書館領域,並圍繞相關理論與應用模式展開了研究。
根據視覺搜索研究的發展軌跡來看,國內關於視覺搜索研究總體仍處於探索與嘗試階段,研究軌跡已基本跨過早期理論性嘗試過程,正步入中期技術性和應用性探索階段。尤其是在我國科學技術部於2011年啟動國家重點基礎研究發展計劃(「973」計劃)「面向公共安全的跨媒體計算理論與方法」,對跨媒體視覺資源的統一表示和建模方法、關聯推理和深度挖掘、綜合搜索和內容合成等關鍵科學問題進行研究之後,國內相關研究步入快速發展階段。自2015年以來,視覺搜索理論與應用研究的重要性和必要性更加凸顯,國務院2015年9月印發的《促進大數據發展行動綱要》提出,要充分利用大數據,提升領域數據資源的獲取和利用能力,推動各類數據融合和資源整合。國務院2015年7月印發的《關於積極推進「互聯網+」行動的指導意見》提出「構建包括語音、圖像、視頻、地圖等數據的海量訓練資源庫,加強人工智慧基礎資源和公共服務等創新平台建設」。國家自然科學重大研究計劃「大數據驅動的管理與決策研究」認為「大數據價值的產生機理和轉換規律具有高度的應用領域依賴性」。科技部2016年發布的《關於發布國家重點研發計劃精準醫學研究等重點專項2016年度項目申報指南的通知》的「雲計算和大數據重點專項」中更是明確將「面向大范圍場景透徹感知的視覺大數據智能分析關鍵技術」列為重點研究內容之一,要求對視覺語義建模、視覺對象的時空定位與搜索、跨場景數據關聯技術等展開研究。
1.3 視覺搜索研究對象及視覺大數據資源特點
視覺搜索的研究已逐漸發展成為信息檢索領域的主要研究趨勢,到目前為止,關於視覺搜索的定義尚未形成統一的認識,但從信息檢索角度來看,大家對它的普遍理解是指將客觀物理世界中的視覺資源作為檢索對象,通過互聯網去獲取關聯信息的一種信息檢索方式。它是以視覺大數據資源及其關聯信息為研究對象,以視覺大數據資源的獲取、分析、組織、理解和表達方法為主要研究內容,以信息技術與方法為主要研究手段,以發現視覺大數據資源蘊含的知識價值和拓展其利用能力為主要研究目標的一種綜合性的應用型前沿領域。它主要針對的是當前大數據環境下海量、多元異構、動態無序和高速進化的視覺資源的分析和利用問題,重點研究的是如何充分利用當前飛速發展的信息技術來解決視覺大數據資源的理解和表達,如何有效地實現視覺搜索,如何利用視覺搜索技術來從海量視覺大數據資源中發現新的知識。
毫無疑問,未來是一個智慧(或稱之為「互聯網+」)的時代。智慧地球、智慧城市、智慧圖書館等理論與應用的迅速發展,給視覺搜索理論與應用研究提供了「沃土」。「互聯網+」時代所衍生的數據規模的劇增,文本、圖像、音視頻、用戶交互信息與各種感測信息會成為「數據海洋」的主流,而這些數據來源中超過80%來自於人類視覺通道,現階段把握「互聯網+」時代信息檢索和知識服務未來發展脈絡的最重要手段可能是視覺搜索。
視覺大數據資源因其包含文本、圖像、音視頻與用戶觀看記錄等復雜無序、動態變化的時空信息,使其成為數字圖書館中內容最豐富的信息載體,並將會成為「互聯網+」時代最為重要的信息表達和信息傳播媒介。而以視覺大數據資源為研究對象的視覺搜索,由於前者所處知識空間的知識實體與知識價值在時間、空間和屬性三個方面的自有特性,使得視覺搜索也呈現出復雜無序、動態變化和時空語義關聯等特性,同時也需要對視覺大數據資源的形式化表達、系統化組織、結構化描述與時空關聯關系分析方法等進行研究。由此可得知視覺大數據資源主要具有以下特徵:
視覺大數據資源包含文本、圖像、視頻、用戶觀看信息及用戶交互信息等時空信息,並且它所包含的視覺對象、事物內容、事件過程在時間、空間、語義等方面具有時序或時空關聯關系。
視覺大數據資源具有時空語義關聯、動態變化、數據規模大和結構復雜等特點,這些基於視覺對象、事物內容、事件過程的動態變化可以用時空語義關聯進行表達和描述,其獲取、組織和描述過程可以用機器語言來進行表達,通過視覺對象、事物內容、事件過程之間的語義關聯映射,建立視覺大數據資源的時空語義關聯關系。
視覺大數據資源具有數據規模大、結構復雜、類型多元、多維尺度關聯和縱深緯度高等特性,可根據視覺大數據資源的時空語義關系建立對應的尺度關聯機制。針對不同尺度、縱深緯度的視覺大數據資源的時空關聯關系,可實現視覺對象、事物內容、事件過程之間的多維尺度轉換和重置,進而實現視覺大數據資源的語義關聯關系分析。
視覺大數據資源能提供基於視覺資源內容來理解視覺對象行為,根據視覺對象的時空語義關聯關系建立起發展趨勢模型,並根據有效組織、理解和描述來預測某特定事物在某特定階段將可能發生的行為態勢。
可針對視覺大數據資源的獲取、組織、理解和描述問題,來實現用戶與視覺大數據資源之間的實時交互、反饋和視覺對象知識庫的構建。根據視覺對象的相似行為特徵、時空關聯關系和實時交互結果,來幫助人們製作、生產、運營和消費新的視覺資源,滿足數字圖書館用戶的多元化知識服務需求。
2、大數據環境下視覺搜索的應用與組織模式
視覺大數據資源經過組織、分析、處理和整合,並建立基於特定領域的數字圖書館視覺搜索平台之後,才能為用戶提供大數據知識服務。不同學科、領域的視覺搜索模式對視覺大數據資源的獲取、組織、處理與整合模式會有所不同。正因如此,當前大部分應用是從知識服務與信息檢索角度,建立起領域導向的視覺大數據資源整合平台,通過視覺搜索來對視覺大數據資源進行有效管理與利用,並按照特定學科、專業和領域的知識服務需求來提供服務,從而滿足各類大數據知識服務需求。
2.1 基於深度學習的視覺搜索工業應用模式
傳統視覺搜索研究主要是先採用人工標注方法對視覺資源的底層特徵進行標注後,再採用機器學習方法來解決視覺資源之間的語義鴻溝、異構鴻溝與語義關聯之間的問題。基於人工標注的視覺大數據資源整合與利用方法,需要標注者擁有豐富的專業領域知識和工業應用經驗,需耗費大量的時間和人力成本,且精確性低。與對視覺資源特徵進行人工標注方法不同的是,深度學習一般都是通過對視覺資源特徵進行多層神經網路訓練後,進行視覺特徵學習,進而獲取到特徵提取更合理、區分性更強的視覺特徵理解和描述。大量研究證明通過深度分析方法所提取到的視覺特徵在圖像分類與識別、視覺場景識別、智能監控、語音識別、知識圖譜構建等應用領域都獲得過成功。視覺資源的顯著性特徵提取和分割方法,能夠採用模擬人類視覺系統和生理認知體系來提取視覺資源中顯著性特徵區域。目前,性能相對最好的視覺資源特徵提取方法在公開的視覺大數據資源數據集中的顯著性特徵檢測准確率在95%左右,視覺資源前景特徵分割准確率將近92%,這一比例在近幾年全球性各類大規模視覺資源分析與識別比賽中,仍然在不斷增加。比如,Google研究組在大規模視覺識別挑戰賽(ILSVRC)中,採用改進的深度卷積網路Google Net將圖像識別准確率提升到93%;Google小組在微軟圖像標題生成挑戰賽(MS COCO ICC)中,採用基於深度分析的圖像特徵提取方法獲得冠軍;悉尼科技大學與卡耐基梅隆大學、微軟亞洲研究院和浙江大學在THUMOS比賽中,均將深度分析方法與視覺對象運動特徵結合起來對視覺資源進行動作識別,分別獲得前三名。
傳統學術研究的理論成果往往需要很長一段時間發展,才能逐漸走向成熟,並進入到實際的工業應用中去。但無論是深度學習,還是視覺搜索,它們都擁有著極強的工程理論模型。一方面,它們在被學術界關注和研究的同時,也被工業領域所密切關注和嘗試;另一方面,由於工業領域(如Google、網路、微軟等)早就擁有著大規模的視覺大數據資源,且一直活躍在諸多信息科學領域的研究前沿,在很多領域,它們相較於學術界更有優勢。如Google的知識圖譜Knowledge Graph,Google Now與Google街景地圖,微軟的語音助手Cortana,愛奇藝的愛奇藝大腦,Facebook的Graph Search等均屬於工業界視覺搜索較為經典的應用案例。事實上,國外工業界各大公司,如Google,Facebook,Microsoft等對視覺搜索不僅僅只是開展大量的研究,甚至還在內部成立了專門研究機構,國內的網路、華為、騰訊和阿里巴巴也不例外。
2.2 基於知識計算的視覺搜索知識服務模式
數字圖書館領域對視覺搜索理論與應用展開研究的一個重要目的,就是為高校和科研機構的研究人員提供嵌入式協作化的知識服務,而數字圖書館視覺搜索平台是將海量視覺大數據資源與平台提供的視覺大數據資源的組織、分析和處理功能嵌入到知識服務過程中。
視覺大數據資源整合與利用是當前國內外人工智慧、信息檢索領域的研究熱點,擁有非常廣泛的應用與研究前景。事實上,圖像搜索作為視覺搜索的一個研究分支方向,近幾年來,國內已有很多個人(如中國科學院高科、北京大學高文與黃鐵軍、南京大學朱慶華)、機構(如浙江大學、清華大學、北京大學、中國科學院計算所等)、企業(如愛奇藝、網路、騰訊、360、搜狗等)正在做與之相關的研究,並且很多已經推出了基於內容的圖像搜索平台,為用戶提供圖像搜索服務。而美國的麻省理工學院、加州大學伯克利分校、伊利諾伊大學和英國的牛津大學等相關研究工作開始得更早,也研發出了相應的基於圖像內容的圖像搜索系統。
在以上所有相關研究中,它們都具有一個典型的研究特徵:研究目的是為了解決視覺搜索的應用問題,而對應的視覺搜索模式大部分是基於知識計算。由於視覺搜索需要組織、分析和處理的對象主要包括文本、圖像、視頻等各類蘊含大量價值的視覺資源,因此,如何從視覺大數據資源中獲取有價值的知識,就成為國外學術界和工業界一直以來的研究熱點。以發掘視覺大數據資源中蘊含的豐富的、復雜關聯的知識為目的的知識庫稱之為視覺對象知識庫。目前,全球基於文本、圖像、音視頻等視覺資源的各類知識庫有不少於60種,而基於這些視覺對象知識庫的具體應用案例和系統平台也有幾百種。其中,比較有代表性的應用案例有維基網路的DBpedia(2014版中包含8.7萬部電影、12.3萬張唱片、45萬個物件等)、Google的知識圖譜Knowledge Graph(包括地標、城市、人名、建築、電影、藝術作品等5億個搜索結果實體與350億條關聯知識條目)、Facebook的Graph Search(包含10億名用戶、2400億張圖像、10000億次頁面訪問量等)等。
藉助視覺搜索的相關理論與技術,開展對海量、異構、多元的視覺大數據資源的研究,不僅可豐富信息檢索的外延和內涵,而且可以有效地解決當前數字圖書館所面臨的「大數據、小知識、小服務」的瓶頸,具有一定的應用價值和現實意義。
2.3 基於語義分析的視覺內容關聯組織模式
從已有研究來看,視覺搜索的研究對象大部分集中在文本與圖像上,其中圖像搜索是學者們著力解決的重點方向。視覺搜索研究可分為3個階段:一是20世紀70年代末期開始的基於文本/元數據的圖像搜索。這一方式主要通過人工標注元數據對圖像進行描述,來實現對圖像的信息檢索功能,缺點是元數據標注費時費力,描述標准與反饋內容不完整,且容易有太多主觀色彩。二是20世紀90年代開始提出基於視覺內容的圖像搜索方法。這一方式其本質是採用人工構造圖像底層視覺特徵的方式來進行圖像相似性比較,進而實現圖像搜索,缺點是對圖像底層特徵和高層語義之間存在的語義鴻溝問題沒有得到較好解決。三是21世紀初期提出的基於深度學習的圖像搜索方法。社交網路與用戶生成內容成為網路數據的主要來源,利用用戶標簽對圖像語義進行組織、表達和理解成為研究主流,深度學習方法由此融入到相關領域。
與圖像搜索相比,視頻表達和分析則是視覺搜索領域相對較新的研究領域。視頻由大量圖像幀組成,且圖像幀之間有較為緊密的時空與語義關聯關系,這對視覺搜索技術要求更高。但由於深度學習在文本與圖像搜索領域所取得的成功,學者們開始藉助於深度學習框架,對視頻進行組織、理解和描述,尤其是在視頻特徵提取這一關鍵環節採取了以下幾種方法:一是視頻靜態關鍵幀特徵描述。由於視頻是由大量圖像幀按時序與語義關聯組成,故可採用深度學習方法對靜態視頻幀(即圖像關鍵幀)進行特徵學習。在具體應用中,一旦確定合理的靜態關鍵幀提取和編碼方式,也能形成較好的視頻描述效果。二是動態視頻時序特徵描述。有學者曾提出密集軌跡方法對視頻進行分析,取得了不錯效果。三是前面兩種方法的有機結合。牛津大學的Simonyan等提出採用時間和空間深度神經網路來對視頻進行分析,時間軸輸入的原始視頻,用於對視頻中的視覺對象進行識別,空間軸輸入的時序關聯場,用於對視頻中視覺對象的動作及其軌跡進行識別。
目前國內外也有大量針對視覺內容分析與表達方面的競賽,比如2013年美國佛羅里達大學組織開展的THUMOS比賽,就對海量視覺數據集中異構無序的視覺資源進行分析和理解,該項賽事隨後每年都會開展相關研究。國內外許多高校、科研機構都積極參與到該項賽事中,如清華大學、浙江大學、香港中文大學、卡耐基梅隆大學、悉尼科技大學等。美國國家標准與技術研究所2011年組織開展的TRECVID比賽,針對大規模視覺數據集中復雜視覺資源中事件監測問題展開研究。近幾年來,該項賽事也一直在圍繞著這個主題開展相關研究,國內許多高校,如復旦大學、浙江大學、北京理工大學與同濟大學等,在這項賽事中也獲得了一定成績。
目前雖然在視覺大數據資源的組織、分析、理解和利用方法上有很多研究成果,但這些成果最終目的是應用於視覺搜索。近年來一系列研究對於視覺搜索及其在各行業、領域的應用與推廣工作起到了積極作用,這對於數字圖書館領域而言,是一個積極信號。
3 大數據環境下視覺搜索研究的5個核心問題
盡管視覺搜索已經獲得了工業界和學術界(包括數字圖書館領域在內)的高度關注,但目前在國內並未得到廣泛應用及推廣,主要原因是由於相關技術與應用產品尚未完全成熟,存在著視覺搜索性能不夠理想或不夠穩定、用戶體驗質量不佳、應用局限性較強等問題,圍繞這些問題,就需要從視覺搜索研究基礎理論與技術角度來解決。從數字圖書館視覺搜索模式構建流程[1]來看,視覺搜索研究主要包括5個核心問題,分別描述如下。
視覺大數據資源的獲取與組織方法。互聯網環境下視覺大數據資源的存在形式是動態無序和異構離散的,視覺資源的生產和發布是動態變化的。視覺資源所蘊含的信息內容都包含多個異構、復雜的信息主題,彼此之間存在語義時空關聯關系。而傳統基於人工標注的視覺資源標注方法往往不夠精確,因此,如何快速獲取到所需視覺資源,是視覺搜索應用的關鍵問題。而對與待搜索視覺對象無關的視覺資源的清洗過濾,以及視覺大數據資源的有效組織是視覺搜索應用的核心問題。
視覺大數據資源的理解與表達方法。為了在海量視覺大數據資源中找到與待搜索對象一致的視覺資源,就需要從符合待搜索視覺資源的特徵分析與理解出發,對其視覺內容進行多元化、結構化、多層次的深度理解和表達。
視覺大數據資源整合與交互方法。視覺搜索作為一種信息檢索模式,其服務對象是用戶。對視覺大數據資源的獲取與組織、理解與表達的目的是為了給用戶提供智慧化、人性化的知識服務。因此,如何圍繞視覺大數據資源整合全生命周期進行多維度分析,從而滿足用戶對視覺大數據資源的多元化知識服務需求,也是視覺搜索研究能否成為現實的核心問題。
視覺對象知識庫建設及標准化問題。視覺搜索依賴於視覺對象知識庫的建設。基於高質量的視覺對象知識庫,用戶可快速將待搜索視覺對象與虛擬信息空間中的視覺大數據資源進行有效關聯,從而享受到數字圖書館提供的視覺搜索知識服務。同時,標准化問題也是視覺搜索應用能否順利應用和推廣的關鍵所在。
視覺搜索體系的安全與可靠性理論。無論在任何時候,網路安全及系統可靠性問題是永遠無法迴避的難題,視覺搜索亦不例外。在視覺搜索體系中,數據安全性與知識產權、用戶隱私權、系統可用性與可靠性等問題亦是視覺搜索能否得到有效推廣與應用的核心問題。
4 總結與展望
在「互聯網+」時代,信息服務正越來越廣泛地深入到用戶智慧化、個性化和嵌入式的知識服務需求中去,數字圖書館領域開始呼喚新型的殺手級信息檢索模式。視覺搜索是當前信息檢索領域發展的一個重要前沿和創新突破口,在充分汲取國內外信息科學領域先進研究成果的基礎上,開展數字圖書館視覺搜索基礎理論與應用研究,不僅有望從理論上豐富數字圖書館知識服務研究思想與未來發展框架,也有利於揭示數字圖書館中視覺大數據資源價值的產生機理與轉換規律。
毫無疑問,人類正在向「『互聯網+』時代」邁進,作為一種技術與理念創新,視覺搜索必然符合一般信息技術生存、發展與成熟基本規律,需要經歷技術誕生的萌芽期、飛速進步的發展期、迅速膨脹的高峰期、去泡沫化的低谷期、穩步發展的光明期和實際應用的高峰期6個階段。目前來看,國內外已有視覺搜索研究正處於發展期,存在著理論與技術交叉之後學科間的不平衡這一問題。當前視覺搜索的理論、方法與技術研究主要集中在商業型視覺搜索應用上,對於產生視覺大數據資源的學術領域則關注較少。實際上,以科學研究、學科服務等學術領域為代表的視覺大數據資源,具有異於商業型應用的豐富內涵與獨特特徵,只有全面掌握商業應用與學術領域的相關研究,才有助於建立更加科學、系統、合理的視覺搜索理論體系和應用框架。