1. 大數據時代發展歷程是什麼
可按照時間點劃分大數據的發展歷程。
2. 15個未來職業是什麼
15個未來職業分別是人工智慧工程技術人員、物聯網工程技術人員、大數據工程技術人員、雲計算工程技術人員、建築信息模型技術員、電子競技運營師、電子競技員、無人機駕駛員、數字化管理師、農業經理人、工業機器人系統操作員、工業機器人系統運維員等,具體內容如下:
一、人工智慧工程技術人員
定義:從事與人工智慧相關演算法、深度學習等多種技術的分析、研究、開發,並對人工智慧系統進行設計、優化、運維、管理和應用的工程技術人員。
主要工作任務:
1、分析、研究人工智慧演算法、深度學習等技術並加以應用;
2、研究、開發、應用人工智慧指令、演算法;
3、規劃、設計、開發基於人工智慧演算法的晶元;
4、設計、集成、管理、部署人工智慧軟硬體系統;
5、設計、開發人工智慧系統解決方案。
二、物聯網工程技術人員
定義:從事物聯網架構、平台、晶元、感測器、智能標簽等技術的研究和開發,以及物聯網工程的設計、測試、維護、管理和服務的工程技術人員。
主要工作任務:
1、研究、應用物聯網技術、體系結構、協議和標准;
2、研究、設計、開發物聯網專用晶元及軟硬體系統;
3、規劃、研究、設計物聯網解決方案;
4、規劃、設計、集成、部署物聯網系統並指導工程實施;
5、安裝、調測、維護並保障物聯網系統的正常運行;
6、監控、管理和保障物聯網系統安全;
7、提供物聯網系統的技術咨詢和技術支持。
十一、工業機器人系統操作員
定義:使用示教器、操作面板等人機交互設備及相關機械工具對工業機器人、工業機器人工作站或系統進行裝配、編程、調試、工藝參數更改、工裝夾具更換及其他輔助作業的人員。
主要工作任務:
1、按照工藝指導文件等相關文件的要求完成作業准備;
2、按照裝配圖、電氣圖、工藝文件等相關文件的要求,使用工具、儀器等進行工業機器人工作站或系統裝配;
3、使用示教器、計算機、組態軟體等相關軟硬體工具對工業機器人、可編程邏輯控制器、人機交互界面、電機等設備和視覺、位置等感測器進行程序編制、單元功能調試和生產聯調;
4、使用示教器、操作面板等人機交互設備進行生產過程的參數設定與修改、菜單功能的選擇與配置、程序的選擇與切換;
5、進行工業機器人系統工裝夾具等裝置的檢查、確認、更換與復位;
6、觀察工業機器人工作站或系統的狀態變化並做相應操作,遇到異常情況執行急停操作等;
7、填寫設備裝調、操作等記錄。
十二、工業機器人系統運維員
定義:使用工具、量具、檢測儀器及設備,對工業機器人、工業機器人工作站或系統進行數據採集、狀態監測、故障分析與診斷、維修及預防性維護與保養作業的人員。
主要工作任務:
1、對工業機器人本體、末端執行器、周邊裝置等機械繫統進行常規性檢查、診斷;
2、對工業機器人電控系統、驅動系統、電源及線路等電氣系統進行常規性檢查、診斷;
3、根據維護保養手冊,對工業機器人、工業機器人工作站或系統進行零位校準、防塵、更換電池、更換潤滑油等維護保養;
4、使用測量設備採集工業機器人、工業機器人工作站或系統運行參數、工作狀態等數據,進行監測;
5、對工業機器人工作站或系統的故障進行分析、診斷與維修;
6、編制工業機器人系統運行維護、維修報告。
十三、物聯網安裝調試員
定義:利用檢測儀器和專用工具,安裝、配置、調試物聯網產品與設備的人員。
主要工作任務:
1、產品和設備檢查,檢測物聯網設備、感知模塊、控制模塊的質量;
2、組裝物聯網設備及相關附件,並選擇位置進行安裝與固定;
3、連接物聯網設備電路,實現設備供電;
4、建立物聯網設備與設備、設備與網路的連接,檢測連接狀態;
5、調整設備安裝距離,優化物聯網網路布局;
6、配置物聯網網關和短距傳輸模塊參數;
7、預防和解決物聯網產品和網路系統中的網路癱瘓、中斷等事件,確保物聯網產品及網路的正常運行。
十四、城市軌道交通線路工
定義:從事城市軌道交通線路設施施工、大修、維修及巡檢的人員。
主要工作任務:
1、線路設備及附屬設施的檢查、檢測;
2、線路的日常保養、維修及病害處理;
3、道岔的日常保養、維修及病害處理;
4、線路附屬設施、設備的日常保養、維修及病害處理;
5、線路大修;
6、道岔大修;
7、線路附屬設施設備大修。
十五、城市軌道交通列車檢修工
定義:從事城市軌道交通列車接收、檢修及調試的人員。
主要工作任務:
1、檢查、檢測、分解、組裝以及調試列車機械繫統的主要部件;
2、檢查、清潔、更換、檢修列車機械繫統關鍵部件,測量、調整關鍵參數;
3、使用工具和技術手段測量、判斷和處理城軌列車機械繫統的故障;
4、檢查和測試列車牽引系統、輔助供電系統的各項功能;
5、根據綜合線路圖,檢查牽引控制迴路、輔助控制迴路各電氣元件狀態,測量和調整主要部件的電氣參數;
6、使用工具和技術手段測量、判斷和處理城軌列車電氣系統控制迴路故障;
7、檢查、調試整列列車性能,確保列車出庫狀態。
3. 2019年有什麼科學家創造的偉大事跡嗎
一、嫦娥四號
月3日,實現人類探測器首次月背軟著陸,傳回世界首張近距離拍攝的月背影像圖像;
二、「東方紅」3號
5月31日,全球最大的靜音科考船「東方紅」3號交付,我國「透明海洋」觀測體系實現跨越式發展;
三、中國運載火箭首次海上發射
6月5日,長征十一號運載火箭在黃海發射,成功將7顆衛星送入預定軌道;
四、人造太陽
6月5日,新一代可控核聚變研究裝置「中國環流器2號」裝置總體安裝啟動,預計2020年投入運行,開展探索清潔能源相關科學實驗;
五、5G商用
6月6日,工信部正式向中國電信、中國移動、中國聯通、中國廣電發放了5G商用牌照。10月31日,5G套餐上線,5G商用時代拉開序幕;
六、人工心臟
7月,第三代人工心臟助兩位心衰患者重獲新生,標志中國人工輔助心臟裝置性能達到國際同類水平。9月,首批人工心臟產品在重慶獲批上市;
七、「雪龍2」號首航南極
7月11日,第一艘自主建造的極地科學考察破冰船「雪龍2」號順利交付。10月15日首航南極。11月20日進行首次陸緣冰破冰作業;
八、北京大興國際機場
9月25日,北京大興國際機場正式投入使用,被稱為「新世界七大奇跡」之首;
九、「高分七號」衛星
11月3日,「高分七號」衛星發射升空,它能在太快拍出媲美「阿凡達」的3D影像。12月10日,發布首批20餘幅亞米級立體影像圖;
十、發現最大恆星級黑洞
11月28日,國家天文台宣布,中國天文學家發現迄今最大恆星級黑洞。
4. 求大數據分析技術
列一大堆沒用的。。。
大數據分析技術兩種理解: 一種是 大數據處理涉及到技術, 一種專是 數據挖掘技術
第一種就屬是數據處理流程: 也就是 數據採集 數據清洗 數據存儲 數據挖掘 結果可視化展示 技術。
第二種就是具體的數據挖掘演算法: 主要是 回歸 分類 關聯規則 聚類 異常檢測 這幾種
看你需要哪種?
5. 基於大數據的視覺搜索應用與組織模式研究
基於大數據的視覺搜索應用與組織模式研究
當前視覺搜索已成為信息科學領域的前沿課題,主要用於分析和研究現實世界實體屬性、行為、事件與視覺大數據資源之間的發展規律,針對視覺大數據資源的獲取、組織、描述與利用問題,研究視覺資源及其時空關聯信息之間的價值發現與資源整合的內在機理
當前視覺搜索已成為信息科學領域的前沿課題,主要用於分析和研究現實世界實體屬性、行為、事件與視覺大數據資源之間的發展規律,針對視覺大數據資源的獲取、組織、描述與利用問題,研究視覺資源及其時空關聯信息之間的價值發現與資源整合的內在機理,解決其多維關聯與協同融合問題,進而實現視覺大數據資源的有效整合、知識發現與實時交互。
基於此,本研究從宏觀與中觀角度,從信息科學視角下視覺搜索研究的起源著手,對其發展歷程、概念與特點進行描述,圍繞其理論與應用研究的幾個關鍵問題展開討論,並簡要探討其最新研究進展及應用。
1、大數據環境下視覺搜索的發展歷程及特點
1.1 問題的提出
視覺搜索不是一個新名詞,它最早出現於心理學與生理學領域,用於描述人們通過視覺通道在特定區域內檢測某特定目標是否出現或出現後確定其位置的行為。如在地圖上找某大學所處位置、在食堂內點菜、在書架上找書或在圖書館內找人等。在現實世界中,人們經常需要利用視覺搜索在復雜物理環境中獲取有價值的信息,來決定接下來的語言和行為。因此,視覺搜索理論受到心理學家和人因(HumanFactors)學家的廣泛關注,大量研究集中在對人類視覺認知、生理反饋機理的理解與表達上,並總結出了許多應用型和理論型知識。正是由於視覺搜索的可用性和有效性,使得許多工作、行業、領域都離不開這一生理行為。
相關基礎理論和關鍵技術的不斷發展與完善,促使傳統視覺搜索應用不斷向信息化、技術化和網路化方向發展,如何將傳統視覺搜索行為轉換成「所見即所知」式視覺搜索模式,這一難題逐漸擺在了人們面前。與此同時,網路環境、信息技術、計算性能、存儲空間、數據規模與軟硬體設施等方面的飛速提升,也為客觀物理世界與虛擬網路空間之間建立起密不可分的關聯關系,使視覺搜索技術的實現成為可能。人們可以方便快捷地採集客觀物理世界中的視覺對象,從互聯網中獲取與之相關的關聯信息。
1.2 視覺搜索發展歷程及發展趨勢
近幾年來,隨著大數據環境的逐步完善和大數據技術的迅速發展,關於視覺資源整合與視覺搜索研究的呼聲越來越大。Nature和Science分別於2008年、2011年出版了大數據專題研究,提出圖像、視頻與用戶交互信息是未來大數據的重要組成部分。2009年,Stanford University的Griod、Chandrasekhar等學者將視覺搜索理論引入到信息檢索領域,提出Visual Search、Mobile Visual Search等概念,舉辦了第一屆移動視覺搜索研討會,並對其體系結構、應用與服務模式等問題進行了探討。2010年,Google技術研究部前主管Norvig在Nature上發表的專題論文2020Visions中指出,「文本、圖像和視頻等視覺資源及用戶交互信息、感測信息的有機融合,會給搜索引擎帶來巨大挑戰,如何對視覺搜索結果進行資源深度整合將會成為Google未來10年面臨的最大挑戰。」同年,北京大學高文、黃鐵軍與段凌宇等將其引入國內,舉辦了第二屆移動視覺搜索研討會,並圍繞其關鍵技術、體系結構、視覺資源組織與描述方法、視覺資源標准化與視覺知識庫建設等問題展開了研討。2012年,這一理論與技術迅速被中國計算機學會所接受,認為將視覺搜索與增強現實技術相結合的信息檢索模式,將是繼搜索引擎之後的新一代互聯網服務範式。隨後,張興旺、朱慶華等嘗試將其引入數字圖書館領域,並圍繞相關理論與應用模式展開了研究。
根據視覺搜索研究的發展軌跡來看,國內關於視覺搜索研究總體仍處於探索與嘗試階段,研究軌跡已基本跨過早期理論性嘗試過程,正步入中期技術性和應用性探索階段。尤其是在我國科學技術部於2011年啟動國家重點基礎研究發展計劃(「973」計劃)「面向公共安全的跨媒體計算理論與方法」,對跨媒體視覺資源的統一表示和建模方法、關聯推理和深度挖掘、綜合搜索和內容合成等關鍵科學問題進行研究之後,國內相關研究步入快速發展階段。自2015年以來,視覺搜索理論與應用研究的重要性和必要性更加凸顯,國務院2015年9月印發的《促進大數據發展行動綱要》提出,要充分利用大數據,提升領域數據資源的獲取和利用能力,推動各類數據融合和資源整合。國務院2015年7月印發的《關於積極推進「互聯網+」行動的指導意見》提出「構建包括語音、圖像、視頻、地圖等數據的海量訓練資源庫,加強人工智慧基礎資源和公共服務等創新平台建設」。國家自然科學重大研究計劃「大數據驅動的管理與決策研究」認為「大數據價值的產生機理和轉換規律具有高度的應用領域依賴性」。科技部2016年發布的《關於發布國家重點研發計劃精準醫學研究等重點專項2016年度項目申報指南的通知》的「雲計算和大數據重點專項」中更是明確將「面向大范圍場景透徹感知的視覺大數據智能分析關鍵技術」列為重點研究內容之一,要求對視覺語義建模、視覺對象的時空定位與搜索、跨場景數據關聯技術等展開研究。
1.3 視覺搜索研究對象及視覺大數據資源特點
視覺搜索的研究已逐漸發展成為信息檢索領域的主要研究趨勢,到目前為止,關於視覺搜索的定義尚未形成統一的認識,但從信息檢索角度來看,大家對它的普遍理解是指將客觀物理世界中的視覺資源作為檢索對象,通過互聯網去獲取關聯信息的一種信息檢索方式。它是以視覺大數據資源及其關聯信息為研究對象,以視覺大數據資源的獲取、分析、組織、理解和表達方法為主要研究內容,以信息技術與方法為主要研究手段,以發現視覺大數據資源蘊含的知識價值和拓展其利用能力為主要研究目標的一種綜合性的應用型前沿領域。它主要針對的是當前大數據環境下海量、多元異構、動態無序和高速進化的視覺資源的分析和利用問題,重點研究的是如何充分利用當前飛速發展的信息技術來解決視覺大數據資源的理解和表達,如何有效地實現視覺搜索,如何利用視覺搜索技術來從海量視覺大數據資源中發現新的知識。
毫無疑問,未來是一個智慧(或稱之為「互聯網+」)的時代。智慧地球、智慧城市、智慧圖書館等理論與應用的迅速發展,給視覺搜索理論與應用研究提供了「沃土」。「互聯網+」時代所衍生的數據規模的劇增,文本、圖像、音視頻、用戶交互信息與各種感測信息會成為「數據海洋」的主流,而這些數據來源中超過80%來自於人類視覺通道,現階段把握「互聯網+」時代信息檢索和知識服務未來發展脈絡的最重要手段可能是視覺搜索。
視覺大數據資源因其包含文本、圖像、音視頻與用戶觀看記錄等復雜無序、動態變化的時空信息,使其成為數字圖書館中內容最豐富的信息載體,並將會成為「互聯網+」時代最為重要的信息表達和信息傳播媒介。而以視覺大數據資源為研究對象的視覺搜索,由於前者所處知識空間的知識實體與知識價值在時間、空間和屬性三個方面的自有特性,使得視覺搜索也呈現出復雜無序、動態變化和時空語義關聯等特性,同時也需要對視覺大數據資源的形式化表達、系統化組織、結構化描述與時空關聯關系分析方法等進行研究。由此可得知視覺大數據資源主要具有以下特徵:
視覺大數據資源包含文本、圖像、視頻、用戶觀看信息及用戶交互信息等時空信息,並且它所包含的視覺對象、事物內容、事件過程在時間、空間、語義等方面具有時序或時空關聯關系。
視覺大數據資源具有時空語義關聯、動態變化、數據規模大和結構復雜等特點,這些基於視覺對象、事物內容、事件過程的動態變化可以用時空語義關聯進行表達和描述,其獲取、組織和描述過程可以用機器語言來進行表達,通過視覺對象、事物內容、事件過程之間的語義關聯映射,建立視覺大數據資源的時空語義關聯關系。
視覺大數據資源具有數據規模大、結構復雜、類型多元、多維尺度關聯和縱深緯度高等特性,可根據視覺大數據資源的時空語義關系建立對應的尺度關聯機制。針對不同尺度、縱深緯度的視覺大數據資源的時空關聯關系,可實現視覺對象、事物內容、事件過程之間的多維尺度轉換和重置,進而實現視覺大數據資源的語義關聯關系分析。
視覺大數據資源能提供基於視覺資源內容來理解視覺對象行為,根據視覺對象的時空語義關聯關系建立起發展趨勢模型,並根據有效組織、理解和描述來預測某特定事物在某特定階段將可能發生的行為態勢。
可針對視覺大數據資源的獲取、組織、理解和描述問題,來實現用戶與視覺大數據資源之間的實時交互、反饋和視覺對象知識庫的構建。根據視覺對象的相似行為特徵、時空關聯關系和實時交互結果,來幫助人們製作、生產、運營和消費新的視覺資源,滿足數字圖書館用戶的多元化知識服務需求。
2、大數據環境下視覺搜索的應用與組織模式
視覺大數據資源經過組織、分析、處理和整合,並建立基於特定領域的數字圖書館視覺搜索平台之後,才能為用戶提供大數據知識服務。不同學科、領域的視覺搜索模式對視覺大數據資源的獲取、組織、處理與整合模式會有所不同。正因如此,當前大部分應用是從知識服務與信息檢索角度,建立起領域導向的視覺大數據資源整合平台,通過視覺搜索來對視覺大數據資源進行有效管理與利用,並按照特定學科、專業和領域的知識服務需求來提供服務,從而滿足各類大數據知識服務需求。
2.1 基於深度學習的視覺搜索工業應用模式
傳統視覺搜索研究主要是先採用人工標注方法對視覺資源的底層特徵進行標注後,再採用機器學習方法來解決視覺資源之間的語義鴻溝、異構鴻溝與語義關聯之間的問題。基於人工標注的視覺大數據資源整合與利用方法,需要標注者擁有豐富的專業領域知識和工業應用經驗,需耗費大量的時間和人力成本,且精確性低。與對視覺資源特徵進行人工標注方法不同的是,深度學習一般都是通過對視覺資源特徵進行多層神經網路訓練後,進行視覺特徵學習,進而獲取到特徵提取更合理、區分性更強的視覺特徵理解和描述。大量研究證明通過深度分析方法所提取到的視覺特徵在圖像分類與識別、視覺場景識別、智能監控、語音識別、知識圖譜構建等應用領域都獲得過成功。視覺資源的顯著性特徵提取和分割方法,能夠採用模擬人類視覺系統和生理認知體系來提取視覺資源中顯著性特徵區域。目前,性能相對最好的視覺資源特徵提取方法在公開的視覺大數據資源數據集中的顯著性特徵檢測准確率在95%左右,視覺資源前景特徵分割准確率將近92%,這一比例在近幾年全球性各類大規模視覺資源分析與識別比賽中,仍然在不斷增加。比如,Google研究組在大規模視覺識別挑戰賽(ILSVRC)中,採用改進的深度卷積網路Google Net將圖像識別准確率提升到93%;Google小組在微軟圖像標題生成挑戰賽(MS COCO ICC)中,採用基於深度分析的圖像特徵提取方法獲得冠軍;悉尼科技大學與卡耐基梅隆大學、微軟亞洲研究院和浙江大學在THUMOS比賽中,均將深度分析方法與視覺對象運動特徵結合起來對視覺資源進行動作識別,分別獲得前三名。
傳統學術研究的理論成果往往需要很長一段時間發展,才能逐漸走向成熟,並進入到實際的工業應用中去。但無論是深度學習,還是視覺搜索,它們都擁有著極強的工程理論模型。一方面,它們在被學術界關注和研究的同時,也被工業領域所密切關注和嘗試;另一方面,由於工業領域(如Google、網路、微軟等)早就擁有著大規模的視覺大數據資源,且一直活躍在諸多信息科學領域的研究前沿,在很多領域,它們相較於學術界更有優勢。如Google的知識圖譜Knowledge Graph,Google Now與Google街景地圖,微軟的語音助手Cortana,愛奇藝的愛奇藝大腦,Facebook的Graph Search等均屬於工業界視覺搜索較為經典的應用案例。事實上,國外工業界各大公司,如Google,Facebook,Microsoft等對視覺搜索不僅僅只是開展大量的研究,甚至還在內部成立了專門研究機構,國內的網路、華為、騰訊和阿里巴巴也不例外。
2.2 基於知識計算的視覺搜索知識服務模式
數字圖書館領域對視覺搜索理論與應用展開研究的一個重要目的,就是為高校和科研機構的研究人員提供嵌入式協作化的知識服務,而數字圖書館視覺搜索平台是將海量視覺大數據資源與平台提供的視覺大數據資源的組織、分析和處理功能嵌入到知識服務過程中。
視覺大數據資源整合與利用是當前國內外人工智慧、信息檢索領域的研究熱點,擁有非常廣泛的應用與研究前景。事實上,圖像搜索作為視覺搜索的一個研究分支方向,近幾年來,國內已有很多個人(如中國科學院高科、北京大學高文與黃鐵軍、南京大學朱慶華)、機構(如浙江大學、清華大學、北京大學、中國科學院計算所等)、企業(如愛奇藝、網路、騰訊、360、搜狗等)正在做與之相關的研究,並且很多已經推出了基於內容的圖像搜索平台,為用戶提供圖像搜索服務。而美國的麻省理工學院、加州大學伯克利分校、伊利諾伊大學和英國的牛津大學等相關研究工作開始得更早,也研發出了相應的基於圖像內容的圖像搜索系統。
在以上所有相關研究中,它們都具有一個典型的研究特徵:研究目的是為了解決視覺搜索的應用問題,而對應的視覺搜索模式大部分是基於知識計算。由於視覺搜索需要組織、分析和處理的對象主要包括文本、圖像、視頻等各類蘊含大量價值的視覺資源,因此,如何從視覺大數據資源中獲取有價值的知識,就成為國外學術界和工業界一直以來的研究熱點。以發掘視覺大數據資源中蘊含的豐富的、復雜關聯的知識為目的的知識庫稱之為視覺對象知識庫。目前,全球基於文本、圖像、音視頻等視覺資源的各類知識庫有不少於60種,而基於這些視覺對象知識庫的具體應用案例和系統平台也有幾百種。其中,比較有代表性的應用案例有維基網路的DBpedia(2014版中包含8.7萬部電影、12.3萬張唱片、45萬個物件等)、Google的知識圖譜Knowledge Graph(包括地標、城市、人名、建築、電影、藝術作品等5億個搜索結果實體與350億條關聯知識條目)、Facebook的Graph Search(包含10億名用戶、2400億張圖像、10000億次頁面訪問量等)等。
藉助視覺搜索的相關理論與技術,開展對海量、異構、多元的視覺大數據資源的研究,不僅可豐富信息檢索的外延和內涵,而且可以有效地解決當前數字圖書館所面臨的「大數據、小知識、小服務」的瓶頸,具有一定的應用價值和現實意義。
2.3 基於語義分析的視覺內容關聯組織模式
從已有研究來看,視覺搜索的研究對象大部分集中在文本與圖像上,其中圖像搜索是學者們著力解決的重點方向。視覺搜索研究可分為3個階段:一是20世紀70年代末期開始的基於文本/元數據的圖像搜索。這一方式主要通過人工標注元數據對圖像進行描述,來實現對圖像的信息檢索功能,缺點是元數據標注費時費力,描述標准與反饋內容不完整,且容易有太多主觀色彩。二是20世紀90年代開始提出基於視覺內容的圖像搜索方法。這一方式其本質是採用人工構造圖像底層視覺特徵的方式來進行圖像相似性比較,進而實現圖像搜索,缺點是對圖像底層特徵和高層語義之間存在的語義鴻溝問題沒有得到較好解決。三是21世紀初期提出的基於深度學習的圖像搜索方法。社交網路與用戶生成內容成為網路數據的主要來源,利用用戶標簽對圖像語義進行組織、表達和理解成為研究主流,深度學習方法由此融入到相關領域。
與圖像搜索相比,視頻表達和分析則是視覺搜索領域相對較新的研究領域。視頻由大量圖像幀組成,且圖像幀之間有較為緊密的時空與語義關聯關系,這對視覺搜索技術要求更高。但由於深度學習在文本與圖像搜索領域所取得的成功,學者們開始藉助於深度學習框架,對視頻進行組織、理解和描述,尤其是在視頻特徵提取這一關鍵環節採取了以下幾種方法:一是視頻靜態關鍵幀特徵描述。由於視頻是由大量圖像幀按時序與語義關聯組成,故可採用深度學習方法對靜態視頻幀(即圖像關鍵幀)進行特徵學習。在具體應用中,一旦確定合理的靜態關鍵幀提取和編碼方式,也能形成較好的視頻描述效果。二是動態視頻時序特徵描述。有學者曾提出密集軌跡方法對視頻進行分析,取得了不錯效果。三是前面兩種方法的有機結合。牛津大學的Simonyan等提出採用時間和空間深度神經網路來對視頻進行分析,時間軸輸入的原始視頻,用於對視頻中的視覺對象進行識別,空間軸輸入的時序關聯場,用於對視頻中視覺對象的動作及其軌跡進行識別。
目前國內外也有大量針對視覺內容分析與表達方面的競賽,比如2013年美國佛羅里達大學組織開展的THUMOS比賽,就對海量視覺數據集中異構無序的視覺資源進行分析和理解,該項賽事隨後每年都會開展相關研究。國內外許多高校、科研機構都積極參與到該項賽事中,如清華大學、浙江大學、香港中文大學、卡耐基梅隆大學、悉尼科技大學等。美國國家標准與技術研究所2011年組織開展的TRECVID比賽,針對大規模視覺數據集中復雜視覺資源中事件監測問題展開研究。近幾年來,該項賽事也一直在圍繞著這個主題開展相關研究,國內許多高校,如復旦大學、浙江大學、北京理工大學與同濟大學等,在這項賽事中也獲得了一定成績。
目前雖然在視覺大數據資源的組織、分析、理解和利用方法上有很多研究成果,但這些成果最終目的是應用於視覺搜索。近年來一系列研究對於視覺搜索及其在各行業、領域的應用與推廣工作起到了積極作用,這對於數字圖書館領域而言,是一個積極信號。
3 大數據環境下視覺搜索研究的5個核心問題
盡管視覺搜索已經獲得了工業界和學術界(包括數字圖書館領域在內)的高度關注,但目前在國內並未得到廣泛應用及推廣,主要原因是由於相關技術與應用產品尚未完全成熟,存在著視覺搜索性能不夠理想或不夠穩定、用戶體驗質量不佳、應用局限性較強等問題,圍繞這些問題,就需要從視覺搜索研究基礎理論與技術角度來解決。從數字圖書館視覺搜索模式構建流程[1]來看,視覺搜索研究主要包括5個核心問題,分別描述如下。
視覺大數據資源的獲取與組織方法。互聯網環境下視覺大數據資源的存在形式是動態無序和異構離散的,視覺資源的生產和發布是動態變化的。視覺資源所蘊含的信息內容都包含多個異構、復雜的信息主題,彼此之間存在語義時空關聯關系。而傳統基於人工標注的視覺資源標注方法往往不夠精確,因此,如何快速獲取到所需視覺資源,是視覺搜索應用的關鍵問題。而對與待搜索視覺對象無關的視覺資源的清洗過濾,以及視覺大數據資源的有效組織是視覺搜索應用的核心問題。
視覺大數據資源的理解與表達方法。為了在海量視覺大數據資源中找到與待搜索對象一致的視覺資源,就需要從符合待搜索視覺資源的特徵分析與理解出發,對其視覺內容進行多元化、結構化、多層次的深度理解和表達。
視覺大數據資源整合與交互方法。視覺搜索作為一種信息檢索模式,其服務對象是用戶。對視覺大數據資源的獲取與組織、理解與表達的目的是為了給用戶提供智慧化、人性化的知識服務。因此,如何圍繞視覺大數據資源整合全生命周期進行多維度分析,從而滿足用戶對視覺大數據資源的多元化知識服務需求,也是視覺搜索研究能否成為現實的核心問題。
視覺對象知識庫建設及標准化問題。視覺搜索依賴於視覺對象知識庫的建設。基於高質量的視覺對象知識庫,用戶可快速將待搜索視覺對象與虛擬信息空間中的視覺大數據資源進行有效關聯,從而享受到數字圖書館提供的視覺搜索知識服務。同時,標准化問題也是視覺搜索應用能否順利應用和推廣的關鍵所在。
視覺搜索體系的安全與可靠性理論。無論在任何時候,網路安全及系統可靠性問題是永遠無法迴避的難題,視覺搜索亦不例外。在視覺搜索體系中,數據安全性與知識產權、用戶隱私權、系統可用性與可靠性等問題亦是視覺搜索能否得到有效推廣與應用的核心問題。
4 總結與展望
在「互聯網+」時代,信息服務正越來越廣泛地深入到用戶智慧化、個性化和嵌入式的知識服務需求中去,數字圖書館領域開始呼喚新型的殺手級信息檢索模式。視覺搜索是當前信息檢索領域發展的一個重要前沿和創新突破口,在充分汲取國內外信息科學領域先進研究成果的基礎上,開展數字圖書館視覺搜索基礎理論與應用研究,不僅有望從理論上豐富數字圖書館知識服務研究思想與未來發展框架,也有利於揭示數字圖書館中視覺大數據資源價值的產生機理與轉換規律。
毫無疑問,人類正在向「『互聯網+』時代」邁進,作為一種技術與理念創新,視覺搜索必然符合一般信息技術生存、發展與成熟基本規律,需要經歷技術誕生的萌芽期、飛速進步的發展期、迅速膨脹的高峰期、去泡沫化的低谷期、穩步發展的光明期和實際應用的高峰期6個階段。目前來看,國內外已有視覺搜索研究正處於發展期,存在著理論與技術交叉之後學科間的不平衡這一問題。當前視覺搜索的理論、方法與技術研究主要集中在商業型視覺搜索應用上,對於產生視覺大數據資源的學術領域則關注較少。實際上,以科學研究、學科服務等學術領域為代表的視覺大數據資源,具有異於商業型應用的豐富內涵與獨特特徵,只有全面掌握商業應用與學術領域的相關研究,才有助於建立更加科學、系統、合理的視覺搜索理論體系和應用框架。
6. 在美國伯克利學大數據研究生回國找工資年薪多少
大數據研來究生留學回來還是自比較吃香的,因為隨著信息技術和互聯網的爆發式發展,人工智慧、物聯網、雲計算等新興技術與大數據緊密結合,整個大數據行業仍將持續高速發展,未來大數據將成為全行業的基石,發展前景不可估量。但不管是從時間還是經驗看,目前國內培養大數據人才的院校都尚處於起步階段,學校教育與大數據市場需求脫節嚴重,如果有美國留學背景的大數據人才,年薪不會低於30萬人民幣。工作5年後平均年薪60萬
7. 大數據專業哪些大學有
北京大學
大數據是一個新的專業,國內首次出現這個專業是在2016年的時候,當時新設這個專業的高校全國只有3所有,其中就有北京大學。
2.對外經濟貿易大學
與北大為同一批次開設大數據專業的學校還有對外經貿大學,很多人不知道這所學校是一所211工程大學,所以這個大數據專業應該是辦得不錯的。
3.中南大學
該校是湖南最好的大學,屬於211和985工程學校。是第一批開設大數據與專業的高校。網上的一些排名中將該校的大數據專業排在了全國第一的位置。
4.中國人名大學
人大屬於第二批開設大數據專業的高校,具體開設時間是在2017年。人大的這個專業雖然開設只有一兩年的時間,但是實力應該是很強的,因為該校的統計學科在國內處於領先地位。
5.復旦大學
復旦大學的大數據專業是在2017年開設的,支撐學科主要涉及到了統計學、計算機科學和數學等學科,應用范圍很廣,幾乎在所有的行業中都可以進行應用。
6.電子科技大學
電子科技大學位於成都,綜合實力在全國范圍內排前50位,在四川省中排名第2位,在全國電子科技內大學中排名第一。
(7)貴陽伯克利大數據創新研究中心擴展閱讀
數據科學與大數據技術專業,簡稱數科或大數據,旨在培養具有大數據思維、運用大數據思維及分析應用技術的高層次大數據人才。掌握計算機理論和大數據處理技術,從大數據應用的三個主要層面(即數據管理、系統開發、海量數據分析與挖掘)系統地培養學生掌握大數據應用中的各種典型問題的解決辦法,實際提升學生解決實際問題的能力,具有將領域知識與計算機技術和大數據技術融合、創新的能力,能夠從事大數據研究和開發應用的高層次人才。
大數據專業將從大數據應用的三個主要層面(即數據管理、系統開發、海量數據分析與挖掘)系統地幫助企業掌握大數據應用中的各種典型問題的解決辦法,包括實現和分析協同過濾演算法、運行和學習分類演算法、分布式Hadoop集群的搭建和基準測試、分布式Hbase集群的搭建和基準測試、實現一個基於、Maprece的並行演算法、部署Hive並實現一個的數據操作等等,實際提升企業解決實際問題的能力。