『壹』 大數據的就業前景怎麼樣
大數據就業發展前景
互聯網中的「大熊貓」
熊貓,作為國寶,不僅因專為萌萌的舉止行動虜獲了屬不少人的心,更因為是世界上的珍稀物種而被另眼相待。在高速發展的互聯網行業中,大數據可以說熱度日漸高漲,可以被認為是IT類職業中的「大熊貓」。
大數據工程師因為稀缺被很多知名企業高價聘請,因為技術的魅力深受國家的重視,對於2019年的大數據就業發展前景是一直被人們看好的。就目前來看大數據工程師的收入待遇可以說達到了同類的頂級,以後的發展前景更是一片光明。
大數據目前行業發展迅速,人才緊缺。2018年人民日報發文稱:大數據人才需求180萬,目前從業只有30萬,人才缺口達到150萬,這也是為什麼大數據工資都如此之高的原因。
據小編觀察,國內IT、通訊、行業招聘中,有10%都是和大數據相關的,且比例還在上升。
大數據時代的到來很突然,在國內發展勢頭迅猛,而人才卻非常有限,現在完全是供不應求的狀況。在美國,大數據工程師平均每年薪酬高達17.5萬美元,而據了解,在國內頂尖互聯網類公司,同一個級別大數據工程師的薪酬可能要比其他職位高20%至30%,且頗受企業重視。
『貳』 滴滴再現大數據「殺熟」 ,為何網約車平台敢明目張膽坑客戶
其實不得不說的是,網約車平台之所以敢明目張膽的坑客戶,也是因為在現實期網約車平台缺乏必要的市場監管,導致價格混亂,另一方面利用平台自身的優勢實行市場定價,也會導致客戶的利益受損,所以在大數據殺死的時代也導致一些客戶的利益遭受損失,因此可以從下幾個方面出發來思考問題。
3,網約車平台之所以明目張膽的坑客戶,最根本原因是因為在大數據時代經過大數據分析,可以對用戶的心理訴求進行猜測,因此導致一些客戶利益得不到保障。其實不能說是在大數據時代滴滴通過大數據分析,對潛在的用戶人群實行群體定位,這就導致一部分顧客因為自身的消費觀念原因,所以導致成為滴滴宰殺的對象,而對我們來說。這也是大數據時代,客戶遭受利益損失的最根本原因/
其實不得不說是第一在線大數與殺數一方面確實是因為自身的壟斷地位,另一方面是因為在大數據時代經過大數據分析對客戶實行消費群體定位,這就導致一部分顧客必定會成為大數據殺手的犧牲品,而另一方面缺乏市場有效的監管,因此滴滴這種行為也很難得到有效的制止。
『叄』 對政府服務和管理而言,大數據的大意義是什麼
1、創新政府大數據管理思維。
第一,利用大數據形成政府管理的大數據思維。政府需要進一步開放數據信息,提升社會公眾對於政府利用大數據技術創新自身管理範式的感知水平。
第二,政府需要強化數據信息整合的力度。政府需要進一步強化對於數據信息的整合與溝通,通過打通不同政府部門之間的「信息孤島」,進而提升政府協同管理水平。
第三,利用大數據提高服務質量。當前我國政府亟需創建創新型與服務型政府,政府在提供公共服務過程中需要藉助大數據相關手段針對社會大眾的需求進行及時收集與回應,以此為基礎來增強社會大眾對於政府服務供給的獲得感。
2、利用大數據手段升級政府管理手段。
第一,利用大數據技術完善政府管理專業的人才儲備。我國政府管理部門應致力於引進大數據專業領域的人才。政府管理部門通過充實大數據人才隊伍,有助於進一步提升政府管理決策的效率,同時鑒於大數據人才的稀缺性,政府不僅需要藉助相關的優惠政策與扶持條件。
吸引大數據領域的高水平人才安家落戶,更需要充分發揮自身的平台優勢,致力於搭建以大數據研究為核心的產學研一體化研究聯盟,通過大數據戰略聯盟的締結,實現大數據管理人才的自給自足。
第二,利用大數據技術更新政府管理技術儲備。
大數據的飛速發展對於網路空間安全提供了較大的挑戰。我國政府需要從頂層設計的戰略視角制定大數據網路安全保障機制,並進一步強化對於網路空間的管理與治理。
3、利用大數據理順政府管理運行體系。
第一,利用大數據手段提升決策科學化水平。大數據技術在政策創新、公共危機治理以及行政監督等領域具有得天獨厚的技術優勢,決策者藉助大數據技術能夠促進對於大數據的深度挖掘和分析,進而對政府的各類管理事項作出科學預測,以提升決策的合理性與科學性。
大數據技術不僅能夠進一步強化政府相關管理決策的指向精準性,同時藉助大數據技術自身所蘊含的先進性與前沿性,能夠為政府管理科學化提供有力支撐。
第二,藉助大數據技術增強政府公共服務產出水平。政府在進行相關公共服務供給過程中,由於不能保障及時有效覆蓋社會大眾的全部需求,在大數據背景下政府應該通過致力於統一公共服務數據的格式與採集標准,持續推進公共服務資源的重新整合、竭力實現公共服務的均等化。
(3)大數據人民日報擴展閱讀
大數據趨勢
趨勢一:數據的資源化
何為資源化,是指大數據成為企業和社會關注的重要戰略資源,並已成為大家爭相搶奪的新焦點。因而,企業必須要提前制定大數據營銷戰略計劃,搶占市場先機。
趨勢二:與雲計算的深度結合
大數據離不開雲處理,雲處理為大數據提供了彈性可拓展的基礎設備,是產生大數據的平台之一。自2013年開始,大數據技術已開始和雲計算技術緊密結合,預計未來兩者關系將更為密切。除此之外,物聯網、移動互聯網等新興計算形態,讓大數據營銷發揮出更大的影響力。
趨勢三:科學理論的突破
隨著大數據的快速發展,就像計算機和互聯網一樣,大數據很有可能是新一輪的技術革命。隨之興起的數據挖掘、機器學習和人工智慧等相關技術,可能會改變數據世界裡的很多演算法和基礎理論,實現科學技術上的突破。
趨勢四:數據科學和數據聯盟的成立
未來,數據科學將成為一門專門的學科,被越來越多的人所認知。各大高校將設立專門的數據科學類專業,也會催生一批與之相關的新的就業崗位。與此同時,基於數據這個基礎平台,也將建立起跨領域的數據共享平台,之後,數據共享將擴展到企業層面,並且成為未來產業的核心一環。
趨勢五:數據泄露泛濫
未來幾年數據泄露事件的增長率也許會達到100%,除非數據在其源頭就能夠得到安全保障。可以說,在未來,每個財富500強企業都會面臨數據攻擊,無論他們是否已經做好安全防範。而所有企業,無論規模大小,都需要重新審視今天的安全定義。
在財富500強企業中,超過50%將會設置首席信息安全官這一職位。企業需要從新的角度來確保自身以及客戶數據,所有數據在創建之初便需要獲得安全保障,而並非在數據保存的最後一個環節,僅僅加強後者的安全措施已被證明於事無補。
參考資料來源:人民網-大數據與政府改革創新
『肆』 大數據和人工智慧是媒體監測的重要發展方向嗎
從數字時代到智能化,媒體正在重新被定義。當大數據、人工智慧、雲計算、物聯網等信息技術加速迭代創新中,在媒體行業的深度融合也愈加緊密,向「智能」「智慧」升級。
在此背景下,為推進廣播影視技術與新一代信息技術的融合發展,代錶行業風向的CCBN(中國國際廣播電視信息網路博覽會),在今年舉辦的第26個年頭,特邀請了百分點集團董事長兼CEO蘇萌博士在主題報告會上進行演講。
蘇萌博士認為:「只有能夠預見未來的人才能贏得未來。」
那麼,未來的媒體將是什麼樣子的?
在過去的20多年裡,整個數字化的進程對於科技的進步形成了一個巨大的拐點,無論是在數據量、數據存儲、還是計算力等方面都實現了巨大的突破。
對於未來媒體,從長遠的觀點來看:首先,人機融合讓我們能夠隨時隨地地獲取更多的信息;其次,未來的媒體將成為人類感觀的延伸,實現媒體全時段連接;最後未來媒體將帶給我們邊界的消解,語言隔閡消失的同時和數字鴻溝也得到消解。
總結來看,未來媒體是建立在大數據、人工智慧、雲計算、物聯網、虛擬技術等各類新技術之上的,是高度智能化的新形態媒體。
媒體智能進化
智能進化分為三步:首先是感知,使機器能夠像人類一樣去聽到、看到;第二步是認知,使機器能夠像人類一樣去理解、推理、思考;第三步是決策,使機器從輔助人類決策到全部自主決策。
從感知到認知再到決策,每一步都會越來越難。認知這一步已經是現在很多高科技公司重點在做的一件事情。在決策層,百分點集團提出「智能決策」,即在動態和多維信息收集的基礎上,對復雜問題自主識別、判斷、推理,並做出前瞻性和實時性決策的過程,同時具備自優化和自適應的能力。
智能決策層,在媒體策采編發環節存在眾多智能化的應用場景,百分點在實踐中,總結了智能采編六部曲:
首先是智能化的內容創作,寫稿機器人迎來爆發期,極大地提升了內容生產效率。但我們認為,寫稿機器人不是要取代記者和編輯,而是讓采編人員把精力集中於更深層次的思考;
在創作了大量的稿件之後,媒體資料庫中將會積攢越來越多的歷史數據,但這些稿件都非常零散,價值難以挖掘,如果能夠將這些稿件通過NLP技術結構化並形成智能專題,對於編輯做出有深度的新聞將會幫助巨大;
形成智能專題庫後,編輯在創作新稿件時,需要快速找到相關的專題和稿件,輔助內容創作,這就需要智能搜索技術,通過關鍵詞的語義相似性找到相關的內容;
為進一步提升用戶獲取信息的效率,將智能搜索的升級為自動問答平台,通過分析用戶查詢意圖,應用深度學習和知識圖譜技術,就可以直接提供最終的答案;
在稿件創作完成之後,下一步的工作就是傳播,智能傳播的目標是提升傳播的效率,核心要解決的是目標群體的識別、內容的精準推送及跟蹤問題;
最後,內容的傳播需要藉助各種設備,智能安全系統能夠保證設備的穩定性,提前預測故障,保證媒體設備和系統的正常運營。
尤其值得注意的是,媒體智能化分層體系中,動態知識圖譜是核心技術。
這是因為,當前知識圖譜的構建還存在一些問題,比如:
1.如何清晰知道聚合後的數據來源,做到信息源可追溯?
2.新的數據源如何快速接入知識圖譜,並進行應用?
3.實體和關系隨時間不斷變化,如何熱更新?
4.在新的領域,如何實現知識圖譜構建的快速遷移?例如如何從出版社的法律領域快速遷移到醫療領域。
解決這些問題的答案,就是動態知識圖譜:
目前,百分點集團已經在媒體出版、公共安全、金融、電商等行業都構建了對應的知識圖譜庫,構建的實體數達到數千萬的量級,關系數達到幾十億的量級。
融合創新
百分點在過去幾年時間里,為很多的廣電和媒體機構做了大數據的技術和產品以及解決方案。同時,針對未來媒體智能化的發展趨勢,對內容創作、智能專題、自動問答、智能傳播及智能安全這五個專題進行了分層研究。
通過經驗的積累,百分點在項目中積累了眾多成功案例:
1.內容創作
今年春節,百分點聯合人民日報和全國黨媒信息公共平台等機構推出「中國首個智能作詩送祝福應用」,產品上線6天點擊量超1000萬。通過對80萬首詩詞歌賦的語料分析,以先進的深度神經網路技術展現詩詞的韻律美,訓練出以春節祝福主題的詩詞自動生成模型。在這裡面,你可以輸入一些你想要的祝福詞,機器會根據大量訓練理解的詩詞歌賦,自動生成你想要的,不喜歡還可以再換,支持很多交互。
2.智能專題
智能專題是百分點為《中國日報》研發的大數據應用,當一個新聞事件發生時候,它快速地對新聞進行歸類,把不同的類別能夠用關聯關系和圖譜的形式表示出來,從預熱、報道、總結三個階段給予全方位支撐,同時形成相關報道趨勢,情感分析、社交評論,不同地域關注度等相關分析,具體包括:主流媒體報道分析、特定子話題生成、分析等等,輔助編輯進行事件全景分析,從而進行報道決策。
3.自動問答
蘇萌博士表示,以目前的技術發展水平來衡量,通用型的智能問答非常難以實現,但在某個專屬領域可以搭建出效果越來越好的自動問答體系。
比如百分點和團中央聯合推出的「小青機器人」,正在服務於中國八千萬共青團員。團中央的青年之聲論壇上有幾百萬的問題,而且每天會不斷產生大量新問題,之前依靠專家解答,遠遠不夠,大量的問題得不到解答。這個時候利用知識圖譜體系進行學習訓練後,小青機器人可以為這些問題提供優質答案,回答的准確率高達90%。
4.智能傳播
智能傳播是現在所有的廣電媒體非常關注的核心技術和解決方案。它的核心在於要精準地識別目標人群,進行內容精準推送和實時信息快速推送。百分點根據建立的用戶標簽、畫像體系,精準地找到意見領袖和傳播的路徑,有效地推送出來用戶感興趣的內容,提高用戶體驗,同時可對推送內容進行持續跟蹤。
5.智能安全
安全對媒體機構來說至關重要,尤其是信息傳播領域需要用大量的設備。如何保證這些設備的運行安全?這將是很關鍵的問題。
比如百分點在和廣電總局無線局的合作中,在百分點大數據全棧技術支撐下,通過物聯網實時採集遍布全球的發射設備的溫度、電流、電壓等指標,再通過大數據技術來分析與檢測判斷設備健康度,並根據這些指標來預測下一個故障會發生在什麼時候、發生在哪裡、發生在哪個部件,可以提前做出預警,准確率已經高達97.3%。可提前半小時進行預警,從而有效地減少了播出信號中斷發生的幾率和時間間隔,顯著降低維修成本。
智能安全將通過「大數據+AI」對媒體進行健康監測和故障預警,同時提供故障診斷和定位,並給出預測性維護建議以及後續運維管理決策。
總結來看,大數據和人工智慧給媒體行業帶來了突破性的進展,解決了很多實際業務問題。百分點集團為新聞報業、媒體出版及廣播電視等眾多媒介機構提供媒體行業「大數據+AI+應用」整體解決方案和應用實踐,覆蓋新華社、新華網、中國日報、南方報業在內的國家級、省級主流媒體,人民出版社、電子工業出版社、中國科技出版社、大網路全書出版社等多家有影響力的綜合、專業出版社,以及廣電總局、江蘇廣電荔枝台等機構,用大數據和人工智慧技術推動媒體融合轉型和發展。
寫在最後:
智能技術還在不斷發展進步,
智能時代將讓媒體更智能,
讓決策更智能。
『伍』 大數據工程師就業的現狀和前景如何
大數據工程師因為稀缺被很多知名企業高價聘請,因為技術的魅力深受國家的重視,對於2019年的內大數容據就業發展前景是一直被人們看好的。就目前來看大數據工程師的收入待遇可以說達到了同類的頂級,以後的發展前景更是一片光明。大數據目前行業發展迅速,人才緊缺。2018年人民日報發文稱:大數據人才需求180萬,目前從業只有30萬,人才缺口達到150萬,這也是為什麼大數據工資都如此之高的原因。大數據時代的到來很突然,在國內發展勢頭迅猛,而人才卻非常有限,現在完全是供不應求的狀況。在美國,大數據工程師平均每年薪酬高達17.5萬美元,而據了解,在國內頂尖互聯網類公司,同一個級別大數據工程師的薪酬可能要比其他職位高20%至30%,且頗受企業重視。
『陸』 大數據時代的到來會為社會發展帶來哪些影響
對社會管理提出了更高的要求、考驗政府的危機應急能力和讓個人隱私和國家機密更容易被泄露和竊取。
1、大數據的大眾性對社會管理提出了更高的要求
在大數據時代,各類信息大規模的自由流動使得民眾參與社會管理和政治事務的熱情很容易被點燃,而這些海量的數據魚目混珠,其中有很多假信息、偽信息和謠言,這對信息的監管提出了更高的要求。
2、大數據的即時性考驗政府的危機應急能力
大數據時代,數據的傳播不受時間和空間的限制,產生後便可即時傳播,使得一旦發生社會事件,信息會通過各種渠道在第一時間傳播到公眾中,而公眾的情緒也能第一時間呈現在龐大的數據洪流中,這讓個別事件在快速傳播之後會從局部事件迅速變成公眾事件。
利用大數據技術,在發生一起公共事件後,通過開放式的軟體平台,人人都可能實時地將自己所看、所聽及所知的具體細節上傳。
在這一人人參與的過程中,人們的心理也會不知不覺發生變化,形成一種共同意識,因為他們在參與的同時,也是在進行一種公開的表達。一個能夠進行公開表達的人群就構成了德國政治哲學家哈貝馬斯所說的「公共領域」。
3、大數據技術讓個人隱私和國家機密更容易被泄露和竊取
大數據時代的到來使得各類信息的公開性和可獲得性空前增加,但這並不意味著任何信息都可以被輕率地使用。
在不斷進步和革新的大數據技術面前,個人的隱私面臨越來越容易泄露的風險,因為日常的電話記錄、郵件往來、經濟消費、交通出行、甚至是醫療檔案等個人信息都在逐漸實現數據化管理和存儲,而這些數據都並非絕對安全。
在大數據時代,鑒於離散型的文獻和文獻檢索方法已無法滿足社會科學研究者對專題性、指向性強的學術文獻的需求,文獻信息服務機構應推進集成式檢索,優化數據挖掘技術、知識發現技術,提供定製化、個性化、知識化服務。
尤其是建立面向科技創新基地、科研院所、課題組乃至個人的學科化服務機制,進一步拓寬文獻信息服務范圍,提升服務層次,加快學術交流和信息、知識的傳播速度,提高文獻信息資源的利用率和共享率,使文獻信息服務機構的服務更直接、更有針對性,更好地服務於創新研究。
對大數據的探索只是剛剛開始,科學認識和把握大數據與經濟社會發展的內在關系、與信息和知識管理的內在關系,可能是包括文獻信息工作者在內的整個學術界在今後相當長一段時間的重要課題。
因此,文獻信息工作者不能停留在低層次、低水平重復的傳統內容生產模式上,而應適應大數據時代的新形勢,推進知識生產過程的有序化、結構化。
人類正處在一個強調知識和信息的時代。培根曾提出「知識就是力量」,後來學術界又提出「信息就是力量」。現在,又有學者提出「共享知識就是力量」,強調把信息管理、信息共享提升到知識管理和知識共享的階段。
利用互聯網來構建知識社會,在網路環境下實現知識交流與共享,這體現了時代的進步,有著豐富的時代內涵。在大數據時代,我們應做好數據管控,把「共享知識就是力量」的理念貫徹到知識服務實踐中。
『柒』 大數據時代:統計學是數據分析的靈魂
大數據時代:統計學是數據分析的靈魂_數據分析師考試
7月中旬以來,從中央到地方,今年上半年經濟社會發展的統計數據陸續進入人們的視野。在觀察、使用統計數據時,類似「大數據時代怎樣用好數據」這樣的話題,再次引起人們的關注。
7月20日出版的《人民日報》,刊發了清華大學統計學研究中心主任劉軍做客人民日報、人民網《文化講壇》時,對相關問題所做的介紹和分析。其內容包括:
什麼是數據?
數據(data)在拉丁文里是「已知」的意思,在英文中的一個解釋是「一組事實的集合,從中可以分析出結論」。籠統地說,凡是用某種載體記錄下來的、能反映自然界和人類社會某種信息的,就可稱之為數據。古人「結繩記事」,打了結的繩子就是數據。步入現代社會,信息的種類和數量越來越豐富,載體也越來越多。數字是數據,文字是數據,圖像、音頻、視頻等都是數據。
什麼是大數據?
量的增多,是人們對大數據的第一個認識。大數據區別於數據,還在於數據的多樣性。從數據到大數據,不僅是量的積累,更是質的飛躍,海量的、不同來源、不同形式、包含不同信息的數據可以容易地被整合、分析,原本孤立的數據變得互相聯通。這使得人們通過數據分析,能發現小數據時代很難發現的新知識,創造新的價值。
大數據時代,統計學是數據分析的靈魂。
大數據告知信息但不解釋信息。打個比方,大數據是「原油」而不是「汽油」,不能被直接拿來使用。大數據時代,統計學依然是數據分析的靈魂。正如美國加州大學伯克利分校邁克爾·喬丹教授指出的,「沒有系統的數據科學作為指導的大數據研究,就如同不利用工程科學的知識來建造橋梁,很多橋梁可能會坍塌,並帶來嚴重的後果。」
事物的發展充滿了不確定性,而統計學,既研究如何從數據中把信息和規律提取出來,找出最優化的方案;也研究如何把數據當中的不確定性量化出來。
劉軍的介紹與分析,幫助我們認識到,從數據到大數據,伴隨質的飛躍;通過對海量數據的整合、分析,可以發現新知識、創造新價值;大數據時代,統計學肩負從數據中提取規律、量化數據中的不確定性等使命。
以上是小編為大家分享的關於大數據時代:統計學是數據分析的靈魂的相關內容,更多信息可以關注環球青藤分享更多干貨
『捌』 新媒體遇上大數據 隱私保護仍是「痛點」
新媒體遇上大數據隱私保護仍是「痛點」_數據分析師考試
大數據並不是簡單地買幾台伺服器把數據存下來,而是要將大數據與實際接軌,突出工具化、服務化和實用化,讓大數據能解決具體問題。
新媒體在運用大數據過程中,一個非常關鍵的問題是隱私保護。在使用大數據過程中保護個人隱私,需要司法機關發布有效的法律判例,對侵犯隱私行為形成輿論壓力;同時要加強大數據隱私保護研究
7月9日,金磚國家領導人第七次會晤在俄羅斯烏法舉行。
當天,人民日報全媒體平台「烹」出一張圖解:《金磚國家大數據》。
這並非新媒體與大數據的第一次結合。
前不久由中國社會科學院發布的《中國新媒體發展報告(2015)》稱,中國新媒體已超越「跨行業」,初步呈現「全產業」發展新趨勢。移動化、大數據化和智能化的新媒體已成為具備高強滲透度的產業基因,可深度融合於經濟產業各領域之中。
專注研究新媒體與數據新聞的清華大學新聞與傳播學院教授沈陽認為,當前,大數據在新媒體中應用廣泛,貫穿於新媒體發展的各個方面。
大數據運用廣泛
人民日報全媒體平台發布的《金磚國家大數據》,只是近期新媒體運用大數據的一個例子。
早在大數據這一概念進入公眾視野不久,便有媒體將大數據運用於新聞報道之中。
2014年春運期間,互聯網上就出現了一張可以呈現國內春節人口遷徙實況的地圖,這張盡顯中國春運遷徙實景的圖片更是登上央視《新聞聯播》進行權威盤點。自從春運開始,這張地圖多次被電視、報紙等媒體引用,成為用數據解讀春運狀況的一個樣本。據稱,這是國內首個運用大數據播報國內春節人口遷徙實況的地圖。
相較於電視、報紙等傳統媒體,新媒體對大數據的運用更加頻繁,作為新媒體代表之一的「澎湃新聞」便是如此:今年2月,「澎湃新聞」出品了《大數據告訴你,梅西的右腳現在有多恐怖》;3月,《落馬老虎大數據:除「軍虎」外,69人共花兩千多年入省部級》「走」下生產線。
在沈陽看來,將大數據應用於報道內容,只是新媒體運用大數據的一個方面。
在與《法制日報》記者交談過程中,沈陽列出了新媒體「遇上」大數據的多個「場景」:在做新媒體功能研發時,哪些要素需要增強、哪些需要減弱,可以運用大數據分析進行修正;在策劃選題時,可以通過大數據分析篩選出哪些話題關注度高、最熱門;在內容推送過程中,可以利用大數據對用戶興趣進行分析並梳理出來;新聞發出後,受眾有哪些評論、轉發多少、分享情況,這些都可以通過大數據獲得結果;即便是在廣告投放環節,也可以通過大數據分析、預判廣告與用戶是否匹配、廣告對新媒體品牌價值是否會有影響。
「大數據貫穿於新媒體的各個方面。」沈陽說。
「完美」並非絕對
盡管大數據很重要、很管用,但沈陽很早就發現,「大數據,沒有看起來那麼美」。
「數據真實性是一個不可迴避的問題。目前,水軍、僵屍粉、刷閱讀量等情況都有存在,這在一定程度上給數據提供了虛假成分。」沈陽說,不過,從宏觀上講,可以控制這些虛假成分。
如何控制「水分」?沈陽舉例說,在統計微博粉絲時,可以將范圍縮小至帶V的粉絲,因為帶V粉絲造假成本高;如果要更精準的數據,可以進一步縮小范圍,如近期活躍的帶V粉絲。「當然,這樣篩選數據會面臨高成本的問題」。
沈陽在早期的研究中還關注到大數據的另外兩個問題:樣本代表性和相關性誤差。
沈陽認為,我們不可能搜集到全數據,而與大數據相關的形容詞往往是大規模、精準、細化,在調用如此「完美」的數據時,如何注意情景和樣本的適用性是一個問題。正如網路民意與現實民意的討論,微博不代表網路,網路不代表社會,朋友圈也是小圈子,跳出圈子看世界不容易,切勿陷入相同的悖論。在選樣、測量、誤差校正不盡如人意時,好數據將劣化,大數據將虛化。
相關性誤差,則更偏向於技術。沈陽認為,在要素構成簡單的情景中,可以利用大數據,基於一定演算法和模型對變數元素進行相關性分析。然而,在復雜系統中,僅有相關性解釋還不夠,易走偏。比如一個明顯不對的結論:一個城市的網頁數越高,其網路形象就越好。雖然數據統計證實了網頁數和網路形象存在一般的正相關,但忽略了負面事件帶來的網頁量爆發等,因此結論也是不科學的。相關性要真正體現在數據之間、數據與真實事件影射的現象之間、真實事件的客觀聯繫上。
「大數據並不是簡單地買幾台伺服器把數據存下來,而是要將大數據與實際接軌,突出工具化、服務化和實用化,讓大數據能解決具體問題。」沈陽說。
隱私保護日益突出
基於多年研究大數據的心得,沈陽認為,新媒體在運用大數據過程中,一個非常關鍵的問題是,隱私保護。「目前,隱私保護問題越來越突出」。
此前,《法制日報》記者在參加一次論壇時,工信部相關部門一名負責人曾表達這樣的觀點:大數據時代到來後,隨著互聯網技術及其應用的發展,大數據、雲計算技術方式的使用,個人信息的價值不斷被挖掘、被使用,但是安全保護是一個很大的問題。
工信部相關部門這名負責人認為,大數據時代的個人信息安全面臨三大問題。
「一個問題是數據未經授權被搜集,這種情況發生得比較多。」工信部相關部門這名負責人說,第二個問題是超出范圍使用。所謂超范圍使用,是指企業通過一定的所謂合法的形式拿到個人信息,但是拿到以後使用信息的目的、用途以及范圍,並非信息權利主體所熟知。這種情況包括,當互聯網對一些數據信息進行更進一步或者深層挖掘時,這種挖掘在一定程度上有可能侵犯了權利主體的權益。因為互聯網企業之前可能告訴權利主體,獲取信息是基於特定的目的或者在特定范圍內使用,但是進一步挖掘就有可能觸犯了約定。第三個問題是數據保存。曾有網路社區存儲的幾千萬用戶信息被黑客拿到後轉賣給第三家,最後造成信息濫用。
在新媒體廣泛使用、深度挖掘大數據的時代,如何保護公民隱私?
工信部相關部門這名負責人提出了一個觀點:信息保護人人有責。
「在信息安全保護方面,很重要的一點在於,權利人自身要加強保護意識。」工信部相關部門這名負責人說,現在,不管是要求政府部門監管,還是要求司法機關動起來,一個重要前提是人人保護信息,這樣才可能使信息保護問題得到根本解決,否則只靠公權力機關單方面去做是沒有用的。當然,在提倡人人保護信息的同時,執法保護也是一個很重要的方面。
在沈陽看來,在使用大數據過程中保護個人隱私,一方面需要司法機關發布有效的法律判例,對侵犯隱私行為形成輿論壓力;另一方面要加強大數據隱私保護研究。
以上是小編為大家分享的關於新媒體遇上大數據隱私保護仍是「痛點」的相關內容,更多信息可以關注環球青藤分享更多干貨