㈠ 誰能做大數據工程師
大數據是眼下非常時髦的技術名詞,與此同時自然也催生出了一些與大數據處理相關的職業,通過對數據的挖掘分析來影響企業的商業決策。
這群人在國外被叫做數據科學家(Data Scientist),這個頭銜最早由D.J.Pati和Jeff Hammerbacher於2008年提出,他們後來分別成為了領英(LinkedIn)和Facebook數據科學團隊的負責人。而數據科學家這個職位目前也已經在美國傳統的電信、零售、金融、製造、物流、醫療、教育等行業里開始創造價值。
不過在國內,大數據的應用才剛剛萌芽,人才市場還不那麼成熟,「你很難期望有一個全才來完成整個鏈條上的所有環節。更多公司會根據自己已有的資源和短板,招聘能和現有團隊互補的人才。」領英(LinkedIn)中國商務分析及戰略總監王昱堯對《第一財經周刊》說。
於是每家公司對大數據工作的要求不盡相同:有的強調資料庫編程、有的突出應用數學和統計學知識、有的則要求有咨詢公司或投行相關的經驗、有些是希望能找到懂得產品和市場的應用型人才。正因為如此,很多公司會針對自己的業務類型和團隊分工,給這群與大數據打交道的人一些新的頭銜和定義:數據挖掘工程師、大數據專家、數據研究員、用戶分析專家等都是經常在國內公司里出現的Title,我們將其統稱為「大數據工程師」。
王昱堯認為,在一個成熟的數據驅動型公司,「大數據工程師」往往是一個團隊,它意味著從數據的收集、整理展現、分析和商業洞察、以至於市場轉化的全過程。這個團隊中可能包括數據工程師、分析師、產品專員、市場專員和商業決策者等角色,共同完成從原始數據到商業價值的轉換—概括來講,這是一個支持企業做出商業決策、發掘商業模式的重要群體。
由於國內的大數據工作還處在一個有待開發的階段,因此能從其中挖掘出多少價值完全取決於工程師的個人能力。已經身處這個行業的專家給出了一些人才需求的大體框架,包括要有計算機編碼能力、數學及統計學相關背景,當然如果能對一些特定領域或行業有比較深入的了解,對於其快速判斷並抓准關鍵因素則更有幫助。
雖然對於一些大公司來說,擁有碩博學歷的公司人是比較好的選擇,不過阿里巴巴集團研究員薛貴榮強調,學歷並不是最主要的因素,能有大規模處理數據的經驗並且有喜歡在數據海洋中尋寶的好奇心會更適合這個工作。
除此之外,一個優秀的大數據工程師要具備一定的邏輯分析能力,並能迅速定位某個商業問題的關鍵屬性和決定因素。「他得知道什麼是相關的,哪個是重要的,使用什麼樣的數據是最有價值的,如何快速找到每個業務最核心的需求。」聯合國網路大數據聯合實驗室數據科學家沈志勇說。學習能力能幫助大數據工程師快速適應不同的項目,並在短時間內成為這個領域的數據專家;溝通能力則能讓他們的工作開展地更順利,因為大數據工程師的工作主要分為兩種方式:由市場部驅動和由數據分析部門驅動,前者需要常常向產品經理了解開發需求,後者則需要找運營部了解數據模型實際轉化的情況。
你可以將以上這些要求看做是成為大數據工程師的努力方向,因為根據萬寶瑞華管理合夥人顏莉萍的觀察,這是一個很大的人才缺口。目前國內的大數據應用多集中在互聯網領域,有超過56%的企業在籌備發展大數據研究,「未來5年,94%的公司都會需要數據科學家。」顏莉萍說。因此她也建議一些原本從事與數據工作相關的公司人可以考慮轉型。
本期《第一財經周刊》采訪了BAT這3家國內互聯網公司,以及相關領域的人力資源專家,他們從職場角度為我們解讀如何成為大數據工程師以及這類崗位的職場現狀。
A 大數據工程師做什麼?
用阿里巴巴集團研究員薛貴榮的話來說,大數據工程師就是一群「玩數據」的人,玩出數據的商業價值,讓數據變成生產力。大數據和傳統數據的最大區別在於,它是在線的、實時的,規模海量且形式不規整,無章法可循,因此「會玩」這些數據的人就很重要。
沈志勇認為如果把大數據想像成一座不停累積的礦山,那麼大數據工程師的工作就是,「第一步,定位並抽取信息所在的數據集,相當於探礦和采礦。第二步,把它變成直接可以做判斷的信息,相當於冶煉。最後是應用,把數據可視化等。」
因此分析歷史、預測未來、優化選擇,這是大數據工程師在「玩數據」時最重要的三大任務。通過這三個工作方向,他們幫助企業做出更好的商業決策。
找出過去事件的特徵
大數據工程師一個很重要的工作,就是通過分析數據來找出過去事件的特徵。比如,騰訊的數據團隊正在搭建一個數據倉庫,把公司所有網路平台上數量龐大、不規整的數據信息進行梳理,總結出可供查詢的特徵,來支持公司各類業務對數據的需求,包括廣告投放、游戲開發、社交網路等。
找出過去事件的特徵,最大的作用是可以幫助企業更好地認識消費者。通過分析用戶以往的行為軌跡,就能夠了解這個人,並預測他的行為。「你可以知道他是什麼樣的人、他的年紀、興趣愛好,是不是互聯網付費用戶、喜歡玩什麼類型的游戲,平常喜歡在網上做什麼事情。」騰訊雲計算有限公司北京研發中心總經理鄭立峰對《第一財經周刊》說。下一步到了業務層面,就可以針對各類人群推薦相關服務,比如手游,或是基於不同特徵和需求衍生出新的業務模式,比如微信的電影票業務。
預測未來可能發生的事情
通過引入關鍵因素,大數據工程師可以預測未來的消費趨勢。在阿里媽媽的營銷平台上,工程師正試圖通過引入氣象數據來幫助淘寶賣家做生意。「比如今年夏天不熱,很可能某些產品就沒有去年暢銷,除了空調、電扇,背心、游泳衣等都可能會受其影響。那麼我們就會建立氣象數據和銷售數據之間的關系,找到與之相關的品類,提前警示賣家周轉庫存。」薛貴榮說。
在網路,沈志勇支持「網路預測」部分產品的模型研發,試圖用大數據為更廣泛的人群服務。已經上線的包括世界盃預測、高考預測、景點預測等。以網路景點預測為例,大數據工程師需要收集所有可能影響一段時間內景點人流量的關鍵因素進行預測,並為全國各個景點未來的擁擠度分級—在接下來的若干天時間里,它究竟是暢通、擁擠,還是一般擁擠?
找出最優化的結果
根據不同企業的業務性質,大數據工程師可以通過數據分析來達到不同的目的。
以騰訊來說,鄭立峰認為能反映大數據工程師工作的最簡單直接的例子就是選項測試(AB Test),即幫助產品經理在A、B兩個備選方案中做出選擇。在過去,決策者只能依據經驗進行判斷,但如今大數據工程師可以通過大范圍地實時測試—比如,在社交網路產品的例子中,讓一半用戶看到A界面,另一半使用B界面,觀察統計一段時間內的點擊率和轉化率,以此幫助市場部做出最終選擇。
作為電商的阿里巴巴,則希望通過大數據鎖定精準的人群,幫助賣家做更好的營銷。「我們更期待的是你能找到這樣一批人,比起現有的用戶,這些人對產品更感興趣。」薛貴榮說。一個淘寶的實例是,某人參賣家原來推廣的目標人群是產婦,但工程師通過挖掘數據之間的關聯性後發現,針對孕婦群體投放的營銷轉化率更高。
B 需要具備的能力
數學及統計學相關的背景
就我們采訪過的BAT三家互聯網大公司來說,對於大數據工程師的要求都是希望是統計學和數學背景的碩士或博士學歷。沈志勇認為,缺乏理論背景的數據工作者,更容易進入一個技能上的危險區域(Danger Zone)—一堆數字,按照不同的數據模型和演算法總能捯飭出一些結果來,但如果你不知道那代表什麼,就並不是真正有意義的結果,並且那樣的結果還容易誤導你。「只有具備一定的理論知識,才能理解模型、復用模型甚至創新模型,來解決實際問題。」沈志勇說。
計算機編碼能力
實際開發能力和大規模的數據處理能力是作為大數據工程師的一些必備要素。「因為許多數據的價值來自於挖掘的過程,你必須親自動手才能發現金子的價值。」鄭立峰說。
舉例來說,現在人們在社交網路上所產生的許多記錄都是非結構化的數據,如何從這些毫無頭緒的文字、語音、圖像甚至視頻中攫取有意義的信息就需要大數據工程師親自挖掘。即使在某些團隊中,大數據工程師的職責以商業分析為主,但也要熟悉計算機處理大數據的方式。
對特定應用領域或行業的知識
在顏莉萍看來,大數據工程師這個角色很重要的一點是,不能脫離市場,因為大數據只有和特定領域的應用結合起來才能產生價值。所以,在某個或多個垂直行業的經歷能為應聘者積累對行業的認知,對於之後成為大數據工程師有很大幫助,因此這也是應聘這個崗位時較有說服力的加分項。
「他不能只是懂得數據,還要有商業頭腦,不論對零售、醫葯、游戲還是旅遊等行業,能就其中某些領域有一定的理解,最好還是與公司的業務方向一致的,」就此薛貴榮還打了個比方,「過去我們說一些奢侈品店員勢利,看人一眼就知道買得起買不起,但這群人恰恰是有敏銳度的,我們認為他們是這個行業的專家。又比如對醫療行業了解的人,他在考慮醫療保險業務時,不僅會和人們醫院看病的記錄相關,也會考慮飲食數據,這些都是基於對該領域的了解。」
C 大數據工程師的職業發展
如何成為大數據工程師
由於目前大數據人才匱乏,對於公司來說,很難招聘到合適的人才——既要有高學歷,同時最好還有大規模數據處理經驗。因此很多企業會通過內部挖掘。
今年8月,阿里巴巴舉辦了一個大數據競賽,把天貓平台上的數據拿出來,去除敏感問題後,放到雲計算平台上交予7000多支隊伍進行比賽,比賽分為內部賽和外部賽。「通過這個方式來激勵內部員工,同時也發現外部人才,讓各行業的大數據工程師涌現出來。」
顏莉萍建議,目前長期從事資料庫管理、挖掘、編程工作的人,包括傳統的量化分析師、Hadoop方面的工程師,以及任何在工作中需要通過數據來進行判斷決策的管理者,比如某些領域的運營經理等,都可以嘗試該職位,而各個領域的達人只要學會運用數據,也可以成為大數據工程師。
薪酬待遇
作為IT類職業中的「大熊貓」,大數據工程師的收入待遇可以說達到了同類的頂級。根據顏莉萍的觀察,國內IT、通訊、行業招聘中,有10%都是和大數據相關的,且比例還在上升。顏莉萍表示,「大數據時代的到來很突然,在國內發展勢頭激進,而人才卻非常有限,現在完全是供不應求的狀況。」在美國,大數據工程師平均每年薪酬高達17.5萬美元,而據了解,在國內頂尖互聯網類公司,同一個級別大數據工程師的薪酬可能要比其他職位高20%至30%,且頗受企業重視。
職業發展路徑
由於大數據人才數量較少,因此大多數公司的數據部門一般都是扁平化的層級模式,大致分為數據分析師、資深研究員、部門總監3個級別。大公司可能按照應用領域的維度來劃分不同團隊,而在小公司則需要身兼數職。有些特別強調大數據戰略的互聯網公司則會另設最高職位—如阿里巴巴的首席數據官。「這個職位的大部分人會往研究方向發展,成為重要數據戰略人才。」顏莉萍說。另一方面,大數據工程師對商業和產品的理解,並不亞於業務部門員工,因此也可轉向產品部或市場部,乃至上升為公司的高級管理層。
㈡ 中國每年孕產婦數量
經述中國頃此衛生部等有關部門發布的數據顯示,2018年中國判裂孕產婦總數約為1700萬,其中常住孕產婦1490萬掘乎閉。
㈢ 大數據告訴你:親愛的,你懷孕了
大數據,英文翻譯為Big Data,聽上去科技感十足的一個詞,到底跟我們的生活有什麼關系呢?我們不妨先從一個故事開始認識一下它。
在信息化領域,國外很多企業走在時代前列。美國一家零售連鎖商塔吉特,很多年前就開始利用銷售過程匯總的數據進行分析。有一段時間,塔吉特公司通過他們所有門店裡女性的消費記錄數據,進行「懷孕預測」。對於零售商來說,發現一個顧客是否懷孕非常重要。因為一旦有了小孩,就意味著一個家庭的消費觀念會發生很大變化,如果能預測消費者的懷孕趨勢就能及時向她們推送孕期每個階段對應的優惠券,從而刺激消費。值得注意的是,有一天,一個中年男人怒氣沖沖的來到塔吉特的一家零售店,他向商店經理投訴:「我女兒還是高中生,你們卻給她郵寄嬰兒服和嬰兒床的優惠券,你們這樣的行為是在鼓勵她懷孕嗎?」。塔吉特商店的經理幾天後打電話向這個男人道歉,這個男人卻感到非常抱歉,他跟塔吉特的經理道歉說:「我跟女兒談過了,她的預產期是8月份,是我自己沒有意識到這件事情。」
這就是一個典型的大數據案例, 大數據如此神奇,它可能比你的父母更了解你的小秘密。你喜歡什麼款式的衣服,你最愛哪家甜品店,你最喜歡的明星是誰……大數據就像你的影子,對你了如指掌。
提起大數據,人們最先想到的一本書往往是《大數據時代》。
《大數據時代》的作者維克托•邁爾•舍恩伯格被譽為「大數據商業應用第一人」,十幾年前就已經洞察到大數據的趨勢,一直潛心研究大數據技術,不僅在哈佛大學、牛津大學等著名學府任教,也為微軟、IBM等知名企業提供咨詢服務,同時還是眾多政府高層的智囊團。維克托將自身對大數據技術的研究與商業實踐、政府決策相結合,進一步獲得對大數據的全球視野。
我們身處一個數據大爆炸的時代,世界的數據以一種超乎想像的速度裂變。哲學上講:量變引起質變。當數據累積到一定程度,必然引起質變。數據的價值也就由此誕生。維克托在《大數據時代》中強調了大數據給我們帶來的三個轉變:
更多:不是隨機樣本,而是全體數據
更雜,不是精確性,而是混雜性
更好,不是因果關系,而是相關關系
大數據的出現對社會科學提出了挑戰,社會科學是非常依賴樣本分析、研究和調查問卷的學科,而大數據時代,數據成為最容易獲得的信息,我們不再受困於數據量的多少,開始利用所有的數據。
有數據證明,採用樣本分析法的正確率可達97%。看上去3%的錯誤率似乎可以接受,但也要就事論事。現在大數據的核心在於預測,為了更精準的預測,自然是越少錯誤率越高,而當數據量足夠大時,當樣本=總體時,數據預測的准確性就能大大提高。
大數據以前的時代是,用盡可能少的數據獲得盡可能多的信息,當人類進入到大數據時代時,是用盡可能多的數據獲得信息。
每次出去旅遊,想搶到便宜的機票簡直是一場大戰。打開購票網站,今天刷一下貴了100,明天刷一下便宜了200,後天再刷又貴了200,每次我都想怎麼才能知道機票什麼時候最便宜。原來,這個功能已經有公司實現了。有一家預測機票價格的公司叫Farecast,Farecast的預需要海量數據的支持,為了提高預測的准確度,Farecast收集了么過商業航空產業中每一條航線上每一架飛機內每一個座位,在一年內的綜合票價記錄。如今,Farecast已經有大約2000億條的飛行數據,最終實現票價預測的准確度高達75%。如果沒有海量數據的支持,所謂的票價預測基本約等於0。
Farecast的創始人埃齊奧尼說:「這只是一個暫時性的數據,隨著你收集的數據越來越多,你的預測結果會越來越准確。」
海量數據的出現,也意味著大量混雜的、不精確的、甚至錯誤的數據出現。大數據時代95%的數據都是混亂的,如果還堅持傳統「小數據」的精確演算法,那將徹底錯過大數據的價值。
為什麼「小數據」要精確?
因為「小數據時代」或者像上文提到的「樣本分析法」中,能收集到的信息量有限,所以必須保證數據盡量精確,才能提高預測的准確度。這是一個概率學問題,簡單來說,給你三個蘋果,只有一個是好的,那你挑到好蘋果的概率是1/3,如果有100個蘋果,即使有一半都是壞的,挑到好蘋果的概率也有1/2。
胡適曾經諷刺過「差不多先生」,因為差不多先生的口頭禪就是:凡事只要差不多就好了,何必太較真呢?「大數據」從某種角度來說也是一位「差不多先生」,要讓我們習慣他可能還需要時間。
小朋友很小的時候就要讀《十萬個為什麼》,培養對世界的好奇心,學習的過程就是搞清楚每一個現象背後的原因,這是我們從小到大養成的慣性思維。
大數據時代,這種思維需要變一變了。 數據量的劇增,使得事物與事物之間的聯系越來越復雜,通過復雜的相關關系,大數據猶如神探破案,找出蛛絲馬跡。現在,只需要知道「是什麼」就夠了,沒必要知道「為什麼」。
建立在相關關系分析法基礎上的預測是大數據的核心。據統計,亞馬遜成交量的三分之一都是來自於相關推薦的購買。當我在亞馬遜上購買這本《大數據時代》時,系統還會同時給我推薦另外幾本相關的書,比如吳軍的《智能時代》,塗子沛的《大數據》等,這些書正好幫我構成了一個「大數據」的主題閱讀書單,這樣我就很可能把這一系列書全部加入購物車。
隨著技術的發展,收集和分析數據的成本越來越低,人們更熱衷於收集海量的數據,來預測分析可能出現的問題。比如,大數據可以用來預測汽車故障,這種功能很適合物流、快遞行業。大型的物流快遞公司會有數量眾多的運輸車隊,一旦車在運輸過程中出現故障,造成的延誤、再裝載損失都很嚴重。通過感測器檢測汽車各種零件的使用情況,能及時預測哪些零件可能在什麼時候出現故障,以便提前進行檢查維修,這樣就能大大減少成本損失。這種預測並不能告訴你,「為什麼」會出現故障,而對於快遞公司來說,也只需要只知道「是什麼」將出現故障就足夠了。
大數據時代,我們的生活將發生翻天覆地的變化,就像望遠鏡能讓我們感受浩瀚的宇宙星空,顯微鏡能讓我們觀察最小顆粒的微生物。大數據是一種收集和分析海量數據的新技術,能幫助我們更好地認識世界、理解世界。大數據不是冰冷的事實,它其實分散在日常生活的各個角落,從思維模式上先給我們帶來一場變革,然後當我們用大數據的思維看世界時,才發現「凡是過去,皆為序曲」。
未來已來,大數據時代裹挾著未來世界的新演算法,新技術像潮水一樣涌來,只有勇於擁抱變化的人才能急流勇進。 大數據時代,更多的數據,更多不確定性,更復雜的相關關系,提供了「更多,更快,更好」的可能。
㈣ 2022年孕婦難產死亡人數
2022年孕婦難產死兆洞亡人數為1920人。根據查詢相關公開信息顯示,族悶枯2022難產死亡率10萬分之16.1,計算可得孕婦難產罩派死亡人數為1920人。
㈤ 2022年孕婦數量
根據中國統計局的數據,2022年全國孕婦數量約為1.2億,占總人口的7.5%。
㈥ 2021孕婦生產死亡人數
2021孕婦生產死亡人數16.1/10萬。2021年孕產婦死亡率已下降到16.1/10萬,嬰兒死亡遲正率下降至5.0‰,5歲以下兒童死亡率下降至7.1‰,婦幼健康核心指標已碼御悔降至歷史最低水拆知平。
㈦ 世界存在的身體有殘缺的孕婦有多少
世界存在的身體有殘缺的孕婦有悔納瞎1520萬,她們年齡不同,但身體碧空大部分都有殘疾。在有茄氏殘疾的情況下,他們還堅持生育。
㈧ 2022合肥孕婦生產死亡率多少
2022合肥孕婦生產死亡率10萬分之16.1。根據查詢相關資料公開信息顯示,北京商報訊於2022年5月30日報道,國家衛生健康委召開一切為了人民健康之我們這十年系列主題新聞發布會(第5場),會上,國家衛生健康委婦幼司司長宋莉介紹,2022年我國孕產婦死亡率已下降到10萬分之16.1,嬰兒死亡扮檔山率下降至千分之5.0,5歲以下兒童死亡率下降至千分之7.1,婦幼健康核心指標已降至歷廳中史最低水平蠢鎮。
㈨ 2022年孕婦多嗎
不多。我國2022年全年出生轎模喊人口為1062萬人,出生率為7.52‰;死亡人口1014萬人,人口死亡碼察率為7.18‰;人口自然增長率為0.34‰,尤其是這個閉野出生率是六十年以來最低。大數據表明,出生率越來越低,由此可見,孕婦不多。
㈩ 2022年孕婦和嬰兒死亡人數
2022年孕婦人數16.1/10萬,嬰兒死亡人數5.0%。根據相滾賣關資料信息,國家衛健告簡委發布2021年衛生健康事業發展統計公報,公報顯示2022年孕婦和嬰兒死亡人數都有所下降,孕產婦死亡率從16.9/10萬下降到16.1/10萬,嬰兒死亡率從5.4‰下降到大友逗5.0‰。死亡是生命結束,而且所有的本來維持其存在(存活)的屬性的喪失,不可逆轉的永久性的終止。