A. 優秀的數據產品經理需要掌握哪些技能
1.要極其熟悉公司業務及動向。
所以要了解公司的商業模式、戰略、以及業務流程、要考核的各種指標,以及指標背後的業務含義等。這一點,再了解都不夠。
2.要了解數據分析。
好的數據PD,即使不做數據PD,也應該是個數據分析師。數據PD的一大要務就是將數據分析做成可復制,可自動運轉的系統。雖然有數據分析師們圍繞在自己周圍,但是自己也要清楚業務的問題,分別要看什麼數據,或者當數據出現後,意味著業務出現了什麼問題或者會出現什麼問題。這一點,要向最好的數據分析師們看齊。
3. 要了解數據倉庫及商務智能。
這 兩個關鍵詞背後都是龐大的體系,恐怕我短短半年的轉崗時間太短,雖然能夠對別人講解一通商務智能產品的架構。嘴裡雖然會拋出若干個類似於匯總,鑽取,度 量,指標,維度,緩慢變化維,層次,屬性,儀表盤等等術語,但是也不支持多幾層的知識鑽取,遇到異常問題,也不知道該從什麼地方分析原因。幸而身邊有數據 倉庫的同事,可以多多學習。這一點,沒有天花板。
而商務智能,做為一門學科,起源於20世紀90年代,它的出發點是幫助用戶更好地獲取決策信息,最初商務智能的動機是為用戶提供自助式的信息獲取方式,這 樣,用戶就可以不用依賴於IT部門去獲取定製的報表。(引自《信息儀表盤》一書P41)。而如今,商務智能除了提供信息,更主要的是降低用戶獲取數據的門 檻,提升數據的實時性等方面。從降低用戶獲取數據的門檻一個方向,我們就可以做很多事情,比如如何設計信息儀表盤(designing of information dashboard)?如何讓數據以更親和的更直觀的方式展示(數據可視化)?如何能夠讓用戶離線訪問?如何能夠實現警戒數據的主動發送?這一點上,花多少功夫都不多。
4. 要精通數據產品開發流程。數據開發+產品開發。
數據PD的最終目的是要做數據產品。這里要拆開看,其一,數據產品本身也是在線可供用戶實現的產品,既然是產品,產品的整套研發思路和普通的產品沒有太大區別,用戶是誰,他們需求是什麼,滿足需求需要什麼featurelist,每個feature list的資源評估以及優先順序如何,產品的生命周期如何?這是產品開發。然後他是個數據產品,意味著這比普通的產品,多了更多的要求。在數據這個內核之外,它需要各種feature list,如訂閱,搜索,自定義,簡訊介面,郵件介面等。但是數據這個內核,也需要一套數據開發流程。
比如:
數據源——是否足夠,是否穩定
數據PD需要足夠了解目前的業務處理系統建設情況,以及數據源的積累程度,用以判斷數據產品的建設時間是否合適。不合適的時機會導致項目組的重復勞動和殘缺 的數據產品誕生。數據產品是用以支持監控,分析,決策的,而業務處理系統的定位在於提升工作效率,解放工作人員手腳。業務系統採集的數據未必滿足所有分析 需要。比如或許領導要分析大量攀升的退換貨的詳細原因,而業務系統目前並沒有要求用戶在申請退換貨的時候選擇原因或只有輸入而非標准化選項,負責退換貨出 力的員工也只有在excel里登記原因,而不是錄入到系統里。所以可能會導致需求方要看的數據提供不出來,那麼數據pd就有必要反向驅動數據源得以採集。
分析模型的設計—— 分析模型的好與不好,其實決定了數據產品的成敗。
在 項目中,可以由BI的數據分析師們擔綱此職責,也可以由數據PD擔綱,更多則由雙方一起確認,內容以數據分析師們為主,功能評估及優先順序、項目計劃和協 調、統籌以數據PD為主。所以數據PD要更加清楚數據分析師們所需要的需求是否能夠實現,背後的商業價值如何,並與數據開發、產品開發保持比數據分析師們 更加通暢的合作關系,能夠借力進行可行性和資源的評估。
有的時候,我們不是沒有數據,而是有了太多的數據,不知道怎麼去看。如果只是拋給用戶一堆數據,很難想像用戶會如何去解讀它。以前做交互設計的時候,我們流行一句話:把用戶當成傻瓜。
而數據平台,因為可能本身就要求有一定的使用門檻,所以想成不會互聯網的傻瓜不太現實,那麼我們就要想成「用戶是不懂數據的傻瓜」。他們或許也能通過一串串 數據體悟到什麼,但是如果是一條上升的退款率趨勢線,或許他們會體悟到更多——畢竟,上和下本身就是直觀的。然後再想一下,如果將這條線上加上一條警戒點 的線,他們會知道從什麼時候開始數據是異常的。再然後,就要設想,當他發現從7月12日數據上升後,想干什麼?他會不會想了解是哪個行業上升了?他會不會 想了解是那個渠道上升了?那麼,就要提供行業和渠道的選項或者對比給他。
再然後,當他過問了這個行業的負責人後,負責人想不想再了解是哪個供應商或者哪類商品上升了?那麼要如何將這些維度、層次都融合在一起,同時又能將用戶非常 方便地去用呢?分析模型的建設至關重要,也可以說,分析模型是前期需求分析的最有價值的產物。分析模型應該會包含幾點:
主題的劃分:
整塊分析會劃分成什麼主題,比如銷售可能會分成銷售走勢及構成分析,行業排名,商品排名等
度量及指標:
分析主題會涉及到的度量及指標的演算法、定義等(這通常會產生一份指標以及維度的定義及描述文檔)
維度:
要分別從什麼維度去看這些指標和度量,如時間,渠道,這些維度是要篩選還是要對比
鑽取:
這些維度本身有沒有層次,需要不需要進行鑽取,如渠道可鑽取到渠道類型,行業可鑽取到子行業,商品類目可鑽取到商品葉子類目等
輸出:
分析需要用何種圖表進行展現
數據的ETL開發
數據的清洗,轉換,裝載流程佔用了數據產品開發的大半資源,不規范的數據源會導致這一塊的資源更大程度的佔用。比如同樣是供應商編碼,系統之一稱為供應商編 碼,系統二命名為供貨商編碼,系統三命名為供應商ID,這三個系統同時是公司的系統,這種情況雖然想起來匪夷所思,但是現實情況卻也存在。雖然ETL開發 是DW開發工程師在做,但是作為數據PD,焉能對這些工作缺乏了解,對ETL工程師反饋的問題,缺乏認知,不理解對於項目的潛在風險是什麼?而且更多時 侯,當遇到數據不規范,不統一的問題,數據PD需要反向驅動業務系統進行數據規范性建設,無論是功能上,還是驅動直接的使用方——如負責錄入數據的行業小 二,建立一套錄入規范。這些工作看似和數據PD無關,我們大可以推脫說:那沒辦法,這是數據源的問題,不是我們功能的問題。但是,用戶是有權利選擇使用不 使用你的數據產品的,當數據產品提供的數據不值得信賴的話,無疑是自取滅亡。一旦用戶對數據不信任,再想挽留他們,是很難的。即使有很多「無能為力」的借 口,我們也不能坐觀其變。
前端交互與體驗的優化
雖然內容定義好了,但是那麼多度量、指標、維度、鑽取,如何劃分信息層級,如何劃分欄目,如何設計用戶的行為路徑?這些就不是數據分析師們的重要工作范疇。 而是交互設計師?鑒於很多數據產品項目可能會沒有交互設計師,所以數據PD應該對內容進行封裝,進行信息架構、頁面布局以及圖表各種功能設計。設計,然後 撰寫詳細的功能需求文檔,交付給產品開發,前端開發以及數據開發,以及前端展現開發四種類型的開發人員。
數據產品的功能描述文檔,除了產品開發部分,其他的就是在描述「內容」,即分析模型,除了主題、度量、維度、鑽取、篩選、輸出圖表類型,有些內容還需要詳細定義到「排序方式」 等等細節,這就case by case來看了。
環境,技術,工具
或許做一個普通的產品,你把需求描述清楚,與產品開發工程師確認好可行性,接受資源評估就OK了。但是數據產品,受制於所部署的環境,所選型的工具,如Oracle,IBM的Cogos,以及SQL Server。其他的產品我不知道怎麼樣,我們用的是Oracle BIEE。那麼作為數據PD,是否需要了解BIEE能夠提供的功能是哪些呢?看文檔,請教別人,不能知其不可而為之。另外,也需要逐漸摸透BIEE的壞脾氣,實現不了的功能,無法克服的難點等。這一點,也需要繼續了解,繼續學習。
B. 互聯網大數據的信用體系個人綜合評分是怎麼來的
您好,互聯網大數據的信用體系個人綜合評分是每個人的借貸行為、履約情況、消費情況、以及手機運營商情況來綜合評估的。
至於社保,公積金、學歷、銀行流水貸款信用這幾項數據,相對來說銀行流水比較看重一些。
大數據信用報告包含以下信息:
1、近六個月話費和通話次數。能夠反映出通話的穩定性,一定程度上能夠影響到貸款機構的評價。
2、近六個月里與貸款機構、信用卡機構、催收公司的累計通話次數。通話次數越多,就越容易對用戶的評分造成負面影響。
3、通話活躍分析。用戶的通訊錄狀況會影響到貸款機構的評估,提查查的大數據報告運用柱狀圖,顯示通話的活躍天數和活躍地區,以此反映出用戶的通訊錄是否符合社交習慣,以及是否具有穩定性。
4、聯系人深度分析。這個版塊展示了用戶與其聯系人的通話次數、時長、主叫次數和被叫次數。
5、通話風險狀況。該板塊展示用戶與110、120、貸款平台、信用卡中心、催收公司、中介部門、法院等部門近半年的通話次數和通話時長,以及欠費風險度、親情網風險度、號碼沉默度。
6、多頭借貸情況。提供比較具象的手機借款調用平台數和身份證借款調用平台數,借款平台類型,如房地產金融、一般消費分期平台、銀行個人業務、P2P網貸、大型消費金融公司、第三方支付等。
7、逾期行為詳情。包括近期逾期平台數、逾期訂單數、逾期金額、逾期時長等數據。
8、負債情況詳情。負債平台數、負債訂單數、負債訂單已還金額、近半年負債情況一覽表等數據。
9、聯系人存疑信息。用戶主動聯系人數、主動聯系黑號數、主動聯系人中曾為申請人的人數、被動聯系的黑號數等信息。
10、申請行為檢測。3個月內身份證是否關聯其它手機號,以及3個月內,申請信息是否關聯多個身份證。
11、風險信息檢測。這一項內容主要包括:手機號是否命中虛假號碼庫、身份證歸屬地是否有高風險、身份證是否命中犯罪通緝名單、身份證是否命中法院執行名單、身份證對應人是否存在助學貸款欠費歷史、身份證是否命中信貸逾期名單、申請人信息是否命中風險關注名單等。
12、失信情況。該板塊主要提供的是一些法院判決信息。
在微信里查找:提查查官方號。
即可查看到我們的網貸數據報告,網貸申請記錄,網黑指數分以及命中風險提示等重要數據信息。
與2000多家網貸平台合作,查詢出的數據相對來說全面且精準。
用戶可以憑借綜合信用分來判斷自身是否為網貸黑名單用戶。
綜合信用分標准為:0-100分,分數越低,信用越好。
而命中風險提示則可以更好的找到自身的不足,提升網貸的審核通過率。
C. 防止墜入「大數據陷阱」,除了技術還需要什麼
面對互聯網金融大潮,在興奮激動之餘,我們還需要一種相對冷靜平和的心態。如果我們真的要搞金融大數據開發,真的要靠有關數據來辦互聯網金融,那確實就要認真思考一下自己所謂擁有的「大數據」真的足夠大了嗎?足夠長了嗎?
當今,互聯網化正帶動著許多行業、產業的組織變革和商業變革。在這一歷史性的進程中,互聯網技術的迅速發展也給金融領域的創新帶來了巨大活力,顯著提升了金融服務的水平。首先,我在大數據巴士中看到有統計從銀行來說,現在銀行已普遍通過互聯網渠道開辦各類業務,銀行服務的成本有了下降(電子銀行每筆交易成本大約只有銀行櫃台每筆交易成本的五分之一到六分之一);銀行傳統信貸的模式有了改變(例如工商銀行(601398,股吧)無人工參與的全流程在線的網路貸款已超過其網路融資的20%);銀行業務處理能力尤其是支付結算的能力和效率都有了提高(例如工商銀行現在每秒鍾業務交易量峰值已超過8700筆,在去年一年的電子銀行交易已佔全部交易的88%,電子銀行交易金額達到了456萬億元,所有的異地支付早已實現實時完成。);各家銀行的服務模式都已越來越多地、越來越自然地融入商業場景之中,一個覆蓋和貫通金融服務、電子商務、社交生活的互聯網銀行架構正在不斷形成和完善。其次,這些年來,各類互聯網企業從事金融業務的也越來越多,互聯網金融已從最初的電子商務、第三方支付等更多進入了資金募集、理財和借貸領域。如果說Paypal、ApplePay和支付寶等,是讓小額支付更便捷,那麼P2P、眾籌包括余額寶等則是對金融資源配置方式的一種有意義的探索,它給不少人提供了一種新的投資渠道,也滿足了一些人籌集資金的需求。近來,一些人又已經開始把更多注意力放到了區塊鏈技術,不少人正在爭先恐後地進行基於區塊鏈的支付和記錄技術等方面的研究和開發。
這一切的結果在大數據巴士中的統計都是顯得那麼的令人振奮,令人欣喜。但我認為在看到互聯網金融快速發展所帶來的種種積極變化的時候,在繼續推進金融創新的過程中,似乎也應該注意兩個問題,一、金融創新的全部內容是不是金融的互聯網化;二、是否應該避免陷入技術至上、唯數據論的誤區。第一點比較容易理解,答案也應該是明確的。關於第二點想必看法不會完全一致。我想就此談談一己淺見。這可以從北京大學國家發展研究院沈艷教授最近的一篇文章說起。
沈艷教授的文章題目是《大數據分析的光榮與陷阱——從谷歌流感趨勢談起》。她在文章中講了一個故事,那就是谷歌公司在2008年11月啟動了一個「谷歌流感趨勢」(GoogleFluTrends,GFT)項目,這個項目曾被許多人認為是大數據分析優勢的一個證明。這個項目的團隊曾宣布他們通過數十億搜索中45個可能涉及流感關鍵詞的分析,就能夠比美國疾控中心提前預報流感的發病率,從而使人們可以有充足的時間提前採取預防措施以避免患上流感。倘若真能如此,這個成果無疑具有重要的社會意義和經濟價值。可惜的是2014年,美國《科學》雜志的有關文獻報道了GFT在2009年沒有能預測到有關流感的爆發,在2011年8月到2013年8月間的108周里,有100周預告不準(預測率是實際報告值的1.5倍多)。沈艷詰問道,為什麼傳說中充滿榮光的大數據分析會出現如此大的系統性誤差呢?她認為如果在數據分析中只關心相關關系而不注意因果關系是不行的,必須避免模型對數據值作出「過度擬合」,她還指出尤需注意不能以為大數據可以完全替代小數據,她呼籲要防止墜入「大數據陷阱」,力戒「大數據自大」。我十分贊同沈艷的觀點。沈教授所指出的問題正是若干年來我們在推進互聯網金融發展中所一直十分注意和努力想解決的問題。
撇開銀行在產品研發、客戶營銷、員工及機構管理等方面的數據應用問題暫且不談,就說銀行最常見也最重視的風險管理,多年來許多銀行尤其是一些大中型銀行都在如何利用數據技術提升風險管控能力方面進行了很多的探索,做出了不懈的努力。例如,工商銀行在估算客戶的違約概率(PD)、違約損失率(LGD)的時候,十分注意把數據長度作為風險參數量化過程中的一個重要因素,堅持要求數據觀察期起碼必須涵蓋一個完整的經濟周期,以努力避免簡單地以昨天的數據來說明今天和預測明天。現在工商銀行非零售業務和零售業務的客戶違約率、損失率數據積累長度均已超過12年。同時包括工商銀行在內的不少銀行還建立起了全行數據質量的管理標准和平台,不斷進行內部評級的復核驗證,以盡可能減少失真數據的干擾和影響。為了能夠對各種風險進行量化,在信用風險管理方面僅工行就開發了34個法人客戶評級模型,實現了對所有法人客戶違約概率(PD)的計量,開發了175個信貸產品的3類債項評級模型,實現了對違約損失率(LGD)的計量。對零售業務,工行還開發了75個信用評分模型,覆蓋了個人客戶准入、賬戶信貸審批和業務管理的完整業務生命周期。在面對市場風險(因市場價格例如利率、匯率、債券股票價格、商品價格的不利變動,而使商業銀行表內和表外業務發生損失的風險)的防控方面,我們制定了16個辦法,開發了17個定價估值模型來進行風險價值(VaR)和壓力風險價值(SVaR)的計量,並且在實踐過程中每日實施返回檢驗,把模型計算所得的風險價值與發生的真實損益進行比較,以檢驗模型、方法的准確性和可靠性。在防控操作風險(主要是指由不完善或有問題的內部程序、員工行為和信息科技系統,以及外部事件所造成的風險)方面,工行開發了操作風險損失事件管理系統,分別用於對操作風險高頻低損和低頻高損部分的計量。
為了達到上述的這種數據採集、挖掘和應用水平,僅為積累有關數據、開發這些風險管控模型,工商銀行就先後花了將近15年時間,投入了巨大的人力和財力。盡管目前這一套風險識別和計量的方法、模型已經按照國際金融穩定理事會的有關標准,經過監管部門組織的多輪評估獲得通過,認定為合格,但坦率地說,我們從來也沒有認為這一切已經是完美無缺的了。面對不斷變化的社會經濟環境,隨著銀行業務日新月異的發展,在數據的管理利用方面確實還有許多問題需要解決,前面的路還很長。這也正是工商銀行近年來又推出了eICBC新發展戰略的一個重要原因。
我之所以不惜篇幅地介紹這些情況,主要想說的就是許多事確實不像想像的那麼簡單。面對互聯網金融大潮,在興奮激動之餘,我們還需要一種相對冷靜平和的心態。如果我們真的要搞金融大數據開發,真的要靠有關數據來辦互聯網金融,那確實就要認真思考一下自己所謂擁有的「大數據」真的足夠大了嗎?足夠長了嗎?
自己擁有的數據中的信噪比問題有效解決了嗎?自己擁有的數據分析模型如果對樣本內的數據分析還算準確的話,那它對樣本外的預測結果也能一樣有效嗎?自己所擁有的數據處理模型是否完全建立在一種假定之上了,那就是以為人們的社交行為數據、那些非結構化數據都是真實的?坦率地說,我始終認為只要一些數據生成者知曉自己的行為數據可以影響自己的利益(例如可以獲得信譽、信用積分,可以獲得授信融資等),那對這部分數據的可靠性就有質疑的理由。這也許就是人文科學領域的「測不準原理」。現在各種花樣百出的水軍現象已經一再提示我們,真是「不能天真地認為數據使用者和數據生成機構都是無意識生產大數據的」(沈艷,2015)。
上述這些還沒有涉及諸如homes系統、高頻交易等技術在這一輪股市風波中的作用究竟應該如何認定的問題。盡管對此還可能有這樣那樣的看法,但可以確定的是,在某些條件下,所謂的技術中性在面對市場時是完全可能發生變異的。
總之,我認為金融的創新、互聯網金融的發展,除了技術,還需要一系列的條件支撐,包括營造一種良好的文化氛圍。在眼花繚亂之中,要力戒浮躁,腳踏實地。互聯網技術是時代進步的標志,是現代文明的產物,它與那些江湖氣其實是不搭的。諸如「流量為王,就是要靠燒錢來吸引客戶」,「互聯網就是財富重分的過程,就是贏者通吃的游戲」,「羊毛出在豬身上,猴數錢,牛買單」等說法,如果僅是開開玩笑,說說段子,那也未嘗不可,但作為一個要對投資者負責、對債權人負責、對債務人負責、對市場穩定負責的金融從業者來說,如果把這真的當成了自己的經營理念,那是萬萬不可的。
D. Type-C中的PD是什麼意思PD概念是什麼
Type-C中的PD的意思指是:USB Power Delivery功率傳輸協議。
USB PD 協議基於USB3.1,是USB3.1 中即type-c埠後提出的功率傳輸概念。可以為這種技術帶來更大的靈活性,將充電能力擴大為目前的10倍:最高可達100瓦。
USB PD,為電力傳輸進行重新設計,為用戶帶來提供強悍的電力輸出選項。目前USB 3.0搭載4.5瓦,而變種的USB BC能夠提供7.5W,而USB目前被運用在智能手機,數碼相機,和平板上。
(4)PD大數據擴展閱讀:
USB Type-C具有以下特點:
1、最大數據傳輸速度達到10Gbit/秒,也是USB 3.1的標准。
2、Type-C介面插座端的尺寸約為8.3mm×2.5mm纖薄設計。
3、支持從正反兩面均可插入的「正反插」功能,可承受1萬次反復插拔。
4、配備Type-C連接器的標准規格連接線可通過3A電流,同時還支持超出現有USB供電能力的「USB PD」,可以提供最大100W 的電力。
參考資料:網路-usb pd
網路-USB Type-C