Ⅰ 如何獲取高質量大數據指數
第一步:抄大數據指數首先是引入各種非傳統、非結構化、海量的信息(即大數據)來預測股市。
第二步:一旦確定該大數據信息對股市有提前的預判,無論是對行業、風格、擇時或者直接對上市公司等收益有預測性,就可以通過量化模型,選擇候選成分股,構建多因子模型。
第三步:從可投資性、換手率、風險控制等角度考慮,綜合博時在的量化投資方面構建的包括基本面因子等在內量化因子體系,構建指數組合。
第四步:每一種量化模型都需要不停升級,博時會根據指數的業績表現以及市場變化,不斷優化和迭代多因子模型,追求獲取更多超額收益。
例如,博時基金「指慧家」品牌旗下目前共有4隻大數據指數,是目前國內產品數量最多的大數據指數品牌。
Ⅱ 天弘基金打造三領域領先的大數據指數
天弘基金打造三領域領先的大數據指數
國務院近日發布了《促進大數據發展行動綱要》(以下簡稱《綱要》),將大數據發展提升為國家戰略,大數據所蘊含的巨大價值將被進一步挖掘。作為國內大數據投研的領先者,天弘基金開發定製的國內首隻社交投資大數據指數——雪球100指數於9月15日正式發布,從此日開始,投資者可通過雪球網、Wind等數據終端查看指數行情,了解具體的點位、漲跌幅、分時走勢等數據。
雪球100指數的特點是投資者最為關心的問題,對此,天弘基金投研部總經理肖志剛介紹稱,天弘基金所定製開發的雪球100指數,在三方面做到領先。第一,率先引入投資眾包思維,篩選大量有經驗的投資者的智慧,將其智慧轉化為有指導意義的、可視化的指數;第二,採用雪球獨特的數據資源,打造國內首隻社交投資大數據指數;第三,編制中剔除其他重復性因子,也是國內首隻純粹的大數據指數。
肖志剛同時表示,天弘基金選擇以雪球的數據來編制大數據指數,是看中了雪球作為社交投資平台,具備去中心化的投資體系。「雪球的數據量大,裡面肯定有很多優秀的投資人,優秀的想法,如果能用一定的方法把這些人篩選出來,把這些想法集中起來,必定能在大概率上跑贏市場。而且雪球的模擬組合能把投資者的投資思路數據化,更加直觀,處理起來也更加方便,因此我們想到了合作開發這樣一隻指數,把大眾的智慧調動起來。」肖志剛表示,在雪球100指數發布後,天弘基金將盡早發行跟蹤雪球100指數的基金,目前產品正在籌備中。
天弘基金在編制雪球100指數時,也打破傳統,採用創新模式,為的是給投資者提供簡單、清晰、有效的工具。
肖志剛表示,在編制過程中,綜合考慮了雪球用戶對股票的認同,用戶的研究能力、投資能力,最後的組合等來綜合決策,是一個經歷了層層篩選的策略,模擬真實的投資決策,能夠反映具有投資能力和研究能力的用戶的股票持倉及增減倉總體情況。簡單來說,雪球100的編制,先篩選出得到用戶認可的大V,然後對其研究能力和投資能力進行量化,再對其股票綜合評分,選取高分組合。
首先,在雪球的全部注冊用戶中,選取粉絲數排名前5%的用戶作為參考用戶;在參考用戶創建的所有自選組合中,選取最近一個月內倉位發生過變動的組合作為參考組合。在全部參考組合所覆蓋的股票中,選取至少被20個參考用戶所持有的股票(截至月末)作為待選樣本;其次,對大V的研究能力和投資能力根據其評論和調倉等數據進行量化。對每個待選樣本所覆蓋的參考用戶,根據其相關的組合歷史業績和線上活躍度進行評分(當組合創建時間不足一年時,相關歷史業績評分為零),得到單個參考用戶關於某待選樣本的能力評分。計算單個待選樣本的持倉評分與調倉評分(增持為正,減持為負),並由此通過加權得到其綜合評分。選取綜合評分最高的100隻待選樣本作為指數樣本股。
另外,雪球100指數的成分股每個月調整一次。最近一期的100隻成分股中,滬市、深市、創業板的股票數量佔比分別為42%、39%和19%,持倉市值佔比分別為57.22%、34.34%和8.44%,包括浦發銀行、民生銀行、中國石化、包鋼股份、復星醫葯等。而且,該指數採用流通市值加權的方式,防止小股票權重過高。目前看,該指數的模擬業績效果很好,走勢相對穩健,換手率較低,近8個月都在30%以下,年化超額收益在30%以上。而且在市場大幅震盪中回撤幅度遠小於其他大數據指數。
以上是小編為大家分享的關於天弘基金打造三領域領先的大數據指數的相關內容,更多信息可以關注環球青藤分享更多干貨
Ⅲ 如何用大數據炒股
我們如今生活在一個數據爆炸的世界裡。網路每天響應超過60億次的搜索請求,日處理數據超過100PB,相當於6000多座中國國家圖書館的書籍信息量總和。新浪微博每天都會發布上億條微博。在荒無人煙的郊外,暗藏著無數大公司的信息存儲中心,24小時夜以繼日地運轉著。
克托·邁爾-舍恩伯格在《大數據時代》一書中認為,大數據的核心就是預測,即只要數據豐富到一定程度,就可預測事情發生的可能性。例如,「從一個人亂穿馬路時行進的軌跡和速度來看他能及時穿過馬路的可能性」,或者通過一個人穿過馬路的速度,預測車子何時應該減速從而讓他及時穿過馬路。
那麼,如果把這種預測能力應用在股票投資上,又會如何?
目前,美國已經有許多對沖基金採用大數據技術進行投資,並且收獲甚豐。中國的中證廣發網路百發100指數基金(下稱百發100),上線四個多月以來已上漲68%。
和傳統量化投資類似,大數據投資也是依靠模型,但模型里的數據變數幾何倍地增加了,在原有的金融結構化數據基礎上,增加了社交言論、地理信息、衛星監測等非結構化數據,並且將這些非結構化數據進行量化,從而讓模型可以吸收。
由於大數據模型對成本要求極高,業內人士認為,大數據將成為共享平台化的服務,數據和技術相當於食材和鍋,基金經理和分析師可以通過平台製作自己的策略。
量化非結構數據
不要小看大數據的本領,正是這項剛剛興起的技術已經創造了無數「未卜先知」的奇跡。
2014年,網路用大數據技術預測命中了全國18卷中12卷高考作文題目,被網友稱為「神預測」。網路公司人士表示,在這個大數據池中,包含互聯網積累的用戶數據、歷年的命題數據以及教育機構對出題方向作出的判斷。
在2014年巴西世界盃比賽中,Google亦通過大數據技術成功預測了16強和8強名單。
從當年英格蘭報社的信鴿、費城股票交易所的信號燈到報紙電話,再到如今的互聯網、雲計算、大數據,前沿技術迅速在投資領域落地。在股票策略中,大數據日益嶄露頭角。
做股票投資策略,需要的大數據可以分為結構化數據和非結構化數據。結構化數據,簡單說就是「一堆數字」,通常包括傳統量化分析中常用的CPI、PMI、市值、交易量等專業信息;非結構化數據就是社交文字、地理位置、用戶行為等「還沒有進行量化的信息」。
量化非結構化就是用深度模型替代簡單線性模型的過程,其中所涉及的技術包括自然語言處理、語音識別、圖像識別等。
金融大數據平台-通聯數據CEO王政表示,通聯數據採用的非結構化數據可以分為三類:第一類和人相關,包括社交言論、消費、去過的地點等;第二類與物相關,如通過正在行駛的船隻和貨車判斷物聯網情況;第三類則是衛星監測的環境信息,包括汽車流、港口裝載量、新的建築開工等情況。
衛星監測信息在美國已被投入使用,2014年Google斥資5億美元收購了衛星公司Skybox,從而可以獲得實施衛星監測信息。
結構化和非結構化數據也常常相互轉化。「結構化和非結構化數據可以形象理解成把所有數據裝在一個籃子里,根據應用策略不同相互轉化。例如,在搜索頻率調查中,用戶搜索就是結構化數據;在金融策略分析中,用戶搜索就是非結構化數據。」網路公司人士表示。
華爾街拿著豐厚薪水的分析師們還不知道,自己的僱主已經將大量資本投向了取代自己的機器。
2014年11月23日,高盛向Kensho公司投資1500萬美元,以支持該公司的大數據平台建設。該平台很像iPhone里的Siri,可以快速整合海量數據進行分析,並且回答投資者提出的各種金融問題,例如「下月有颶風,將對美國建材板塊造成什麼影響?」
在Kensho處理的信息中,有80%是「非結構化」數據,例如政策文件、自然事件、地理環境、科技創新等。這類信息通常是電腦和模型難以消化的。因此,Kensho的CEO Daniel Nadler認為,華爾街過去是基於20%的信息做出100%的決策。
既然說到高盛,順便提一下,這家華爾街老牌投行如今對大數據可謂青睞有加。除了Kensho,高盛還和Fortress信貸集團在兩年前投資了8000萬美元給小額融資平台On Deck Capital。這家公司的核心競爭力也是大數據,它利用大數據對中小企業進行分析,從而選出值得投資的企業並以很快的速度為之提供短期貸款。
捕捉市場情緒
上述諸多非結構化數據,歸根結底是為了獲得一個信息:市場情緒。
在采訪中,2013年諾貝爾經濟學獎得主羅伯特•席勒的觀點被無數采訪對象引述。可以說,大數據策略投資的創業者們無一不是席勒的信奉者。
席勒於上世紀80年代設計的投資模型至今仍被業內稱道。在他的模型中,主要參考三個變數:投資項目計劃的現金流、公司資本的估算成本、股票市場對投資的反應(市場情緒)。他認為,市場本身帶有主觀判斷因素,投資者情緒會影響投資行為,而投資行為直接影響資產價格。
然而,在大數據技術誕生之前,市場情緒始終無法進行量化。
回顧人類股票投資發展史,其實就是將影響股價的因子不斷量化的過程。
上世紀70年代以前,股票投資是一種定性的分析,沒有數據應用,而是一門主觀的藝術。隨著電腦的普及,很多人開始研究驅動股價變化的規律,把傳統基本面研究方法用模型代替,市盈率、市凈率的概念誕生,量化投資由此興起。
量化投資技術的興起也帶動了一批華爾街大鱷的誕生。例如,巴克萊全球投資者(BGI)在上世紀70年代就以其超越同行的電腦模型成為全球最大的基金管理公司;進入80年代,另一家基金公司文藝復興(Renaissance)年均回報率在扣除管理費和投資收益分成等費用後仍高達34%,堪稱當時最佳的對沖基金,之後十多年該基金資產亦十分穩定。
「從主觀判斷到量化投資,是從藝術轉為科學的過程。」王政表示,上世紀70年代以前一個基本面研究員只能關注20隻到50隻股票,覆蓋面很有限。有了量化模型就可以覆蓋所有股票,這就是一個大的飛躍。此外,隨著計算機處理能力的發展,信息的用量也有一個飛躍變化。過去看三個指標就夠了,現在看的指標越來越多,做出的預測越來越准確。
隨著21世紀的到來,量化投資又遇到了新的瓶頸,就是同質化競爭。各家機構的量化模型越來越趨同,導致投資結果同漲同跌。「能否在看到報表數據之前,用更大的數據尋找規律?」這是大數據策略創業者們試圖解決的問題。
於是,量化投資的多米諾骨牌終於觸碰到了席勒理論的第三層變數——市場情緒。
計算機通過分析新聞、研究報告、社交信息、搜索行為等,藉助自然語言處理方法,提取有用的信息;而藉助機器學習智能分析,過去量化投資只能覆蓋幾十個策略,大數據投資則可以覆蓋成千上萬個策略。
基於互聯網搜索數據和社交行為的經濟預測研究,已逐漸成為一個新的學術熱點,並在經濟、社會以及健康等領域的研究中取得了一定成果。在資本市場應用上,研究發現搜索數據可有效預測未來股市活躍度(以交易量指標衡量)及股價走勢的變化。
海外就有學術研究指出,公司的名稱或者相關關鍵詞的搜索量,與該公司的股票交易量正相關。德國科學家Tobias Preis就進行了如此研究:Tobias利用谷歌搜索引擎和谷歌趨勢(Google Trends),以美國標普500指數的500隻股票為其樣本,以2004年至2010年為觀察區間,發現谷歌趨勢數據的公司名稱搜索量和對應股票的交易量,在每周一次的時間尺度上有高度關聯性。也就是說,當某個公司名稱在谷歌的搜索量活動增加時,無論股票的價格是上漲或者下跌,股票成交量與搜索量增加;反之亦然,搜索量下降,股票成交量下降。以標普500指數的樣本股為基礎,依據上述策略構建的模擬投資組合在六年的時間內獲得了高達329%的累計收益。
在美國市場上,還有多家私募對沖基金利用Twitter和Facebook的社交數據作為反映投資者情緒和市場趨勢的因子,構建對沖投資策略。利用互聯網大數據進行投資策略和工具的開發已經成為世界金融投資領域的新熱點。
保羅·霍丁管理的對沖基金Derwent成立於2011年5月,注冊在開曼群島,初始規模約為4000萬美元, 2013年投資收益高達23.77%。該基金的投資標的包括流動性較好的股票及股票指數產品。
通聯數據董事長肖風在《投資革命》中寫道,Derwent的投資策略是通過實時跟蹤Twitter用戶的情緒,以此感知市場參與者的「貪婪與恐懼」,從而判斷市場漲跌來獲利。
在Derwent的網頁上可以看到這樣一句話:「用實時的社交媒體解碼暗藏的交易機會。」保羅·霍丁在基金宣傳冊中表示:「多年以來,投資者已經普遍接受一種觀點,即恐懼和貪婪是金融市場的驅動力。但是以前人們沒有技術或數據來對人類情感進行量化。這是第四維。Derwent就是要通過即時關注Twitter中的公眾情緒,指導投資。」
另一家位於美國加州的對沖基金MarketPsych與湯普森·路透合作提供了分布在119個國家不低於18864項獨立指數,比如每分鍾更新的心情狀態(包括樂觀、憂郁、快樂、害怕、生氣,甚至還包括創新、訴訟及沖突情況等),而這些指數都是通過分析Twitter的數據文本,作為股市投資的信號。
此類基金還在不斷涌現。金融危機後,幾個台灣年輕人在波士頓組建了一家名為FlyBerry的對沖基金,口號是「Modeling the World(把世界建模)」。它的投資理念全部依託大數據技術,通過監測市場輿論和行為,對投資做出秒速判斷。
關於社交媒體信息的量化應用,在股票投資之外的領域也很常見:Twitter自己也十分注重信息的開發挖掘,它與DataSift和Gnip兩家公司達成了一項出售數據訪問許可權的協議,銷售人們的想法、情緒和溝通數據,從而作為顧客的反饋意見匯總後對商業營銷活動的效果進行判斷。從事類似工作的公司還有DMetics,它通過對人們的購物行為進行分析,尋找影響消費者最終選擇的細微原因。
回到股票世界,利用社交媒體信息做投資的公司還有StockTwits。打開這家網站,首先映入眼簾的宣傳語是「看看投資者和交易員此刻正如何討論你的股票」。正如其名,這家網站相當於「股票界的Twitter」,主要面向分析師、媒體和投資者。它通過機器和人工相結合的手段,將關於股票和市場的信息整理為140字以內的短消息供用戶參考。
此外,StockTwits還整合了社交功能,並作為插件可以嵌入Twitter、Facebook和LinkedIn等主要社交平台,讓人們可以輕易分享投資信息。
另一家公司Market Prophit也很有趣。這家網站的宣傳語是「從社交媒體噪音中提煉市場信號」。和StockTwits相比,Market Prophit更加註重大數據的應用。它採用了先進的語義分析法,可以將Twitter里的金融對話量化為「-1(極度看空)」到「1(極度看多)」之間的投資建議。網站還根據語義量化,每天公布前十名和後十名的股票熱度榜單。網站還設計了「熱度地圖」功能,根據投資者情緒和意見,按照不同板塊,將板塊內的個股按照顏色深淺進行標注,誰漲誰跌一目瞭然。
中國原創大數據指數
盡管大數據策略投資在美國貌似炙手可熱,但事實上,其應用尚僅限於中小型對沖基金和創業平台公司。大數據策略投資第一次被大規模應用,應歸於中國的百發100。
網路金融中心相關負責人表示,與歐美等成熟資本市場主要由理性機構投資者構成相比,東亞尤其是中國的股票類證券投資市場仍以散戶為主,因此市場受投資者情緒和宏觀政策性因素影響很大。而個人投資者行為可以更多地反映在互聯網用戶行為大數據上,從而為有效地預測市場情緒和趨勢提供了可能。這也就是中國國內公募基金在應用互聯網大數據投資方面比海外市場並不落後、甚至領先的原因。
百發100指數由網路、中證指數公司、廣發基金聯合研發推出,於2014年7月8日正式對市場發布,實盤運行以來一路上漲,漲幅超過60%。跟蹤該指數的指數基金規模上限為30億份,2014年9月17日正式獲批,10月20日發行時一度創下26小時瘋賣18億份的「神話」。
外界都知道百發100是依託大數據的指數基金,但其背後的細節鮮為人知。
百發100數據層面的分析分為兩個層面,即數據工廠的數據歸集和數據處理系統的數據分析。其中數據工廠負責大數據的收集分析,例如將來源於互聯網的非結構化數據進行指標化、產品化等數據量化過程;數據處理系統,可以在數據工廠遞交的大數據中尋找相互統計關聯,提取有效信息,最終應用於策略投資。
「其實百發100是在傳統量化投資技術上融合了基於互聯網大數據的市場走勢和投資情緒判斷。」業內人士概括道。
和傳統量化投資類似,百發100對樣本股的甄選要考慮財務因子、基本面因子和動量因子,包括凈資產收益率(ROE)、資產收益率(ROA)、每股收益增長率(EPS)、流動負債比率、企業價值倍數(EV/EBITDA)、凈利潤同比增長率、股權集中度、自由流通市值以及最近一個月的個股價格收益率和波動率等。
此外,市場走勢和投資情緒是在傳統量化策略基礎上的創新產物,也是百發100的核心競爭力。接近網路的人士稱,市場情緒因子對百發100基金起決定性作用。
網路金融中心相關負責人是羅伯特•席勒觀點的支持者。他認為,投資者行為和情緒對資產價格、市場走勢有著巨大的影響。因此「通過互聯網用戶行為大數據反映的投資市場情緒、宏觀經濟預期和走勢,成為百發100指數模型引入大數據因子的重點」。
傳統量化投資主要著眼點在於對專業化金融市場基本面和交易數據的應用。但在網路金融中心相關業務負責人看來,無論是來源於專業金融市場的結構化數據,還是來源於互聯網的非結構化數據,都是可以利用的數據資源。因此,前文所述的市場情緒數據,包括來源於互聯網的用戶行為、搜索量、市場輿情、宏觀基本面預期等等,都被網路「變廢為寶」,從而通過互聯網找到投資者參與特徵,選出投資者關注度較高的股票。
「與同期滬深300指數的表現相較,百發100更能在股票市場振盪時期、行業輪動劇烈時期、基本面不明朗時期抓住市場熱點、了解投資者情緒、抗擊投資波動風險。」網路金融中心相關負責人表示。
百發100選取的100隻樣本股更換頻率是一個月,調整時間為每月第三周的周五。
業內人士指出,百發100指數的月收益率與中證100、滬深300、中證500的相關性依次提升,說明其投資風格偏向中小盤。
但事實並非如此。從樣本股的構成來說,以某一期樣本股為例,樣本股總市值6700億元,佔A股市值4.7%。樣本股的構成上,中小板21隻,創業板4隻,其餘75隻樣本股均為大盤股。由此可見,百發100還是偏向大盤為主、反映主流市場走勢。
樣本股每個月的改變比例都不同,最極端的時候曾經有60%進行了換倉。用大數據預測熱點變化,市場熱點往往更迭很快;但同時也要考慮交易成本。兩方面考慮,網路最後測算認為一個月換一次倉位為最佳。
樣本股對百發100而言是核心機密——據說「全世界只有基金經理和指數編制機構負責人兩個人知道」——都是由機器決定後,基金經理分配給不同的交易員建倉買入。基金經理也沒有改變樣本股的權利。
展望未來,網路金融中心相關負責人躊躇滿志,「百發100指數及基金的推出,只是我們的開端和嘗試,未來將形成多樣化、系列投資產品。」
除了百發100,目前市場上打著大數據旗幟的基金還有2014年9月推出的南方-新浪I100和I300指數基金。
南方-新浪I100和I300是由南方基金、新浪財經和深圳證券信息公司三方聯合編制的。和百發100類似,也是按照財務因子和市場情緒因子進行模型打分,按照分值將前100和前300名股票構成樣本股。推出至今,這兩個指數基金分別上漲了10%左右。
正如百發100的市場情緒因子來自網路,南方-新浪I100和I300的市場情緒因子全部來自新浪平台。其中包括用戶在新浪財經對行情的訪問熱度、對股票的搜索熱度;用戶在新浪財經對股票相關新聞的瀏覽熱度;股票相關微博的多空分析數據等。
此外,阿里巴巴旗下的天弘基金也有意在大數據策略上做文章。據了解,天弘基金將和阿里巴巴合作,推出大數據基金產品,最早將於2015年初問世。
天弘基金機構產品部總經理劉燕曾對媒體表示,「在傳統的調研上,大數據將貢獻於基礎資產的研究,而以往過度依賴線下研究報告。大數據將視野拓展至了線上的數據分析,給基金經理選股帶來新的邏輯。」
在BAT三巨頭中,騰訊其實是最早推出指數基金的。騰訊與中證指數公司、濟安金信公司合作開發的「中證騰安價值100指數」早在2013年5月就發布了,號稱是國內第一家由互聯網媒體與專業機構編制發布的A股指數。不過,業內人士表示,有關指數並沒有真正應用大數據技術。雖然騰訊旗下的微信是目前最熱的社交平台,蘊藏了大量的社交數據,但騰訊未來怎麼開發,目前還並不清晰。
大數據投資平台化
中歐商學院副教授陳威如在其《平台戰略》一書中提到,21世紀將成為一道分水嶺,人類商業行為將全面普及平台模式,大數據金融也不例外。
然而,由於大數據模型對成本要求極高,就好比不可能每家公司都搭建自己的雲計算系統一樣,讓每家機構自己建設大數據模型,從數據來源和處理技術方面看都是不現實的。業內人士認為,大數據未來必將成為平台化的服務。
目前,阿里、網路等企業都表示下一步方向是平台化。
螞蟻金服所致力搭建的平台,一方麵包括招財寶一類的金融產品平台,另一方麵包括雲計算、大數據服務平台。螞蟻金服人士說,「我們很清楚自己的優勢不是金融,而是包括電商、雲計算、大數據等技術。螞蟻金服希望用這些技術搭建一個基礎平台,把這些能力開放出去,供金融機構使用。」
網路亦是如此。接近網路的人士稱,未來是否向平台化發展,目前還在討論中,但可以確定的是,「網路不是金融機構,目的不是發產品,百發100的意義在於打造影響力,而非經濟效益。」
當BAT還在摸索前行時,已有嗅覺靈敏者搶佔了先機,那就是通聯數據。
通聯數據股份公司(DataYes)由曾任博時基金副董事長肖風帶隊創建、萬向集團投資成立,總部位於上海,公司願景是「讓投資更容易,用金融服務雲平台提升投資管理效率和投研能力」。該平台7月上線公測,目前已擁有130多家機構客戶,逾萬名個人投資者。
通聯數據目前有四個主要平台,分別是通聯智能投資研究平台、通聯金融大數據服務平台、通聯多資產投資管理平台和金融移動辦公平台。
通聯智能投資研究平台包括雅典娜-智能事件研究、策略研究、智能研報三款產品,可以對基於自然語言的智能事件進行策略分析,實時跟蹤市場熱點,捕捉市場情緒。可以說,和百發100類似,其核心技術在於將互聯網非結構化數據的量化使用。
通聯金融大數據服務平台更側重於專業金融數據的分析整理。它可以提供公司基本面數據、國內外主要證券、期貨交易所的行情數據、公司公告數據、公關經濟、行業動態的結構化數據、金融新聞和輿情的非結構化數據等。
假如將上述兩個平台比作「收割機」,通聯多資產投資管理平台就是「廚房」。在這個「廚房」里,可以進行全球跨資產的投資組合管理方案、訂單管理方案、資產證券化定價分析方案等。
通聯數據可以按照主題熱點或者自定義關鍵字進行分析,構建知識圖譜,將相關的新聞和股票提取做成簡潔的分析框架。例如用戶對特斯拉感興趣,就可以通過主題熱點看到和特斯拉相關的公司,並判斷這個概念是否值得投資。「過去這個搜集過程要花費幾天時間,現在只需要幾分鍾就可以完成。」王政表示。
「通聯數據就好比一家餐館,我們把所有原料搜集來、清洗好、准備好,同時准備了一個鍋,也就是大數據存儲平台。研究員和基金經理像廚師一樣,用原料、工具去『烹制』自己的策略。」王政形容道。
大數據在平台上扮演的角色,就是尋找關聯關系。人類總是習慣首先構建因果關系,繼而去倒推和佐證。機器學習則不然,它可以在海量數據中查獲超越人類想像的關聯關系。正如維克托`邁爾-舍恩伯格在《大數據時代》中所提到的,社會需要放棄它對因果關系的渴求,而僅需關注相互關系。
例如,美國超市沃爾瑪通過大數據分析,發現颶風用品和蛋撻擺在一起可以提高銷量,並由此創造了頗大的經濟效益。如果沒有大數據技術,誰能將這毫無關聯的兩件商品聯系在一起?
通聯數據通過機器學習,也能找到傳統量化策略無法發現的市場聯系。其中包括各家公司之間的資本關系、產品關系、競爭關系、上下游關系,也包括人與人之間的關系,例如管理團隊和其他公司有沒有關聯,是否牽扯合作等。
未來量化研究員是否將成為一個被淘汰的職業?目前研究員的主要工作就是收集整理數據,變成投資決策,而之後這個工作將更多由機器完成。
「當初醫療科技發展時,人們也認為醫生會被淘汰,但其實並不會。同理,研究員也會一直存在,但他們會更注重深入分析和調研,初級的數據搜集可以交給機器完成。」王政表示。
但當未來大數據平台並廣泛應用後,是否會迅速擠壓套利空間?這也是一個問題。回答根據網上資料整理
Ⅳ 淘金100指數是什麼淘金100指數基金又是什麼
在不久前,蟻金服聯合博時基金、恆生聚源及中證指數共同發布了全球首個電商大數據指數--中證淘金大數據100指數,也就是我們說的淘金100指數,那麼這個淘金一百指數是什麼?淘金100指數基金又是什麼呢?
淘金100指數是什麼?
淘金100指數的全稱是中證淘金大數據100指數,是由螞蟻金融服務集團(簡稱「螞蟻金服」)、博時基金管理有限公司、恆生聚源及中證指數共同發布。中證淘金大數據100指數也是全球首個電商大數據指數。
淘金100是一個股票指數。與其他傳統指數不同,淘金100是基於海量的電商交易數據,經過大數據與金融的碰撞後,產生的全球首個電商大數據指數產品。
淘金100指數依託螞蟻金服的大數據平台,基於海量的互聯網電商交易大數據,來預期一個行業未來盈利狀況,預判一個行業的繁榮程度,並在此基礎上選取100隻股票形成投資組合。
由於時效性的大幅提升,淘金100會每個月審核一次樣本股,並將樣本股調整周期縮短至一個月。值得關注的是,淘金100的業績表現非常出色。從2009年12月31日的基日計算,五年的預期年化預期收益率超過572%;2014年全年的預期年化預期收益率超過116%;2015年第一季度的預期年化預期收益率超過41%。據測算,2009年至2014年,淘金100的歷史預期年化預期收益率約為54%,遠超同期的上證綜指、滬深300等大盤走勢。
淘金100指數基金是什麼?
淘金100指數基金是指與淘金100指數掛鉤的基金產品,已經在審批之中,一隻保本基金和一隻指數基金預計在4月中下旬推向市場。指數基金的投資會與淘金100的成份股對應,並採用等權重方式。理財也表示,相比於個人投資股票,選擇投資基金,會更加穩健。特別是指數基金,巴菲特在1993年至2008年間,曾經8次介紹指數基金,「大部分投資者,包括機構投資者和個人投資者,早晚會發現,最好的投資股票方法是購買管理費很低的指數基金」。
Ⅳ 百發100指數是什麼和i100、i300、騰安指數有什麼區別
百發指數首次採用網路金融搜索和用戶行為大數據,通過相應的數據挖掘和分析手段,將涉及特定金融實體的數據進行自動分析、歸並、統計和計算,並引入量化投資模型,編制股票市場指數。
百發100指數,全稱中證網路百發策略100指數,是百發系列指數中的第一隻產品,是中證指數公司與網路公司、廣發基金管理有限公司合作編制並對外發布的互聯網指數,是國內真正利用大數據挖掘平台開發的首隻互聯網金融產品,是對傳統指數編制方法和基金銷售渠道的改進和探索相比市場主流指數,百發100指數自發布以來取得了突出的表現。累計預期年化預期收益方面,百發100指數2009年1月1日至9月18日已經取得了的漲幅,遠高於同期滬深300的累計漲幅,更高於上證綜指12%的累計預期年化預期收益,也遠遠戰勝了全市場業績基準中證全指56%的累計預期年化預期收益。該指數2014年初以來至9月18日,漲幅達從歷史走勢來看,百發100指數能夠顯著戰勝市場所有主流寬基指數,是一條良好的被動投資標的。
2014年9月17日,廣發中證網路百發策略100指數基金已正式獲批。
百發100指數和i100、i300、騰安指數有什麼區別?
他們是由不同的指數公司編制的指數。
百發100指數是由中證公司與網路、廣發基金合作編制的指數,創新融合了互聯網、大數據與量化策略,是國內首隻互聯網大數據基金。百發100所基於的網路金融搜索和用戶行為大數據有著得天獨厚的優勢:網路是全球最大的中文搜索引擎,在國內涵蓋超80%用戶群,基礎數據更可觀、更具有投資前瞻性。
i100、i300指數的樣本股選擇是根據因子與新浪大數據決定。騰安指數則由騰訊與中證指數公司、濟安金信公司合作開發。
Ⅵ 大數據基金逆勢猛發 主動引入量化對沖策略
大數據基金逆勢猛發 主動引入量化對沖策略
大數據正在持續激發商業模式創新,不斷催生新業態,成為互聯網等新興領域促進業務創新增值、提升企業核心價值的重要驅動力。大數據產業正在成為新的經濟增長點,對未來信息產業格局產生重要影響。在各個互聯網平台紛紛拿出自己的數據做成金融產品的同時,基金公司也在希望借力大數據基金,抓住成長於互聯網時代的新一代基民。
六月以來,國內資本市場逐步走弱,基金募集依然極度低迷。新基金不僅首募規模慘淡,且頻現延長募集問題。行情不好,公募也明顯放慢了新產品的發行節奏。而其中,大數據基金反而是靜流中的一股暗涌。不僅形形色色大數據指數陸續面世,而且基於這些指數開發的產品也將列隊發行。
大數據指數的開發也進入精耕細作的階段。公募對互聯網數據的要求越來越挑剔,尤其要求與投資者行為密切相關。公募合作的互聯網平台從網路、新浪財經,亦發展到雪球、騰訊自選股、同花順等記錄了投資行為的平台。
中國公募基金行業對大數據引入投資的應用還處於初級階段,因此開發較為簡單的指數型基金是多數試水者的首選。然而,今年6月中旬以來A股接連幾度大跌,讓始終保持高倉位、必須跟隨指數的大數據指數基金面臨著業績的壓力。
震盪市中,配置了代表轉型方向小票的高倉位大數據指數基金遭遇重挫,先行者也在思考這類產品如何轉身的問題。如今,大數據基金產品的開發走向了倉位和操作更加靈活的主動量化趨勢,引入對沖策略。
大數據為新基金「貼金」
經濟觀察報注意到,僅是今年7、8兩個月份,中證指數公司已發布三條與雪球相關的大數據指數,三條與銀聯相關的大數據指數,一條與360旗下的搜索引擎有關的大數據指數,一條與搜房網房天下有關的大數據指數。記者了解到,博時基金、大成基金、天弘基金、中歐基金、鵬華基金正在開發基於上述指數的基金產品,將在未來兩三個月內發行。
大數據基金始步於2014年,升溫於2015年。去年,廣發基金[微博]與網路的合作打響大數據基金頭炮;今年,除了新增南方、博時、大成、天弘、中歐、鵬華、嘉實等將近十家試水者之外,產品發行的速度和數量均在今年明顯上升一個台階。記者了解到,博時和大成等公募基金公司已經把大數據基金的開發作為公司的戰略重點。
年輕的大數據指數尚未建立自己的地位。大數據是否只是營銷的噱頭,仍是多數基民心中揮之不去的質疑。對此,博時基金副總裁王德英以量化基金在國內從不受重視到大受歡迎的經歷勉勵自己。他認為,前幾年尚未做出業績的量化基金發展得不溫不火。但從去年開始,一些運作時間較長的量化基金已積累出業績,尤其是在今年股市震盪期中成為很多投資者在債券、固定收益類產品之外的避險之選,「希望多積累點業績,來說服投資者。」
大數據因子的出現,寄予了公募在投研方式變革的期望,也希望能夠把大數據開發成一個良好的策略,幫助原有的量化模型跑贏市場。
大數據基金的選股多採用「多因子」模型,參考此類基金的基金合同,大都採用「財務」、「動量」、「大數據」等三類因子選股。
王德英介紹,目前各家公募所引用的互聯網數據要麼與基本面有關,如銀聯跨行交易數據,以及螞蟻金服旗下支付寶[微博]金融信息服務平台提供的網上消費類統計型趨勢特徵數據;要麼是與市場信心或情緒有關的數據,如反映市場熱點的網路或新浪財經等。
華南一位大數據指數基金經理告訴經濟觀察報,大數據跟投資的相關性大小對最後出來的指數產品的影響並不是那麼直接,還取決於它跟現有的模型匹配的程度有多大,「如果它在某一段時間的市場情況下我們覺得表現會好,會增加它的權重,有時候會降低。」
大成基金首席戰略官溫智敏認為,原則上隨著對大數據的應用能力的提升,大數據的權重會越來越大,「包括我們關於這支產品或者後續的產品方面在未來會把互聯網的元素強化。」
經濟觀察報了解到,大數據指數的選股模型的優劣取決與各家公募在量化投資領域的積累。仔細研究發現,來自各個互聯網平台的數據只是選股模型中的一個因子,且所佔的權重目前還不大,少則六分之一,多則三分之一。
王德英表示,將大數據因子融入原有的量化模型中,考驗的是模型的成熟度。包括大數據在內的各個因子的權重並不是固定的。不同因子如何調配才能優勢互補,需要多年的運行經驗才能總結出來,「模型經常要調整,哪個失效,要剔掉;要不斷統計和優化。」
這意味著大數據指數和傳統被動管理型的指數有較大差異。通過多個因子策略的調整和權重優化,大數據指數可實現一定程度的主動管理。
目前市面上的大數據指數基金多數是每月調一次倉。一位不願具名的大數據指數基金的基金經理告訴經濟觀察報,現在大數據指數都是一個月一換倉,換手率比其它的主動管理型基金還是偏高一些。其進一步揭示了產品局限性和風險性,「主動管理型基金可以挑時間換倉,而我們每個月就定期這樣去換,如果趕上時間點不好,大容量可能會容納不下。」
前述基金經理管理的大數據指數基金並沒有設置最大的規模。其表示,「規模如果太大可能會影響一些調倉,尤其像現在股市不好成交低迷的情況。但是三十億、五十億正常規模的基金應該是沒問題的,畢竟百隻股票三千萬、五千萬,即使換倉一天換不了,拿三五天、一周來換的話也是很合理的。」
不過,與主動型基金相比,大數據指數基金的管理費用低廉具有明顯的競爭優勢。一位業內人士認為,這也是策略指數能夠在很短的時間內獲得市場和投資者廣泛青睞的一個重要原因。
逆勢而上 勇於創新
溫智敏告訴經濟觀察報,策略指數在國外很重要的一種策略就是等權重。傳統的指數採用的是市值加權的方式,意味著更看重所謂市值較大的股票。而大數據指數則是在等權重的情況下,由模型中的多個因子去考量和選擇。
溫智敏認為,現在經濟轉型的情況下,資本市場更加看重成長性股票。等權重的方式下選出了大量的小票,是有資本市場的判斷邏輯在背後支撐。
然而,先行者卻在實踐中發現了問題。傾向於小盤股的特點導致其收益不穩定。
以最早成立的廣發中證網路百發策略100指數基金為例,其募集金額曾高達23億元,基金的成分股為100隻,成分股中中小盤股佔比較高。該指數策略採用等權重方式,以23億元的募集金額來看,每隻股票的配置資金為2300萬元。值得投資者注意的是,中小盤股較多,當基金進行調倉時可能將產生一定的沖擊成本。
近幾個月的震盪市中,受傷最大的是那些被認為代表轉型方向,最有上升空間的小票。配置了小票的高倉位大數據指數基金,便在這一過程中遭遇了較大的回撤。百發100指數基金便是其中一員。
百發100指數基金自去年運行以來,廣發基金意識到該基金的規模局限性,廣發基金大數據混合基金經理季峰表示,「假設在極端行情下,市場流動性匱乏,成分股大部分集中在小盤股上,後果就是交易過程中會產生巨大的沖擊成本,對基金業績造成影響。」
高倉位,主動性差,作為第一波大數據指數基金的先行者,廣發基金思考著如何更好地發揮大數據的優勢。指數型產品碰壁之後,首隻大數據主動量化基金廣發大數據混合在解決問題的背景下誕生。記者發現,新發的廣發大數據混合在倉位上更加靈活,為0~95%之間,而非百發100那樣在任何時候都必須保持90%以上的倉位。
在加權方式上,第二代大數據基金也做了改變,拋棄了等權的方法。廣發大數據混合不再像此前那樣按等權重買入,而是按照市值比例進行配置。季峰認為,由於加權方式採用類市值加權,因而基金規模不做任何限制,調倉的流動性風險和沖擊成本將大幅降低。此外,在應對下跌趨勢時,除了降低倉位,一旦展開趨勢性行情時,該基金也會開股指期貨空單對沖。
股市行情震盪,讓市場上基金的業績表現分化。基金管理公司也開始從側重指數型產品轉型到側重主動管理型產品。主動管理型能夠在大數據選股的優勢上結合擇時對沖風險。
以上是小編為大家分享的關於大數據基金逆勢猛發 主動引入量化對沖策略的相關內容,更多信息可以關注環球青藤分享更多干貨
Ⅶ 大數據指數目前有哪些典型應用
博時基金指慧家就是一個典型的大數據指數應用產品,綜合大數據因子、財務價值版因子、市場驅動因權子,精選出最具投資價值的個股組合編製成指數。
「指慧家」的大數據指數覆蓋面非常廣,覆蓋衣、食、住、行、娛、醫等全市場行業,涵蓋互聯網電商、線下消費、社交金融、房地產交易等領域。博時基金優選合作夥伴,螞蟻金服、銀聯、雪球、搜房網等都是各自領域中的龍頭企業,擁有具有行業代表性的大數據。
Ⅷ 藍方001113基金用的什麼大數據
國內首批推出的大數據指數,南方新浪大數據100指數的編制初衷在於股票研究數猛宏據和方法上的補位。互聯老知判網大數侍改據信息、財務信息、市場行情驅動信息三大信息源構成了三維一體的投資數據基礎。在研究方法上,通過藉助大量數學模型和優化工具來處理大數據。得益於計算機的強大處理能力,將海量數據和數學模型有效結合,使得基於互聯網大數據的股票研究成為可能。