導航:首頁 > 網路數據 > 大盤大數據

大盤大數據

發布時間:2023-03-25 22:49:38

❶ 用大數據炒股,靠譜嗎

因為最近在考察幾個量化交易平台,或許正好能夠回答你的這個問題。
在國外現內在量化交易已經非常非容常的普及,但是據說在國內只有不到5%,似乎是國內散戶太多的原因。
而量化交易就是能夠通過模型預測未來一段時間的走勢,從而不斷去調整,購買較大勝率的股票、期貨或者大宗商品。
某種程度上來說,這些大數據預測相對於國內的賭徒心理還是有更高的成功率的。

當然,也不能太迷信數據,數據是死的,而人性莫測。在國內,即使你個股再好,還是看出現跑不贏大盤的局面,而且有時候還得考慮人的情緒、政策等等。不過,如果能夠堅持,大數據還是相對靠譜的。觀點僅供參考,投資需謹慎。

❷ 大數據--趨勢和特點

歐幾里得的《幾何原本》是基於邏輯推理的公理論推論,為後來的幾何學、數學和自然科學奠定了基礎;托勒密的地心說將歐幾里得的這套方法運用到天文學中,建立起了一套完整並且嚴格的天體運動規律的理論體系;牛頓的力學三定律和萬有引力定律破解了宇宙萬物運動之謎,同時宣告了科學時代的來臨。

這些偉人的思想如果上升到哲學高度,其方法論其實是一脈相承的,可大體概括成如下幾句話:世界變化的規律是確定的,且這些規律是可以被認識的,而且可以用簡單的公式或者語言描述清楚,最後這些規律應該是放之四海而皆準的。

正是在機械思維的引導下,才有了工業革命。在工業革命時期,人類創造了巨大的財富。馬克思曾經說過:「資產階級在其不到100年的階級統治中所創造的生產力,比過去一切時代創造的生產力還要多,還要大」。同時由於機械思維的影響,人類的壽命也得到了大大的延長,在1800年之後,世界各國的人均壽命都先後翻了一番。

從工業時代到信息時代,再到互聯網時代,機械思維的局限性已越來越明顯。像過去那樣找到因果關系已經變得非常困難,因為簡單的因果關系規律性都被發現了。人們越來越發現世界本身存在很大的不確定性。

我們可能已經察覺,現在如果仍然採用機械思維去思考世界,很多問題已經變得很難預測了。比如我們最常見的交通阻塞,近些年來一直是最嚴重的城市病之一,也是各國政府最頭疼的問題之一。現在的處理手段無外乎新建公路、擴寬馬路、增設人行天橋等,通過改善基礎設施的方式來緩解,很明顯這些手段的效果均不太理想;股票市場,投資人可能要考慮行業的發展、政策的導向、公司的業績,甚至是大盤的情緒,而情緒是很難用公理論來進行推論的;現代醫療,治癒癌銷叢症是人類半個多世紀以來的夢想,人類在抗癌研究方面投入的資金比阿波羅登月或者語音識別要多得多。癌細胞是細胞在復制過程中基因出了錯而產生的,並且癌細胞在擴散時自我復制也有可能出錯,所以面對這種具有極強的不確定性疾病時,機械思維變得跟不上了。

如果用道家的「陰陽」理念來解釋人類思維的發展,是否可以這么理解。當人類第一次面對極端不確定的世界時,機械思維得到了飛速的發展;而在人類對世界有了比較清楚的認識,很多不確定性都被認知後,當機械思維發展到極致時,所謂極陽之後必然轉陰,又面臨了更多新的不確定性問題。並且這次人類所面臨的問題跟以前是不一樣的,以前的問題是無法解決,而現在的問題是解決起來過於復雜,問題解決的速度趕不上新問題產生的速度。而在這些歷史背景下,才產生了大數據思維。

那麼,大數據到底是具有了什麼特徵,居然能夠彌補甚至取代機械思維呢?以下從三個方面進行說明。

一、大數據的體量夠大,能窮盡所有相關數據。

大數據最明顯的特點就是體量大,這一點無論是內行還是外行都認可,沒什麼異議。我們國家僅僅北京的國家超級大數據中心,佔地面積就8萬平方米,包含9棟數據中心機房和1棟感知體驗中心。試想:如果托勒密掌握了足夠多的有關天體運動的數據,可能會提出更嚴謹的天體運行規律,其發表的《實用天體氏枝表》也不會在經歷1500年後對太陽運動的累積誤差多出10天。但是,如果僅僅是體量大,比如僅記錄全世界70億人的出生日期這個數據其體量就已經不小。但僅僅只有這一項數據,也只能反映出全世界的人口分布而已,對解決如今復雜的社會問題,似乎提供不了太多有用的幫助。這就涉及到大數據的另外一個特徵--多維度。

二、大數據的多維度夠多,能窮盡所有相關可能性。

搜索引擎出身的Google公司實際上是全球最大的大數據公司,扎克伯格只不過想了個更好的辦法,也可以說是高明地繞了個大圈子,利用搜索功能來更高效的收集數據。眾所周知,Google的人工智慧已經走在了前沿,也是目前全球估值最高的公司。但是,無論是AlpahaGo、無人駕駛還是IT醫療公司Calico,都是建立在多維度的大數據基礎之上的。例如關於「食物」這個問題,Google會利用用戶輸入的信息,收集所有相關的信息。不僅涉及到食物的做法、吃法、成分、營養價值、價格、問題來源的地域和時間等維度,而且還藏著很多外人不注意的隱含信息,比如提問者或者回答者使用的計算機(或手機)以及瀏覽器。這些「相當雜亂」的多維度信息(時間殲斗敏、地域、食品、做法和成分)聯系了起來。經過對這些數據的挖掘、加工和整理,就得到了有意義的統計規律,比如得出的關於不同地域的飲食習慣。如果再加入提問者和回答者的收入情況,便可以得知各個收入階層的飲食習慣。京東也是利用多維度的大數據,來建立高效的物流系統。例如通過記錄某種型號的冰箱的網上瀏覽、訂購、退貨、售後等信息,來決定其在這個區域的倉儲策略。現在有了多維護的大數據,在過去看來很復雜很難處理的問題似乎可以迎刃而解了,顯然這些都是機械思維所不能高效解決的。

三、大數據的完備性

機械思維時代的抽樣調查方式都是採用抽取有限的樣本進行統計,從而得出整體的趨勢。抽樣的核心原則是隨機性,不隨機就不能真實地反應整體的趨勢。但是要做到隨機性是很難的。例如電視收視率調查,要從不同階層隨機找被調查的人,但高學歷高收入的大忙人們普遍拒絕被調查,他們根本就不會因為幾個蠅頭小利而浪費時間,電視調查的結果就可想而知。然而,Google的機器翻譯系統就能很好的要利用大數據的完備性。通過數據學到了不同語言之間很長句子成分的對應,讓後直接把一種語言翻譯成另一類,前提條件就是使用的數據必須是比較全面地覆蓋中文、英文,以及其他各種語言的所有句子,也就是說具備兩種語言之間翻譯的完備性。

上述是關於大數據趨勢和特點的理解,也是關於吳軍老師《智能時代》的部分讀書筆記,下周繼續分享:大數據--面臨的技術挑戰。

❸ 大數據股票龍頭一覽表

大數據股票龍頭一覽表:
1、福田汽車:大數據龍頭股。 2021年第二季度公司實現總營收160.6億,同比增長-10.72%;毛利潤為15.17億。 公司是網路Apollo的合作夥伴,與網路就車聯網、大數據、智能汽車和無人駕駛展開全面合作,共同打造面向未來的智能互聯網商用汽車。
2、高鴻股份:大數據龍頭股。 2021年第二季度,公司實現總營收19.25億,同比增長7.39%,凈利潤為632.3萬,毛利潤為1.317億。 公司持有貴州大數據旅遊公司30%;主營建設貴州大數據旅遊雲平台,提供貴州省高解析度遙感空間信息在各行業的應用服務;18年9月25日公告,子公司與IDC運營商設立合資公司。 大數據概念股其他的還有:芭田股份、長信科技、恆華科技、安恆信息等。
拓展資料
龍頭股票有哪些:
大數據股票龍頭股票主要有海量數據(603138)、科創信息(300730)、新國都(300130)、德生科技(002908)、真視通(002771)、拓爾思(300229)、思特奇(300608)、先進數通(300541)、同有科技(300302)、眾應互聯(002464)等。
龍頭股是指在某一行業中具有影響和號召力的股票,起到帶頭的作用,其漲跌往往對其他同行業板塊股票的漲跌起引導和示範作用。龍頭股的技術面表現和成交量都會遠遠強於同時間的大盤和板塊。
龍頭股具備的條件:
1、龍頭股必須從漲停板開始,漲停板是多空雙方最准確的攻擊信號,不能漲停的個股,不可能做龍頭。
2、龍頭股必須是低價股,只有低價股才能得到股民追捧,一般不超過10元,因為高價股不具備炒作空間。
3、龍頭股流通市要適中,適合大資金運作和散戶追漲殺跌,大市值股票和小盤股都不可能充當龍頭。
4、龍頭股必須同時滿足日KDJ,周KDJ,月KDJ同時低價金叉。
5、龍頭股通常在大盤下跌末期端,市場恐慌時,逆市漲停,提前見底,或者先於大盤啟動,並且經受大盤一輪下跌考驗。
最後提醒:龍頭股並不是一成不變的,它的地位往往只能維持一段時間。

❹ 拼多多在那裡看大盤數據

拼多多官方目前沒有這些數據提供給商家的,使用第三方數據分析軟體多多情報通。綁定自己的店鋪ID,然後查看自己店鋪類目下的數據。功能包括市場行業【市場分析,選品定價,大盤走勢】,店鋪分析【店鋪排名,店鋪查詢、競店探索,店鋪監控】,商品分析【商品排名,屬性排名,競品探索,商品查詢,商品監控】,推廣營銷【關鍵詞分析,熱搜詞分析,活動分析】等。
具體步驟:
1.點擊進入該網站,在導航欄找到並點擊「登錄」按鈕,(如是未注冊用戶,則點擊「 注冊」按鈕,注冊賬號),登錄賬號進入個人後台。
2.進入個人賬號後台,點擊導航欄中的「市場」模塊中的「市場行情」欄目,即可查看拼多多類目行業大盤數據了。
3.如果想查看各行業類目下的子類目行業數據,用戶還可以選擇點擊「二級/三級/四級」子類目行業數據。
一.什麼是大盤數據:
大盤指數是指滬市的「上證綜合指數」和深市的「深證成份股指數」,屬於股票指數。
股市指數的意思就是,就是由證券交易所或金融服務機構編制的、表明股票行市變動的一種供參考的數字。
二.國內常見的指數有哪些?
根據股票指數的編制方法和性質來有針對性的分類,股票指數大致分為這五種類型:規模指數、行業指數、主題指數、風格指數和策略指數。
三.股票指數有什麼用?
如何能直觀地知曉當前各個股票市場的漲跌情況呢?通過觀察指數就可以。
指數選取了市場中具有代表性的一些股票,所以根據指數,就可以很迅速的知道市場整體漲跌的情況,就能順勢看出市場熱度如何,甚至將來的走勢都能夠被預測到。

❺ 如何用大數據炒股

我們如今生活在一個數據爆炸的世界裡。網路每天響應超過60億次的搜索請求,日處理數據超過100PB,相當於6000多座中國國家圖書館的書籍信息量總和。新浪微博每天都會發布上億條微博。在荒無人煙的郊外,暗藏著無數大公司的信息存儲中心,24小時夜以繼日地運轉著。
克托·邁爾-舍恩伯格在《大數據時代》一書中認為,大數據的核心就是預測,即只要數據豐富到一定程度,就可預測事情發生的可能性。例如,「從一個人亂穿馬路時行進的軌跡和速度來看他能及時穿過馬路的可能性」,或者通過一個人穿過馬路的速度,預測車子何時應該減速從而讓他及時穿過馬路。

那麼,如果把這種預測能力應用在股票投資上,又會如何?

目前,美國已經有許多對沖基金採用大數據技術進行投資,並且收獲甚豐。中國的中證廣發網路百發100指數基金(下稱百發100),上線四個多月以來已上漲68%。

和傳統量化投資類似,大數據投資也是依靠模型,但模型里的數據變數幾何倍地增加了,在原有的金融結構化數據基礎上,增加了社交言論、地理信息、衛星監測等非結構化數據,並且將這些非結構化數據進行量化,從而讓模型可以吸收。

由於大數據模型對成本要求極高,業內人士認為,大數據將成為共享平台化的服務,數據和技術相當於食材和鍋,基金經理和分析師可以通過平台製作自己的策略。

量化非結構數據

不要小看大數據的本領,正是這項剛剛興起的技術已經創造了無數「未卜先知」的奇跡。

2014年,網路用大數據技術預測命中了全國18卷中12卷高考作文題目,被網友稱為「神預測」。網路公司人士表示,在這個大數據池中,包含互聯網積累的用戶數據、歷年的命題數據以及教育機構對出題方向作出的判斷。

在2014年巴西世界盃比賽中,Google亦通過大數據技術成功預測了16強和8強名單。

從當年英格蘭報社的信鴿、費城股票交易所的信號燈到報紙電話,再到如今的互聯網、雲計算、大數據,前沿技術迅速在投資領域落地。在股票策略中,大數據日益嶄露頭角。

做股票投資策略,需要的大數據可以分為結構化數據和非結構化數據。結構化數據,簡單說就是「一堆數字」,通常包括傳統量化分析中常用的CPI、PMI、市值、交易量等專業信息;非結構化數據就是社交文字、地理位置、用戶行為等「還沒有進行量化的信息」。

量化非結構化就是用深度模型替代簡單線性模型的過程,其中所涉及的技術包括自然語言處理、語音識別、圖像識別等。

金融大數據平台-通聯數據CEO王政表示,通聯數據採用的非結構化數據可以分為三類:第一類和人相關,包括社交言論、消費、去過的地點等;第二類與物相關,如通過正在行駛的船隻和貨車判斷物聯網情況;第三類則是衛星監測的環境信息,包括汽車流、港口裝載量、新的建築開工等情況。

衛星監測信息在美國已被投入使用,2014年Google斥資5億美元收購了衛星公司Skybox,從而可以獲得實施衛星監測信息。

結構化和非結構化數據也常常相互轉化。「結構化和非結構化數據可以形象理解成把所有數據裝在一個籃子里,根據應用策略不同相互轉化。例如,在搜索頻率調查中,用戶搜索就是結構化數據;在金融策略分析中,用戶搜索就是非結構化數據。」網路公司人士表示。

華爾街拿著豐厚薪水的分析師們還不知道,自己的僱主已經將大量資本投向了取代自己的機器。
2014年11月23日,高盛向Kensho公司投資1500萬美元,以支持該公司的大數據平台建設。該平台很像iPhone里的Siri,可以快速整合海量數據進行分析,並且回答投資者提出的各種金融問題,例如「下月有颶風,將對美國建材板塊造成什麼影響?」

在Kensho處理的信息中,有80%是「非結構化」數據,例如政策文件、自然事件、地理環境、科技創新等。這類信息通常是電腦和模型難以消化的。因此,Kensho的CEO Daniel Nadler認為,華爾街過去是基於20%的信息做出100%的決策。

既然說到高盛,順便提一下,這家華爾街老牌投行如今對大數據可謂青睞有加。除了Kensho,高盛還和Fortress信貸集團在兩年前投資了8000萬美元給小額融資平台On Deck Capital。這家公司的核心競爭力也是大數據,它利用大數據對中小企業進行分析,從而選出值得投資的企業並以很快的速度為之提供短期貸款。

捕捉市場情緒

上述諸多非結構化數據,歸根結底是為了獲得一個信息:市場情緒。

在采訪中,2013年諾貝爾經濟學獎得主羅伯特•席勒的觀點被無數采訪對象引述。可以說,大數據策略投資的創業者們無一不是席勒的信奉者。

席勒於上世紀80年代設計的投資模型至今仍被業內稱道。在他的模型中,主要參考三個變數:投資項目計劃的現金流、公司資本的估算成本、股票市場對投資的反應(市場情緒)。他認為,市場本身帶有主觀判斷因素,投資者情緒會影響投資行為,而投資行為直接影響資產價格。
然而,在大數據技術誕生之前,市場情緒始終無法進行量化。

回顧人類股票投資發展史,其實就是將影響股價的因子不斷量化的過程。

上世紀70年代以前,股票投資是一種定性的分析,沒有數據應用,而是一門主觀的藝術。隨著電腦的普及,很多人開始研究驅動股價變化的規律,把傳統基本面研究方法用模型代替,市盈率、市凈率的概念誕生,量化投資由此興起。

量化投資技術的興起也帶動了一批華爾街大鱷的誕生。例如,巴克萊全球投資者(BGI)在上世紀70年代就以其超越同行的電腦模型成為全球最大的基金管理公司;進入80年代,另一家基金公司文藝復興(Renaissance)年均回報率在扣除管理費和投資收益分成等費用後仍高達34%,堪稱當時最佳的對沖基金,之後十多年該基金資產亦十分穩定。

「從主觀判斷到量化投資,是從藝術轉為科學的過程。」王政表示,上世紀70年代以前一個基本面研究員只能關注20隻到50隻股票,覆蓋面很有限。有了量化模型就可以覆蓋所有股票,這就是一個大的飛躍。此外,隨著計算機處理能力的發展,信息的用量也有一個飛躍變化。過去看三個指標就夠了,現在看的指標越來越多,做出的預測越來越准確。

隨著21世紀的到來,量化投資又遇到了新的瓶頸,就是同質化競爭。各家機構的量化模型越來越趨同,導致投資結果同漲同跌。「能否在看到報表數據之前,用更大的數據尋找規律?」這是大數據策略創業者們試圖解決的問題。

於是,量化投資的多米諾骨牌終於觸碰到了席勒理論的第三層變數——市場情緒。

計算機通過分析新聞、研究報告、社交信息、搜索行為等,藉助自然語言處理方法,提取有用的信息;而藉助機器學習智能分析,過去量化投資只能覆蓋幾十個策略,大數據投資則可以覆蓋成千上萬個策略。

基於互聯網搜索數據和社交行為的經濟預測研究,已逐漸成為一個新的學術熱點,並在經濟、社會以及健康等領域的研究中取得了一定成果。在資本市場應用上,研究發現搜索數據可有效預測未來股市活躍度(以交易量指標衡量)及股價走勢的變化。

海外就有學術研究指出,公司的名稱或者相關關鍵詞的搜索量,與該公司的股票交易量正相關。德國科學家Tobias Preis就進行了如此研究:Tobias利用谷歌搜索引擎和谷歌趨勢(Google Trends),以美國標普500指數的500隻股票為其樣本,以2004年至2010年為觀察區間,發現谷歌趨勢數據的公司名稱搜索量和對應股票的交易量,在每周一次的時間尺度上有高度關聯性。也就是說,當某個公司名稱在谷歌的搜索量活動增加時,無論股票的價格是上漲或者下跌,股票成交量與搜索量增加;反之亦然,搜索量下降,股票成交量下降。以標普500指數的樣本股為基礎,依據上述策略構建的模擬投資組合在六年的時間內獲得了高達329%的累計收益。

在美國市場上,還有多家私募對沖基金利用Twitter和Facebook的社交數據作為反映投資者情緒和市場趨勢的因子,構建對沖投資策略。利用互聯網大數據進行投資策略和工具的開發已經成為世界金融投資領域的新熱點。

保羅·霍丁管理的對沖基金Derwent成立於2011年5月,注冊在開曼群島,初始規模約為4000萬美元, 2013年投資收益高達23.77%。該基金的投資標的包括流動性較好的股票及股票指數產品。
通聯數據董事長肖風在《投資革命》中寫道,Derwent的投資策略是通過實時跟蹤Twitter用戶的情緒,以此感知市場參與者的「貪婪與恐懼」,從而判斷市場漲跌來獲利。

在Derwent的網頁上可以看到這樣一句話:「用實時的社交媒體解碼暗藏的交易機會。」保羅·霍丁在基金宣傳冊中表示:「多年以來,投資者已經普遍接受一種觀點,即恐懼和貪婪是金融市場的驅動力。但是以前人們沒有技術或數據來對人類情感進行量化。這是第四維。Derwent就是要通過即時關注Twitter中的公眾情緒,指導投資。」

另一家位於美國加州的對沖基金MarketPsych與湯普森·路透合作提供了分布在119個國家不低於18864項獨立指數,比如每分鍾更新的心情狀態(包括樂觀、憂郁、快樂、害怕、生氣,甚至還包括創新、訴訟及沖突情況等),而這些指數都是通過分析Twitter的數據文本,作為股市投資的信號。

此類基金還在不斷涌現。金融危機後,幾個台灣年輕人在波士頓組建了一家名為FlyBerry的對沖基金,口號是「Modeling the World(把世界建模)」。它的投資理念全部依託大數據技術,通過監測市場輿論和行為,對投資做出秒速判斷。

關於社交媒體信息的量化應用,在股票投資之外的領域也很常見:Twitter自己也十分注重信息的開發挖掘,它與DataSift和Gnip兩家公司達成了一項出售數據訪問許可權的協議,銷售人們的想法、情緒和溝通數據,從而作為顧客的反饋意見匯總後對商業營銷活動的效果進行判斷。從事類似工作的公司還有DMetics,它通過對人們的購物行為進行分析,尋找影響消費者最終選擇的細微原因。

回到股票世界,利用社交媒體信息做投資的公司還有StockTwits。打開這家網站,首先映入眼簾的宣傳語是「看看投資者和交易員此刻正如何討論你的股票」。正如其名,這家網站相當於「股票界的Twitter」,主要面向分析師、媒體和投資者。它通過機器和人工相結合的手段,將關於股票和市場的信息整理為140字以內的短消息供用戶參考。

此外,StockTwits還整合了社交功能,並作為插件可以嵌入Twitter、Facebook和LinkedIn等主要社交平台,讓人們可以輕易分享投資信息。

另一家公司Market Prophit也很有趣。這家網站的宣傳語是「從社交媒體噪音中提煉市場信號」。和StockTwits相比,Market Prophit更加註重大數據的應用。它採用了先進的語義分析法,可以將Twitter里的金融對話量化為「-1(極度看空)」到「1(極度看多)」之間的投資建議。網站還根據語義量化,每天公布前十名和後十名的股票熱度榜單。網站還設計了「熱度地圖」功能,根據投資者情緒和意見,按照不同板塊,將板塊內的個股按照顏色深淺進行標注,誰漲誰跌一目瞭然。

中國原創大數據指數

盡管大數據策略投資在美國貌似炙手可熱,但事實上,其應用尚僅限於中小型對沖基金和創業平台公司。大數據策略投資第一次被大規模應用,應歸於中國的百發100。

網路金融中心相關負責人表示,與歐美等成熟資本市場主要由理性機構投資者構成相比,東亞尤其是中國的股票類證券投資市場仍以散戶為主,因此市場受投資者情緒和宏觀政策性因素影響很大。而個人投資者行為可以更多地反映在互聯網用戶行為大數據上,從而為有效地預測市場情緒和趨勢提供了可能。這也就是中國國內公募基金在應用互聯網大數據投資方面比海外市場並不落後、甚至領先的原因。

百發100指數由網路、中證指數公司、廣發基金聯合研發推出,於2014年7月8日正式對市場發布,實盤運行以來一路上漲,漲幅超過60%。跟蹤該指數的指數基金規模上限為30億份,2014年9月17日正式獲批,10月20日發行時一度創下26小時瘋賣18億份的「神話」。

外界都知道百發100是依託大數據的指數基金,但其背後的細節鮮為人知。

百發100數據層面的分析分為兩個層面,即數據工廠的數據歸集和數據處理系統的數據分析。其中數據工廠負責大數據的收集分析,例如將來源於互聯網的非結構化數據進行指標化、產品化等數據量化過程;數據處理系統,可以在數據工廠遞交的大數據中尋找相互統計關聯,提取有效信息,最終應用於策略投資。

「其實百發100是在傳統量化投資技術上融合了基於互聯網大數據的市場走勢和投資情緒判斷。」業內人士概括道。

和傳統量化投資類似,百發100對樣本股的甄選要考慮財務因子、基本面因子和動量因子,包括凈資產收益率(ROE)、資產收益率(ROA)、每股收益增長率(EPS)、流動負債比率、企業價值倍數(EV/EBITDA)、凈利潤同比增長率、股權集中度、自由流通市值以及最近一個月的個股價格收益率和波動率等。

此外,市場走勢和投資情緒是在傳統量化策略基礎上的創新產物,也是百發100的核心競爭力。接近網路的人士稱,市場情緒因子對百發100基金起決定性作用。

網路金融中心相關負責人是羅伯特•席勒觀點的支持者。他認為,投資者行為和情緒對資產價格、市場走勢有著巨大的影響。因此「通過互聯網用戶行為大數據反映的投資市場情緒、宏觀經濟預期和走勢,成為百發100指數模型引入大數據因子的重點」。

傳統量化投資主要著眼點在於對專業化金融市場基本面和交易數據的應用。但在網路金融中心相關業務負責人看來,無論是來源於專業金融市場的結構化數據,還是來源於互聯網的非結構化數據,都是可以利用的數據資源。因此,前文所述的市場情緒數據,包括來源於互聯網的用戶行為、搜索量、市場輿情、宏觀基本面預期等等,都被網路「變廢為寶」,從而通過互聯網找到投資者參與特徵,選出投資者關注度較高的股票。

「與同期滬深300指數的表現相較,百發100更能在股票市場振盪時期、行業輪動劇烈時期、基本面不明朗時期抓住市場熱點、了解投資者情緒、抗擊投資波動風險。」網路金融中心相關負責人表示。

百發100選取的100隻樣本股更換頻率是一個月,調整時間為每月第三周的周五。

業內人士指出,百發100指數的月收益率與中證100、滬深300、中證500的相關性依次提升,說明其投資風格偏向中小盤。

但事實並非如此。從樣本股的構成來說,以某一期樣本股為例,樣本股總市值6700億元,佔A股市值4.7%。樣本股的構成上,中小板21隻,創業板4隻,其餘75隻樣本股均為大盤股。由此可見,百發100還是偏向大盤為主、反映主流市場走勢。

樣本股每個月的改變比例都不同,最極端的時候曾經有60%進行了換倉。用大數據預測熱點變化,市場熱點往往更迭很快;但同時也要考慮交易成本。兩方面考慮,網路最後測算認為一個月換一次倉位為最佳。

樣本股對百發100而言是核心機密——據說「全世界只有基金經理和指數編制機構負責人兩個人知道」——都是由機器決定後,基金經理分配給不同的交易員建倉買入。基金經理也沒有改變樣本股的權利。

展望未來,網路金融中心相關負責人躊躇滿志,「百發100指數及基金的推出,只是我們的開端和嘗試,未來將形成多樣化、系列投資產品。」

除了百發100,目前市場上打著大數據旗幟的基金還有2014年9月推出的南方-新浪I100和I300指數基金。

南方-新浪I100和I300是由南方基金、新浪財經和深圳證券信息公司三方聯合編制的。和百發100類似,也是按照財務因子和市場情緒因子進行模型打分,按照分值將前100和前300名股票構成樣本股。推出至今,這兩個指數基金分別上漲了10%左右。

正如百發100的市場情緒因子來自網路,南方-新浪I100和I300的市場情緒因子全部來自新浪平台。其中包括用戶在新浪財經對行情的訪問熱度、對股票的搜索熱度;用戶在新浪財經對股票相關新聞的瀏覽熱度;股票相關微博的多空分析數據等。

此外,阿里巴巴旗下的天弘基金也有意在大數據策略上做文章。據了解,天弘基金將和阿里巴巴合作,推出大數據基金產品,最早將於2015年初問世。

天弘基金機構產品部總經理劉燕曾對媒體表示,「在傳統的調研上,大數據將貢獻於基礎資產的研究,而以往過度依賴線下研究報告。大數據將視野拓展至了線上的數據分析,給基金經理選股帶來新的邏輯。」

在BAT三巨頭中,騰訊其實是最早推出指數基金的。騰訊與中證指數公司、濟安金信公司合作開發的「中證騰安價值100指數」早在2013年5月就發布了,號稱是國內第一家由互聯網媒體與專業機構編制發布的A股指數。不過,業內人士表示,有關指數並沒有真正應用大數據技術。雖然騰訊旗下的微信是目前最熱的社交平台,蘊藏了大量的社交數據,但騰訊未來怎麼開發,目前還並不清晰。

大數據投資平台化

中歐商學院副教授陳威如在其《平台戰略》一書中提到,21世紀將成為一道分水嶺,人類商業行為將全面普及平台模式,大數據金融也不例外。

然而,由於大數據模型對成本要求極高,就好比不可能每家公司都搭建自己的雲計算系統一樣,讓每家機構自己建設大數據模型,從數據來源和處理技術方面看都是不現實的。業內人士認為,大數據未來必將成為平台化的服務。

目前,阿里、網路等企業都表示下一步方向是平台化。

螞蟻金服所致力搭建的平台,一方麵包括招財寶一類的金融產品平台,另一方麵包括雲計算、大數據服務平台。螞蟻金服人士說,「我們很清楚自己的優勢不是金融,而是包括電商、雲計算、大數據等技術。螞蟻金服希望用這些技術搭建一個基礎平台,把這些能力開放出去,供金融機構使用。」

網路亦是如此。接近網路的人士稱,未來是否向平台化發展,目前還在討論中,但可以確定的是,「網路不是金融機構,目的不是發產品,百發100的意義在於打造影響力,而非經濟效益。」
當BAT還在摸索前行時,已有嗅覺靈敏者搶佔了先機,那就是通聯數據。

通聯數據股份公司(DataYes)由曾任博時基金副董事長肖風帶隊創建、萬向集團投資成立,總部位於上海,公司願景是「讓投資更容易,用金融服務雲平台提升投資管理效率和投研能力」。該平台7月上線公測,目前已擁有130多家機構客戶,逾萬名個人投資者。

通聯數據目前有四個主要平台,分別是通聯智能投資研究平台、通聯金融大數據服務平台、通聯多資產投資管理平台和金融移動辦公平台。

通聯智能投資研究平台包括雅典娜-智能事件研究、策略研究、智能研報三款產品,可以對基於自然語言的智能事件進行策略分析,實時跟蹤市場熱點,捕捉市場情緒。可以說,和百發100類似,其核心技術在於將互聯網非結構化數據的量化使用。

通聯金融大數據服務平台更側重於專業金融數據的分析整理。它可以提供公司基本面數據、國內外主要證券、期貨交易所的行情數據、公司公告數據、公關經濟、行業動態的結構化數據、金融新聞和輿情的非結構化數據等。

假如將上述兩個平台比作「收割機」,通聯多資產投資管理平台就是「廚房」。在這個「廚房」里,可以進行全球跨資產的投資組合管理方案、訂單管理方案、資產證券化定價分析方案等。

通聯數據可以按照主題熱點或者自定義關鍵字進行分析,構建知識圖譜,將相關的新聞和股票提取做成簡潔的分析框架。例如用戶對特斯拉感興趣,就可以通過主題熱點看到和特斯拉相關的公司,並判斷這個概念是否值得投資。「過去這個搜集過程要花費幾天時間,現在只需要幾分鍾就可以完成。」王政表示。

「通聯數據就好比一家餐館,我們把所有原料搜集來、清洗好、准備好,同時准備了一個鍋,也就是大數據存儲平台。研究員和基金經理像廚師一樣,用原料、工具去『烹制』自己的策略。」王政形容道。

大數據在平台上扮演的角色,就是尋找關聯關系。人類總是習慣首先構建因果關系,繼而去倒推和佐證。機器學習則不然,它可以在海量數據中查獲超越人類想像的關聯關系。正如維克托`邁爾-舍恩伯格在《大數據時代》中所提到的,社會需要放棄它對因果關系的渴求,而僅需關注相互關系。

例如,美國超市沃爾瑪通過大數據分析,發現颶風用品和蛋撻擺在一起可以提高銷量,並由此創造了頗大的經濟效益。如果沒有大數據技術,誰能將這毫無關聯的兩件商品聯系在一起?
通聯數據通過機器學習,也能找到傳統量化策略無法發現的市場聯系。其中包括各家公司之間的資本關系、產品關系、競爭關系、上下游關系,也包括人與人之間的關系,例如管理團隊和其他公司有沒有關聯,是否牽扯合作等。

未來量化研究員是否將成為一個被淘汰的職業?目前研究員的主要工作就是收集整理數據,變成投資決策,而之後這個工作將更多由機器完成。

「當初醫療科技發展時,人們也認為醫生會被淘汰,但其實並不會。同理,研究員也會一直存在,但他們會更注重深入分析和調研,初級的數據搜集可以交給機器完成。」王政表示。
但當未來大數據平台並廣泛應用後,是否會迅速擠壓套利空間?這也是一個問題。回答根據網上資料整理

閱讀全文

與大盤大數據相關的資料

熱點內容
錄像機的文件視頻在哪裡 瀏覽:784
書生閱讀器不能列印紅頭文件 瀏覽:508
win10游戲目錄是哪個文件夾里 瀏覽:78
手機u盤滿了找不到文件 瀏覽:554
存儲文件壓縮包和文件夾哪個合適 瀏覽:778
看房子哪個網站比較好 瀏覽:817
oppoa57用什麼數據線 瀏覽:832
一點停app真垃圾 瀏覽:53
移出私人空間文件找不到了 瀏覽:601
微信一視頻切換到語音 瀏覽:190
電腦里我的照片放在哪個文件夾 瀏覽:288
iphone6s升級到128 瀏覽:674
移動硬碟視頻文件修復 瀏覽:330
更新win10會不會丟失文件 瀏覽:21
win10會受病毒感染么 瀏覽:775
以及cad的存儲文件的格式 瀏覽:45
有哪些招募網站 瀏覽:864
網站右側qq客服代碼 瀏覽:283
美國失業數據是什麼 瀏覽:322
蘋果中國利潤 瀏覽:386

友情鏈接