Ⅰ 如何获取高质量大数据指数
第一步:抄大数据指数首先是引入各种非传统、非结构化、海量的信息(即大数据)来预测股市。
第二步:一旦确定该大数据信息对股市有提前的预判,无论是对行业、风格、择时或者直接对上市公司等收益有预测性,就可以通过量化模型,选择候选成分股,构建多因子模型。
第三步:从可投资性、换手率、风险控制等角度考虑,综合博时在的量化投资方面构建的包括基本面因子等在内量化因子体系,构建指数组合。
第四步:每一种量化模型都需要不停升级,博时会根据指数的业绩表现以及市场变化,不断优化和迭代多因子模型,追求获取更多超额收益。
例如,博时基金“指慧家”品牌旗下目前共有4只大数据指数,是目前国内产品数量最多的大数据指数品牌。
Ⅱ 天弘基金打造三领域领先的大数据指数
天弘基金打造三领域领先的大数据指数
国务院近日发布了《促进大数据发展行动纲要》(以下简称《纲要》),将大数据发展提升为国家战略,大数据所蕴含的巨大价值将被进一步挖掘。作为国内大数据投研的领先者,天弘基金开发定制的国内首只社交投资大数据指数——雪球100指数于9月15日正式发布,从此日开始,投资者可通过雪球网、Wind等数据终端查看指数行情,了解具体的点位、涨跌幅、分时走势等数据。
雪球100指数的特点是投资者最为关心的问题,对此,天弘基金投研部总经理肖志刚介绍称,天弘基金所定制开发的雪球100指数,在三方面做到领先。第一,率先引入投资众包思维,筛选大量有经验的投资者的智慧,将其智慧转化为有指导意义的、可视化的指数;第二,采用雪球独特的数据资源,打造国内首只社交投资大数据指数;第三,编制中剔除其他重复性因子,也是国内首只纯粹的大数据指数。
肖志刚同时表示,天弘基金选择以雪球的数据来编制大数据指数,是看中了雪球作为社交投资平台,具备去中心化的投资体系。“雪球的数据量大,里面肯定有很多优秀的投资人,优秀的想法,如果能用一定的方法把这些人筛选出来,把这些想法集中起来,必定能在大概率上跑赢市场。而且雪球的模拟组合能把投资者的投资思路数据化,更加直观,处理起来也更加方便,因此我们想到了合作开发这样一只指数,把大众的智慧调动起来。”肖志刚表示,在雪球100指数发布后,天弘基金将尽早发行跟踪雪球100指数的基金,目前产品正在筹备中。
天弘基金在编制雪球100指数时,也打破传统,采用创新模式,为的是给投资者提供简单、清晰、有效的工具。
肖志刚表示,在编制过程中,综合考虑了雪球用户对股票的认同,用户的研究能力、投资能力,最后的组合等来综合决策,是一个经历了层层筛选的策略,模拟真实的投资决策,能够反映具有投资能力和研究能力的用户的股票持仓及增减仓总体情况。简单来说,雪球100的编制,先筛选出得到用户认可的大V,然后对其研究能力和投资能力进行量化,再对其股票综合评分,选取高分组合。
首先,在雪球的全部注册用户中,选取粉丝数排名前5%的用户作为参考用户;在参考用户创建的所有自选组合中,选取最近一个月内仓位发生过变动的组合作为参考组合。在全部参考组合所覆盖的股票中,选取至少被20个参考用户所持有的股票(截至月末)作为待选样本;其次,对大V的研究能力和投资能力根据其评论和调仓等数据进行量化。对每个待选样本所覆盖的参考用户,根据其相关的组合历史业绩和线上活跃度进行评分(当组合创建时间不足一年时,相关历史业绩评分为零),得到单个参考用户关于某待选样本的能力评分。计算单个待选样本的持仓评分与调仓评分(增持为正,减持为负),并由此通过加权得到其综合评分。选取综合评分最高的100只待选样本作为指数样本股。
另外,雪球100指数的成分股每个月调整一次。最近一期的100只成分股中,沪市、深市、创业板的股票数量占比分别为42%、39%和19%,持仓市值占比分别为57.22%、34.34%和8.44%,包括浦发银行、民生银行、中国石化、包钢股份、复星医药等。而且,该指数采用流通市值加权的方式,防止小股票权重过高。目前看,该指数的模拟业绩效果很好,走势相对稳健,换手率较低,近8个月都在30%以下,年化超额收益在30%以上。而且在市场大幅震荡中回撤幅度远小于其他大数据指数。
以上是小编为大家分享的关于天弘基金打造三领域领先的大数据指数的相关内容,更多信息可以关注环球青藤分享更多干货
Ⅲ 如何用大数据炒股
我们如今生活在一个数据爆炸的世界里。网络每天响应超过60亿次的搜索请求,日处理数据超过100PB,相当于6000多座中国国家图书馆的书籍信息量总和。新浪微博每天都会发布上亿条微博。在荒无人烟的郊外,暗藏着无数大公司的信息存储中心,24小时夜以继日地运转着。
克托·迈尔-舍恩伯格在《大数据时代》一书中认为,大数据的核心就是预测,即只要数据丰富到一定程度,就可预测事情发生的可能性。例如,“从一个人乱穿马路时行进的轨迹和速度来看他能及时穿过马路的可能性”,或者通过一个人穿过马路的速度,预测车子何时应该减速从而让他及时穿过马路。
那么,如果把这种预测能力应用在股票投资上,又会如何?
目前,美国已经有许多对冲基金采用大数据技术进行投资,并且收获甚丰。中国的中证广发网络百发100指数基金(下称百发100),上线四个多月以来已上涨68%。
和传统量化投资类似,大数据投资也是依靠模型,但模型里的数据变量几何倍地增加了,在原有的金融结构化数据基础上,增加了社交言论、地理信息、卫星监测等非结构化数据,并且将这些非结构化数据进行量化,从而让模型可以吸收。
由于大数据模型对成本要求极高,业内人士认为,大数据将成为共享平台化的服务,数据和技术相当于食材和锅,基金经理和分析师可以通过平台制作自己的策略。
量化非结构数据
不要小看大数据的本领,正是这项刚刚兴起的技术已经创造了无数“未卜先知”的奇迹。
2014年,网络用大数据技术预测命中了全国18卷中12卷高考作文题目,被网友称为“神预测”。网络公司人士表示,在这个大数据池中,包含互联网积累的用户数据、历年的命题数据以及教育机构对出题方向作出的判断。
在2014年巴西世界杯比赛中,Google亦通过大数据技术成功预测了16强和8强名单。
从当年英格兰报社的信鸽、费城股票交易所的信号灯到报纸电话,再到如今的互联网、云计算、大数据,前沿技术迅速在投资领域落地。在股票策略中,大数据日益崭露头角。
做股票投资策略,需要的大数据可以分为结构化数据和非结构化数据。结构化数据,简单说就是“一堆数字”,通常包括传统量化分析中常用的CPI、PMI、市值、交易量等专业信息;非结构化数据就是社交文字、地理位置、用户行为等“还没有进行量化的信息”。
量化非结构化就是用深度模型替代简单线性模型的过程,其中所涉及的技术包括自然语言处理、语音识别、图像识别等。
金融大数据平台-通联数据CEO王政表示,通联数据采用的非结构化数据可以分为三类:第一类和人相关,包括社交言论、消费、去过的地点等;第二类与物相关,如通过正在行驶的船只和货车判断物联网情况;第三类则是卫星监测的环境信息,包括汽车流、港口装载量、新的建筑开工等情况。
卫星监测信息在美国已被投入使用,2014年Google斥资5亿美元收购了卫星公司Skybox,从而可以获得实施卫星监测信息。
结构化和非结构化数据也常常相互转化。“结构化和非结构化数据可以形象理解成把所有数据装在一个篮子里,根据应用策略不同相互转化。例如,在搜索频率调查中,用户搜索就是结构化数据;在金融策略分析中,用户搜索就是非结构化数据。”网络公司人士表示。
华尔街拿着丰厚薪水的分析师们还不知道,自己的雇主已经将大量资本投向了取代自己的机器。
2014年11月23日,高盛向Kensho公司投资1500万美元,以支持该公司的大数据平台建设。该平台很像iPhone里的Siri,可以快速整合海量数据进行分析,并且回答投资者提出的各种金融问题,例如“下月有飓风,将对美国建材板块造成什么影响?”
在Kensho处理的信息中,有80%是“非结构化”数据,例如政策文件、自然事件、地理环境、科技创新等。这类信息通常是电脑和模型难以消化的。因此,Kensho的CEO Daniel Nadler认为,华尔街过去是基于20%的信息做出100%的决策。
既然说到高盛,顺便提一下,这家华尔街老牌投行如今对大数据可谓青睐有加。除了Kensho,高盛还和Fortress信贷集团在两年前投资了8000万美元给小额融资平台On Deck Capital。这家公司的核心竞争力也是大数据,它利用大数据对中小企业进行分析,从而选出值得投资的企业并以很快的速度为之提供短期贷款。
捕捉市场情绪
上述诸多非结构化数据,归根结底是为了获得一个信息:市场情绪。
在采访中,2013年诺贝尔经济学奖得主罗伯特•席勒的观点被无数采访对象引述。可以说,大数据策略投资的创业者们无一不是席勒的信奉者。
席勒于上世纪80年代设计的投资模型至今仍被业内称道。在他的模型中,主要参考三个变量:投资项目计划的现金流、公司资本的估算成本、股票市场对投资的反应(市场情绪)。他认为,市场本身带有主观判断因素,投资者情绪会影响投资行为,而投资行为直接影响资产价格。
然而,在大数据技术诞生之前,市场情绪始终无法进行量化。
回顾人类股票投资发展史,其实就是将影响股价的因子不断量化的过程。
上世纪70年代以前,股票投资是一种定性的分析,没有数据应用,而是一门主观的艺术。随着电脑的普及,很多人开始研究驱动股价变化的规律,把传统基本面研究方法用模型代替,市盈率、市净率的概念诞生,量化投资由此兴起。
量化投资技术的兴起也带动了一批华尔街大鳄的诞生。例如,巴克莱全球投资者(BGI)在上世纪70年代就以其超越同行的电脑模型成为全球最大的基金管理公司;进入80年代,另一家基金公司文艺复兴(Renaissance)年均回报率在扣除管理费和投资收益分成等费用后仍高达34%,堪称当时最佳的对冲基金,之后十多年该基金资产亦十分稳定。
“从主观判断到量化投资,是从艺术转为科学的过程。”王政表示,上世纪70年代以前一个基本面研究员只能关注20只到50只股票,覆盖面很有限。有了量化模型就可以覆盖所有股票,这就是一个大的飞跃。此外,随着计算机处理能力的发展,信息的用量也有一个飞跃变化。过去看三个指标就够了,现在看的指标越来越多,做出的预测越来越准确。
随着21世纪的到来,量化投资又遇到了新的瓶颈,就是同质化竞争。各家机构的量化模型越来越趋同,导致投资结果同涨同跌。“能否在看到报表数据之前,用更大的数据寻找规律?”这是大数据策略创业者们试图解决的问题。
于是,量化投资的多米诺骨牌终于触碰到了席勒理论的第三层变量——市场情绪。
计算机通过分析新闻、研究报告、社交信息、搜索行为等,借助自然语言处理方法,提取有用的信息;而借助机器学习智能分析,过去量化投资只能覆盖几十个策略,大数据投资则可以覆盖成千上万个策略。
基于互联网搜索数据和社交行为的经济预测研究,已逐渐成为一个新的学术热点,并在经济、社会以及健康等领域的研究中取得了一定成果。在资本市场应用上,研究发现搜索数据可有效预测未来股市活跃度(以交易量指标衡量)及股价走势的变化。
海外就有学术研究指出,公司的名称或者相关关键词的搜索量,与该公司的股票交易量正相关。德国科学家Tobias Preis就进行了如此研究:Tobias利用谷歌搜索引擎和谷歌趋势(Google Trends),以美国标普500指数的500只股票为其样本,以2004年至2010年为观察区间,发现谷歌趋势数据的公司名称搜索量和对应股票的交易量,在每周一次的时间尺度上有高度关联性。也就是说,当某个公司名称在谷歌的搜索量活动增加时,无论股票的价格是上涨或者下跌,股票成交量与搜索量增加;反之亦然,搜索量下降,股票成交量下降。以标普500指数的样本股为基础,依据上述策略构建的模拟投资组合在六年的时间内获得了高达329%的累计收益。
在美国市场上,还有多家私募对冲基金利用Twitter和Facebook的社交数据作为反映投资者情绪和市场趋势的因子,构建对冲投资策略。利用互联网大数据进行投资策略和工具的开发已经成为世界金融投资领域的新热点。
保罗·霍丁管理的对冲基金Derwent成立于2011年5月,注册在开曼群岛,初始规模约为4000万美元, 2013年投资收益高达23.77%。该基金的投资标的包括流动性较好的股票及股票指数产品。
通联数据董事长肖风在《投资革命》中写道,Derwent的投资策略是通过实时跟踪Twitter用户的情绪,以此感知市场参与者的“贪婪与恐惧”,从而判断市场涨跌来获利。
在Derwent的网页上可以看到这样一句话:“用实时的社交媒体解码暗藏的交易机会。”保罗·霍丁在基金宣传册中表示:“多年以来,投资者已经普遍接受一种观点,即恐惧和贪婪是金融市场的驱动力。但是以前人们没有技术或数据来对人类情感进行量化。这是第四维。Derwent就是要通过即时关注Twitter中的公众情绪,指导投资。”
另一家位于美国加州的对冲基金MarketPsych与汤普森·路透合作提供了分布在119个国家不低于18864项独立指数,比如每分钟更新的心情状态(包括乐观、忧郁、快乐、害怕、生气,甚至还包括创新、诉讼及冲突情况等),而这些指数都是通过分析Twitter的数据文本,作为股市投资的信号。
此类基金还在不断涌现。金融危机后,几个台湾年轻人在波士顿组建了一家名为FlyBerry的对冲基金,口号是“Modeling the World(把世界建模)”。它的投资理念全部依托大数据技术,通过监测市场舆论和行为,对投资做出秒速判断。
关于社交媒体信息的量化应用,在股票投资之外的领域也很常见:Twitter自己也十分注重信息的开发挖掘,它与DataSift和Gnip两家公司达成了一项出售数据访问权限的协议,销售人们的想法、情绪和沟通数据,从而作为顾客的反馈意见汇总后对商业营销活动的效果进行判断。从事类似工作的公司还有DMetics,它通过对人们的购物行为进行分析,寻找影响消费者最终选择的细微原因。
回到股票世界,利用社交媒体信息做投资的公司还有StockTwits。打开这家网站,首先映入眼帘的宣传语是“看看投资者和交易员此刻正如何讨论你的股票”。正如其名,这家网站相当于“股票界的Twitter”,主要面向分析师、媒体和投资者。它通过机器和人工相结合的手段,将关于股票和市场的信息整理为140字以内的短消息供用户参考。
此外,StockTwits还整合了社交功能,并作为插件可以嵌入Twitter、Facebook和LinkedIn等主要社交平台,让人们可以轻易分享投资信息。
另一家公司Market Prophit也很有趣。这家网站的宣传语是“从社交媒体噪音中提炼市场信号”。和StockTwits相比,Market Prophit更加注重大数据的应用。它采用了先进的语义分析法,可以将Twitter里的金融对话量化为“-1(极度看空)”到“1(极度看多)”之间的投资建议。网站还根据语义量化,每天公布前十名和后十名的股票热度榜单。网站还设计了“热度地图”功能,根据投资者情绪和意见,按照不同板块,将板块内的个股按照颜色深浅进行标注,谁涨谁跌一目了然。
中国原创大数据指数
尽管大数据策略投资在美国貌似炙手可热,但事实上,其应用尚仅限于中小型对冲基金和创业平台公司。大数据策略投资第一次被大规模应用,应归于中国的百发100。
网络金融中心相关负责人表示,与欧美等成熟资本市场主要由理性机构投资者构成相比,东亚尤其是中国的股票类证券投资市场仍以散户为主,因此市场受投资者情绪和宏观政策性因素影响很大。而个人投资者行为可以更多地反映在互联网用户行为大数据上,从而为有效地预测市场情绪和趋势提供了可能。这也就是中国国内公募基金在应用互联网大数据投资方面比海外市场并不落后、甚至领先的原因。
百发100指数由网络、中证指数公司、广发基金联合研发推出,于2014年7月8日正式对市场发布,实盘运行以来一路上涨,涨幅超过60%。跟踪该指数的指数基金规模上限为30亿份,2014年9月17日正式获批,10月20日发行时一度创下26小时疯卖18亿份的“神话”。
外界都知道百发100是依托大数据的指数基金,但其背后的细节鲜为人知。
百发100数据层面的分析分为两个层面,即数据工厂的数据归集和数据处理系统的数据分析。其中数据工厂负责大数据的收集分析,例如将来源于互联网的非结构化数据进行指标化、产品化等数据量化过程;数据处理系统,可以在数据工厂递交的大数据中寻找相互统计关联,提取有效信息,最终应用于策略投资。
“其实百发100是在传统量化投资技术上融合了基于互联网大数据的市场走势和投资情绪判断。”业内人士概括道。
和传统量化投资类似,百发100对样本股的甄选要考虑财务因子、基本面因子和动量因子,包括净资产收益率(ROE)、资产收益率(ROA)、每股收益增长率(EPS)、流动负债比率、企业价值倍数(EV/EBITDA)、净利润同比增长率、股权集中度、自由流通市值以及最近一个月的个股价格收益率和波动率等。
此外,市场走势和投资情绪是在传统量化策略基础上的创新产物,也是百发100的核心竞争力。接近网络的人士称,市场情绪因子对百发100基金起决定性作用。
网络金融中心相关负责人是罗伯特•席勒观点的支持者。他认为,投资者行为和情绪对资产价格、市场走势有着巨大的影响。因此“通过互联网用户行为大数据反映的投资市场情绪、宏观经济预期和走势,成为百发100指数模型引入大数据因子的重点”。
传统量化投资主要着眼点在于对专业化金融市场基本面和交易数据的应用。但在网络金融中心相关业务负责人看来,无论是来源于专业金融市场的结构化数据,还是来源于互联网的非结构化数据,都是可以利用的数据资源。因此,前文所述的市场情绪数据,包括来源于互联网的用户行为、搜索量、市场舆情、宏观基本面预期等等,都被网络“变废为宝”,从而通过互联网找到投资者参与特征,选出投资者关注度较高的股票。
“与同期沪深300指数的表现相较,百发100更能在股票市场振荡时期、行业轮动剧烈时期、基本面不明朗时期抓住市场热点、了解投资者情绪、抗击投资波动风险。”网络金融中心相关负责人表示。
百发100选取的100只样本股更换频率是一个月,调整时间为每月第三周的周五。
业内人士指出,百发100指数的月收益率与中证100、沪深300、中证500的相关性依次提升,说明其投资风格偏向中小盘。
但事实并非如此。从样本股的构成来说,以某一期样本股为例,样本股总市值6700亿元,占A股市值4.7%。样本股的构成上,中小板21只,创业板4只,其余75只样本股均为大盘股。由此可见,百发100还是偏向大盘为主、反映主流市场走势。
样本股每个月的改变比例都不同,最极端的时候曾经有60%进行了换仓。用大数据预测热点变化,市场热点往往更迭很快;但同时也要考虑交易成本。两方面考虑,网络最后测算认为一个月换一次仓位为最佳。
样本股对百发100而言是核心机密——据说“全世界只有基金经理和指数编制机构负责人两个人知道”——都是由机器决定后,基金经理分配给不同的交易员建仓买入。基金经理也没有改变样本股的权利。
展望未来,网络金融中心相关负责人踌躇满志,“百发100指数及基金的推出,只是我们的开端和尝试,未来将形成多样化、系列投资产品。”
除了百发100,目前市场上打着大数据旗帜的基金还有2014年9月推出的南方-新浪I100和I300指数基金。
南方-新浪I100和I300是由南方基金、新浪财经和深圳证券信息公司三方联合编制的。和百发100类似,也是按照财务因子和市场情绪因子进行模型打分,按照分值将前100和前300名股票构成样本股。推出至今,这两个指数基金分别上涨了10%左右。
正如百发100的市场情绪因子来自网络,南方-新浪I100和I300的市场情绪因子全部来自新浪平台。其中包括用户在新浪财经对行情的访问热度、对股票的搜索热度;用户在新浪财经对股票相关新闻的浏览热度;股票相关微博的多空分析数据等。
此外,阿里巴巴旗下的天弘基金也有意在大数据策略上做文章。据了解,天弘基金将和阿里巴巴合作,推出大数据基金产品,最早将于2015年初问世。
天弘基金机构产品部总经理刘燕曾对媒体表示,“在传统的调研上,大数据将贡献于基础资产的研究,而以往过度依赖线下研究报告。大数据将视野拓展至了线上的数据分析,给基金经理选股带来新的逻辑。”
在BAT三巨头中,腾讯其实是最早推出指数基金的。腾讯与中证指数公司、济安金信公司合作开发的“中证腾安价值100指数”早在2013年5月就发布了,号称是国内第一家由互联网媒体与专业机构编制发布的A股指数。不过,业内人士表示,有关指数并没有真正应用大数据技术。虽然腾讯旗下的微信是目前最热的社交平台,蕴藏了大量的社交数据,但腾讯未来怎么开发,目前还并不清晰。
大数据投资平台化
中欧商学院副教授陈威如在其《平台战略》一书中提到,21世纪将成为一道分水岭,人类商业行为将全面普及平台模式,大数据金融也不例外。
然而,由于大数据模型对成本要求极高,就好比不可能每家公司都搭建自己的云计算系统一样,让每家机构自己建设大数据模型,从数据来源和处理技术方面看都是不现实的。业内人士认为,大数据未来必将成为平台化的服务。
目前,阿里、网络等企业都表示下一步方向是平台化。
蚂蚁金服所致力搭建的平台,一方面包括招财宝一类的金融产品平台,另一方面包括云计算、大数据服务平台。蚂蚁金服人士说,“我们很清楚自己的优势不是金融,而是包括电商、云计算、大数据等技术。蚂蚁金服希望用这些技术搭建一个基础平台,把这些能力开放出去,供金融机构使用。”
网络亦是如此。接近网络的人士称,未来是否向平台化发展,目前还在讨论中,但可以确定的是,“网络不是金融机构,目的不是发产品,百发100的意义在于打造影响力,而非经济效益。”
当BAT还在摸索前行时,已有嗅觉灵敏者抢占了先机,那就是通联数据。
通联数据股份公司(DataYes)由曾任博时基金副董事长肖风带队创建、万向集团投资成立,总部位于上海,公司愿景是“让投资更容易,用金融服务云平台提升投资管理效率和投研能力”。该平台7月上线公测,目前已拥有130多家机构客户,逾万名个人投资者。
通联数据目前有四个主要平台,分别是通联智能投资研究平台、通联金融大数据服务平台、通联多资产投资管理平台和金融移动办公平台。
通联智能投资研究平台包括雅典娜-智能事件研究、策略研究、智能研报三款产品,可以对基于自然语言的智能事件进行策略分析,实时跟踪市场热点,捕捉市场情绪。可以说,和百发100类似,其核心技术在于将互联网非结构化数据的量化使用。
通联金融大数据服务平台更侧重于专业金融数据的分析整理。它可以提供公司基本面数据、国内外主要证券、期货交易所的行情数据、公司公告数据、公关经济、行业动态的结构化数据、金融新闻和舆情的非结构化数据等。
假如将上述两个平台比作“收割机”,通联多资产投资管理平台就是“厨房”。在这个“厨房”里,可以进行全球跨资产的投资组合管理方案、订单管理方案、资产证券化定价分析方案等。
通联数据可以按照主题热点或者自定义关键字进行分析,构建知识图谱,将相关的新闻和股票提取做成简洁的分析框架。例如用户对特斯拉感兴趣,就可以通过主题热点看到和特斯拉相关的公司,并判断这个概念是否值得投资。“过去这个搜集过程要花费几天时间,现在只需要几分钟就可以完成。”王政表示。
“通联数据就好比一家餐馆,我们把所有原料搜集来、清洗好、准备好,同时准备了一个锅,也就是大数据存储平台。研究员和基金经理像厨师一样,用原料、工具去‘烹制’自己的策略。”王政形容道。
大数据在平台上扮演的角色,就是寻找关联关系。人类总是习惯首先构建因果关系,继而去倒推和佐证。机器学习则不然,它可以在海量数据中查获超越人类想象的关联关系。正如维克托`迈尔-舍恩伯格在《大数据时代》中所提到的,社会需要放弃它对因果关系的渴求,而仅需关注相互关系。
例如,美国超市沃尔玛通过大数据分析,发现飓风用品和蛋挞摆在一起可以提高销量,并由此创造了颇大的经济效益。如果没有大数据技术,谁能将这毫无关联的两件商品联系在一起?
通联数据通过机器学习,也能找到传统量化策略无法发现的市场联系。其中包括各家公司之间的资本关系、产品关系、竞争关系、上下游关系,也包括人与人之间的关系,例如管理团队和其他公司有没有关联,是否牵扯合作等。
未来量化研究员是否将成为一个被淘汰的职业?目前研究员的主要工作就是收集整理数据,变成投资决策,而之后这个工作将更多由机器完成。
“当初医疗科技发展时,人们也认为医生会被淘汰,但其实并不会。同理,研究员也会一直存在,但他们会更注重深入分析和调研,初级的数据搜集可以交给机器完成。”王政表示。
但当未来大数据平台并广泛应用后,是否会迅速挤压套利空间?这也是一个问题。回答根据网上资料整理
Ⅳ 淘金100指数是什么淘金100指数基金又是什么
在不久前,蚁金服联合博时基金、恒生聚源及中证指数共同发布了全球首个电商大数据指数--中证淘金大数据100指数,也就是我们说的淘金100指数,那么这个淘金一百指数是什么?淘金100指数基金又是什么呢?
淘金100指数是什么?
淘金100指数的全称是中证淘金大数据100指数,是由蚂蚁金融服务集团(简称“蚂蚁金服”)、博时基金管理有限公司、恒生聚源及中证指数共同发布。中证淘金大数据100指数也是全球首个电商大数据指数。
淘金100是一个股票指数。与其他传统指数不同,淘金100是基于海量的电商交易数据,经过大数据与金融的碰撞后,产生的全球首个电商大数据指数产品。
淘金100指数依托蚂蚁金服的大数据平台,基于海量的互联网电商交易大数据,来预期一个行业未来盈利状况,预判一个行业的繁荣程度,并在此基础上选取100只股票形成投资组合。
由于时效性的大幅提升,淘金100会每个月审核一次样本股,并将样本股调整周期缩短至一个月。值得关注的是,淘金100的业绩表现非常出色。从2009年12月31日的基日计算,五年的预期年化预期收益率超过572%;2014年全年的预期年化预期收益率超过116%;2015年第一季度的预期年化预期收益率超过41%。据测算,2009年至2014年,淘金100的历史预期年化预期收益率约为54%,远超同期的上证综指、沪深300等大盘走势。
淘金100指数基金是什么?
淘金100指数基金是指与淘金100指数挂钩的基金产品,已经在审批之中,一只保本基金和一只指数基金预计在4月中下旬推向市场。指数基金的投资会与淘金100的成份股对应,并采用等权重方式。理财也表示,相比于个人投资股票,选择投资基金,会更加稳健。特别是指数基金,巴菲特在1993年至2008年间,曾经8次介绍指数基金,“大部分投资者,包括机构投资者和个人投资者,早晚会发现,最好的投资股票方法是购买管理费很低的指数基金”。
Ⅳ 百发100指数是什么和i100、i300、腾安指数有什么区别
百发指数首次采用网络金融搜索和用户行为大数据,通过相应的数据挖掘和分析手段,将涉及特定金融实体的数据进行自动分析、归并、统计和计算,并引入量化投资模型,编制股票市场指数。
百发100指数,全称中证网络百发策略100指数,是百发系列指数中的第一只产品,是中证指数公司与网络公司、广发基金管理有限公司合作编制并对外发布的互联网指数,是国内真正利用大数据挖掘平台开发的首只互联网金融产品,是对传统指数编制方法和基金销售渠道的改进和探索相比市场主流指数,百发100指数自发布以来取得了突出的表现。累计预期年化预期收益方面,百发100指数2009年1月1日至9月18日已经取得了的涨幅,远高于同期沪深300的累计涨幅,更高于上证综指12%的累计预期年化预期收益,也远远战胜了全市场业绩基准中证全指56%的累计预期年化预期收益。该指数2014年初以来至9月18日,涨幅达从历史走势来看,百发100指数能够显著战胜市场所有主流宽基指数,是一条良好的被动投资标的。
2014年9月17日,广发中证网络百发策略100指数基金已正式获批。
百发100指数和i100、i300、腾安指数有什么区别?
他们是由不同的指数公司编制的指数。
百发100指数是由中证公司与网络、广发基金合作编制的指数,创新融合了互联网、大数据与量化策略,是国内首只互联网大数据基金。百发100所基于的网络金融搜索和用户行为大数据有着得天独厚的优势:网络是全球最大的中文搜索引擎,在国内涵盖超80%用户群,基础数据更可观、更具有投资前瞻性。
i100、i300指数的样本股选择是根据因子与新浪大数据决定。腾安指数则由腾讯与中证指数公司、济安金信公司合作开发。
Ⅵ 大数据基金逆势猛发 主动引入量化对冲策略
大数据基金逆势猛发 主动引入量化对冲策略
大数据正在持续激发商业模式创新,不断催生新业态,成为互联网等新兴领域促进业务创新增值、提升企业核心价值的重要驱动力。大数据产业正在成为新的经济增长点,对未来信息产业格局产生重要影响。在各个互联网平台纷纷拿出自己的数据做成金融产品的同时,基金公司也在希望借力大数据基金,抓住成长于互联网时代的新一代基民。
六月以来,国内资本市场逐步走弱,基金募集依然极度低迷。新基金不仅首募规模惨淡,且频现延长募集问题。行情不好,公募也明显放慢了新产品的发行节奏。而其中,大数据基金反而是静流中的一股暗涌。不仅形形色色大数据指数陆续面世,而且基于这些指数开发的产品也将列队发行。
大数据指数的开发也进入精耕细作的阶段。公募对互联网数据的要求越来越挑剔,尤其要求与投资者行为密切相关。公募合作的互联网平台从网络、新浪财经,亦发展到雪球、腾讯自选股、同花顺等记录了投资行为的平台。
中国公募基金行业对大数据引入投资的应用还处于初级阶段,因此开发较为简单的指数型基金是多数试水者的首选。然而,今年6月中旬以来A股接连几度大跌,让始终保持高仓位、必须跟随指数的大数据指数基金面临着业绩的压力。
震荡市中,配置了代表转型方向小票的高仓位大数据指数基金遭遇重挫,先行者也在思考这类产品如何转身的问题。如今,大数据基金产品的开发走向了仓位和操作更加灵活的主动量化趋势,引入对冲策略。
大数据为新基金“贴金”
经济观察报注意到,仅是今年7、8两个月份,中证指数公司已发布三条与雪球相关的大数据指数,三条与银联相关的大数据指数,一条与360旗下的搜索引擎有关的大数据指数,一条与搜房网房天下有关的大数据指数。记者了解到,博时基金、大成基金、天弘基金、中欧基金、鹏华基金正在开发基于上述指数的基金产品,将在未来两三个月内发行。
大数据基金始步于2014年,升温于2015年。去年,广发基金[微博]与网络的合作打响大数据基金头炮;今年,除了新增南方、博时、大成、天弘、中欧、鹏华、嘉实等将近十家试水者之外,产品发行的速度和数量均在今年明显上升一个台阶。记者了解到,博时和大成等公募基金公司已经把大数据基金的开发作为公司的战略重点。
年轻的大数据指数尚未建立自己的地位。大数据是否只是营销的噱头,仍是多数基民心中挥之不去的质疑。对此,博时基金副总裁王德英以量化基金在国内从不受重视到大受欢迎的经历勉励自己。他认为,前几年尚未做出业绩的量化基金发展得不温不火。但从去年开始,一些运作时间较长的量化基金已积累出业绩,尤其是在今年股市震荡期中成为很多投资者在债券、固定收益类产品之外的避险之选,“希望多积累点业绩,来说服投资者。”
大数据因子的出现,寄予了公募在投研方式变革的期望,也希望能够把大数据开发成一个良好的策略,帮助原有的量化模型跑赢市场。
大数据基金的选股多采用“多因子”模型,参考此类基金的基金合同,大都采用“财务”、“动量”、“大数据”等三类因子选股。
王德英介绍,目前各家公募所引用的互联网数据要么与基本面有关,如银联跨行交易数据,以及蚂蚁金服旗下支付宝[微博]金融信息服务平台提供的网上消费类统计型趋势特征数据;要么是与市场信心或情绪有关的数据,如反映市场热点的网络或新浪财经等。
华南一位大数据指数基金经理告诉经济观察报,大数据跟投资的相关性大小对最后出来的指数产品的影响并不是那么直接,还取决于它跟现有的模型匹配的程度有多大,“如果它在某一段时间的市场情况下我们觉得表现会好,会增加它的权重,有时候会降低。”
大成基金首席战略官温智敏认为,原则上随着对大数据的应用能力的提升,大数据的权重会越来越大,“包括我们关于这支产品或者后续的产品方面在未来会把互联网的元素强化。”
经济观察报了解到,大数据指数的选股模型的优劣取决与各家公募在量化投资领域的积累。仔细研究发现,来自各个互联网平台的数据只是选股模型中的一个因子,且所占的权重目前还不大,少则六分之一,多则三分之一。
王德英表示,将大数据因子融入原有的量化模型中,考验的是模型的成熟度。包括大数据在内的各个因子的权重并不是固定的。不同因子如何调配才能优势互补,需要多年的运行经验才能总结出来,“模型经常要调整,哪个失效,要剔掉;要不断统计和优化。”
这意味着大数据指数和传统被动管理型的指数有较大差异。通过多个因子策略的调整和权重优化,大数据指数可实现一定程度的主动管理。
目前市面上的大数据指数基金多数是每月调一次仓。一位不愿具名的大数据指数基金的基金经理告诉经济观察报,现在大数据指数都是一个月一换仓,换手率比其它的主动管理型基金还是偏高一些。其进一步揭示了产品局限性和风险性,“主动管理型基金可以挑时间换仓,而我们每个月就定期这样去换,如果赶上时间点不好,大容量可能会容纳不下。”
前述基金经理管理的大数据指数基金并没有设置最大的规模。其表示,“规模如果太大可能会影响一些调仓,尤其像现在股市不好成交低迷的情况。但是三十亿、五十亿正常规模的基金应该是没问题的,毕竟百只股票三千万、五千万,即使换仓一天换不了,拿三五天、一周来换的话也是很合理的。”
不过,与主动型基金相比,大数据指数基金的管理费用低廉具有明显的竞争优势。一位业内人士认为,这也是策略指数能够在很短的时间内获得市场和投资者广泛青睐的一个重要原因。
逆势而上 勇于创新
温智敏告诉经济观察报,策略指数在国外很重要的一种策略就是等权重。传统的指数采用的是市值加权的方式,意味着更看重所谓市值较大的股票。而大数据指数则是在等权重的情况下,由模型中的多个因子去考量和选择。
温智敏认为,现在经济转型的情况下,资本市场更加看重成长性股票。等权重的方式下选出了大量的小票,是有资本市场的判断逻辑在背后支撑。
然而,先行者却在实践中发现了问题。倾向于小盘股的特点导致其收益不稳定。
以最早成立的广发中证网络百发策略100指数基金为例,其募集金额曾高达23亿元,基金的成分股为100只,成分股中中小盘股占比较高。该指数策略采用等权重方式,以23亿元的募集金额来看,每只股票的配置资金为2300万元。值得投资者注意的是,中小盘股较多,当基金进行调仓时可能将产生一定的冲击成本。
近几个月的震荡市中,受伤最大的是那些被认为代表转型方向,最有上升空间的小票。配置了小票的高仓位大数据指数基金,便在这一过程中遭遇了较大的回撤。百发100指数基金便是其中一员。
百发100指数基金自去年运行以来,广发基金意识到该基金的规模局限性,广发基金大数据混合基金经理季峰表示,“假设在极端行情下,市场流动性匮乏,成分股大部分集中在小盘股上,后果就是交易过程中会产生巨大的冲击成本,对基金业绩造成影响。”
高仓位,主动性差,作为第一波大数据指数基金的先行者,广发基金思考着如何更好地发挥大数据的优势。指数型产品碰壁之后,首只大数据主动量化基金广发大数据混合在解决问题的背景下诞生。记者发现,新发的广发大数据混合在仓位上更加灵活,为0~95%之间,而非百发100那样在任何时候都必须保持90%以上的仓位。
在加权方式上,第二代大数据基金也做了改变,抛弃了等权的方法。广发大数据混合不再像此前那样按等权重买入,而是按照市值比例进行配置。季峰认为,由于加权方式采用类市值加权,因而基金规模不做任何限制,调仓的流动性风险和冲击成本将大幅降低。此外,在应对下跌趋势时,除了降低仓位,一旦展开趋势性行情时,该基金也会开股指期货空单对冲。
股市行情震荡,让市场上基金的业绩表现分化。基金管理公司也开始从侧重指数型产品转型到侧重主动管理型产品。主动管理型能够在大数据选股的优势上结合择时对冲风险。
以上是小编为大家分享的关于大数据基金逆势猛发 主动引入量化对冲策略的相关内容,更多信息可以关注环球青藤分享更多干货
Ⅶ 大数据指数目前有哪些典型应用
博时基金指慧家就是一个典型的大数据指数应用产品,综合大数据因子、财务价值版因子、市场驱动因权子,精选出最具投资价值的个股组合编制成指数。
“指慧家”的大数据指数覆盖面非常广,覆盖衣、食、住、行、娱、医等全市场行业,涵盖互联网电商、线下消费、社交金融、房地产交易等领域。博时基金优选合作伙伴,蚂蚁金服、银联、雪球、搜房网等都是各自领域中的龙头企业,拥有具有行业代表性的大数据。
Ⅷ 蓝方001113基金用的什么大数据
国内首批推出的大数据指数,南方新浪大数据100指数的编制初衷在于股票研究数猛宏据和方法上的补位。互联老知判网大数侍改据信息、财务信息、市场行情驱动信息三大信息源构成了三维一体的投资数据基础。在研究方法上,通过借助大量数学模型和优化工具来处理大数据。得益于计算机的强大处理能力,将海量数据和数学模型有效结合,使得基于互联网大数据的股票研究成为可能。