㈠ 首只大数据中概股IPO,讲的什么故事
2016年9月23日,国双科技登陆纳斯达克,成为中国首家在美股上市的大数据公司。
国双科技IPO价格回为13美元/股,估值3.7亿美元。上市首日,股价上涨21%,当日收盘于15.75美元。国答双科技首日表现尚可,下一步股价走势要看市场反馈。
其对标公司HubSpot目前市值20亿,IPO价格25美元,IPO当天收于30美元,股价增幅20%;Marketo目前市值16亿,IPO价格同为13美元,IPO当天收盘价为23美元,股价暴涨77%
㈡ 大数据时代的几个关键词是什么
1、容量(Volume):数据的大小决定所考虑的数据的价值和潜在的信息;
2、种类(Variety):数据类型的多样性;
3、速度(Velocity):指获得数据的速度;
4、可变性(Variability):妨碍了处理和有效地管理数据的过程。
5、真实性(Veracity):数据的质量。
6、复杂性(Complexity):数据量巨大,来源多渠道。
7、价值(value):合理运用大数据,以低成本创造高价值。
(2)美股大数据扩展阅读:
大数据的精髓:
大数据带给我们的三个颠覆性观念转变:是全部数据,而不是随机采样;是大体方向,而不是精确制导;是相关关系,而不是因果关系。
A、不是随机样本,而是全体数据:在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样(随机采样,以前我们通常把这看成是理所应当的限制,但高性能的数字技术让我们意识到,这其实是一种人为限制);
B、不是精确性,而是混杂性:研究数据如此之多,以至于我们不再热衷于追求精确度;
之前需要分析的数据很少,所以我们必须尽可能精确地量化我们的记录,随着规模的扩大,对精确度的痴迷将减弱;拥有了大数据,我们不再需要对一个现象刨根问底,只要掌握了大体的发展方向即可,适当忽略微观层面上的精确度,会让我们在宏观层面拥有更好的洞察力;
C、不是因果关系,而是相关关系:我们不再热衷于找因果关系,寻找因果关系是人类长久以来的习惯,在大数据时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系;相关关系也许不能准确地告诉我们某件事情为何会发生,但是它会提醒我们这件事情正在发生。
㈢ “大数据”主要涉及哪些领域相关股票分别有哪些
近期,大数据概念正在风靡全球,从华尔街到国内资本市场,大数据概念股持续走强。5月17日,可视化数据分析软件供应商Tableau 及大数据营销公司Marketo一登陆美股市场,便引来疯狂的买盘。截至当日收盘,Marketo的股价飙升77.69%,Tableau的股价也暴涨63.71%。美股对“大数据”概念的疯狂热炒很快传播到了A股市场。今年以来至今,大数据概念股逆市上扬,累计涨幅达47.8%。根据细分行业分类,“大数据”主要涉及七大领域,包括数据处理和分析环节以及综合处理、语音识别、视频识别、商业智能软件、数据中心建设与维护、IT咨询和方案实施、信息安全等。
相关股票
“大数据”涉及的七大领域之一数据处理、分析环节和综合处理,与其相关的国内A股上市公司拓尔思和美亚柏科,近期表现抢眼。
语音识别作为“大数据”涉及的七大领域之一,近期,其相关的科大讯飞、大华股份(002236)、华平股份(300074)、中威电子(300270)和国腾电子(300101)等5只个股受到市场关注。
目前,国内A股市场中涉及视频识别行业的上市公司主要有5家,具体为:海康威视(002415)、大华股份、华平股份、中威电子、国腾电子。这5只个股今年以来至今均有不错表现,大华股份(74.34%)、华平股份(60.34%)、国腾电子(25.49%)、海康威视(22.47%)、中威电子(15.60%)。
目前,A股市场中涉及商业智能软件生产的上市公司主要有:久其软件(002279)、用友软件(600588)、东方国信(300166)。
对于国内企业而言,在大型设备与基础软件方面尚无法与全球IT巨头匹敌。不过,在应用软件、IT服务的多个细分领域,国内企业已积累了客户基础与行业、项目经验,有望借大数据的兴起而获得增长助力。
值得一提的是,汉得信息是我国本土领先的IT咨询企业,多年来致力于为企业提供高端ERP实施服务。
三分技术,七分数据,得数据者得天下。随着未来数据的规模剧增,数据中心的建设与维护是必不可少的。目前A股中涉及数据中心建设与维护的公司包括天玑科技(300245)、银信科技(300231)和荣之联(002642)。
目前A股涉及信息安全领域的个股包括:卫士通(002268)、同有科技(300302)、美亚柏科等等。
㈣ 大数据受益股有哪些大数据受益股解析
大数据受益股及解析:(截止年12月)
1:300245:天玑科技:出资1300万设立合资公司,开展云计算与大数据相关业务。
2:300170:汉得信息:设立美国全资子公司,从事信息系统和数据管理系统的安装以及信息系统的集成。
3:002236:大华股份:与阿里云计算正式签署战略合作协议,双方将围绕云计算、大数据技术在视频监控行业的应用,全面展开合作。
4:300270:中威电子:公司主要产品是数字视频光端机、VAR光平台、高清摄像机及智能交通产品等,技术涉及图像视频智能分析方面,因此被市场列为“大数据”概念股票之一。
5:002230:科大讯飞:购买上海瑞元100%的股权,积极推进公司在大数据业务分析领域的市场,在语音生态圈的基础上构建大数据分析平台。
6:600804:鹏博士:鹏博士公司未来将以全国50个城市的云数据中心群为依托形成大数据优势,在对WIFI进网用户使用信息分析的基础上,提供精准的广告信息推送等应用服务,提升网络广告价值。
7:600588:用友网络:国内最大的管理软件厂商用友软件与微软、IBM两大国际IT巨头合作,合作内容涉及大数据、云平台合作。
8:300074:华平股份:通过视频识别,成功进军“大数据”产业。
9:002279:久其软件:以“大数据”为主线链接集团管控和电子政务两大传统主营业务,未来仍能保持稳定增长。
10:000977:浪潮信息:公司以自有资金1,000万元在广东省广州市投资设立全资子公司广东浪潮大数据研究院有限公司,专业从事服务器、存储及大数据相关产品的研发、生产、销售。
11:002642:荣之联:与美国数据分析解决方案提供商Alpine签订合作关系并获得其捕获、存储、管理和分析“大数据”的原始工具资源。
12:300229:拓尔思:投资设立合资公司有利于推动公司金融大数据行业技术和信息服务业务的拓展,为公司未来向多领域多行业大数据应用业务拓展提供实践经验。
13:300188:美亚柏科:全球仅有的电子数据取证行业两家上市企业之一。
㈤ 银行数字化转型加速,潜在风险如何防范业内共识:加强监管!
金融业数字化转型正衔枚疾进。
这条因新冠肺炎疫情倒逼而来的转型之路,已由匀速变成加速。而市场需求之迫切,更是超乎想象:数字化转型,不仅成为近来很多金融论坛的重要议题,一些互联网银行以及传统金融机构金融 科技 方面的负责人,更成为炙手可热的嘉宾,或专题讲座,或网上授课,或论坛演讲。而金融 科技 巨头更是大举进军金融业,为数字化转型需求迫切的金融机构提供 科技 支撑。继阿里云加码“数字农信”战略,将开放更多智能风控、数据智能经验和数字生活场景等生态资源,助力农信社、农商银行等中小银行形成特有的创新型服务业态后,8月16日,腾讯云也与昆山农商银行正式签署战略合作协议,双方将在银行私有云平台建设、分布式架构转型、分布式数据库应用、移动端开发等金融新基建领域展开合作,同时依托双方优势资源,推进零售业务数字化建设以及场景金融创新,构建面向未来金融场景的数字新连接能力。
然而,数字化转型从来不像人们想象的那样,将业务从线下搬到线上,就一劳永逸;也不是成立一个金融 科技 部,做几个银行APP那么轻巧。由于涉及金融机构整个内部架构、流程和理念等全方位重构,想要实现真正意义上的数字化转型,并非易事。这其中,在转型过程中,如何有效防控未来智能金融的潜在风险,尤其困难。
众所周知,数字化转型离不开大数据、云计算、人工智能;只有充分发挥技术的力量,才能实现传统金融向数字化时代智能金融的转变。利用大数据,金融机构可以构建符合自身实际需求的业务、风控模型;利用云计算,可以按照模型,进行高效快速运算,将结果用于日常运营;利用人工智能,可以实现高频小额贷款的自动发放,实现真正意义上的“秒贷”。可以说,数字化时代的智能金融,颠覆了传统金融业务模式,省去了大量人工操作过程,极大提升了客户体验和满意度,让以客户为中心的经营理念变成了现实。这从头部民营互联网银行每年动辄服务数千万,甚至上亿客户,发放数千万笔贷款中可窥见一斑。
不过,硬币总有两面。当金融机构享受数字化转型后的智能金融带来的便利、高效等好处的同时,潜在的风险也如影随形。
中国证监会原主席肖钢日前警告称,“人工智能与金融业深度融合的新业态,是金融模式变革的方向,在大力发展的同时亦需要提防可能带来的系统性风险。”他表示,由于人工智能主要依靠模型和算法,因此在该技术运用于金融市场时,一旦数据质量不高或出现偏差,则有可能产生蝴蝶效应,带来系统性风险。例如,在资本市场上,事先设定的投资模型往往在实施中没有人为干预,这可能使得投资策略产生高度一致性,并在某个时点上对市场造成冲击,由此引发系统性风险。美股就曾经出现过“闪电崩盘”,道琼斯指数在极短时间内暴跌上千点。
虽然肖钢的观点,业内早有认知,但在当前金融机构纷纷加大数字化转型、发展智能金融的大背景下,仍具有振聋发聩的意义。
事实上,业内对智能金融潜在风险认识非常深刻。苏宁银行董事长黄金老此前在接受采访时就表示,通过数字化转型,金融服务会像水一样渗透到各个场景各个生态之中,把金融服务或者金融产品内嵌到企业的生产环节、交易环节和个人的生活环节,但这种“渗透”也会带来新的风险和挑战。第一大风险是数据风险,这来源于金融的全自动化,要依靠数据来决策。银行是数据化应用最丰富,或者是最全面的一个领域。如何合理整合这些数据是数字化转型中银行的必修课。应对不当,就会产生数据造假、数据中断、数据泄露、数据滥用等风险。第二大风险是技术风险,既包括算法的可解释性和可评估性,比如构造了包含一百个变量的模型来评估贷款是否可以发放,但由谁衡量这个模型是否适当。也涵盖技术带来的安全风险,在高度依赖数字化系统的情况下,一旦系统被攻击或者停摆,可能会对金融安全造成更大的危害。
正因为数据采集来自于人,模型搭建来自于人,因此,智能金融虽然省事,虽然智能,但也会因为数据质量问题和算法参数设定等问题,潜藏较大风险。如果建立模型的人再有不良用心,潜藏的风险更大。而智能金融一旦发生风险,常常是系统性的。因此,未雨绸缪,做好风险防控工作,非常重要。
如何防范潜在风险?业内共识是,加强监管。
智能金融时代,传统监管理念和手段,无法有效匹配。因此,金融机构在加速数字化转型,监管当局的监管手段也应当加速转换。既然智能金融的风险点潜藏在数据治理和算法等方面,那么,监管对象就应当既包含对模型的可解释性的监管,要让监管对象能够解释清楚模型到底基于何种逻辑;也应包含对智能金融有关模型和算法的构建者、设计者的监管,为此要及时完善监管制度,堵塞监管盲区,通过资质认定,让相关从业者具有监管层认可的资质。最重要的是,监管层要有懂行的监管者,要能看得明白,管得到位,治得有效。
㈥ 美国大数据工程师面试攻略
项目数据分析师分享:美国大数据工程师面试攻略
方法/步骤
先做一个自我介绍,本科南开后,加入了一个创业公司kuxun,做实时信息检索,后来进入网络基础架构组,搭建了Bai App Engine的早期版本,随后去Duke大学留学,在攻读硕士期间,做跟Hadoop大数据相关的研究项目Starfish,之后在Amazon EC2部门实习,了解它们的内部架构,毕业后加入Linkedin,做广告组的架构,涉及Hadoop调优,Data Pipeline, Offline/Online, 实时系统。最新是在Coursera从事数据工程师工作。在多年工作中,除了对技术的不懈追求,也积累了大量的面试经验,从国内的一线互联网网络,阿里巴巴,奇虎,人人,到美国一线公司Facebook,Google,Linkedin,Twitter,Amazon,到热门Startup,Uber,Pinterest,Airbnb,Box,Dropbox,Snapchat,Houzz,拿到10+ offer,并且在Linkedin期间也面试过100+候选人,参与面试题制定,乐于分享并帮助很多人成功求职,实现目标。
我们看一下这张硅谷地图,它坐落于美国加州,从圣何塞到旧金山的狭长地带,中间是San francisco bay,简称湾区。它的由来是这边有计算机核心处理器中离不开的硅,30年来,硅谷就发展成为无数技术性创业公司的摇篮。在20多年前,就有很多硬件公司的辉煌Intel,Oracle,Apple,Cisco成功上市,10年前,互联网的兴起,造就了Yahoo,Google,Ebay的神奇,而如今Tesla,Facebook,Twitter,Linkedin正扶摇直上,成为美股高科技股的领头羊。这些公司的市值从几十billion到几百billion,PE从负数到上千。疯狂的估值背后也改变了世界。
如果说硅谷成功是有原因的,我觉得有两点。地理位置是得天独厚吸引大量人才,这里有Stanford和加州州立高校提供智力库的支持,在硅谷可以看到来自全世界的最聪明的人,中国人,印度人,犹太人构成这些Engineer的主力。虽然国内做技术自嘲为码农,但在硅谷成为一个优秀工程师还是收获颇丰。另一方面创业是一个永恒的话题,在Stanford有个说法空气中都飘扬中创业的味道,一些早期员工通过上市套现又积累经验成了天使投资,Y Combinator,各种技术forum,meetup,创业导师,都很活跃。资本的力量功不可没,早年VC通过投资,收购,上市放大形成一个雪球效应。大家总喜欢问什么是next big thing,哪一个是下一个facebook,下一个musk,根据统计10年能成就一个千亿以上的公司,目前这个进程正在缩短。
我就拿Linkedin作为例子,介绍高科技公司(FLG)是什么样子。它是成立2003年的职业社交网站。在10年的发展中,也不是一下子爆发的,目前有3亿的全球用户,虽然跟Facebook,Google 10亿+用户没法比,但是它有很好的护城河,用户定位高端精准,单位价值高。这张照片中左边这位是创始人Reid Hoffman,是Paypal黑帮成员,在硅谷也是呼风唤雨的大佬,目前是董事和投资人。中间这位是CEO Jeff,2013年被Glassdoor评为最佳CEO,作为职业经理人,成功帮助linkedin高速成长,他最喜欢提到transformation,希望我们每个员工能挑战自我,在各自岗位上进化。Linkedin提供了员工很好的福利,有号称湾区最佳的免费食堂,每个月一次的in day,hack day, 帮助员工内部创业的incumbator计划。它特点是数据驱动的开发产品,比如 People you may know, Job you may be interested, 我做过Sponroed Ads 都是需要很强数据背景和data scientist的支持。它的Biz model也很独特,有3个line,面向公司的招聘服务,面向广告商的市场服务,面向个人的订阅服务,还有最新Sales Solution,因为这么多可能性,成为华尔街的宠儿。
说硅谷,除了那些已经成功的大公司,不得不说现在最新的创业动向,这些代表了未来下一个FLG。我总结了一些领域和代表公司:云计算(box, dropbox),大数据(cloudera),消费互联网(pinterest),健康(fitbit),通讯(snapchat),支付(square),生活(uber)。 这里是华尔街网站更新的最新融资规模,比如Uber就达到18Billion的估值,我当时拿到offer没去,还是觉得很疯狂,如果细看这张表,大家可以看到硅谷(蓝色)尤其是旧金山它们的融资规模远远大于其他地区,还是地理决定论。而在国内的两家xiaomi,jingdong都是在北京,而最近大家看到一些泡沫论,说什么阿里巴巴上市是否美股到顶,经纬VC创始人也提醒我们泡沫的风险,我无法判断。如果能参与到下一波浪潮里面去是很过瘾的。我推荐大家去看看 <浪潮之巅>,<奇点临近>,我还是很期待未来20年的技术革命。
我个人热爱大数据,在硅谷这也是大家津津乐道的,有个笑话,big data is like teenage talking about sex, nobody know how to do it. 其实大家还是兴趣驱动就好,不要那么功利,大数据技术涉及太多,平常工作中也是慢慢积累,有无数的坑和技术细节需要克服。并不是说那个技术最热就要用哪个,如果你用不好,你的压力很大的,举个例子,你用某个开源数据库,发现它偶尔有数据丢失怎么办,如果这是线上服务,你不断收到报警,这时候你当时选用它的优点 scalable,容错性都没意义了。接着说大数据,这里面Hadoop作为行业标准,我面过的除了Google,微软不用,几乎所有的公司都在用,建议大家利用这个机会。这里面有三巨头,cloudera是老牌Hadoop咨询公司,Hadoop的创始人做CTO,Hortonworks也是很多Hadoop的committee,MapR是提出hdfs的erasure 编码方式高效而著名,它们都是融了巨资,模式也很像,先推出社区免费版,但有个商业版提供更好的管理。 而今年出现一匹黑马,Spark,简单说就是内存级别的计算,比Hadoop框架里能节约IO,利用缓存,能适应批处理,迭代,流式计算。
这里看一下它的生态系统,如何学Hadoop是个循序渐进过程,先要理解学习它的core系统,HDFS, MapRece, Common,在外围有无数的系统工具方便开发,我个人用过的是 Avro作为数据格式,Zookeeper作为选主的高可靠性的组件,Solr作为搜索接口,Pig搭建工作流,Hive 数据仓库查询,Oozie管理工作流,HBase 作为KV 分布式存储,mahout数据挖掘的库,Cassandra nosql 数据库。我建议初学的考虑Chinahadoop的课程。
而Hadoop本身也是个进化过程,几年前0.19版本,到0.20, 0.23分流成Yarn架构最后进化成Hadoop2.0, Hadoop1.0 和 2.0 它们的接口和组件是完全不同的,但总体上Hadoop 2.0 是趋势,因为它有Yarn这样分离的资源管理平台,可以以插件的方式开发上面的Application,解放了生产力,而像Spark,Storm这些新型处理器也是支持Hadoop 2.0的。这里是Hortonworks它们提出来的社区版本架构,可以说标准的制定者,一流的公司制定标准,其他的公司一般用只能用它们提供的稳定版,没有多少话语权。但从事大数据,并不见得是要去这些制定标准的公司,大量的应用也是非常考验架构的灵活性。并且能看到实际的产品,很有成就感。
说到今年火的,还是要看Spark。从去年至今,已经开了2届Spark大会,上千人的规模,无数人对比Hadoop 100倍的性能提升而兴奋。这里说它的背景是诞生于Berkeley的Amplab,它们有个很有名的BDAS(Berkeley Data Analytics Stack),目前Spark已经成为Apache的顶级项目。去年这个实验室的教授跟学生出去成立Databricks公司,拉到两轮上千万的风投,有人成Spark是Hadoop的终结者吗?我看今年Spark大会上,所有的Hadoop大佬公司都是鼎力支持,像Cloudrea甚至放弃impala的一线支持而转变成Spark。如果这么发展下去,星星之火可以燎原啊。它里面用到Scala是一种函数式语言。里面的组件也很多,有Shark支持SQL类似Hive,有Spark Streaming,MLlib,Graphx,SparkR,BlinkDB。它的核心数据结构是RDD,可以跑在各种分布式系统上。总体上是个包容性+侵略性的系统。我个人也很看好它们的发展。