❶ 大数据平台的软件有哪些
这个要分好几块来讲,首先我要说明的是大数据项目也是要有很多依赖的模块的。每个模块的软件不一样,下面分别聊一下。
一、大数据处理
这个是所谓大数据项目中最先想到的模块。主要有spark,hadoop,es,kafka,hbase,hive等。
当然像是flume,sqoop也都很常用。
这些软件主要是为了解决海量数据处理的问题。软件很多,我只列几个经典的,具体可以自行网络。
二、机器学习相关
大部分大数据项目都和机器学习相关。因此会考虑到机器学习的一些软件,比如说sklearn,spark的ml,当然还有自己实现的代码。
三、web相关技术
大部分项目也都跑不了一个web的展示,因此web就很重要的,java的ssh,python的django都可以,这个看具体的项目组习惯了。
四、其它
还有一些很常用的东西,个人感觉不完全算是大数据特定使用范橘埋高围。反正我在做大数据项目的时候也都用到了。
比如说数据存储:redis,mysql。
数据可视化:echart,d3js。
图数据库:neo4j。
再来说说大数据平台的软件或者工具:
1、数据库,大数据平台类,星环,做Hadoop生态系列的大数据平台圆尺公司。Hadoop是开源的,星环主要做的是把Hadoop不稳定的部分优化,功能细化,为企业提供Hadoop大数据引擎及液键数据库工具。
2、大数据存储硬件类,浪潮,很老牌的IT公司,国资委控股,研究大数据方面的存储,在国内比较领先。
3、云计算,云端大数据类,阿里巴巴,明星产品-阿里云,与亚马逊AWS抗衡,做公有云、私有云、混合云。实力不差,符合阿里巴巴的气质,很有野心。
4、数据应用方面这个有很多,比如帆软旗下的FineReport报表系统和FineBI大数据分析平台等。
帆软是商业智能和数据分析平台提供商,从报表工具到商业智能,有十多年的数据应用的底子,在这个领域很成熟,目前处于快速成长期,但是很低调,是一家有技术有实力而且对客户很真诚的公司。
❷ 那些好的大数据平台
1、新增一个数据搜索平台:DataDance(城市地图),不用费力的去各个平台找数据,通过这个平台搜索或勾选需要的标签就行,就能找到各个维度的数据。提供12大类、50多万个数据和数据报告(基本上覆盖了市面上所有细分行业)。在网站首页就有全面又详细的数据分类,可以点击分类查看也可以通过数据关键词查询。比如勾选“餐饮服务”,就可以快速查到大量相关数据:
人群画像数据:
数据更新及时,紧跟当下热点,以及网站全部的数据可以下载。
平台还提供常驻客户画像、民用住宅及房价、周边餐饮业态、周边医疗相关业态、周边教育培训相关业态、周边宠物相关业态、周边景区业态、周边交通相关业态、周边公司分布业态、周边商务住宿业态、周边生活服务业态、周边 体育 休闲业态、周边政府机构业态、周边公共设施业态,部分消费类提供有人均消费和评分等信息,我就不逐一放图说明了,有兴趣您可以自己去看下。
2、艾瑞指数——主要用户:互联网从业者艾瑞旗下/包括移动APP指数、PCWeb指数、影视指数、广告指数、移动设备指数五类指数查询工具。
4、搜狗指数——主要用户:营销人搜狗旗下/基于搜狗用户行为的数据分享平台,同时支持搜索微信热度。
❸ 电商大数据平台有哪些
电商大数据平台如下:
1、星仔魔盒是为淘宝,天猫,京东,阿里,巴巴和巨化开发的电子商务软件。美利说可以有效提高7%的工作效率,节省8%的时间。
2、传奇:这是一个必要的数据分析工具,为卖家在天猫,淘宝,传奇。具有诸如淘宝指数、淘宝关键词助手、货币选择和测量以及竞争对手分析等功能。
3、业务人员:阿里巴巴集团,淘宝/阿里巴巴程心交流平台,数据辅助工具,交易指数流量指数计算公式,帮助商家打造爆款,实时直观把握市场和竞争态势。
❹ 目前国内有哪些好用的大数据分析平台
专业做旅游大数据的平台,推荐一个叫海鳗云旅游大数据平台。平台数据量大,信源全。
❺ 数据分析工具类软件,好用的有哪些
未至科技魔方是一款大数据模型平台,是一款基于服务总线与分布式云计算两大技术架构的一款数据分析、挖掘的工具平台,其采用分布式文件系统对数据进行存储,支持海量数据的处理。采用多种的数据采集技术,支持结构化数据及非结构化数据的采集。通过图形化的模型搭建工具,支持流程化的模型配置。通过第三方插件技术,很容易将其他工具及服务集成到平台中去。数据分析研判平台就是海量信息的采集,数据模型的搭建,数据的挖掘、分析最后形成知识服务于实战、服务于决策的过程,平台主要包括数据采集部分,模型配置部分,模型执行部分及成果展示部分等。
分析软件有Excel、SPSS、MATLAB、 SAS、Finereport等 其中Excel我就不多说了相信大家都懂。 SPSS是世界上最早采用图形菜单驱动界面的统计软件它将几乎所有的功能都以统一、规范的界面展现出来。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足大部分的工作需要。 MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境使用的。 其优点如下: 一、高效的数值计算及符号计算功能,能使用户从繁杂的数学运算分析中解脱出来; 二、 具有完备的图形处理功能,实现计算结果和编程的可视化; 三、友好的用户界面及接近数学表达式的自然化语言,使学者易于学习和掌握; 四、功能丰富的应用工具箱(如信号处理工具箱、通信工具箱等) ,为用户提供了大量方便实用的处理工具。 但是这款软件的使用难度较大,非专业人士不推荐使用。 SAS是把数据存取,管理,分析和展现有机地融为一体。其功能非常强大统计方法齐,全,新。它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等。SAS系统基本上可以分为四大部分:SAS数据库部分;SAS分析核心;SAS开发呈现工具;SAS对分布处理模式的支持及其数据仓库设计。不过这款软件的使用需要一定的专业知识,非专业人士不推荐使用。 Finereport类EXCEL设计模式,EXCEL+绑定数据列”形式持多SHEET和跨SHEET计算,完美兼容EXCEL公式,用户可以所见即所得的设计出任意复杂的表样,轻松实现中国式复杂报表。它的功能也是非常的丰富,比如说 数据支持与整合、聚合报表、数据地图、Flash打印、交互分析等
BI数据分析工具这个可以。BI数据分析系统用来将企业中现有的数据进行有效的整合,快速准确地提供报表并提出决策依据,帮助企业做出明智的业务经营决策。
做BI数据分析系统十多年的厂 商(奥威 软件)
spss,excel,在线spss-spssau,R等等。最好用的是在线网页spssau。
大数据分析的几个方面:
1、可视化分析:可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。
2、数据挖掘算法:大数据分析的理论核心就是数据挖掘算法。
3、预测性分析:从大数据中挖掘出特点,通过科学的建立模型,从而预测未来的数据。
4、语义引擎:需要设计到有足够的人工智能以足以从数据中主动地提取信息。
5、数据质量和数据管理:能够保证分析结果的真实性。
目前市场上的数据分析工具还是比较多的,国内跟国外都有,我就介绍几款主流的给楼主。
国外:
Tableau:自身定位是一款可视化工具,与Qlikview的定位差不多,可视化功能很强大,对计算机的硬件要求较高,部署较复杂。目前移动端只支持IOS系统。
Qlikview:最大的竞争者是Tableau,同Tableau和国内众多BI一样,是属于新一代的轻量化BI产品,体现在建模、部署和使用上。只能运行在windows系统,C/S的产品架构。采用内存动态计算,数据量小时,速度很快;数据量大时,吃内存很厉害性能偏慢。
Cognos:传统BI工具中最被广泛使用的,已被IBM收购。拥有强大的数据库平台、在数据管理、数据整合以及中间件领域专业功底深厚。偏操作型,手工建模,一旦需求变化需要 重新建模,学习要求较高。
国内:
FineBI:帆软旗下的自助性BI产品,轻量化的BI工具,部署方便,走多维分析方向。后期采用jar包升级换代,维护方便,最具性价比。
永洪BI:敏捷BI软件,产品稳定性较高。利用sql处理数据,不支持程序接口,实施交由第三方外包。
当前流行的图形可视化和数据分析软件有Matlab,Mathmatica和Maple等。这些软件功能强大,可满足科技工作中的许多需要,但使用这些软件需要一定的计算机编程知识和矩阵知识,并熟悉其中大量的函数和命令。
瑭锦tanjurd解释而使用Origin就像使用Excel和Word那样简单,只需点击鼠标,选择菜单命令就可以完成大部分工作,获得满意的结果。 但它又比excel要强大些。一般日常的话可以用Excel,然后加载宏,里面有一些分析工具,不过有时需要数据库软件支持。
❻ 大数据分析平台和工具有哪些
①Disco
Disco最初由诺基亚开发,这是一种分布式计算框架,与Hadoop一样,它也基于MapRece。它包括一种分布式文件系统以及支持数十亿个键和值的数据库。
支持的操作系统:Linux和OSX。
②HPCC
作为Hadoop之外的一种选择,HPCC这种大数据平台承诺速度非常快,扩展性超强。除了免费社区版外,HPCCSystems还提供收费的企业版、收费模块、培训、咨询及其他服务。
支持的操作系统:Linux。
③Lumify
Lumify归Altamira科技公司(以国家安全技术而闻名)所有,这是一种开源大数据整合、分析和可视化平台。你只要在Try.Lumify.io试一下演示版,就能看看它的实际效果。
支持的操作系统:Linux。
④Pandas
Pandas项目包括基于Python编程语言的数据结构和数据分析工具。它让企业组织可以将Python用作R之外的一种选择,用于大数据分析项目。
支持的操作系统:Windows、Linux和OSX。
⑤Storm
Storm现在是一个Apache项目,它提供了实时处理大数据的功能(不像Hadoop只提供批任务处理)。其用户包括推特、美国天气频道、WebMD、阿里巴巴、Yelp、雅虎日本、Spotify、Group、Flipboard及其他许多公司。
支持的操作系统:Linux。
❼ 请问大数据开发工具有哪些
你好,目前大数据常用的工具有Apache Hadoop、Apache Spark、Apache Storm、Apache Cassandra、Apache Kafka等等。下面分别介绍一下这几种工具:
Hadoop用于存储过程和分析大数据。Hadoop 是用 Java 编写的。Apache Hadoop 支持并行处理数据,因为它同时在多台机器上工作。它使用集群架构。集群是一组通过 LAN 连接的系统。Apache Hadoop是大数据行业中最常用的工具之一
Apache Spark可以被认为是 Hadoop 的继承者,因为它克服了它的缺点。Spark 与 Hadoop 不同,它同时支持实时和批处理。它是一个通用的集群系统。它还支持内存计算,比 Hadoop 快 100 倍。这可以通过减少对磁盘的读/写操作次数来实现
Apache Storm 是一个开源的大数据工具,分布式实时和容错处理系统。它有效地处理无限的数据流。通过无界流,我们指的是不断增长的数据,并且有一个开始但没有定义的结束
Apache Cassandra是一个分布式数据库,可提供高可用性和可扩展性,而不会影响性能效率。它是最好的大数据工具之一,可以容纳所有类型的数据集,即结构化、半结构化和非结构化
MongoDB是一个开源数据分析工具,提供跨平台能力的NoSQL数据库。对于需要快速移动和实时数据来做出决策的企业来说,它堪称典范
Apache Kafka 是一个分布式事件处理或流式处理平台,可为系统提供高吞吐量。它的效率足以每天处理数万亿个事件。它是一个高度可扩展的流媒体平台,还提供了出色的容错能力
当然,除了这些之外,还有一些其他跨平台的工具可供大数据使用。
希望我的回答能帮到你!