⑴ 数据库需要用哪些软件
这类软件主要用于更专业的数据分析挖掘工作,尤其是在银行、金融、保险业。
SPSS、SAS都是用于统计分析,围绕统计学知识的一些基本应用,包括描述统计,方差分析,因子分析,主成分分析,基本的回归,分布的检验等等。SPSS用于市场研究较多,SAS银行金融和医学统计较多,有一些难度。
R语言像是综合性较强的一类数据分析工具,集统计分析、数据挖掘,数据可视化。
展开来,讲讲数据分析~
这些数据分析工具的使用还是看需求,每个企业应用的选择和方式都不同。数据分析的概念很广,站在IT的角度,实际应用中可以把数据分析工具分成两个维度:
第一维度:数据存储层——数据报表层——数据分析层——数据展现层
第二维度:用户级——部门级——企业级——BI级
1、数据存储层
数据存储设计到数据库的概念和数据库语言,这方面不一定要深钻研,但至少要理解数据的存储方式,数据的基本结构和数据类型。SQL查询语言必不可少,精通最好。可从常用的selece查询,update修改,delete删除,insert插入的基本结构和读取入手。
Access2003、Access07等
,这是最基本的个人数据库,经常用于个人或部分基本的数据存储;MySQL数据库,这个对于部门级或者互联网的数据库应用是必要的,这个时候关键掌握数据库的库结构和SQL语言的数据查询能力;SQLServer2005或更高版本坦洞
,对中小企业,一些大型企业也可以握信丛采用SQLServer数据库,其实这个时候本身除了数据存储,也包括了数据报表和数据分析了,甚至数据挖掘工具都在其中了;DB2,Oracle数据库都是大型数据库
,主要是企业级,特别是大型企业或者对数据海量存储需求的就是必须的了,一般大型数据库公司都提供非常好的数据整合应用平台;BI级别
,实际上这个不是数据库,而是建立在前面数据库基础上的,企业级应用的数据仓库。DataWarehouse,建立在DW机上的数据存储基本上都是商业智能平台,整合了各种数据分析,报表、分析和展现,BI级别的数据仓库结合BI产品也是近几年的大趋势。2、报表/BI层
企业存储了数据需要读取,需要展现,报表工具是最普遍应用的工具,尤其是在国内。过去传统报表大多解决的是展现问题,如今像帆软报表FineReport也会和其他应用交叉,做数据分析报表,通过接口开放功能、填报、决策报表功能,能够做到打通数据的进出,涵盖了早期商业智能的功能。
Tableau、Qlikview、FineBI这类BI工具,可分在报表层也可分为数据展现层,涵盖了数据整合、数据分析和数据展现。FineBI和Tableau同属于近年来非常棒的软件,可作为可视化数据分析软件,可常用FineBI从数据库中取数进行报表和可视化分析。相对而言,可视化Tableau更优,但FineBI又有另一种身份——
商业智能
,所以在大数据处理方面的能力更胜一筹。3、数据分析层
这个层其实有很多分析工具,当然我们最常用的就是Excel。
Excel软件
,首先版本越高越好用这是肯定的;当然对excel来讲很多人只是掌握了5%Excel功能,Excel功能非常强大,甚至可以完成所有的统计分析工作!但是我也常说,有能力把Excel玩成统计工具不如专门学会统计软件段樱;SPSS软件
:当前版本是18,名字也改成了PASWStatistics;我从3.0开始Dos环境下编程分析,到现在版本的变迁也可以看出SPSS社会科学统计软件包的变化,从重视医学、化学等开始越来越重视商业分析,现在已经成为了预测分析软件;SAS软件
:SAS相对SPSS其实功能更强大,SAS是平台化的,EM挖掘模块平台整合,相对来讲,SAS比较难学些,但如果掌握了SAS会更有价值,比如离散选择模型,抽样问题,正交实验设计等还是SAS比较好用,另外,SAS的学习材料比较多,也公开,会有收获的!JMP分析
:SAS的一个分析分支XLstat
:Excel的插件,可以完成大部分SPSS统计分析功能4、表现层
表现层也叫数据可视化,以上每种工具都几乎提供了一点展现功能。FineBI和Tableau的可视化功能上文有提过。其实,近年来Excel的可视化越来越棒,配上一些插件,使用感更佳。
PPT:
办公常用,用来写数据分析报告;Xmind&网络脑图:
梳理流程,帮助思考分析,展现数据分析的层次;Xcelsius软件:
Dashboard制作和数据可视化报表工具,可以直接读取数据库,在Excel里建模,互联网展现,最大特色还是可以在PPT中实现动态报表。最后,需要说明的是,这样的分类并不是区分软件,只是想说明软件的应用。有时候我们把数据库就用来进行报表分析,有时候报表就是分析,有时候分析就是展现;当然有时候展现就是分析,分析也是报表,报表就是数据存储了!
⑵ 数据库软件有哪些
常用数据库
1.IBM的DB2
作为关系数据库领域的开拓者和领航人,IBM在1997年完成了SystemR系统的原型,1980年开始提供集成的数据库服务器——System/38,随后是SQL/DSforVSE和VM,其初始版本与SystemR研究原型密切相关。DB2forMVSV1在1983年推出。该版本的目标是提供这一新方案所承诺的简单性,数据不纳吵相关性和用户生产率。1988年DB2forMVS提供了强大的在线事务处理(OLTP)支持,1989年和1993年分别以远程工作单元和分布式工作单元实现了分布式数据库支持。最近推出的DB2UniversalDatabase6.1则是通用数据库的典范,是第一个具备网上功能的多媒体关系数据库管理系统,支持包括Linux在内的一系列平台。
2.Oracle
Oracle前身叫SDL,由LarryEllison和另两个编程人员在1977创办,他们开发了自己的拳头产品,在市场上大量销售,1979年,哪茄正Oracle公司引入了第一个商用SQL关系数据库管理系统。Oracle公司是最早开发关系数据库的厂商之一,其产品支持最广泛的操作系统平台。目前Oracle关系数据库产品的市场占有率名列前茅。
3.Informix
Informix在1980年成立,目的是为Unix等开放操作系统提供专业的关系型数据库产品。公司的名称Informix便是取自Information和Unix的结合。Informix第一个真正支持SQL语言的关系数据库产品是InformixSE()。InformixSE是在当时的微机Unix环境下主要的数据库产品。它也是第一个被移植到Linux上的商业数据库产品。
4.Sybase
Sybase公司成立于1984年,公司名称“Sybase”取自“system”和“database”相结合的含义。Sybase公司的创始人之一BobEpstein是Ingres大学版(与System/R同时期的关系数据库模型产品)的主要设计人员。公司的第一个关系数据库产品是1987年5月推出的SybaseSQLServer1.0。Sybase首先提出Client/Server数据库体系结构的思想,并率先在SybaseSQLServer中实现。
5.SQLServer
1987年,微软和IBM合作开发完成OS/2,IBM在其销售的OS/2系统中绑定了OS/2DatabaseManager,而微软产品线中尚缺少数据库产品。为此,微软将目光投向Sybase,同Sybase签订了合作协议,使用Sybase的技术开发基于OS/2平台的关系型数据库。1989年,微软发布了SQLServer1.0版。
6.PostgreSQL
PostgreSQL是一种特性非常齐全的自由软件的对象——关系性数据库管理系统(ORDBMS),它的很多特性是当今许多商业数据库的前身。PostgreSQL最早开始于BSD的Ingres项目。PostgreSQL的特性覆盖了SQL-2/SQL-92和SQL-3。首先,它包括了可以说是目前世界上最丰富的数据类李悔型的支持;其次,目前PostgreSQL是唯一支持事务、子查询、多版本并行控制系统、数据完整性检查等特性的唯一的一种自由软件的数据库管理系统.
7.mySQL
mySQL是一个小型关系型数据库管理系统,开发者为瑞典MySQLAB公司。在2008年1月16号被Sun公司收购。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。MySQL的官方网站的网址是:www.mysql