Ⅰ 电脑如何建立数据源
它可能是最简单的搭建教程,有一点Python基础都能完成。比起动辄研发数月的成熟系统,借助开源工具,整个时间能压缩在一小时内完成。
优秀的数据分析平台,首先要满足数据查询、统计、多维分析、数据报表等功能。可惜很多分析师,工作的第一年,都是埋葬在SQL语句中,以SQL+Excel的形式完成工作,却用不上高效率的工具。
说Excel也很好用的同学,请先回避一下。
另外一方面,以互联网为代表的公司越来越重视数据,数据获取不再是难点,难点是怎样敏捷分析获得洞察。
市面上已经有不少公司推出企业级的分析平台和BI,可惜它们都是收费的。我相信不少读者听说过,但一直没有机会体验,或者老板们囊中羞涩。现在,完完全全能免费建立一套BI系统,即可以单机版用以分析,也能私有化部署到服务器,成为自家公司的分析工具。
这一切,只需要一小时。
Superset
Superset是一款轻量级的BI工具,由Airbnb的数据部门开源。整个项目基于Python框架,不是Python我也不会推荐了,它集成了Flask、D3、Pandas、SqlAlchemy等。
这是官网的案例,想必设计界面已经能秒杀一批市面上的产品了,很多BI真的是浓烈的中国式报表风......因为它的前端基于D3,所以绝大部分的可视化图表都支持,甚至更强大。
Superset本身集成了数据查询功能,查询对分析师那是常有的事。它支持各类主流数据库,包括MySQL、PostgresSQL、Oracle、Impala、SparkSQL等,深度支持Druid。
后台支持权限分配管理,针对数据源分配账户。所以它在部署服务器后,分析师们可以通过它查询数据,也能通过数据建立Dashboard报表。
介绍了这么多,想必大家已经想要安装了吧
安装
Superset同时支持Python2和Python3, 我这里以Python3作为演示。它支持pip形式的下载,不过我不建议直接安装,因为Superset的依赖包较多,如果直接安装,很容易和现有的模块产生冲突。
这里需要先搭建Python的虚拟环境。虚拟环境可以帮助我们在单机上建立多个版本的Python。简而言之,即可以Python2和Python3共存,也能Python3.3、3.4、3.5共济一堂,彼此间互相独立。
虚拟环境的安装方式很多,pyenv和virtualenv等。这里用Anaconda自带的conda工具。打开电脑终端/cmd,输入以下命令。
conda create -n superset python=3.4
conda create是创建虚拟环境的命令。-n是环境的命名参数,在这里,我们创建了名为superset的环境,它安装在Anaconda的envs目录下。python版本为3.4(superset暂时不支持3.6)。
该命令只会安装基础包,如果需要额外安装其他包,在命令行后加上想要的包名字即可,如python=3.4 numpy pandas。
安装很迅速,完成后,我们的Python环境还是默认版本,现在需要激活虚拟环境。
Ⅱ 如何配置ODBC数据源(以Access数据库为例)
以access数据库为例,Window7 系统,配置数据源,操作步骤如下:
1、打开电脑,点击开回始菜单。
Ⅲ office2013:如何实现一个excel数据透视表对应多个数据源
外部数据源创建的数据透视表,只需要刷新数据透视表,新增的数据就会实时更新到透视表中;如果是用EXCEL工作表中的数据创建动态数据源的数据透视表,则需要对数据源加以处理,才可以将变化后的数据源即时刷新到数据透视表中。 一、创建动态数据源透视表的方法1、运用EXCEL列表的方法创建动态数据源透视表 。方法是选中工作表中任一单元格,数据-列表-创建列表。在这个列表的基础上创建数据透视表(创建透视表的向导快捷键ALT+D+P),可以达到动态刷新数据透视表的作用。这个方法的特点是简单、实用,方便、快捷,但有一个缺点是只能对数据记录的增减变化有效,而对数据结构的增加无效,即增加了列字段,则无法更新到数据透视表中,所以是有限的动态。 注意:当你转换数据列表时, EXCEL会自动生成一个叫做“DATABASE”的数据区域名称,如果在创建数据透视表时选择的区域中EXCEL给你填入了DATABASE的名称时,则无法实现实时更新,必须要在这里填入数据列表的实际区域地址。2、定义名称。 一般情况下,使用如下公式定义的名称,可以实现动态数据源的实时刷新(假设数据源放在工作表A1单元格开始)。 Offset($A$1 ,,, counta(A:A),counta($1:$1)) 在创建透视表时,选择数据区域时填入用这个公式命名的名称,即可实现数据源的动态刷新。 二、多重合并计算区域数据源透视表 将一个工作簿中不同工作表的数据源汇总在一起创建透视表,用一般创建数据透视表的方法是没办法实现的,只能用多重合并计算数据区域的方法才行。 用多重合并计算数据区域创建透视表时,可分创建单页页字段和自定义页字段的方法, 单页页字段更加简单、快捷,自定义页字段的方法更加灵活、有效。 运用多重合并计算数据区域创建的透视表,无论你源数据有多少个字段,它都会只有4个字段(页、行、列、值),除了行字段,源数据的所有字段都作为了数据字段并转换成列的形式并列在透视表的数据区域中,无法作为单独的字段进行分析和处理,这样就改变了源数据字段的独立属性。这一点是多重合并数据区域创建数据透视表的严重不足之处。
Ⅳ 如何配置odbc数据源
工具/原料
事先配置相应的环境mysql(mysql安装程序)mysql-connector-odbc-3.51.20-win32.exe(mysql数据源dobc安装程序)
步骤/方法
在网上下载一个是MYSQL数据库的ODBC驱动程序:mysql-connector-odbc-3.51.20-win32.exe(已上传),以默认选项安装该文件。
打开数据源:开始->设置->控制面板->找到数据源
打开数据源(ODBC),在用户DSN选项卡中点击“添加”按钮,弹出“创建新数据源”窗口。
选中“MYSQL ODBC 5.1 Driver”,点击“完成”按钮。
弹出新窗口,在login选项卡中填写数据源信息。
Data Source Name 数据原名称;
Discription 描述(选填);
Server 数据源计算机的IP;
User 数据库用户名;
Password 数据库密码;
DataBase 数据源所要连接的数据库;
配置完后,点击“test”按钮, 如果出现如下提示,即配置成功。
点击“OK”返回用户DSN选项卡,增加一条记录,名为你所配置的数据源名称。
Ⅳ 如何在win7中正确设置数据源
点击桌面抄的我Windows
图标,找打控制面板
进入控制面板主页,选择系统和安全,进入系统和安全
进入系统和安全主页后选择管理工具,点击进入
进入管理工具后,选择数据源,进行数据源的配置
打开页面之后点击添加
打开添加页面,选择SQL
SEVER
然后选择完成
完成后进入下一页面,填上你的数据源名称和服务器名称,完成后下一步
在出现的页面中,选择SQL
Sever登录验证,在下面写上你的数据库密码和用户名,完成点击下一步
选择数据库,改变默认数据库,选择你要的数据库,完成点击下一步
在出现的页面,点击完成
测试数据源
,验证数据源是否可以连接
或许要用一到两分钟,这很正常
数据源测试连接成功,点击完成
然后在出现的页面,点击完成,这个时候,数据源就配好了。
在会到配置开始的页面,检查一下
是否出现了刚配置的数据源,结果是出现了新的数据源