❶ 有什么比较好的大数据入门的书推荐
比较好的大数据入门的书有《大数据日知录:架构与算法》。
《大数据日知录:架构与算法》是2014年电子工业出版社出版的图书,作者是张俊林。《大数据日知录:架构与算法》从架构与算法的角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点。
其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。
主要介绍
本书对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结构、大数据存储。
以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术分支在内的大数据处理等几个大的方向。通过这种体系化的知识梳理与讲解,相信对于读者整体和系统地了解、吸收和掌握相关的技术有很大的帮助与促进作用。
❷ 对即将学习大数据专业的学生有什么建议和推荐的书籍
对于即将学习大数据专业的学生,个人认为主要取决于,自己对大数据的理解,其实很多人对大数据仅限于知道,而并非真正了解大数据,个人的主要建议就是,一定要明白什么是数据,大数据的入门基础,如果大数据的基本概念,都不明白,那怎么来学习。
❸ 有什么比较好的大数据入门的书推荐
1. 《大数据分析:点“数”成金》
你现在正坐在一座金矿上,这些金子或被埋于备份,或正藏在你眼前的数据集里,他们是提升公司效益、拓展新的商业关系、制定更直观决策的秘诀所在,足以使你的企业更上一层楼。你将明白如何利用、分析和驾驭数据来获得丰厚回报。作者Frank Ohlhorst厚积数十年的技术经验写了此书。该书介绍了如何将大数据应用于各行各业,你将了解到如何对数据进行挖掘,怎样从数据中揭示趋势并转化为竞争策略及提取价值的方法。这些更有意思也是更有效的方法能够提升企业的智能化水平,将有助于企业解决实际问题,提升利润空间,提高生产率并发现更多的商业机会。
2.《大数据时代》
《大数据时代》是国外大数据系统研究的先河之作,本书作者维克托被誉为”大数据商业应用第一人”,拥有再哈佛大学、牛津大学和新加坡国立大学等多个互联网研究重镇任教经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。该书主要讲了大数据时代的变革、商业变革和管理变革。《大数据时代》认为大数据的核心就是预测。大数据为人类的生活创造了前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。
3.《云端时代杀手级应用:大数据分析》
《云端时代杀手级应用:大数据分析》分析了什么是大数据、大数据大商机、技术与前瞻三个部分。第一个部分介绍大数据分析的概念,以及企业、政府部门可应用的范畴。什么是大数据分析?与个人与企业有什么关系?将对全球产业造成什么样的冲击?第二部分完整介绍了大数据在各产业的应用实况,为企业及政府部门提供应用的方向。提供了全球各地的实际应用案例,涵盖了零售、金融、政府部门、能源、制造、娱乐等各个行业,充分展示了大数据分析产生的效益。第三部分则简单介绍了大数据分析所需要的技术及未来的发展趋势,为读者提供了应用与研究的方向。
4.《大数据》
本书通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例奥巴马建设”前所未有的开放政府“的雄心、公开财务透明的曲折。《数据质量法》背后隐情,全国医改法案的波澜、统一身份证的百年纠结以及云计算、Facebook和推特等社交媒体等等,为您一一讲解数据创新给社会带来的种种变革和挑战。
5.《大数据互联网大规模数据挖掘与分布式处理》。
该书主要讲的是海量数集数据挖掘常用的算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前WEB端应用的许多重要话题等。
❹ 从入门到精通 互联网数据分析书籍清单
从入门到精通:互联网数据分析书籍清单
任何一个技能的学习,都有从浅到深的过程,数据分析也不例外。一个完整的数据分析知识体系类似金字塔结构:最顶层是对数据价值的认知、业务理解,中间是数据分析方法论,而最底层则是数据分析的解决方案或者具体的操作方法。我把数据分析的推荐书籍划分成三个段位,便于大家渐进式学习。
数据分析入门版
入门版适合数据分析的入门者、对数据分析没有整体概念的人,常见于应届毕业生、经验尚浅的转行者。
入门版推荐书籍
《深入浅出数据分析》:O’Relly出版的HeadFirst(深入浅出)系列书籍之一,书中有大量的图片和有趣的案例组合。本书浅显易懂形象生动,可以使入门者对分析的概念有个全面的认知。
《谁说菜鸟不会数据分析》:本书详细介绍了数据分析的基本方法和过程,并且以Excel表格为例进行了案例阐述。同时本书还介绍了数据分析在职场的意义,可以帮助职场小白快速上手。
《赤裸裸的统计学》:作者年轻时是个追求学习的学霸,后来自己从统计学中发掘了很多可以应用到生活的地方。这也是本书的主旨,结合生活讲解统计知识,生动有趣。可以避免统计学一上来就大讲贝叶斯概率和随机分析的枯燥。
同样类似的书籍还有《统计数字会撒谎》,这本书知名度要高点,通过揭露“虚假数字信息”来帮助大家理解背后的统计学原理。
数据分析进阶版
进阶版具有一定的行业针对性,要求分析者具备一定的数据分析常识和业务理解;适合网站分析师,商业分析师以及数据产品经理等人群。
进阶版推荐书籍
《精通web analytics 2.0》:Analytics将点击流网站分析工具与定性数据、测试与试验以及竞争情报工具相结合,从而推演出详尽的网站战略以及操作层方案。此书虽老,但其中很多思想和流量分析的案例仍然很有借鉴意义,现在国内只能买到二手的旧书。
与此类似的有《网站分析实战》,是国内一本讲网站分析的书,没有上面经典,但胜在新出,很多案例和理念都有及时的更新。
《深入浅出统计学》:与上面的《深入浅出数据分析》同属于Headfirst系列书籍,运用充满互动性的真实世界情节,帮助读者快速了解统计方面的理论知识。
《数据化管理》:黄成明著,讲解在企业中应用数据的例子,读完受益匪浅,里面举的很多例子都很接地气。虽说偏向于零售业管理,但大道归一,可适用于很多行业,当时依据里面的理念规划了美团外卖面向BD的数据产品。
《MySQL必知必会》:这本也是我当年学习SQL的入门书,薄册子一本,看起来很快。SQL是个性价比很高的技能,简单而强大。任何想进一步提高自己数据分析技能的产品/运营/分析师 同学,都建议点亮这个技能点。
《互联网增长的第一本数据分析手册》:我们公司的出的一本数据分析手册,全书以增长为主题。这本手册介绍了互联网创业企业增长方法论、互联网数据分析的常见方法(趋势、转化、留存、实时、分群、细查、热图)、细分行业(如SaaS、互联网金融、电商等)的应用。
数据分析高阶版
更高阶的数据分析相对来说专业性就强了,如涉及到企业内部数据治理,数据结合的业务分析,数据可视化等。当然,还有数据挖掘算法之类的更深入的东西,这块没有研究就不瞎推荐了。
高阶版推荐书籍
《决战大数据》:阿里巴巴前数据副总裁车品觉老师所著,讲解了阿里巴巴在企业内部治理数据过程中的心得,所讲“存-通-用”数据管理三板斧和“从数据化运营到运营数据”,字字珠玑,可堪借鉴。
《精益数据分析》:此书优势在于将企业分成了几个大的行业类别,并分门别类的讲解了每个行业的商业模式特点及分析技巧,对使用者的分析能力要求较高,且必须具备相应的业务知识。
《The Wall Street Journal Guide to Information Graphics》,华尔街日报负责商业分析的人做的可视化指南,精华且实用,我之前写过读书笔记《华尔街日报是这样做数据可视化的》,可供大家参考。
《数据仓库经典教程》:网上有人整理出来的资料,优点是简单明了,不像正常的数据仓库教材厚厚一本。
当然,数据分析是一门很深的学问,我也只是窥得冰山一角。要想做好数据分析必须具备多方面的技能:需要看清数据的价值并且懂业务,需要熟知数据分析的方法论,同时也要熟练掌握数据分析软件的操作。在学习上面数据分析推荐书籍的同时,不断在实践中加深自己的理解,用数据来驱动业务和客户增长。
❺ 大数据入门书籍有哪些
1、舍恩伯格的《大数据时代》;
2、巴拉巴西的《爆发》;
3、涂子沛的《大数据》
❻ 市面上大数据的书不少,如果只挑一本,哪本值得推荐
市场上大数据的说不少,但是你要挑一本的话,其实我还是觉得你在网络上选择一些自己可以公开的数据。因为每个人需要的每个程度的书是不一样的,你可以选择购买一些书的电子版本。电子版本反而比书籍会更好一点。
❼ 大数据入门书籍有哪些
当年互联网疯狂发展的时候,很多人在观望和犹豫中错过了这班顺风车(没有尽早开个淘宝店,肠子都悔青了好几遍呢)。如今,同样的桥段上演,大数据时代,坚决不能再无动于衷!
于是,你着急,你迷茫,你很方……除了平时要加班加点的搬砖,牙缝里挤出来的的闲碎时间都贡献给度娘了,“小白如何学习大数据”,“大数据入门书籍有哪些”……
1:<大数据时代>
这是学习大数据必读的一本书,也是最系统的关于大数据概念的一本书,由维克托·迈尔-舍恩伯格和肯尼斯·库克耶编写,主要介绍了大数据理念和生活工作及思维变革的关系。
它被包括宽带资本董事长田朔宁、知名IT评论人谢文等专业读者鉴定为“大数据领域最好的著作没有之一,一本顶一万本”。有这么好吗?看完自己评价吧。这本书对这个大规模产生、分享和应用数据的新的大时代进行了阐述和厘清,作者围绕“要全体不要抽样、要效率不要绝对精确、要相关不要因果”三大理念,通过数十个商业和学术案例,剖析了万事万物数据化和数据复用挖掘的巨大价值。
2:<爆发>
由巴拉巴西编写,主要讲了在一个历史故事的连续讲述中,了解大数据的概念实质。从大数据的历史开始,能更深入的了解大数据的发展历程。
巴拉巴西整本书讲述的大数据根本目的,是预测。他甚至有零有整地判断,人类行为93%是可以预测的。打个比方,千百年前人类无法如今天般准确预测天气,以致某些大致预测的行为都被认为是“通神”,其实核心在于对天气数据的海量占有和分析能力。但假如全人类的所有基础及行为数据全部被占有全部能分析呢?比如通过智能终端LBS功能采集全部运动轨迹、通过金融系统采集所有支付记录、通过SNS采集所有社会关系和通过邮件、文档、社会视频监控和自我视频监测采集所有言行记录,24小时,每分每秒,一生,全地球70亿人,那会如何?
3:<大数据>
由徐子沛编写,看美国政府在大数据开放上的进程与反复,算是个案。如果能够基本了解这三本的观点,出门有底气,见人腰杆直,不再被忽悠。
全书讲述的,是大数据在美国政府管理中的应用,以及美国政府运行方式大数据变革的历史与斗争,其实也是故事性的。从奥巴马上台就颁布《信息公开法案》,到设立第一个美国政府首席信息官开始,讲述美国政府与民间在社会数据公开的斗争史,以及美国社会管理向大数据思维转变的过程。首先,这算是一个最详实的案例;其次,这代表的不是某种管理方式变革,深处是对民主运行机制的变革与进步。说好了,这本书用心良苦,远远超越科普技术领域;说坏了,其心可诛。有一段,民间斗争,逼迫奥巴马公布所有每日白宫全部日程,包括接见了谁、谈话的全部内容,这不就是个人大数据全公开在公众人物上的应用吗?这可比现在所谓官员公开财产的要求高了几十倍——这要求政府全部行为、全部数据、全部公开,全体公众随时可查——技术和成本上其实已经可以做到或至少努力接近——如果不这么做,不止是落后问题而是真正的其心可诛了。
4:<大数据基础与应用>
由陈明编写。看名字就知道,入门级别拯救小白的书。这本书共17章,第1章是对大数据的简单概述,第2章介绍大数据研究的方法论,第3、8、9、14章介绍大数据的生态环境,第17章介绍数据科学的内容,剩下的章节是本书重点,介绍大数据技术及应用方法。
身处大数据大环境下,身边的人经常讨论数据库、数据可视化、大数据预处理等等。这些词听得多了会让人产生错觉——自己已经知道里面的门道了。但事实上还是个“门外汉”。
举个例子,没有人肯在上千人规模的讲座上专门花半个小时教你怎样进行数据清洗。本书专门列了一章,详细介绍大数据预处理技术,包括数据清洗的实现方式,从步骤到检验,都做了用心的阐述。诸如此类,数据挖掘、大数据流式计算、Hadoop、NoSQL等等都从最基础的点做了详细介绍。耐心看完这些,再往深处进阶就不会那么吃力了。
5:<一本书读懂大数据>
进入大数据时代,让数据开口说话将成为司空见惯的事情,本书将从大数据时代的前因后果讲起,全面分析大数据时代的特征、企业实践的案例、大数据的发展方向、未来的机遇和挑战等内容,展现一个客观立体、自由开放的大数据时代。
5:<集体智慧编程>
入门,浅显易懂,里面每一章都是一个案例,但是很方便,有具体的代码,用来入门最好。
6:<社交网络的数据挖掘>
专门做社交网络的数据挖掘,案例很丰富,有代码。
7:<数据可视化之美>
致力于介绍各种可视化方案。
8:<鲜活的数据>
比较简单的可视化,不过内容丰富,有代码。
9:<数据挖掘导论完整版>
看完上述的书,对大数据产生很大的兴趣,已经初步入门了,现在开始理论方面的学习,数据挖掘入门教程,个人觉得写的很好,目前正在研究这本书,努力。。。
10:<统计学习方法>
这本书比较深,刚开始看的就是这一本,不过太深,看到一半,准备在导论看完之后,在看这本书提升一下自己。
11:<鸟哥私房菜—基础篇>
作为一个计算机专业linux那是必学的,而且Hadoop是建立在Linux基础上的,不求多么的精通,但是基础的操作要学会。
如果是没有任何编程语言基础的想入行大数据的话,是必须要学习java基础的,虽然大数据支持很多开发语言,但是企业用的最多的还是java,接下来学习数据结构,关系型数据库,linux系统操作,有了基础之后,在进入大数据学习,可以给小白学习的体系。
第一阶段
COREJAVA(加**的需重点熟练掌握,其他掌握)
Java基础**
数据类型
运算符、循环
算法
顺序结构程序设计
程序结构
数组及多维数组
面向对象**
构造方法、控制符、封装
继承**
多态**
抽象类、接口**
常用类
集合Collection、list**
HashSet、TreeSet、Collection
集合类Map**
异常
File
文件/流**
数据流和对象流**
线程(理解即可)
网络通信(理解即可)
第二阶段
数据结构
关系型数据库
Linux系统操作
Linux操作系统概述
安装Linux操作系统
图形界面操作基础
Linux字符界面基础
字符界面操作进阶
用户、组群和权限管理
文件系统管理
软件包管理与系统备份
Linux网络配置
(主要掌握Linux操作系统的理论基础和服务器配置实践知识,同时通过大量实验,着重培养学生的动手能力。使学生了解Linux操作系统在行业中的重要地位和广泛的使用范围。在学习Linux的基础上,加深对服务器操作系统的认识和实践配置能力。加深对计算机网络基础知识的理解,并在实践中加以应用。掌握Linux操作系统的安装、命令行操作、用户管理、磁盘管理、文件系统管理、软件包管理、进程管理、系统监测和系统故障排除。掌握Linux操作系统的网络配置、DNS、DHCP、HTTP、FTP、SMTP和POP3服务的配置与管理。为更深一步学习其它网络操作系统和软件系统开发奠定坚实的基础。与此同时,如果大家有时间把javaweb及框架学习一番,会让你的大数据学习更自由一些)
重点掌握:
常见算法
数据库表设计
SQL语句
Linux常见命令
第三阶段
Hadoop阶段
离线分析阶段
实时计算阶段
重点掌握:
Hadoop基础
HDFS
MapRece
分布式集群
Hive
Hbase
Sqoop
Pig
Storm实时数据处理平台
Spark平台
若之前没有项目经验或JAVA基础,掌握了第一阶段进入企业,不足以立即上手做项目,企业需再花时间与成本培养;
第二阶段掌握扎实以后,进入企业就可以跟着做项目了,跟着一大帮人做项目倒也不用太担心自己能不能应付的来,当然薪资不能有太高的要求;
前两个阶段都服务于第三阶段的学习,除了熟练掌握这些知识以外,重点需要找些相应的项目去做,不管项目大小做过与没有相差很多的哦!掌握扎实后可直接面对企业就业,薪资待遇较高!
❽ 有没有适合自学数据分析的书推荐
第一大类:理论类。 理论层面的书籍,比如《大数据时代》 、《数据之版巅》 。
第二大类:技权术类。 技术层面的书籍,比如《Hadoop技术内幕》系列。这一类的书籍,主要是指系统技术类,在构建大数据系统时,系统如何运作,各系统组件的设计目标、框架结构、适用场景、工作原理、运作机制、实现功能等等。这类书籍,适合于IT系统部,开发部的技术人员。他们需要明白系统的运作机制,利用系统来实现大数据的应用开发,以及系统运维优化等。
第三大类:应用类。 应用层面的书籍,比如《数据挖掘技术》 、《基于SPSS的数据分析》等等。 这一类的书籍,主要是指应用技术类,告诉你如何应用工具和方法,从海量数据中提取有用的信息,来解决真实的业务问题。这类书籍,适合于业务部门、市场营销部门及与业务结合比较紧密的人员。他们更关注业务问题的解决,围绕业务问题来构建分析和解决方案。