⑴ 如何做一份完整的数据分析报告
了解整理数据来源或者采集数据;
理解数据、处理数据;用内工具Excel、数据库等对数据进行处理。
掌握数据整理、可容视化和报表制作:数据整理,是将原始数据转换成方便实用的格式,Excel在协同工作上并不是一个好工具,报表FineReport比较推荐。项目部署的Tableau、FineBI、Qlikview一类BI工具,有没有好好培训学习,这些便捷的工具都能淡化数据分析时一些重复性操作,把精力更多留于分析。
⑵ 数据分析报告怎么写 数据分析报告写法介绍
1、分析报告一般都要写一段导语,以此来说明这次情况分析的目的、对象、范围、经过情况、收获、基本经验等,这些方面应有侧重点,不必面面俱到。或侧重于情况分析的目的、时间、方法、对象、经过的说明,或侧重于主观情况,或侧重于收获、基本经验,或对领导所关注和情况分析所要迫切解决的问题作重点说明。如果是几个部门共同调查分析的。
2、还可在导语中写上参加调查分析的单位、人员等。总之,导语应文字精练,概括性强。应按情况分析主旨来写,扣住中心内容,使读者对调查分析内容获得总体认识,或提出领导所关注和调查分析所要迫切解决的问题,引人注目,唤起读者重视。
3、主体是分析报告的主要部分,一般是写调查分析的主要情况、做法、经验或问题。如果内容多、篇幅长,最好把它分成若干部分,各加上一个小标题。
4、结尾的写法灵活多样,一般有以下几种:(1)自然结尾。如果主体部分已把观点阐述清楚,作出了明确结论,就不必再硬加一条尾巴。(2)总结性结尾。为加深读者的印象,深化主旨,概括前文,把调查分析后对事物的看法再一次强调,作出结论性的收尾。(3)启示性结尾。在写完主要事实和分析结论之后,如果还有些问题或情况需要指出,引起读者的思考和探讨,或为了展示事物发展的趋势,指出努力方向,就可以写一个富有启示性的结尾。(4)预测性结语。有的报告在提出调查分析情况和问题之后,又写出作者的预测,说明发展的趋向,指出可能引起的后果和影响。这是在更广阔的视野上来深化主题。
⑶ 怎么写好一份数据分析报告
每到周五,估计都会有很多童鞋为本周的周报发愁不已!今天就结合几个真实案例来教大家如何玩转数据分析报告。不过,场景的主角名字都做了简单的处理!
立即登录BDP,1分钟制作你的专属数据分析报告,简答又高效!
⑷ 数据分析怎么写报告
数据分析怎么写报告
数据分析怎么写报告。现代社会是一个大数据的时代,很多东西都可以通过大数据分析一些基本的概况,职场上是需要我们写数据分析报告的。接下来就由我带大家了解数据分析怎么写报告的相关内容。
目录
标题页
目录
前言
正文
结论与建议
附录
在数据分析报告结构中,“总—分—总”结构的开篇部分包括标题页、目录和前言罩仔(主要包括分析背景、目的与思路);正文部分主要包括具体分析过程与结果;结尾部分包括结论、建议及附录。
一、标题页
标题页物悄汪需要写明报告的题目,题目要精简干练,根据版面的要求在一两行内完成。标题是一种语言艺术,好的标题不仅可以表现数据分析的主题,而且能够激发读者的阅读兴趣,因此需要重视标题的制作,以增强其艺术性的表现力。
(1)标题常用的类型
A.解释基本观点:往往用观点句来表示,点明数据分析报告的基本观点,如《不可忽视高价值客户的保有》《语音业务是公司发展的重要支柱》等;
B.概括主要内容:重在叙述数据反映的基本事实,概括分析报告的主要内容,让读者能抓住全文的中心,如《我公司销售额比去年增长30%》《2010年公司业务运营情况良好》等;
C.交代分析主题:反映分析的对象、范围、时间、内容等情况,并不点明分析师的运毕看法和主张,如《发展公司业务的途径》《2010年运营分析》《2010年部门业务对比分析》等;
D.提出问题:以设问的方式提出报告所要分析的问题,引起读者的注意和思考,如《客户流失到哪里去了》《公司收入下降的关键何在》《1500万利润是怎样获得的》
(2)标题的制作要求
A.直接:数据分析报告是一种应用性较强的文体,它直接用来为决策者的决策和管理服务,所以标题必须用毫不含糊的语言,直截了当、开门见山地表达基本观点,让读者一看标题就能明白数据分析报告的基本精神,加快对报告内容的理解。
B.确切:标题的撰写要做到文题相符,宽窄适度,恰如其分地表现分析报告的内容和对象的特点。
C.简洁:标题要直接反映出数据分析报告的主要内容和基本精神,就必须具有高度的概括性,用较少的文字集中、准确、简洁地进行表述。
(3)标题的艺术性
标题的撰写除了要符合直接、确切、简洁三点基本要求,还应力求新鲜活泼、独具特色、增强艺术性。要使标题具有艺术性,就要抓住对象的特征展开联想,适当运用修辞手法给予突出和强调,如《我的市场我做主》《我和客户有个约会》等。有时,报告的作者也要在题目下方出现,或者在报告中要给出所在部门的名称,为了将来方便参考,完成报告的日期也应当注明,这样能够体现出报告的时效性。
二、目录
目录可以帮助读者快捷方便地找到所需的内容,因此,要在目录中列出报告主要章节的名称。如果是在word中撰写报告,在章节名称后面还要加上对应的.页码,对于比较重要的二级目录,也可以将其列出来。所以,从另外一个角度说,目录也就相当于数据分析大纲,它可以体现出报告的分析思路。但是目录也不要太过详细,因为这样阅读起来让人觉得冗长并且耗时。
此外,通常公司或企业的高层管理人员没有时间阅读完整的报告,他们仅对其中一些以图表展示的分析结论会有兴趣,因此,当书面报告中没有大量图表时,可以考虑将各章图表单独制作成目录,以便日后更有效地使用。
三、前言
前言的写作一定要经过深思熟虑、前沿内容是否正确,对最终报告是否能解决业务问题,能够给决策者决策提供有效依据起决定性作用。前沿是分析报告的一个重要组成部分,主要包括分析背景、目的及思路三方面:为何要开展此次分析?有何意义?通过此次分析要解决什么问题?达到何种目的?如何开展此次分析,主要通过哪几方面开展?
(1)分析背景
对数据分析背景进行说明主要是为了 让报告阅读这对整个分析研究的背景有所了解,主要阐述此项分析的主要原因、分析的意义、以及其他相关信息,如行业发展现状等内容。
(2)分析目的
数据分析报告中陈述分析目的是为了让报告的阅读者了解开展此次分析能带来何种效果,可以解决什么问题。有时将研究背景和目的意义合二为一。
(3)分析思路
分析思路用来指导数据分析师如何进行一个完整的数据分析,即确定需要分析的内容或指标。这是分析方法论中的重点,也是很多人常常感到困惑的问题。只有在营销、管理理论的指导下,才能确保数据分析维度的完整性,分析结果的有效性及正确性。
四、正文
正文是数据分析报告的核心部分,它将系统全面地表述数据分析的过程与结果。
撰写正文报告时,根据之前分析思路中确定的每项分析内容,利用各种数据分析方法,一步步地展开分析,通过图表及文字相结合的方式,形成报告正文,方便阅读者理解。
正文通过展开论题,对论点进行分析论证,表达报告撰写者的见解和研究成果的核心部分,因此正文占分析报告的绝大部分篇幅。一篇报告只有想法和主张是不行的 ,必须经过科学严密的论证,才能确认观点的合理性和真实性,才能使别人信服。因此,报告主题部分的论证是极为重要的。
报告正文具有以下几个特点:是报告最长的主题部分、包含所有数据分析事实和观点、通过数据图表和相关的文字结合分析、正文各部分具有逻辑关系。
我们通常通过金字塔原理来组织报告逻辑,整个报告的核心观点是什么,又由哪些子观点构建,支持每个子观点的数据是什么,如图所示:
五、结论与建议
结论是以数据分析结果为依据得出的分析结果,通常以综述性文字来说明。它不是分析结果的简单重复,而是结合公司实际业务,经过综合分析、逻辑推理形成的总体论点。结论是去粗取精、由表及里而抽象出的共同、本质的规律,它与正文紧密衔接,与前言相呼应,使分析报告首尾呼应。结论应该措辞严谨、准确、鲜明。
建议是根据数据分析结论对企业或业务等所面临的问题而提出的改进方法,建议主要关注在保持有时候及改进劣势等方面。因为分析人员所给出的建议主要是基于数据分析结果而得到的。会存在局限性,因此必须结合公司的具体业务才能得出切实可行的建议。
六、附录
附录是数据分析报告的一个重要组成部分。一般来说,附录提供正文中涉及而未予阐述的有关资料,有时也含有正文中提及的资料,从而向读者提供一条深入数据分析报告的途径。它主要包括报告中涉及的专业名词解释、计算方法、重要原始数据、地图等内容。每个内容都需要编号,以备查询。
当然并不是要求每篇报告都有附录,附录是数据分析报告的补充,并不是必需的,应该根据各自的情况再决定是否需要在报告结尾处添加附录。
注意事项
1、分析结论要明确,要精,要有逻辑
如果没有明确的结论那分析就不叫分析了,也失去了意义,因为我们是要去寻找或者印证一个结论才会去做分析的,所以千万不要忘本舍果;
如果可以的话一个分析一个最重要的结论就好了,很多时候分析就是发现问题,如果一个分析能发现一个重大问题,就达到目的了,不要事事求多,宁要仙桃一口,不要烂杏一筐,精简的结论也容易让阅读者接受,减少重要阅读者(通常是事务繁多的领导,没有太多时间看那么多)的阅读心理门槛,如果别人看到问题太多,结论太繁,读不下去,一百个结论也等于零;
不要有猜测性的结论,太主观的东西会没有说服力,如果一个结论连自己都没有肯定的把握就不要拿出来误导别人了。
2、数据分析报告尽量图表化,风格统一
用图表代替大量堆砌的数字会有助于人们更形象更直观地看清楚问题和结论,当然,图表也不要太多,过多的图表一样会让人无所适从;
数据分析报告本身是一个很严肃的东西,跟样式、美观程度也有一定关系,不是说做的花销,而是基本的美观度要保证,风格要统一。
例如一些常识性的配色:
餐饮类(暖色调,例如橘色、红色、黄色);
国际贸易类(蓝色、灰色、雾蓝色、灰绿色等);
社会人文类(按照感情颜色进行配色,例如较严峻的社会问题,要用灰色、深蓝;较喜庆的,使用红色、绿色、黄色;具体可按需搭配对比色和互补色等)。
3、好的分析一定要基于可靠的数据源,同时具有可读性
其实很多时候收集数据会占据更多的时间,包括规划定义数据、协调数据上报、让开发人员提取正确的数据或者建立良好的数据体系平台,最后才在收集的正确数据基础上做分析,既然一切都是为了找到正确的结论,那么就要保证收集到的数据的正确性, 否则一切都将变成为了误导别人的努力;
除此之外,每个人都有自己的阅读习惯和思维方式,写东西总会按照自己的思维逻辑来写,别人不一定了解,要知道阅读者往往只会花10分钟以内的时间来阅读,所以要考虑你的报告阅读者是谁?他们最关心什么?必须站在读者的角度去写分析报告。
一般来说,数据分析报告有很多的类型,这是很多数据分析师都知道的,数据报告的对象、内容、时间和方法是不同的,对于数据分析报告的内容不同需要有不同形式的报告类型,一般来说,数据分析报告有专题分析报告、综合分析报告和日常数据通报等内容。
首先说说日常数据通报。一般来说,日常数据通报需要按日、周、月、季等时间阶段定期进行的,因此也叫定期分析报告。日常数据通报需要对进度、规范、时效设置高标准。首先说说规范性。日常数据分析报告需要有规范的结构形式,也就是反映计划执行的基本情况、分析完成和未完成的原因、总结计划执行中的成绩和经验,找出存在的问题、提出措施和建议。而时效性就是由日常数据通报的性质和任务决定,这是时效性最强的一种分析报告,这是帮助决策者掌握企业的最新动态,一般来说,这些报告主要通过微软的word、Excel和PPT来表现。而进度性由于日常数据通报主要反映计划的执行情况,因此必须把执行进度和时间的进展结合分析,观察比较两者是否一致,从而判断计划完成的好坏。
然后说说专题分析报告吧,专题分析报告是对社会经济现象的某一方面或某一个问题进行专门研究的一种数据分析报告,它的主要作用是为决策者制定某项政策、解决某个问题提供决策参考和依据。专题分析报告需要注意两个地方,第一个就是注意专题分析的单一性。专题分析不要求反映事务的全貌,主要针对某一方面或者某一问题进行分析,如用户流失分析、提升用户转化率等分析。第二个就是需要注意深入性。有的分析报告由于内容单一,重点突出,因此要集中精力解决主要的问题,包括对问题的具体描述,原因分析和提出可行的解决办法。这需要对公司业务有足够的认识。
最后说说综合分析报告,一般来说综合分析报告是全面评价一个地区、单位、部门业务或其他方面发展情况的一种数据分析报告。综合分析报告需要注意很多的内容,比如需要注意的是数据分析报告的全面性。这就需要站在全局高度反映总体特征,做出总体评价。其次需要注意的是联系性。综合分析报告要把互相关联的一些现象、问题综合其他进行系统的分析。这种分析不系统地分析指标体系的基础上,考察现象之间的内部联系和外部联系。做到了这些就是一个合适的综合分析报告。
8月份商品房市场出现供应量、成交量双高位情况。成交量较7月份相比,变化情况不大,成交量走势略微上升。供应量变化较大,环比增长近一倍。本月全市商品房供应量为148.03万平方米,与去年同期相比减少18.5%,但环比上升95.99%。8月份商品房成交量为139.7万平,成交量环比增长3.7%,与7月份基本持平。8月份商品住宅成交量121.6万平,环比增长4.6%,商品住宅成交量较上月无明显变化,但同比增长64.8%。
商品房供应量分析
本月全市商品房供应量为310.4万平方米,环比增长109.68%,供应套数为33269套。其中商品住宅供应面积为287.6万平方米,占总供应量92.66%,商品住宅供应套数为30518套,商业用房供应面积为19.8万平方米,占总供应量6.38%,供应套数为1452套。
商品房供应量走势
由于秋季房交会的推动作用,全市2009年9月份的商品房供应面积达到310.4万平,供应套数为33269套,超越2008年9月份的供应量,成为近一年来的新高。从整体上看,2009年以来,商品房供应量呈持续上升的态势,房地产开发商对市场普遍看好。随着房交会的结束,预计10月份商品房供应量相比9月份将会出现下降,但作为传统的销售旺季,不会改变整体上升的趋势。
本月各区供应量分布情况
本月和平区和沈北新区的商品房供应量排在首位,所占比例分别为21.2%和21.1%,供应量分别为65.4万平和65.1万平。铁西区商品房供应量排第三位,供应面积为45.5万平,所占比例为14.9%。
商品房成交走势分析
受秋季房交会的影响,全市2009年9月份的商品房的成交面积达到195.6万平米,超越6月份夏季房交会的成交量,成为今年的新高。从整体上看,2009年以来,全市的商品房的成交量呈持续上升的态势,市场信心较足。随着房交会的结束,预计10月份区内商品住宅交易量相比9月份也将会出现下降,但作为传统的销售旺季,不会改变整体上升的趋势。
商品住宅市场综述
9月份商品房市场延续了供应量、成交量双高位情况。受秋季房交会的影响,商品房供应量大幅度增长,销售量达到了2009年的新高,市场表现良好;但供求比相对下降,商品房的市场将趋于平稳,随着房交会的结束,预计10月份商品房的供应量和成交量将出现下降。
商品住宅供应量分析
由于秋季房交会的推动作用,全市2009年9月份的商品住宅供应面积达到287.6万平,供应套数为30518套,超越2008年9月份的供应量,成为近一年来的新高。从整体上看,2009年以来,商品住宅供应量呈持续上升的态势,房地产开发商对市场普遍看好。随着房交会的结束,预计10月份商品住宅供应量相比9月份将会出现下降,但不会改变整体上升的趋势。
成交量分析
受秋季房交会的影响,全市2009年9月份的商品住宅的成交面积达到192.2万平米,超越6月份夏季房交会的成交量,成为今年的新高。从整体上看,2009年以来,全市的商品住宅的成交量呈持续上升的态势,市场信心较足。随着房交会的结束,预计10月份区内商品住宅交易量相比9月份也将会出现下降,但作为传统的销售旺季,不会改变整体上升的趋势。
各区商品住宅成交情况分析
9月份商品住宅成交量排在首位的仍为铁西区,成交面积46.7万平,成交套数5375套。于洪区成交情况位居第二,成交面积38.4万平,成交套数4327套。沈河区成交量最少,成交面积42.9万平米,成交套数469套。
商业用房市场综述
9月份商品住宅市场延续了供应量、成交量双高位情况。受秋季房交会的影响,商品住宅供应量大幅度增长,销售量达到了2009年的新高,市场表现良好;但供求比相对下降,商品住宅市场将趋于平稳,随着房交会的结束,预计10月份商品住宅的供应量和成交量将出现下降。
供应量分析
9月份商业用房供求比为0.79,供求比相对上升,但仍处低位,商业用房的供应出现小幅下降,成交情况出现小幅上升。从2009年以来整体上看,商业用房市场供求相对平衡,市场趋于稳定。
成交量分析
9月份商业用房市场成交情况较为平稳,本月成交面积15.7万平米,成交量小幅上升,并达到了2009年的最高值,市场接受度较高。从整体上来看,2009年商业用房市场是稳中有升,市场情况较为平稳。
各区商业用房成交情况分析
9月份商业用房成交量排在首位的仍为铁西区,成交面积4.88万平,成交套数320套。于洪区成交情况位居第二,成交面积4.22万平,成交套数275套。大东区和浑南新区成交量次之,分别为1.92和1.9万平米。
商业用房市场综述
9月份商品住宅市场延续了供应量、成交量双高位情况。受秋季房交会的影响,商品住宅供应量大幅度增长,销售量达到了2009年的新高,市场表现良好;但供求比相对下降,商品住宅市场将趋于平稳,随着房交会的结束,预计10月份商品住宅的供应量和成交量将出现下降。
⑸ 如何写数据分析报告
相信很多数据分析师在写数据分析报告的时候也会遇到一些困惑,因为我最近也在写一个报告,在这里就梳理一下如何写数据分析报告
数据分析报告是数据分析师常见的工具,写好一份数据分析报告,不但能够清楚描述问题,洞察数据并且提出一些有思考的举措,也很能反映出一个数据分析师的思维和用数据讲故事的能力,网上虽然也有很多关于写好数据分析报告的文章,但是大部分都是偏重于理论,具体实践的很少,我就在这里做一个汇总,希望能帮助一些朋友,以期抛砖引玉
--------分割线--------正式开始--------
一份好的数据分析报告离不开两部分:数据部分和分析部分。巧妇难为无米之炊,数据之于数据分析师就好像食材之于巧妇,数据的重要性可见一斑,分析部分是数据分析师将数据做成报告的最重要一步,是最体现一个数据分析师功底的部分,也是拉开差距的部分,下面就针对两部分分别进行阐述
一. 数据部分
数据部分最重要的就是数据质量,数据质量的好坏直接决定一份数据分析报告的好坏,如果报告中某一个数据被质疑,会直接影响这份数据分析报告的可信度,本章说一说跟数据有关的一些内容
1.数据的质量
1.1数据类型
数据类型比较好理解,就是数据以什么样的类型存储的,不同的数据类型有不同的使用方法,因此在处理数据之前,必须要先了解数据类型,常见的数据类型有(这里只说一些常见的数据类型):
整数型
int :用于存储整数,存储从-2的31次方到2的31次方之间的所有正负整数,每个INT类型的数据按4 个字节存储
bigint :用于存储大整数,存储从-2的63次方到2的63次方之间的所有正负整数,每个BIGINT 类型的数据占用8个字节的存储空间
smallint :用于存储小整数,存储从-2的15次方到2的15次方之间的所有正负整数。每个SMALLINT 类型的数据占用2 个字节的存储空间
浮点型
real :存储的数据可精确到第7 位小数,其范围为从-3.40E -38 到3.40E +38。 每个REAL类型的数据占用4 个字节的存储空间
float :存储的数据可精确到第15 位小数,其范围为从-1.79E -308 到1.79E +308。 每个FLOAT 类型的数据占用8 个字节的存储空间。 FLOAT数据类型可写为FLOAT[ n ]的形式。n 指定FLOAT 数据的精度。n 为1到15 之间的整数值。当n 取1 到7 时,实际上是定义了一个REAL 类型的数据,系统用4 个字节存储它;当n 取8 到15 时,系统认为其是FLOAT 类型,用8 个字节存储它
字符型
char : 数据类型的定义形式为CHAR[ (n) ],n 表示所有字符所占的存储空间,n 的取值为1 到8000, 即可容纳8000 个ANSI 字符。若不指定n 值,则系统默认值为1。 若输入数据的字符数小于n,则系统自动在其后添加空格来填满设定好的空间。若输入的数据过长,将会截掉其超出部分
nchar : 它与CHAR 类型相似。不同的是NCHAR数据类型n 的取值为1 到4000。 因为NCHAR 类型采用UNICODE 标准字符集(CharacterSet)。 UNICODE 标准规定每个字符占用两个字节的存储空间,所以它比非UNICODE 标准的数据类型多占用一倍的存储空间。使用UNICODE 标准的好处是因其使用两个字节做存储单位,其一个存储单位的容纳量就大大增加了,可以将全世界的语言文字都囊括在内,在一个数据列中就可以同时出现中文、英文、法文、德文等,而不会出现编码冲突
varchar :VARCHAR数据类型的定义形式为VARCHAR [ (n) ]。 它与CHAR 类型相似,n 的取值也为1 到8000, 若输入的数据过长,将会截掉其超出部分。不同的是,VARCHAR数据类型具有变动长度的特性,因为VARCHAR数据类型的存储长度为实际数值长度,若输入数据的字符数小于n ,则系统不会在其后添加空格来填满设定好的空间。一般情况下,由于CHAR 数据类型长度固定,因此它比VARCHAR 类型的处理速度快
时间和日期型
date :‘2018-01-17’
time :‘10:14:00’
timestamp :‘2018-01-17 10:14:00.45’
以上就是常用的数据类型,如果有其他的数据类型没有说到,可以去网上搜一下,都比较好理解
1.2噪音数据
因为网上有非常多的关于噪音数据的解释,都非常专业,我就不在这里做过多的详细解释了,我们只探讨从sql取出数据的时候有一些异常值的处理办法:
null
一般跑过sql的朋友肯定会发现,在跑出来的数据中会有null的情况,这个时候需要对null进行替换,如果是计算用,就把null替换成0,这个步骤可以在sql里面完成,也可以在excel里面完成
极大值
极大值会影响数据的计算结果,一般会进行处理,要么替换成除极大值以外的最大值,要么直接弃用
作为分母的0
如果0作为分母,在excel里会出现#DIV/0,这个时候可以直接把结果替换,或者在sql里面直接进行替换,用case……when……就可以替换
1.3数据的口径
数据的口径很重要,根据经验看,大部分的数据出现问题是口径造成的,数据的口径一定要跟业务的口径一致,拿留存率举例:
留存率是周期比率型指标,一般在计算留存率的时候需要确定 留存周期 和 活跃判定的口径
留存周期:留存周期通俗来讲就是指用户在多长时间范围内活跃,并在下一个周期内仍然活跃,这里的多长时间就是指留存周期
活跃判定:指怎么判定一个用户活跃,可以是启动App,可以是登陆,也可以是完成了一次其他特定行为,这个主要依照业务需求而定
实际计算:
周留存率的计算
分子:本周活跃 且 上周也活跃的用户数
分母:上周活跃的用户数
2.可能会用到的工具
在处理数据的过程中可以用很多工具,在这里就介绍一些比较常见的工具,大家耳熟能详,学起来也不是特变难
2.1提取数据
mysql
hivesql
两者的查询语句有相似的地方也有不同的地方,主要看自己所在公司的数据存储情况
2.2数据处理
python:一般写个脚本做一些机械的操作(我目前是这么用),也可以用来做计算
mysql:在查询的时候可以进行处理
excel:数据量比较小的时候,可以在excel上简单处理
2.3数据可视化
python:可以用来做一些词云图
Tableau:可视化一些图表,可以和sql结合着用
excel:做一些简单的图表,实际上数据处理的好的话,一般用excel就足够了
二. 分析部分
在处理了数据以后就要开始进行报告的撰写,写报告会涉及到几个部分的工作,这里分别进行介绍一下:
1.报告结构
一篇数据分析报告的结构是十分重要的,一个好的结构能够将他人带入到你的报告中,让他人更好的明白你的意图,减少信息传递之间的丢失,同时你的思维也主要展现在结构上,这就意味着在写数据分析报告前,一定好想清楚数据分析报告的结构,当然这里说的报告结构即包括整个报告的结构,也包括每一个章节的结构,这里就放到一起说了
1.1 总 - 分 - 总(多用在整体结构)
我们在读一本书的时候,打开目录,会发现整部书的结构一般包括:
前言
第一篇
第二篇
……
第n篇
结尾
这就是典型的总 - 分 - 总结构,是最常见的结构,如果是对一个专题进行分析,用这种形式是非常好的,举个例子:
某电商App近一个月内的销售额出现下滑,让你针对这个问题进行一次专题分析
分析思路:拿到这个问题,我们很容易想到的是,销售额出现下滑出现的原因有两个,一个是付费用户数减少了,另一个是付费用户的人均付费金额减少了,这两个原因属于并列的原因,不存在递进关系,也就是说付费用户数减少了与人均付费金额减少并不存在因果关系,没有什么相关性,因此需要对两个原因共同分析,最后输出结论和提升建议,分析完以后,会发现总
- 分 - 总结构很适合这样的分析,所以列出以下提纲
问题描述
销售额近一个月下降多少?绝对值,环比,同比数据
原因假设:付费用户数下降/人均付费金额下降
付费用户数下降分析
付费用户数降幅是多少?绝对值,环比,同比数据
定位下降人群:是整体下降还是某一群体用户数下降
这里就涉及到用户分群,用户分群的方法有很多,涉及到用户价值的分群常见的就是RFM模型,将分完群的用户进行数据对比,看看上个月付费用户的结构占比跟本月有什么不同,当然用户分群的方法也不止这一个,还有按照会员等级分群(主要用会员等级进行用户分群),按照活跃程度(新用户/留存用户/回流用户),按照消费习惯(一般用户表里面都会有用户的标签,标识这个用户的消费习惯,表示这个用户更喜欢购买哪一类的商品),不管用什么分群方法,都需要纵向对比,也就是这个月和上个月付费人群的对比
原因分析:
如果是付费用户整体下降(这种是大家都不想看到的现象,欣慰大盘数据的驱动需要投入大量的资源,也有可能是自然波动),考虑可能的原因主要有:用户整体流失,比如用户流失到竟对;或者本月有什么特殊情况,影响到了整体的用户活跃;或者是从活动维度去观察,是不是活动的力度减小,影响了用户付费的欲望
如果是某一个用户群体下降:考虑的原因可能有商品品类的影响,是不是某一类商品在平台没有上架,或者某一类商品涨价;或者这一类用户受到了哪些影响,一般可以从属性和行为角度去分析
提出策略:
针对分析出的原因提出可落地的策略(策略一定要落地,要具体,比如如果你提出一条策略是:提升新注册用户数,那么等于没说,老板多数会diss你,但是你如果说,通过减少注册时填写的非必要字段,如年龄/职业,来简化注册流程,挺升注册转化率,进而提升新注册用户数,那感觉是不一样的)
人均付费金额下降分析
人均付费金额的降幅是多少?绝对值,环比,同比数据
定位原因
人均付费金额下降可能的原因主要有:订单数量下降;每个订单包含的商品数的下降/某一个品类购买数下降
提出策略:针对分析出的原因提出可落地的策略
总结问题
明确造成销售额下降的原因到底是什么(定性以后,记得一定要量化,不量化会被diss)
提出有针对性的建议
如何预防再次发生
1.2 递进(可用于整体结构和章节内部结构)
这种结构适合对一个问题进行探索,就像上一个例子中,我们针对每一个可能原因进行分析的时候,就是采用的这种分析方法,这种分析结构特别适合对一个小问题进行深入的探索分析,层层递进,深挖原因,这里在举一个例子:
某一个App的新注册用户数环比上个月减少,需要你做一个深入的分析,找到原因,提供改进策略
分析思路:新注册用户数的的影响因素是一个典型的漏斗结构,也是一个典型的单向性用户旅程,画一张图就能说明白:
如图所示,影响注册用户数的原因全部标注在漏斗里面,但是注册全流程这个漏斗只能看个大概流失,所以我们会对某一步进行细化,这张图上,我们对用户从启动到注册成功进行细化,细化到用户行为,这样能够提出一些产品上的改进意见,这个时候,如果想要提升新注册用户数,只需要针对每一步流失原因进行分析,找到提升策略就可以了,基本上是所见即所得的分析
比如:我们想对提交注册信息到注册成功这一步进行优化,那么首先我们要找到用户注册失败的原因有什么,一般有:
用户已注册
密码格式不合规
系统错误
未勾选《隐私协议》
在提出建议的时候,只要针对以上原因提出具体改进意见就可以了
1.3并列结构(多用于整体结构)
这种结构一般遇到的情况不多,常见的有对不同的校区进行经营分析/对不同品类的商品进行售卖分析,基本都是以描述型分析为主,因为分析的主体是并列关系,所以只需要每个主体就行单独分析就好,基本采用的分析思路是一样的
1.4因果结构(多用于章节内部结构)
这种结构一般用在复盘分析报告中,复盘是常见的数据分析报告类型之一,也是很多公司比较重视的一个报告,比如双十一复盘/新手活动复盘等等, 以电商某一次大促复盘为例 ,这里直接写结构:
总体描述:
本次大促整体数据表现,整体活动节奏的介绍;销售额是多少,同比提升多少;利润情况;参与用户有多少,同比提升多少;卖出商品有多少,同比提升多少;各个子活动的贡献是多少
子活动1的效果分析
子活动1的简介,作用,发力点
子活动1的贡献是什么,对于直接提升结果指标或者间接提升指标有哪些贡献
子活动1的成本是什么?投入产出比是多少?
子活动2的效果分析
子活动x的效果分析
最后汇总,提出优化建议
2.分析方法
讲完了整体结构,我们就该进入到具体分析的过程里面,这里的分析方法,主要想说说怎么去针对不同的数据进行分析,也就是说怎么通过数据看出问题,这里介绍常用的5种分析方法,但是有一句话非常重要,想写这节的最前面: 数据分析师一定要懂业务,在分析之前最好能把问题定位个大概,再去捞数,再去分析,否则每天会沉浸在漫无目的取数中,我认为一个数据分析师最重要的能力是要懂业务,从数据的角度看业务,才能驱动业务
2.1 对比分析
横向对比
横向对比就是把一个指标按照不同维度拆分,去对比不同维度的变化,举个简单的例子来说就是:
昨天的DAU增长了30%,那么把DAU进行拆分,可以拆分成以下三种方式:
DAU=新注册用户数+留存用户数+回流用户数
DAU=北京活跃用户数+河北活跃用户数+山东活跃用户数+……
DAU=北京活跃用户数+河北的活跃用户数+……
=北京的新增用户数+北京的留存用户数+北京的回流用户数+河北的新增用户数+河北的留存用户数+河北的回流用户数+……
这里留一个疑问,怎么去选择优先下钻的维度?想明白以后分析的效率就会有很大提升
纵向对比
在进行完横向对比以后,就要开始进行纵向对比,纵向对比主要是在时间维度上,还拿上一个例子来说,我们按照第一种方式进行横向对比以后,就要纵向对比,见下表:
2.2分布分析
分布分析一般是应用的场景比如用累计消费金额去分组/按照用户一个月活跃天数去分组,这些场景都有两个共性的特征:
属性值都是数值类型,或者日期类型
属性值非常多,比如累计消费金额可能从1-90000中间任意一个数字,也就是属性值非常多,没办法用每一个属性值去单独分析,因此需要分组
还是上图说明:
2.3交叉分析
交叉分析一般指多维度交叉,或者不同指标之间的交叉
多维度交叉其实有点类似对比分析的第三类分类方法,这里不在赘述了,还是那个图,但是在实际分析中的作用其实很是强大,具体如何应用就需要大家举一反三啦,仔细看看这张图,可以换成哪些分析场景下的哪些场景的交叉分析:
不同指标交叉一般用在分析变化趋势中,或者寻找相关因素的时候,上图:
这样既能看绝对值的变化,又能一目了然的看出变化趋势,如果不同指标之间呈现一定的相关性,那就是相当完美了
2.4漏斗分析
漏斗分析模型比较好理解了,一般在行为分析中常用到,直接上图吧:
是不是有点眼熟?漏斗分析一般分析应用在分析用户使用某项业务时,经过一系列步骤转化的效果,因为用户会沿着产品设计的路径到达最终目标事件,在分析每一步转化的时候会用到这个模型
2.5矩阵分析
矩阵分析是一个不错的分析模型,主要用在分类上面,常见的有用户分类、产品分类等,比如像常见的RFM模型是一个三维矩阵,有八个象限,上两个图看看:
矩阵分析其实不难理解,但是涉及到一个比较关键的问题,就是临界点怎么选择,通俗来说就是第一象限和第二象限的临界值是多少,有的是0,有的不是0,举个例子:
我想用活跃度和累计消费金额对1万个用户进行分群,使用矩阵分析
我建好了这个二维矩阵,我第一件事就是先要确定原点的坐标值,也就是说用户的累计消费金额大于x,就会出现在第一/四象限,如果小于x,就会出现在第二/三象限,想确定这个值需要一定的方法,会用到一些分类算法,这个可以去网上查一些关于分类的教程,有很多,后续我会写一盘文章来介绍分类,这里就不细讲了
以上就是数据分析最重要的两个模块,当然在实际操作中还有很多需要思考的地方,太细节的东西不太能够面面俱到,这里留给大家去思考的空间,比如:
数据分析报告怎么讲成一个故事,比如背景-现状-原因-策略-预期结果-复盘结果?
每一页PPT怎么排版会让你的数据分析报告可读性更高?
如果你的数据分析报告不采用上述的结构,还能用哪些结构?
怎么让你的数据分析报告显得更高大上?
可以留言交流哦