A. 大数据技术中,关于用户行为分析方面的有哪些技术
做用户行为分析的基础是获得用户行为数据,例如用户页面停留时间、跳转来源等等。这些信息有些能直接拿到,有些是需要做一些计算才能拿到的。一般来说用户访问时的一些信息都是以日志的形式打到web容器的日志空间中去,这其中包含了最通用的一些访问信息以及一些自定义的日志打点。
题主提到了大数据技术中对用户行为进行分析,那么可以假定网站或者App的访问量是比较傲多的。由于系统流量比较大,计算维度又比较多,后续数据消费者的需求增长比较快,所以对计算分析平台有了一定的要求。具体表现为:
1.负载能力。流量增大以后带来的压力是多方面的,比如网络带宽的压力、计算复杂度带来的压力、存储上的压力等等。一般来说这些都是比较显而易见的,会对产生比较直接的影响,比如计算实时性下降、消息出现了堆积、OOM等等。为了解决这一现象,一般来说会选择一些分布式的框架来解决这个问题,比如引入分布式计算框架storm、spark,分布式文件系统hdfs等。
2.实时性。在系统资源捉襟见肘时消息的实时性会立即受到严重影响,这使得部分算法失效(例如对计算和收集上来的数据进行行为分析后,反馈到推荐系统上,当整体响应时间过场时会严重影响推荐效果和准确度)。对于这个情况来说可能会选择storm这种具有高实时性的分布式流式计算框架来完成任务。
3.系统管理和平台化相关技术手段。在大数据情景下,企业内数据环境和应用环境都是比较复杂的,用户行为分析应用不是一成不变的,那么就要求用户行为分析这种多变的应用在复杂环境中能有效生存,这包括算法数据材料的获得、系统运维、系统任务调度、系统资源调度等等,相关的技术很多时候要求团队自研,但也有ganglia、yarn、mesos这类开源系统可以参考或者直接使用。
4.数据链路。企业技术环境一般来说是非常复杂的,一层一层交错在一起,远不是一句MVC三层架构能够概括得了的,为了避免消息流通呈复杂的网状结构,一般会考虑应用服务化、企业服务总线(ESB)及消息总线来做传输,有兴趣的话题主可以网络一下这几个方向的技术和开源工具。
5.应用快速生成工具。我个人认为在大数据环境下应用都摆脱不了一个快速开发的要求,用户行为分析也是如此,这时候要考虑对接一些开源的分布式数据分析算法库而不是通过自己去实现,比如像spark ml,mahout这类的库用得好能减少很多工作量。
B. 互联网 + 媒体之移动互联与用户行为
移动互联网正是我们要面对的未来 ,这在中国尤为明显的。截至2014 年5 月,全球移动互联网使用量占互联网使用总量的25% ,亚洲更是达到 37% 。2014 年6 月,中国手机上网比例首次超过 PC 机上网 比例,手机网民规模增长超八成 。
在移动时代,媒体的疆域也在拓展 。移动媒体等于新闻客户端 吗?当然不是。移动媒体 = 内容媒体 + 关系媒体 + 服务媒体 。从 2013 年开始中国网络媒体发生了 三个方向的转型,即视频化、社交化、移动化,当然这三个方向的转型最终都会落脚在移动化这样一个基本前提上。
在研究中国移动媒体发展趋势之前, 需要了解今天的用户正在变成什么样 。2014 年10 月,企鹅智酷分两轮进行一共涉及 20 万名移动终端用户的调查,调查没有试图覆盖移动用户的全体,而是重点考察 移动媒体的相关使用移动终端的行为,以揭示新闻资讯消费及其相关的社交 、娱乐和其他服务的用户行为偏好 。
·移动终端使用习惯
首先,移动互联网这个概念进入中国的时间并不长 ,但是在短短几年内,使用移动终端的用户已经变成重度用户 ,在被调查的用户中 , 每天使用移动终端超过 5 小时的用户在所有的时长比例中是最高的 , 超过 26% 再加上每天使用 3 - 5 个小时这个区间的用户 。有将近五成是移动终端非常重度的用户 ,近半数用户会在 2 1 - 24 点之间使用移动设备 .他们除了把工作学习之外的大部分时间都贡献给了移动互联网或者移动媒体, 而且从使用时间来看,基本上他们的夜生活都是和移动终端相伴随的。
当用户越来越多地使用移动终端时,他们在看新闻上的使用比例也是超乎寻常的高 。近七成用户更多地使用移动终端阅读新闻资讯,主要依赖电脑看新闻的用户降至不到 一成。新闻的使用在所有用户下 载的 App 中比例是最高的,而且新闻和社交这两个词现在像影子 一样, 很难分离,也就是说所谓的 无社交不新闻 , 在今天的用户身上已经变成现实。
在被调查的用户中 ,在三个问题上回答 ”是"的用户都有将近八 成,
第一个问题:是不是在社交媒体上分享新闻 ?
第二个问题:是不是因为社交平台而增加了某些新闻的关注度?
第三个问题:是不是会因为社交平台的使用而增加对新闻的了解?
对移动媒体用户来说,新闻消费是他们最重要的需求 ,除此之外 ,他们对新闻之外的那些领域有着 广泛的兴趣 ,娱乐当然也是移动媒体的重头戏。在娱乐领域中游戏 、 小说和音乐这几项几乎是差不多的 。值得关注的是在超过 1 0 万名用户调查 中,视频客户端使用者占比仅次于新闻客 户端 ,视频客户端既是播放工具,也是综合媒体。
同时,值得关注的是,今天的移动终端对很多用户来说已经变成他们生活和服务的一个平台。差不多有二成用户在移动终端上有过对娱乐的内容付费的经历,这对相关产业来说是一个好消息 ,他们愿意 为娱乐内容花钱 。但同时也要看到 ,还有 40% 的用户表示,不管是现在还是将来 ,都不愿意花钱买娱乐 ,所以培养用户的这样一种付费习惯,在内容包括娱乐内容这样的领域中, 应该还是有一段路要走的 。当然,移动支付在今天已经变成非常普遍的行为, 2014 年“双十一”的数据就是最有力的证据 。
另外 ,在移动服务领域中,应该说在线教 育 、 在线医疗以及在线商务应该是大有可为的领域 。将近六成网民作这些方面都表现出了兴趣 ,当然还有一些网民已经尝试过这方面的应用了 。今天 ,当服务成为人们越来越多的普遍需求 时 ,怎么样把内容媒体和服务平台打通 ,这可能是在移动终端的媒 体开发方面一 个非常重要的考虑。
•移动时代的场景
今天这样一个所谓的移动时代,实际上也是一个场景的时代 。这个场景,有时候可能偏向空间环境的一种描述和研究,有时候可能偏向人们在某种特定的情境下的行为研究,不管是哪一种,今天网民在 移动终端上的行为都是和具体的环境相依托的 。在今天的移动客户端使用上,除了一般性的休闲时间外,卫生间和床也是人们最常使用客户端的场景 。
近半数用户会在休息或闲暇时间访问移动媒体 。超六成用户会在碎片时间里访问移动媒体, 这些笑话 、 段子等内容的机会笑话 、 八卦、段子不够 “高大上”其实它们已经自成媒体,且广受欢迎 。
移动媒体进一步细分 ,会给文史化带来市场,但亚文化终归是调味料 ,不能成为移动迅速发展的必要条件。
多年前,大家讨论未来网络媒体会不会冲击纸质媒体时,当时有人很自豪地说他可以把报纸搬到卫生间去, 你能把电脑搬去吗 ?当时很难做出评论,但是今天发生了很大的变化, 所谓的卫生间读物正在从过去传统的报纸杂志转变成手机和移动终端 。
另外,在我们移动空间里的场景正在转变为公交的 一个新的情境 。同样地,过去在公交车上 、在地铁上经常看到的大家手捧一本书或看报纸的情境也正在被大家低头看手机的场景所替代 。这是整个移动场景发生的一个很重要的变化, 对移动终端消费者来说,其实有时候可能他们的场景考虑主要是看是不是更便宜 一些,或者手边是不是有电脑 。但是调查也发现,有将近 1/3 的用户会不假思索地在任何场景下 、任何情况下选择用移动终端购物 ,这一点也是超乎想象的 。
1场景的要素之一:
空间与环境移动时代,除了社交成为媒体的新要素, 更应该注意场景这个新要素 。场景进一步细分为两种:第一种是固定场景, 即人们日常生活的环境,与生活习惯相关,是一个 “常量”,这种常量的变化从调查结果来看,过去更多的是在客厅、书房, 现在转向了卫生间、床上这样更私密的地方,这是固定场景中的诞生 。
同时,吃饭 (餐桌)这样过去很少被电脑终端 ”侵入” 的场景,今天已经受到移动终端的普遍干扰 。
移动终端在改变家庭中的媒休使用场景的同时, 也在影响家庭成员的关系,家庭成员之间交流的因素逐渐增多 。如何针对家庭这样的场景开发新功能,弥补断裂的家庭成员关系,促进家庭成员互动,应该是未来移动产品设计的一个重要方向 。 在如今的学校或单位里, 移动互联网的使用已经打破工作与学习场景中本应具有的 “封闭性” 与 “专注性”,使得工作、学习与休息、 娱乐这几者之间的界限被模糊 。这也突显了移动信息消费的碎片化特征。
另一种是移动场景 ,即人们在活动中“遭遇” 的环境 。比如当一个客户在书店时,他是从家里赶过来的, 还是刚才逛了旁边的商场顺便到书店来的,这两种情况完全不同 :他到书店来 是 一个非常认真、非常努力的行为 ,还是很随意的顺便溜达的行为 。因此,对他之前的方位、 之前的需求的了解有助于更好地判断他此时此刻的需求 。接下来往后延 伸,就是把他引导到新的地方去,他看完书以后把他引导到附近的电影院还是径馆.这也是对场景的挖掘 。 这 是今天在做移动媒体时需要进一步研究的方向 ,也是商业应用的方向。
罗伯特 ·斯考伯 和谢尔 ·伊斯雷尔存 《即将到来的场崇时代 》中 写道 :"移动互联网时代,场景 (情境)的意义被极大强化,移动传播 是基于场景(情境)的服务, 即对环境的感知及信息 (服务)适配。与 场景时代相关的五个因素是大数据 、移动设备 、社交媒体 、 传感器 、 定位系统 。” 可见场景应用一定是未来移动媒体的引爆点 。
移动场崇分析与应用分为三个阶段 。第一个阶段 是 :从哪里来, 分析用户此前的空间与当前空间的关联性,分析用户此前的行为与当前行为的关联性 。 第二个阶段是 :现在哪里,分析与满足用户此刻在此场景中的需求。第三个阶段是:要去哪里 .为用户提供行动路线的导航 、 为用户提供新的需求的诱导。
随着信息超载 .越发突显个性化需求,人们移动传播深化, 空间场景成为新变量 ,同时大数据为个性化信息服 务提供)。 “今日头条“ 等推荐试图解决基于个体偏好的个性化。接下来 、 对场景、情境适配的个性化将是新的方向 。。。 比如 Breaki ngNews.com 在客户端应用“让新闻追看用户跑” 的新思维 ,报道中嵌入地理位置信息 ,通过 GPS 找到用户 ,实现新闻精准推送。
2 场景的要素之 二:
用户的实时状态无论是固定场景还是移动场景 ,人们的实时状态都会与空间因素共同作用。用户的实 时状念包括其自身的数据,也包括他们感兴趣的环境信息。过去想要搜集用户实时信息可谓天方夜谭 ,如今可穿戴设备的出现使这个维度的数据采集和实时数据成为现实。
2014 年网络发布的可穿戴设备网络眼 ( BaiEye), 正是试图定位于某些特定空间中的信息采集和个性化服务, 如商场和博物馆 。当人们身在博物馆时 ,他们感兴趣的展品, 与其视线相关,网络眼了解了 用户感兴趣的展品后,可以自动获取与这些展品相关的信息并通过语 音传送给用户。
除了可穿戴的移动设备, 固定设备也能够实时监测分析用户行为 , 如阿根廷公司 Shopperception 通过设置在天花板上的立体传感器,即时了解到顾客看了什么商品、在哪些地方停留 、购买什么商品需要多长时间等移动状态下的用户行为 。
英特尔推出的环境感知营销解决方案, 则将用户实时数据的采集推向了进一步的应用层面 。当一位消费者路过基于英特尔酷睿处理器的数字广告牌时 ,英特尔广告框架技术可分析根据天气、 社交媒体 , 以及包括顾客年龄 、性别和手机在内的信息, 调整内容和用户界面, 使其与受众更具相关性 、更加个性化。
3 场景的要素之三 :
用户生活惯性 人们在各种场景下的需求与行为模式,通常被认为是以往生活经验的惯性延伸 ,而在如今的 DT 时代 ,基于可穿戴设备, 可将用户的生活惯性以更加准确的方式识别、 匹配、分析、储存。
英国维珍航空公司在 2014 勾勺初开展了一项实验,利用谷歌眼镜和索尼智能手表,精准实现头等舱乘客识别,狄取饮食偏好 、上次出行信息、目的地信息等,以快速提供个性化服务。
4 场景要素之四:社交氛围
在 《即将到来的场景时代 》一书中,两位作者将社交媒体也列为 场景时代的一个重要元素,并指出,正是通过在线交谈,我们明确了自己的喜好、所处的位置以及我们所寻求的目标 。这些内容使得技术可以理解 “你是谁”、 “你正在做什么”以及 “你接下来可能做什么 ” 等场景。可见,社交媒体中用户及其相关者的数据分析, 可从另一维度,为场景分析提供支持 。
需要注意的是,场景分析的最终目标是提供特定场景下的适配信息或服务 。服务适配比信息适配的范围更广 、手段更多样 、满足的需求更多元,但无论是对信息还是服务的适配,都与一定的形式适配相 关联。从信息推送的角度看 ,适配不仅意味着内容与场景的匹配,也意味着形式与特定场景下的阅读需求相适应 。
对于移动媒体的内容 生产者来说,如今的一个重要目标是通过自己的努力,将文字的精华,通过其他表现形式,如信息图表和 PPT , 进行提炼与再呈现 。因此,今天的移动媒体的标题中,越来越多地出 现了“一分钟读懂”“两分钟了解”“ 八张图让你知道” 等字眼。当然 , 这还只是移动阅读式的 ,不同场景信息阅读的个性化特点如何在呈现形式上做出述说还需要今后进一步探索。
当移动媒体在内容媒体 、 关系媒体、服务媒体三个方向上拓展时,
移动媒体的主要任务就是完成信息流 、关系流与服务流的形成与组织 。 拥有强势的 “流” 的平台,也就有成为 “入口的潜力”。当越来越多的信息与服务依赖场景这一变化时,场景本身可以成为信息组织、关系组织与服务组织的核心逻辑, 可以成为信息 - 关系 - 服务等几者联结的纽带,场景本身可能成为移动媒体的新入口 。
尽管今天我们讨论场景的意义时 ,更多的是试图把场景的分析作为设计新产品、提升服务质址的依据 。但应该看到的是,移动传播带来的信息消费场景或社交场景的变化 ,并非都是在向着更人性、更友 好的方向发展,甚至它可能是在一定程度上侵蚀人的良好天性, 破坏人与环境 (空间的或人际的)的友好关系 。因此 ,对场景的开发与应 用,也应该保持一定的警惕与节制 。未来的移动服务提供商,未必是要将自己侵入每个场景中的某些时候,场景分析的目标也许并不是渗透 ,而是规避。
C. 大数据技术中,关于用户行为分析方面的有哪些技术
未至抄科技显微镜是一款大数据袭文本挖掘工具,是指从文本数据中抽取有价值的信息和知识的计算机处理技术,
包括文本分类、文本聚类、信息抽取、实体识别、关键词标引、摘要等。基于Hadoop
MapRece的文本挖掘软件能够实现海量文本的挖掘分析。CKM的一个重要应用领域为智能比对,
在专利新颖性评价、科技查新、文档查重、版权保护、稿件溯源等领域都有着广泛的应用。
数据立方是一款大数据可视化关系挖掘工具,展现方式包括关系图、时间轴、分析图表、列表等多种表达方式,为使用者提供全方位的信息展现方式。
D. 为什么要进行用户行为分析
对于C端产品来说,用户就是你的目标,不分析用户,你难道在盲目的自嗨么。所以不以用户利益为目标的产品经都是捣蛋鬼。
E. HCR大数据战略之三:全景洞察的消费者画像模型
当前,基于大数据与标签化思路的消费者画像分析,成为B2C企业深入认知目标消费者特性的重要工具,并在电商、DSP广告等互联网企业发挥作用。越来越多的传统B2C行业,也开始重视其价值。同时,更多的数据资源方(如运营商等)也希望凭借其大数据资源上的消费者画像服务,获得更多的衍生收入。
消费者画像,本质作为消费者研究的一种量化形式,核心问题仍然是消费者的洞察。而HCR作为市场研究公司,在消费者研究方面有着长期的模型积累和经验丰富的研究人员。如今,HCR借助自身研究优势,同时吸取其他系统优点,建立推出真正具有全景、深入洞察能力的消费者画像模型。
HCR消费者画像模型体系由两大部分组成:标签体系与相应的分析模型。首先我们来介绍一下标签体系。
已经完成的标签体系中,设计用户标签近200个(根据业务/.研究深入在不断扩展中),共分为5大类,如下图(限于篇幅图中仅列举部分标签)
数据来源 : 大数据平台部@HCR
HCR用户标签体系所具有的全景刻画能力,主要表现在:
l 提供对消费者更全面的刻画维度。当前众多标签体系(以电商和在线广告为代表)基本是面向精准营销和个性化推荐为目的,虽然也号称全景,但实际标签集中于购买兴趣/爱好和消费倾向这些与后续营收相关的用户特性。而这只是HCR用户标签的一个子集(第四大类)。仔细研究HCR的标签体系你会发现,除了兴趣爱好外,HCR的基本属性、社会/生活属性与行为习惯的相关标签类,真正从消费者实际日常生活的更多基本角度(如健康/车辆使用/住房/移动通信/居住/日常交通等等)全面立体地描述消费者的特性。
l 标签的刻画粒度也更加细化。比如年龄段,常规的多采用70后/80后/90后这样的划分原则,而HCR除此之外还能提供更多描述粒度,如中学生/高中生(甚至高三学生)/大学生… 这对发现和细分目标用户更有价值。
而HCR用户标签的深入洞察能力,则主要表现在:
l 更加丰富的标签体系带来更多洞察可能,但这还不够,HCR首创引入了心理学属性标签(第五大类 共30多个),融合了消费者研究的思想,以生活方式/个性/价值观等深层标识,来揭示消费者的内在特性,使得我们能够深入探查消费者的本性,也使得画像结果有更泛化的应用价值。
l 更深入的算法模型。基于标签体系上的分析算法模型,在标注精度和广度上都有了更大进步(见后面详细介绍)
l 标签的标注结果,加入程度指标来细化,这样更准确地区分消费者对某种特性的贴近程度(如爱好游戏可分为轻度、中度和重度三种程度)。这对于更准确地理解消费者大有帮助。
与标签体系一样,HCR的标签分析模型也具有独特而有效的的分析方法。
l 主要通过行为类数据为分析依据
在标签分析中,主要借助行为类大数据(而非直接的属性数据)来推演得到相应结果(如不是基于客户身份证信息推导其性别标签)。 这样的方法,难度大,需要对行为理解更深入,但可以避免涉及大量用户敏感信息,同时也更具有更好的适用性。
HCR认为,用户的行为数据(当前主要为线上行为)主要由下几种行为场景模式组成(这里浏览包含网页与视频)。当市面上大多数标签研究聚焦于搜索/浏览和购物行为数据时,我们选择了手机App使用行为这个独特的突破口。
数据来源 : 大数据平台部@HCR
HCR消费者画像分析团队由HCR资深消费者研究员与大数据平台部挖掘算法人员组成。双方配合探索研发兼具研究与技术分析优点的可计算模型。
n 行为规则库抽象用户行为模式: 因为消费者的日常行为会反映其个人特性(标签),因此通过行为模式的推理就能为消费者打上相应标签。相比其他方案,HCR通过研究员团队,,把消费者行为推理思路进行抽象,得到可以用于自动分析的方法规则,记录到规则知识库。该规则知识库是对消费者研究的经验浓缩,覆盖大量常规行为场景,并具有相当的洞察深度(如可以推演出生活方式等深层次标签),这是当前基于纯技术驱动的分析方法所无法做到的。
n 规则推演引擎自动分析常规标签标注:基于分析规则库,挖掘算法人员研发了智能推演算法与自动处理程序,可快速计算消费者相关行为的统计/分布特性,并结合规则库自动计算得到消费者的标签(以概率值形式代表可能性)。自动推演引擎解决了符合规则特征的海量用户的标签快速推演,模式具有独创性,相关算法正申请专利中。
n 机器学习算法给更多消费者打标签。实际分析中,很多标签所对应的行为特点是隐性的,无法被发现和规则抽象。此时,挖掘算法人员进一步通过机器学习算法(有监督学习加推荐计算),通过已标注标签的消费者的行为特性,来推导大量未标注/新用户的特性标签,。这种机器学习的模式通过已分析消费者的结果,极大扩展了标签可标注的用户范围。
在初步建立相关分析模型后,我们对移动互联网用户的App使用行为大数据进行了标签分析的初步试验。目标数据来自HCR HiMobile业务的数百万移动互联网匿名用户的长期(2个月连续)App使用行为,共300多亿记录),得到了良好的效果。下图是其中某匿名用户分析得到的实际画像结果,非常具有代表性。
数据来源 : 大数据平台部@HCR
从图里可以看出,该匿名属性用户的特性通过行为已被画像结果有效勾勒出来(所有标签通过可信度概率标示,右侧灰色内容为分析得到的心理学属性标签)。无论目标描述的特性范围和深度,都比其他系统有较大的优势。
在大数据产业链中,HCR的定位是数据洞察者。而消费者画像分析作为典型的研究洞察服务,将逐步成为HCR的核心竞争力,在未来得到不断地加强和广泛应用。主要的应用模式包括:
l 作为HCR所有消费者研究业务的基础分析功能,帮助研究员在研究业务中洞察消费者的群体/个体特性。
l 为具有消费者画像能力的企业(如电商),提供更多角度的用户画像分析结果,作为其自身用户画像的有效补充,从而大大增加其产品推荐的精度与适用性。
l 为具有用户行为大数据但缺乏用户画像能力的大量B2C企业(尤其移动互联网企业),以标准化API的方式,提供快速的标签化分析服务,帮助企业轻松获得用户标签化分析能力,从而将分析结果轻松应用于后续的业务服务中
在后续的研究工作中,HCR的消费者画像团队将继续完善现有行为规则库和算法模型。并针对更多行为数据空间(如搜索和浏览),扩展标签的分析能力,力求使HCR消费者画像分析成为最具竞争力的消费者洞察服务。
F. 用户行为特征
用户行为特征
用户行为特征,对于运营来说用户的行为是需要关注的一个点,很多时候用户的行为决定了一个网站甚至是一个软件能否继续运运营下去,所以通常都是要对于用户行为特征进行一个分析,下面一起看看相关内容。
用户行为是用户在产品上产生的行为,实际表现为相关的用户数据。产品经理运用不同分析方法对不同数据进行分析,进而为产品迭代和发展提供方向。
一、用户行为是什么?
1、用户行为
用户行为是用户在产品上产生的行为。我们以小明的case具象化用户行为表现:
因为小明关注作者的信息被记录了下来,当该作者有发布信息时,则会通知所有关注他的人,而小明也是其中之一。
小明关注作者的信息记录,则是行为数据。小明的行为数据会有 启动app、浏览、查看图集、播放视频、点赞、关注作者……
2、用户行为数据
用户行为数据是从一次次的行为中而来的,行为数据是通过埋点进行监控(相见埋点介绍)、后续一篇文章将介绍如何(设计埋点)。通常是数据同学完成埋点设计,由开发完成监控程序 或 调用SDK。针对小明的行为(假设以下均已埋点):
3、用户行为分析
是指对用户行为数据进行数据分析、研究。
4、用户行为分析的作用
(1)通过用户行为分析,可以还原用户使用的真实过程。
一个xxx的人在什么样的环境中(由于什么样的行为)在时间点做了xxx事情做了什么事情结果如何
(2)“了解用户,还原用户”是“以用户中心”的第一步。只有详细、清楚的了解用户的行为习惯、真实的使用路径、进而找出 产品使用、渠道推广等过程中存在的问题,提高用户/页面/业务过程中的转化率。
(3)用户行为分析(case需要补充)可以用于
A、拉新:渠道分析、SEM分析、用户质量分析、
B、转化:新增用户注册转化过程、产品使用过程转化(搜索、推荐等)、push推送调起过程、站外拉起过程
C、促活:用户停留时长、用户行为分布、
D、留存:用户留存分析
E、商业化:根据用户历史行为展示广告
二、如何进行用户行为分析?
1、行为事件分析
行为事件分析方法主要用于 深度研究某行为事件,以及对产品的影响以及影响程度。
针对某一具体行为,全面的描述、对比,针对其异常表象 深度下钻分析各维度、确认导致该行为数据表现的原因。如快手的播放量徒增:同期对比分析,确认历史上是否有发生过,对比 去年/上个季度/上月/上周/昨日的 数据的相对表现。多事件对比分析。对比浏览量、点赞、评论、分享事件的数据是否存在徒增。通过对比多个事件,确认徒增现象发生的范围。维度下钻:由于播放量取决于3个部门用户在快手消费视频,被监控程序上报。
所以在三个方面分析:
监控程序是否异常?在快手哪个页面的播放量增加呢?是发现、关注、还是同城?-> 对应页面做了哪些调整?是否增加了引流;哪一部分用户群的播放量增加了?交叉分析 用户自然属性(平台、性别、年龄、地域、教育学历、机型、消费能力)、行为属性(新增、回流、常活跃用户;直播用户、短视频用户…、)、视频属性(视频类型、作者类型…、)
2、留存分析
留存是衡量用户是否再次使用产品的指标,也是每一个app赖以生存的指标,能够反映任何一款产品健康度,是产品、运营、推荐效果的整体表现。如果一个app从来没有留存用户,那DAU将永远是新增用户,那么产品将无法运行下去,更别说新用户成本付诸东流。
贴合业务属性、精细化留存过程 将对留存数据更有价值和指导意义。通过留存分析,能够剖析用户留在产品的原因,从而优化产品核心功能提升留存。
留存的类型:
用户留存:用户使用app后,经过一段时间仍旧使用。功能留存:用户使用xxx功能后,经过一段时间仍旧使用该功能,且其他功能均有所变化。此时,该功能对用户留存有正向作用。先前有写过 留存分析的文章,这里就不赘述了。
3、漏斗分析
漏斗分析实质是转化分析,是通过衡量每一个转化步骤的转化率,通过转化率的异常数据找出有问题的环节并解决,进而实现优化整个流程的完成率。
在产品初期(处于与市场适配的阶段):通过漏斗分析找到用户触达的瓶颈,帮助用户触达产品核心价值,真实反映MVP与市场匹配程度;在产品中期(处于用户平稳增加的阶段): (1)通过漏斗分析优化渠道,找到目标群体用户; (2)通过漏斗分析优化用户在各模块的体验(基础的登录模块、产品核心价值模块: 如抖音的播放模块、淘宝的购买模块等);在产品后期(处于用户价值产出的阶段): (1)通过漏斗分析可以改善用户生命周期(优化用户体验提高用户生命周期,间接拉长用户群体的价值产出的时间长度,减少高价值用户群体的流失);(2)可以通过漏斗分析优化商业化模块,像商品的购买过程(购物车-提交订单的转化漏斗)、广告的曝光点击等,提高生命周期中单位时间产生的价值。
4、路径分析
路径分析可以将纷杂的app日志按照用户的使用过程,呈现出“明确的”用户现存路径。发现路径问题,进而优化,使用户尽可能短路径体验到产品核心价值。
通过路径分析,可以了解到像小明这样9点左右播放视频的用户:他们是通过push点击而来,这部分用户占比是多少;他们匆匆结束播放,再也没有下一步行为,这部分用户占比又有多少。针对他们利用碎片化时间播放视屏的场景,尤其是突然退出的'场景,是否在下一次打开app时,仍旧打开终端的视频。是否有其他策略可以针对该场景来优化?
此外,路径分析不仅仅可以用于行为路径分析,也可以用于用户群体转化分析。例如:新用户中分别转化为 忠实用户、常活跃用户、潜在流失用户、流失用户的分析。
5、用户分群分析
通过了解用户画像,可以帮助运营理解用户。根据用户画像(基本属性、用户偏好、生活习惯、用户行为等)的标签信息将用户分群。
通过用户分群行为表现对比,可以进一步了解不同群体对产品的反馈,有针对性的优化产品。
发现中 西南地区的低端机型使用app时,奔溃率特别高,开发可以针对该点进行优化、降低奔溃率;可以针对不同的用户群体的行为表现 做 定向投放、push等,从而实现精细化运营。业内的商业化行为分析产品,基本上将用户画像的生成、标签的过程均合并在用户分群的群体定义中,降低了操作流程。
三、用户行为分析的完整链路
以小明为case的用户行为每天数以万/亿计的产生,如何对“这类人群”进行“行为分析”?需要行为分析将明细级别的日志聚合后再以较为可读的形式展示出来。
为了保障埋点可靠、数据上报及时、行为数据分析有效。需要一套完整的用户行为系统,包括从数据埋点设计、埋点开发、数据上报、数据模型开发、行为数据分析。 过程中也需要多方协作完成,如何保障多方协作中高效、便利的完成、产出具有业务价值的数据分析结论。后续将介绍服务于用户行为分析的相关平台介绍。
一、什么是用户行为
中国有句古话“天地四方为宇,古往今来为宙”,这句话揭示了空间和时间的概念。我们要想透彻地研究任何事物,常以时间和空间两个维度来考虑。分析用户行为也不例外。
换句话说,用户行为的研究内容可以按照时间和空间维度展开。
从时间的维度来看,按照管理学大师菲利普科特勒的理论,用户的行为轨迹包括:产生需求、信息收集、方案比选、购买决策;购后行为5个阶段。其中购后行为包括使用习惯、使用体验、满意度、忠诚度等。
从空间的维度来看,用户行为的构成要素包括5W2H,例如我们要全面描述用户在购买阶段的行为,就要回答这样的问题,谁(who)?打算在什么时候(when)?什么地方(where)?买什么东西(what)?产生需求的动机是什么(why)?打算买多少(how much)?如何买(how)?同理,在使用阶段也可以从这7个要素来描述。
5阶段和7要素的结合,形成了用户行为分析的研究体系。这个体系细化了用户行为的研究内容,基于这些内容,就有了用户调查问卷的一些基本的问题。
二、为什么分析用户行为(Why)?
之所以分析用户行为,是为了找到用户行为的特征,从而为企业的经营提供支持。
大家想想,用户行为具有哪些特征呢?
Q1: 用户行为是同质化的,还是差异化的?
A1:差异化的,因此用户行为具有差异性
Q2:用户行为是静态不动的,还是动态变化的?
A2:动态变化的,因此用户行为具有流动性
Q3:用户行为是相互隔绝的,还是相互影响的?
A3:相互影响的,因此用户行为具有传播性
差异性、流动性和传播性是用户行为的三个显著特征。那么,这些特征具体是如何表现的,分析这些特征对企业的经营有什么作用?
这里我们只谈差异性,后面的博文中会谈流动性和传播性。
用户行为从时间和空间的维度,分为5阶段7要素。因此用户的差异性,就表现在这5阶段和7要素上。例如,在产生需求阶段,用户的需求动机why不同。同样是买电脑,有的是为了工作、有的为了学习、有的是为了消遣;再比如,在信息收集阶段,用户的信息收集渠道where不同。同样是买房子,有的看网络广告;有的听朋友介绍;有的到现场采点。
这里只举了两个阶段,你能说出在其他阶段用户的差异性表现吗?
意识到用户的差异性,企业的营销工作就不会搞一刀切,就不会拿大炮轰蚊子,而是会进行市场细分和目标市场选择,然后针对目标用户进行精准营销。这种精准营销体现在市场定位、竞争战略选择、品牌形象和营销组合等很多方面。
三、如何分析用户行为(How)?
这里我们只谈差异性,后面的博文中会谈流动性和传播性。
我们前面谈到因为用户行为具有差异性,因此需要进行市场细分和目标市场选择,那么如何进行市场细分和目标市场选择呢?
市场细分的思路是看看从哪个维度切分市场,使所分得的细分市场内部具有的共性,细分市场之间具有个性。从哪个维度切要结合企业所处的行业特点的。例如食品市场,地域差异比较明显,南甜北咸东辣西酸,所以食品市场可按地域分;服装市场,性别差异非常突出,男款少而精;而女款多而靓,所以服装市场可按性别分。此外二八原则,也广泛用于市场细分,即我们可以按重要程度将用户分为大中小三类。重要性可以有很多评价指标,比如规模、综合实力、业内影响力、对企业的贡献率、在同类产品上的总投入等等。
将市场划分成几个细分市场后,企业就面临着目标市场选择的问题。如何选择目标市场呢?这是一个团体决策的过程,在选择目标市场时往往需要企业的管理人员和骨干营销人员坐在一起讨论来确定。讨论共有五步进行
第一步指标的选择需结合企业自身的实际情况。例如,我是大企业,规模经济是我的优势,那市场规模就是我选择的重要指标;我是中小企业,我要更关注竞争的激烈程度,因为竞争太激烈了,我可能无法存活。因此,竞争强度就是我选择的重要指标。
第二和第三步确定优先级和为指标打分的方法可参考小蚊子的《谁说菜鸟不会数据分析》中的权重确定方法
第四步的综合得分是第二步和第三步的结果加权平均得到。
第五步选择目标市场可以企业适应度和市场吸引力为横纵坐标,得出各个细分市场在四个象限中的位置。
中国移动互联网市场经过几年的高速发展,增速已经明显放缓,人口红利逐渐消失。移动互联网进入了下半场,市场竞争已经从增量用户竞争逐步转化成为存量用户竞争。同时伴随流量红利消失,数据红利时代已经到来,流程驱动性公司正转变为数据驱动的数字公司,竞争从同业蔓延至异业竞争,跟随用户,跨场景地满足用户的需求将会成为数据红利时代最核心的诉求。
如果说数字化转型不可逆,那么对于用户的精细化运营将会是数字化转型的支撑点之一。要实现对用户的精细化运营,必不可少要对用户行为进行分析。比如对网站、APP等渠道的用户行为数据进行采集,对获取到的用户行为数据进行多维度、多角度对比分析,用以指导提升获客效率、优化产品服务和用户体验,以数据驱动业务持续增长。
但目前来看,距离要实现这一目标,还有一定的差距。由于日常工作中,大家的分工不同,仅关注某一个方面的数据显然不够,无法全面了解产品运营情况,更不能提出行之有效的分析建议。
现在的情况是在公司内,业务部门想要看数据,会先提出自己的数据需求,这时候需要找到技术人员或者数据分析师,根据需求写SQL将数据从库里提出来,交给数据分析师进行分析,形成对应报表之后,再发给业务部门查看,完成整个过程没个三五天搞不定,数据分析的时效性大大降低。
企业采用用户行为分析工具,可以让产品、运营、市场、数据等业务部门更方便的分析数据,让技术部门日常面对的零碎需求更少,能把等多精力放在建立数据仓库等核心工作上。
当我们在做产品开发或者产品运营时,通常需要第三方工具去做用户行为分析以提供数据支持。因此免费产品的试用成了大家在前期选择工具的必要方式。为了方便大家对目前市场上的用户分析工具有一个清晰的了解,我们在试用了大量的工具后,分别从数据接入、数据分析、安全与拓展几个方面进行了综合分析。
许多人都在问,市场上有没有免费的用户行为分析工具,答案是有的!不过各家各有特点,国外知名用户行为数据分析工具像Google Analytics(以下简称GA)、Mixpanel,国内有网络统计、易观方舟Argo、友盟、TalkingData免费版(以下简称TD免费版)。
01、数据接入
谈到数据接入,首先需要说明的是几个产品在数据模型上的差别。
GA、网络统计诞生于传统PC互联网时代,都是以传统的页面浏览(PV)和用户会话(Session)为核心。其中GA经过多年演进,增加了一些关于事件分析和自定义属性的内容,但本质上主要还是服务于页面类的产品。网络统计还是依然只支持页面和会话统计。
随着移动互联网时代到来,用户的行为触点变多,以往以页面和会话为中心所能采集到的结构化数据颗粒度不够细,页面和会话模型已经不适用了。因此,基于“用户+事件(User+Event)”模型出现了,在分析的时候可以完全自主的定义需要分析的事件,并从不同的属性维度进行交叉分析。刚推出不久的易观方舟Argo,以及Mixpanel、友盟、TalkingData免费版都采用了 “用户+事件”模型。
在埋点方面,目前根据埋点的工具和方式,可以划分为三种类型:代码埋点,可视化埋点和全埋点,并没有说哪一种方式能够碾压其他几种,因为都各有弊端,具体的各种埋点方法的分类与优缺点我们也做一下对比:
下面我们看一下市面上几家免费的数据分析产品之间在数据接入方面对比。需要注意的是由于GA、Mixpanel都是国外产品,在数据采集的规则适配了iOS、Android的设计规范,但国内开发者常常直接忽视这些设计规范开发产品,而GA、Mixpanel在数据采集上没有针对国内产品的特点进行优化,因此在数据采集的准确性上可能会受到一些影响。
另外,需要提到的一点是Mixpanel和易观方舟Argo的数据采集SDK开放了源代码,一定程度上可以打消企业在数据采集安全方面的顾虑。
02、数据分析
数据分析是用户行为分析工具的核心,除了网络统计以外,其他几款产品都可以满足用户行为数据分析的基本需求,但在功能的丰富程度上不尽相同。具体对比可以看下表。
从分析模型丰富程度上来看,Mixpanle和易观方舟Argo是里面功能最全的,堪称全家桶,唯一遗憾的是目前易观方舟Argo目前尚不支持热图分析。比如最常用的“事件分析”这个功能,不止可以从PV、UV等方面进行分析,还可以根据不同的属性值设定具体的指标按照不同的维度进行对比,功能非常强大。
从数据准确性上来看,GA在算法的严谨性上应该是最好的,但如果用户或者事件量比较大的时候,会采取抽样分析,可能会影响到数据的准确性,Mixpanel的免费版本也会存在类似的问题。易观方舟Argo在这方面表现抢眼,在数据计算上支持秒级实时数据分析、自定义指标、多维多人群指标对比、人群交叉分析、智能分析、数据实时回传、即席数据分析等。
从数据管理、项目管理、权限管理这些常用的管理功能方面来看,几款工具都提供了比较友好的支持。但仅有友盟+提供了手机app,可以随时通过手机查看监测的数据情况,易观方舟Argo支持通过手机浏览器访问查看数据看板。
另外,值得一提的是易观方舟Argo里面的用户运营和触达功能。目前易观方舟Argo可以在完成用户分析与分群后,通过邮件、短信、Push消息等方式对目标用户进行触达,还支持配置UTM追踪参数对广告进行跟踪。
03、安全与拓展性
企业级产品在数据安全性和可拓展性上,需要提前做一些考量,几款产品也各有侧重,具体对比情况如下表所示:
(点击图片可查看清晰大图)
GA免费版 和 Mixpanel 提供的都是SaaS服务,但因为服务器都在国外,在国内使用起来稳定性和刷新速度上可能会有一定的影响;网络统计、友盟统计、TD免费版基本上都是SaaS服务;易观方舟Argo提供安装包,可由企业自己私有部署,如果对数据安全有顾虑,易观方舟Argo是个不错的选择。在服务方面,除了GA和易观方舟Argo可提供社区服务支持以外,其他产品目前还没有完善的用户服务支持。
总结
对比来说,刚推出不久的易观方舟Argo,在数据采集、数据分析能力上,已经可以满足产品数据和用户行为数据分析的需求,而且提供了独家的一站式用户运营和用户触达。与目前其他国内的免费工具产品对比来说,易观方舟Argo在颗粒度细致程度、分析模型全面性、系统性能方面表现优秀。
目的,大多数成长型团队、创业团队的市场及运营预算都相对紧张,每一分投出去的钱恨不得立马知道什么时候能转化回来,如果自己搭建一套完整的数据分析平台要花费的功夫肯定不少。相信更多性能全面的用户分析和运营分析工具的免费开放,能避免企业在市场运营方面走弯路;也能解放团队更专注的在业务上,通过用户行为分析提升营销效率、优化迭代产品、留住更多用户,真正用数据指导和驱动业务。
最后,这次选型过程中,在易观方舟Argo社区交流感受较好,现在市面上能见到的免费工具产品不少,但真正形成自己技术服务社区的不多。相信未来他们能把这个社区做的更好,就像当年小米运营MIUI做社区一样,能给广大的技术宅和数据爱好者提供一个炫技、PK、互助的圈子。
G. 大数据在互联网用户系统中的应用
大数据在互联网用户系统中的应用
但是对于今日的互联网和移动互联网,大数据的规模和应用深度早已不次于传统的电信、民航等行业,甚至超过不少。因此笔者还是想写些东西浅谈一下互联网的大数据应用,权当抛砖引玉,也希望更多的朋友参与交流和讨论。
首先,第一篇想谈一下互联网的用户系统。无论互联网还是移动互联网,本身具有很大的特性就是互联,所以我们都可以称之为互联网,或者说移动互联网是互联网的一个子集和延伸。
在传统的电信、民航、能源等行业,企业的客户和主体用户构成都是有身份ID的。比如电信行业中身份证登记的手机卡号,比如民航用户乘坐航班登机的身份证或护照信息等,这些信息可以作为基本的用户身份ID,便于企业对其用户、客户进行身份辨别,并对后续的用户行为进行跟踪和分析。传统企业所存储的用户信息的很大优势在于完整性,很多先天的比如姓名、性别、年龄甚至籍贯等真实的基础身份信息都可以简单获得。而在互联网上,用户的访问都是匿名的,即使用户在接入互联网的时候使用的登记信息是实名的,但那主要是提供给电信服务商和公共安全机构备案而用。普通的互联网网站在用户面前是完全透明的被"围观"的,这个状况在web1.0 的主要产品--门户网站中最为典型。到了web2.0 时代,互联网开始变得互动起来,用户从简单的匿名浏览,变成了可以通过注册身份参与信息的制造和流通。这个时候,诞生了这个时代在谈的互联网大数据应用中非常重要的一个非决定性条件--用户身份系统。为什么说是"非决定性条件"呢?因为,在这之前,大量的数据分析也是可以做的,但是由于对用户缺乏身份缺乏甄别,因此数据分析能够应用的场景和得到的数据都相对很有限,但并不代表不能做大数据分析。而web2.0的用户身份系统诞生,则使互联网某种程度上具有了和传统行业同样的用户身份记录系统,数据统计和分析都可以更精准和深入。其中,以腾讯QQ、新浪UC等PC桌面产品为代表的互联网早期产品,应该是建立了互联网更早的用户身份系统,我们也可以看到这些系统在其后续的web产品铺开时同样被继承了过来。
那么,互联网的用户身份系统,一般都具有哪些信息呢?
打开任何一个网站,我们都可以看到注册页面需要填写用户名/email,性别,年龄 等基本信息。当然,不同的网站和互联网产品有不同的用户资料细化的程度。拿现在比较流行的几款产品做比较,其他互联网产品大多类似:1.新浪微博中用户可以填写自己的昵称、头像、真实姓名、所在地、性别、生日、博客地址、email、QQ/MSN、自我介绍、用户标签、教育信息、职业信息……;2.腾讯QQ客户端上可以填写头像、昵称、个性签名、姓名、性别、英文名、生日、血型、生肖、故乡、所在地、邮编、电话、学历、职业、语言、手机……
看起来还真不少,那么网站要用户的这些信息会被干嘛用呢?
这里笔者刘三德认为主要有以下几点:1. 展示自我;2.作为唯一的身份ID用作用户身份区别;3.搜索和推荐相关;4.网站自身可以做用户分析和用户行为跟踪。展现自我放到第一位是因为这是从产品满足用户需求的角度决定的,用户资料的首要任务就是为了作为用户唯一的可识别身份标识展示自我。其次,搜索和推荐相关这一点笔者刘三德计划在后续用专门的篇章来写,此处简单理解即可。最后一点,也就是本文所关注的一点,就是用用户身份来做数据分析。涉及到的用户分析主要维度为用户资料和用户行为。同样,用户行为也计划在后续篇章专门来写,本文着重讨论一下用户资料的分析。
可能行业内的一些文章和老前辈的观点,数据首先要量大、其次要有高的复杂度,才可以称为大数据。但笔者认为,大数据在一维的层次上不一定具有很强的复杂度,大部分是由最简单的数据形式构成。就譬如用户资料,一个网站如果有一千万的注册用户,如果每个用户的资料具有6个有效字段,就是6000万的有效数据。而将这6000万的有效数据通过一层或者几层简单的统计叠加分析、交叉分析等,在计算上本身就具有了不小的复杂度。何况现今的互联网产品,尤其社交类产品如FACEBOOK,腾讯QQ、新浪微博等动辄上亿的注册用户,本身用户系统就是一个非常具有价值的大数据。[page]
通过分析用户系统可以得到什么呢?
当然,用户填写的注册资料中包含的资料,都是最基础的分析数据。还是用数据说话,如下图:
以上图片来自互联网
以上数据是第三方机构公布的,而且都是最简单的一维数据,我们可以看到很多家网站的用户资料对比(上面引用的部分数据来源也可为线上调查问卷等形式)。对于独立的一个网站来说,用户资料的分析当然只是局限在自己的网站范围之内。进入互联网web2.0时代以后,大家都开始更加重视用户和用户体验,对于网站自身用户的特征进行分析,可以更好的网站的用户特性分布,方便针对网站的用户群特点更有针对性的进行对应的产品设计和研发。比如通过了解用户的消费层次等,也可以更好的提供用户消费相关展示和服务。
那么,无用户身份信息的互联网是否不再大数据?--不用注册的用户身份系统的。
可能有的朋友会对这个话题存疑问,也可能有的朋友会惊恐,认为隐私泄露了,其实这里的应用也非常简单。在类似传统的web1.0 门户类以展示为主的互联网产品中,也是可以做数据的分析和挖掘的,而且也有比较成熟的方案。是否有朋友曾经经历过以下场景:在网络上搜索汽车、查了半天汽车资料,一个小时以后再随手打开的一个图书阅读网站上居然出现了"汽车广告".其实,即使我们没有在这些网站上注册,网络等搜索引擎本身还是可以为用户标识一个唯一的身份信息,虽然这个身份信息只是临时的,可能有效期也只有几天左右。但是,这依然是一种唯一的用户身份,只不过是记录的信息有限而已,但是仍然为用户行为分析提供了很大的帮助。感兴趣的朋友可以搜索"google adsense隐私政策" 进行相关了解,此处不在赘述。
用户资料系统方便了一系列的大数据挖掘
除了传统的互联网桌面端和web端产品,最近几年突飞猛进的移动互联网以及终端应用,基本也都有完备的用户信息系统。apple苹果公司做了app store,迄今为止的应用下载次数突破250亿次,而每一次的下载都需要使用唯一的用户ID,通过分析,苹果可能比你父母更加了解你想要什么--这属于用户行为分析范畴,后续将专门讨论。
总之,用户身份和资料的分析是互联网大数据分析中最基础的分析,用户身份系统在互联网的大数据时代,为后续的用户行为分析和对应的企业产品、服务设计提供了基石,也为更加深入的数据挖掘奠定了基础。
H. 大数据的价值如何体现
大数据的价值如何体现_数据分析师考试
进入大数据时代,运营商应用大数据发展的驱动因素是什么,是否需要建立新型数据库? 刘伟光: 随着通信行业的竞争日益激烈,传统的语音和短信等主营收入的利润不断下滑,导致运营商必须找到新的利润增长点,同时有效控制运营成本,从而使自身可以在激烈竞争中立于不败之地。这也是为什么运营商把实现精准化营销和精细化运营提升到战略层次的重要原因。
此外,传统数据库技术已无法满足运营商对大数据充分利用的需求。新型数据库应该具备如下特点:首先应该采用支持大规模并行处理的分布式架构;其次,应该使用基于符合工业标准的开放硬件和系统平台,保证成本可控;第三,随着开源技术不断成熟,创新速度快,新型数据库平台应该易于与新的开源技术进行融合;第四,新的数据库平台应该可以实现与Hadoop平台的无缝集成,实现跨结构化、半结构化、非结构化海量数据的混合分析能力。 卢东明: 运营商目前试图做新型数据库,但是不太现实,首先数据库公司一直以来都是很稳定的几家,需要长期积淀。
其次,大数据不是取代以前的技术,而是混合补充使用,不是新型数据库出来后,就完全替代传统数据库从而大规模使用。数据库是核心、稳定的技术,大数据是开源的软件技术,运营商还是会选择使用相对成熟的软件。 《通信世界周刊》: 大数据今年以来得到格外关注,目前发展状况如何? 卢东明: 大数据在运营商的业务中早就有应用,目前在各个省都得到普遍应用了。大数据这个词目前有些炒作成分,它和以前的数据库不是完全脱节的,是对数据库的延伸。大数据是个现象,是数据库的另一个形态,不是否定、颠覆之前的数据库形态。
目前做大数据的厂商依然是以前那几家数据厂商,不同的产品解决不同的问题。在中国电信行业,从数据量和应用角度来看处于世界领先地位,这是由于电信用户多、规模大,电信业遇到的问题和挑战比较大,解决方案难度高。 刘伟光: 目前中国三个电信运营商在业务支撑领域、网管IT支撑领域包括增值业务领域,已经随着市场的需求推出了很多新的大数据实时分析的项目,相信未来的两到三年这个市场将会成倍增长,甚至会到达我们今天不能预期的数量。 需要分析共享大数据的管理工具 《通信世界周刊》: IT企业如何依托大数据为运营商提供管理工具,提升运营效率? 刘伟光: 实现各部门的紧密协作永远都是提升运营效率的不二法门。而IT企业应该为运营商提供实现紧密协作、分析、共享大数据的管理工具,来达成提升运营效率的目标。
此外,大数据时代,IT企业仅仅为运营商提供分析平台、分析工具是不够的。这是因为运营商虽然很了解业务和需求,但普遍缺乏数学建模能力,因此很难利用好这些平台,使其发挥最大效益。所以,如何利用这些平台、系统和数据实现科学建模,同样是提升运营效率的关键所在。 武新: 运营商要解决数据处理效率问题,现在的数据用以前的系统处理需要一天一夜,而应用大数据技术处理可以一个小时完成。在大数据平台,应用云技术,通过集群的方式,几十台服务器同时工作,并进行压缩数据来节省空间。
目前大数据主要是针对结构化数据的应用,用户上哪个网,停留多长时间,通过分析都可做相应的分析结果推送给相关部门。除了对用户上网行为分析,还有网络使用情况、网络设备情况和用户使用手机类型分析。而对非结构化的数据,如视频和图片,目前分析得还较少。 《通信世界周刊》: 大数据具体应用于运营商的哪些业务中,有哪些成功的应用和案例? 卢东明: 大数据主要应用在运营商的“信令”系统分析上,由于其数据量非常大,比“话单”分析的挑战大很多。移动互联网发展起来之后,运营商开始关注大数据,进行“用户行为分析”,根据人群分析做精准营销,推荐流量套餐。
此外,运营商提供IDC服务,通过“云”中心的方式为互联网企业提供服务。 武新: 运营商从最近两三年开始,感受到这方面的压力,开始寻求解决方案。中国移动“信令”分析系统项目对海量数据进行分析和挖掘;中国联通对“话单”数据进行用户行为分析。中国电信“新一代数据库”产品正在测试中,通过精分系统,进行精准营销。此外,在运营商专网也已应用大数据。运营商目前仍处于测试探索中,通过几种方法针对不同的应用进行测试、筛选。
目前运营商的相关项目有“流量分析”、“智能管道”和“新一代数据库”产品等,传统的数据库面对海量数据已经无法支撑,将来会慢慢被大数据代替掉。 要有开放的心态 《通信世界周刊》: 发展大数据需要解决哪些问题,关键点是什么? 卢东明: 由于数据分析要看存储效果,涉及到效率和速度。目前运营商应用大数据存在的问题是避免无限制的花钱。另一方面,运营商要和厂商合作,针对不同的业务类型和应用场景,采取不同的分析方法。此外,运营商要有开放的心态,因为大数据作为开源的软件也不是可以解决所有的问题的。 武新: 在数据处理上,运营商转型中不仅有技术上的问题,还需要经历一个时间阶段和过程。
此外,运营商要转变思维方式,其在数据分析上的经验不如互联网企业,这是方法论问题,关系到如何用数据做生意。运营商以前都是依托传统业务,海量数据的出现,使得行业即将洗牌,运营商不得不转型重视数据挖掘。 但运营商可以发挥自己的优势,首先,要分析用户行为的变化,由分析以前的语音用户转变为分析上网行为。其次,运营商有能力提供类似互联网公司的服务,如QQ聊天。
最后,运营商有专网资源,有自己的数据中心可以运维,但是目前这些优势还没有完全发挥出来,是因为还没把握透用户的需求。
以上是小编为大家分享的关于大数据的价值如何体现的相关内容,更多信息可以关注环球青藤分享更多干货
I. 什么是用户行为分析怎么做用户行为分析
第一个问题,什么是用户行为分析:
过去的用户行为分析普遍的问题是:分专析不聚焦、采集不全属面、开发周期长、完全依靠人工埋点、事后分析、维度单一、指标传统。
所以当下可以把用户行为分析定义为:基于用户生命周期管理模型、全面采集所有数据、事中分析、提前预测、实时多维组合、科学维度划分、自定义指标的分析。
第二个问题:怎么做用户行为分析
你提出这个问题,证明你可能暂时没有数据分析团队,或者数据分析团队尚不成熟和完善,所以需要开展数据分析工作的话建议是借助第三方的平台。
这一块业务目前国内已经相对成熟,也有很多不错的合作伙伴可以选择了,硅谷的明星公司可以选择Google Analytics或者Mixpanel等,不过我最推荐的还是国内的数极客。
具体如何开展,我个人的建议是:
选择采用AARRR模型的平台,通过对用户全程行为的跟踪,让我们在经营中运营中,拥有Acquisition(获客)、Activation(激活与活跃)、Retention(留存)、Revenue(收入)、Refer(二次传播) 全程数据分析功能。
J. 大数据之如何进行“用户行为分析”
而消费者们作为这场游戏中的弱者,不断地被这些真假价格战挑逗着和引导着。然而,在当今的商场上,还有另外一类企业不是通过简单粗暴的价格战,而是通过对数据的充分使用和挖掘而在商战中获胜的。 最典型的当属全球电子商务的创始者亚马逊(Amazon.com)了,从 1995 年首创网上售书开始,亚马逊以迅雷不及掩耳之势,彻底颠覆了从图书行业开始的很多行业的市场规则及竞争关系,10 年之内把很多像 Borders 以及 Barnes and Noble 这样的百年老店被逼到破产或濒临破产。亚马逊在利润并不丰厚的图书行业竞争中取胜的根本原因在于对数据的战略性认识和使用,在大家还都不太明白什么是电子商务时,亚马逊已经通过传统门店无法比拟的互联网手段,空前地获取了极其丰富的用户行为信息,并且进行深度分析与挖掘。 何为“用户行为信息”(User Behavior Information)呢?简单地说,就是用户在网站上发生的所有行为,如搜索、浏览、打分、点评、加入购物筐、取出购物筐、加入期待列表(Wish List)、购买、使用减价券和退货等;甚至包括在第三方网站上的相关行为,如比价、看相关评测、参与讨论、社交媒体上的交流、与好友互动等。 和门店通常能收集到的购买、退货、折扣、返券等和最终交易相关的信息相比,电子商务的突出特点就是可以收集到大量客户在购买前的行为信息,而不是像门店收集到的是交易信息。 在电商领域中,用户行为信息量之大令人难以想象,据专注于电商行业用户行为分析的公司的不完全统计,一个用户在选择一个产品之前,平均要浏览 5 个网站、36 个页面,在社会化媒体和搜索引擎上的交互行为也多达数十次。如果把所有可以采集的数据整合并进行衍生,一个用户的购买可能会受数千个行为维度的影响。对于一个一天 PU 近百万的中型电商上,这代表着一天近 1TB 的活跃数据。而放到整个中国电商的角度来看,更意味着每天高达数千 TB 的活跃数据。 正是这些购买前的行为信息,可以深度地反映出潜在客户的购买心理和购买意向。例如,客户 A 连续浏览了 5 款电视机,其中 4 款来自国内品牌 S,1 款来自国外品牌 T;4 款为 LED 技术,1 款为 LCD 技术;5 款的价格分别为 4599 元、5199 元、5499 元、5999 元、7999 元;这些行为某种程度上反映了客户 A 对品牌认可度及倾向性,如偏向国产品牌、中等价位的 LED 电视。而客户 B 连续浏览了 6 款电视机,其中 2 款是国外品牌 T,2 款是另一国外品牌 V,2 款是国产品牌 S;4 款为 LED 技术,2 款为 LCD 技术;6 款的价格分别为 5999 元、7999 元、8300 元、9200 元、9999 元、11050 元;类似地,这些行为某种程度上反映了客户 B 对品牌认可度及倾向性,如偏向进口品牌、高价位的 LED 电视等。 亚马逊通过对这些行为信息的分析和理解,制定对客户的贴心服务及个性化推荐。例如:当客户浏览了多款电视机而没有做购买的行为时,在一定的周期内,把适合客户的品牌、价位和类型的另一款电视机促销的信息通过电子邮件主动发送给客户;再例如,当客户再一次回到网站,对电冰箱进行浏览行为时,可以在网页上给客户 A 推荐国产中等价位的冰箱,而对客户 B 推荐进口高档价位的商品。 这样的个性化推荐服务往往会起到非常好的效果,不仅可以提高客户购买的意愿,缩短购买的路径和时间,通常还可以在比较恰当的时机捕获客户的最佳购买冲动,也降低了传统的营销方式对客户的无端骚扰,还能提高用户体验,是一个一举多得的好手段。 纵观国内外成功的电商企业,对用户行为信息的分析和使用,无不在这个兵家必争之地做大量投入。他们对数据战略性的高度认识和使用,非常值得国内的电商学习和借鉴。