⑴ 《用户网络行为画像大数据中的用户网络行为画像分析与内容推荐应用》pdf下载在线阅读,求百度网盘云资源
《用户网络行为画像》(牛温佳)电子书网盘下载免费在线阅读
链接:https://pan..com/s/1N7m61Yj832fPKXM50e2PkQ 密码:24qk
书名:用户网络
链接:https://pan..com/s/1N7m61Yj832fPKXM50e2PkQ 密码:24qk
行为画像
作者:牛温佳
豆瓣评分:6.7
出版社:电子工业出版社
出版年份:2016-3-1
页数:223
内容简介:
如何能牢牢地黏住老用户、吸引新用户、读懂用户的偏好兴趣和喜怒哀乐,这都是对企业发展至关重要甚至关乎生死存亡的问题,解决这个问题的方法就是推荐系统。本书分为上中下三篇,共13章,上篇为用户画像知识工程基础,包括表征建模、画像计算、存储及各种更新维护等管理操作;中篇为推荐系统与用户画像,包括传统协同过滤等经典推荐算法的介绍,以及涉及用户画像的推荐方法;下篇为应用案例分析,包括Netflix、阿里等数据竞赛的经典数据案例,以及在具体工程开发过程的具体案例,分别从系统需求、总体结构、算法设计、运行流程及测试结果等五个方面提供详细案例指导。
作者简介:
牛温佳,男,博士,中国科学院信息工程研究所副研究员。主持国家自然科学基金青年基金项目和广西可信软件重点实验室开放课题各一项,作为骨干先后参与了多个重要项目,包括工信部重大专项、973、863和中科院战略先导专项等。
⑵ 互联网 + 媒体之移动互联与用户行为
移动互联网正是我们要面对的未来 ,这在中国尤为明显的。截至2014 年5 月,全球移动互联网使用量占互联网使用总量的25% ,亚洲更是达到 37% 。2014 年6 月,中国手机上网比例首次超过 PC 机上网 比例,手机网民规模增长超八成 。
在移动时代,媒体的疆域也在拓展 。移动媒体等于新闻客户端 吗?当然不是。移动媒体 = 内容媒体 + 关系媒体 + 服务媒体 。从 2013 年开始中国网络媒体发生了 三个方向的转型,即视频化、社交化、移动化,当然这三个方向的转型最终都会落脚在移动化这样一个基本前提上。
在研究中国移动媒体发展趋势之前, 需要了解今天的用户正在变成什么样 。2014 年10 月,企鹅智酷分两轮进行一共涉及 20 万名移动终端用户的调查,调查没有试图覆盖移动用户的全体,而是重点考察 移动媒体的相关使用移动终端的行为,以揭示新闻资讯消费及其相关的社交 、娱乐和其他服务的用户行为偏好 。
·移动终端使用习惯
首先,移动互联网这个概念进入中国的时间并不长 ,但是在短短几年内,使用移动终端的用户已经变成重度用户 ,在被调查的用户中 , 每天使用移动终端超过 5 小时的用户在所有的时长比例中是最高的 , 超过 26% 再加上每天使用 3 - 5 个小时这个区间的用户 。有将近五成是移动终端非常重度的用户 ,近半数用户会在 2 1 - 24 点之间使用移动设备 .他们除了把工作学习之外的大部分时间都贡献给了移动互联网或者移动媒体, 而且从使用时间来看,基本上他们的夜生活都是和移动终端相伴随的。
当用户越来越多地使用移动终端时,他们在看新闻上的使用比例也是超乎寻常的高 。近七成用户更多地使用移动终端阅读新闻资讯,主要依赖电脑看新闻的用户降至不到 一成。新闻的使用在所有用户下 载的 App 中比例是最高的,而且新闻和社交这两个词现在像影子 一样, 很难分离,也就是说所谓的 无社交不新闻 , 在今天的用户身上已经变成现实。
在被调查的用户中 ,在三个问题上回答 ”是"的用户都有将近八 成,
第一个问题:是不是在社交媒体上分享新闻 ?
第二个问题:是不是因为社交平台而增加了某些新闻的关注度?
第三个问题:是不是会因为社交平台的使用而增加对新闻的了解?
对移动媒体用户来说,新闻消费是他们最重要的需求 ,除此之外 ,他们对新闻之外的那些领域有着 广泛的兴趣 ,娱乐当然也是移动媒体的重头戏。在娱乐领域中游戏 、 小说和音乐这几项几乎是差不多的 。值得关注的是在超过 1 0 万名用户调查 中,视频客户端使用者占比仅次于新闻客 户端 ,视频客户端既是播放工具,也是综合媒体。
同时,值得关注的是,今天的移动终端对很多用户来说已经变成他们生活和服务的一个平台。差不多有二成用户在移动终端上有过对娱乐的内容付费的经历,这对相关产业来说是一个好消息 ,他们愿意 为娱乐内容花钱 。但同时也要看到 ,还有 40% 的用户表示,不管是现在还是将来 ,都不愿意花钱买娱乐 ,所以培养用户的这样一种付费习惯,在内容包括娱乐内容这样的领域中, 应该还是有一段路要走的 。当然,移动支付在今天已经变成非常普遍的行为, 2014 年“双十一”的数据就是最有力的证据 。
另外 ,在移动服务领域中,应该说在线教 育 、 在线医疗以及在线商务应该是大有可为的领域 。将近六成网民作这些方面都表现出了兴趣 ,当然还有一些网民已经尝试过这方面的应用了 。今天 ,当服务成为人们越来越多的普遍需求 时 ,怎么样把内容媒体和服务平台打通 ,这可能是在移动终端的媒 体开发方面一 个非常重要的考虑。
•移动时代的场景
今天这样一个所谓的移动时代,实际上也是一个场景的时代 。这个场景,有时候可能偏向空间环境的一种描述和研究,有时候可能偏向人们在某种特定的情境下的行为研究,不管是哪一种,今天网民在 移动终端上的行为都是和具体的环境相依托的 。在今天的移动客户端使用上,除了一般性的休闲时间外,卫生间和床也是人们最常使用客户端的场景 。
近半数用户会在休息或闲暇时间访问移动媒体 。超六成用户会在碎片时间里访问移动媒体, 这些笑话 、 段子等内容的机会笑话 、 八卦、段子不够 “高大上”其实它们已经自成媒体,且广受欢迎 。
移动媒体进一步细分 ,会给文史化带来市场,但亚文化终归是调味料 ,不能成为移动迅速发展的必要条件。
多年前,大家讨论未来网络媒体会不会冲击纸质媒体时,当时有人很自豪地说他可以把报纸搬到卫生间去, 你能把电脑搬去吗 ?当时很难做出评论,但是今天发生了很大的变化, 所谓的卫生间读物正在从过去传统的报纸杂志转变成手机和移动终端 。
另外,在我们移动空间里的场景正在转变为公交的 一个新的情境 。同样地,过去在公交车上 、在地铁上经常看到的大家手捧一本书或看报纸的情境也正在被大家低头看手机的场景所替代 。这是整个移动场景发生的一个很重要的变化, 对移动终端消费者来说,其实有时候可能他们的场景考虑主要是看是不是更便宜 一些,或者手边是不是有电脑 。但是调查也发现,有将近 1/3 的用户会不假思索地在任何场景下 、任何情况下选择用移动终端购物 ,这一点也是超乎想象的 。
1场景的要素之一:
空间与环境移动时代,除了社交成为媒体的新要素, 更应该注意场景这个新要素 。场景进一步细分为两种:第一种是固定场景, 即人们日常生活的环境,与生活习惯相关,是一个 “常量”,这种常量的变化从调查结果来看,过去更多的是在客厅、书房, 现在转向了卫生间、床上这样更私密的地方,这是固定场景中的诞生 。
同时,吃饭 (餐桌)这样过去很少被电脑终端 ”侵入” 的场景,今天已经受到移动终端的普遍干扰 。
移动终端在改变家庭中的媒休使用场景的同时, 也在影响家庭成员的关系,家庭成员之间交流的因素逐渐增多 。如何针对家庭这样的场景开发新功能,弥补断裂的家庭成员关系,促进家庭成员互动,应该是未来移动产品设计的一个重要方向 。 在如今的学校或单位里, 移动互联网的使用已经打破工作与学习场景中本应具有的 “封闭性” 与 “专注性”,使得工作、学习与休息、 娱乐这几者之间的界限被模糊 。这也突显了移动信息消费的碎片化特征。
另一种是移动场景 ,即人们在活动中“遭遇” 的环境 。比如当一个客户在书店时,他是从家里赶过来的, 还是刚才逛了旁边的商场顺便到书店来的,这两种情况完全不同 :他到书店来 是 一个非常认真、非常努力的行为 ,还是很随意的顺便溜达的行为 。因此,对他之前的方位、 之前的需求的了解有助于更好地判断他此时此刻的需求 。接下来往后延 伸,就是把他引导到新的地方去,他看完书以后把他引导到附近的电影院还是径馆.这也是对场景的挖掘 。 这 是今天在做移动媒体时需要进一步研究的方向 ,也是商业应用的方向。
罗伯特 ·斯考伯 和谢尔 ·伊斯雷尔存 《即将到来的场崇时代 》中 写道 :"移动互联网时代,场景 (情境)的意义被极大强化,移动传播 是基于场景(情境)的服务, 即对环境的感知及信息 (服务)适配。与 场景时代相关的五个因素是大数据 、移动设备 、社交媒体 、 传感器 、 定位系统 。” 可见场景应用一定是未来移动媒体的引爆点 。
移动场崇分析与应用分为三个阶段 。第一个阶段 是 :从哪里来, 分析用户此前的空间与当前空间的关联性,分析用户此前的行为与当前行为的关联性 。 第二个阶段是 :现在哪里,分析与满足用户此刻在此场景中的需求。第三个阶段是:要去哪里 .为用户提供行动路线的导航 、 为用户提供新的需求的诱导。
随着信息超载 .越发突显个性化需求,人们移动传播深化, 空间场景成为新变量 ,同时大数据为个性化信息服 务提供)。 “今日头条“ 等推荐试图解决基于个体偏好的个性化。接下来 、 对场景、情境适配的个性化将是新的方向 。。。 比如 Breaki ngNews.com 在客户端应用“让新闻追看用户跑” 的新思维 ,报道中嵌入地理位置信息 ,通过 GPS 找到用户 ,实现新闻精准推送。
2 场景的要素之 二:
用户的实时状态无论是固定场景还是移动场景 ,人们的实时状态都会与空间因素共同作用。用户的实 时状念包括其自身的数据,也包括他们感兴趣的环境信息。过去想要搜集用户实时信息可谓天方夜谭 ,如今可穿戴设备的出现使这个维度的数据采集和实时数据成为现实。
2014 年网络发布的可穿戴设备网络眼 ( BaiEye), 正是试图定位于某些特定空间中的信息采集和个性化服务, 如商场和博物馆 。当人们身在博物馆时 ,他们感兴趣的展品, 与其视线相关,网络眼了解了 用户感兴趣的展品后,可以自动获取与这些展品相关的信息并通过语 音传送给用户。
除了可穿戴的移动设备, 固定设备也能够实时监测分析用户行为 , 如阿根廷公司 Shopperception 通过设置在天花板上的立体传感器,即时了解到顾客看了什么商品、在哪些地方停留 、购买什么商品需要多长时间等移动状态下的用户行为 。
英特尔推出的环境感知营销解决方案, 则将用户实时数据的采集推向了进一步的应用层面 。当一位消费者路过基于英特尔酷睿处理器的数字广告牌时 ,英特尔广告框架技术可分析根据天气、 社交媒体 , 以及包括顾客年龄 、性别和手机在内的信息, 调整内容和用户界面, 使其与受众更具相关性 、更加个性化。
3 场景的要素之三 :
用户生活惯性 人们在各种场景下的需求与行为模式,通常被认为是以往生活经验的惯性延伸 ,而在如今的 DT 时代 ,基于可穿戴设备, 可将用户的生活惯性以更加准确的方式识别、 匹配、分析、储存。
英国维珍航空公司在 2014 勾勺初开展了一项实验,利用谷歌眼镜和索尼智能手表,精准实现头等舱乘客识别,狄取饮食偏好 、上次出行信息、目的地信息等,以快速提供个性化服务。
4 场景要素之四:社交氛围
在 《即将到来的场景时代 》一书中,两位作者将社交媒体也列为 场景时代的一个重要元素,并指出,正是通过在线交谈,我们明确了自己的喜好、所处的位置以及我们所寻求的目标 。这些内容使得技术可以理解 “你是谁”、 “你正在做什么”以及 “你接下来可能做什么 ” 等场景。可见,社交媒体中用户及其相关者的数据分析, 可从另一维度,为场景分析提供支持 。
需要注意的是,场景分析的最终目标是提供特定场景下的适配信息或服务 。服务适配比信息适配的范围更广 、手段更多样 、满足的需求更多元,但无论是对信息还是服务的适配,都与一定的形式适配相 关联。从信息推送的角度看 ,适配不仅意味着内容与场景的匹配,也意味着形式与特定场景下的阅读需求相适应 。
对于移动媒体的内容 生产者来说,如今的一个重要目标是通过自己的努力,将文字的精华,通过其他表现形式,如信息图表和 PPT , 进行提炼与再呈现 。因此,今天的移动媒体的标题中,越来越多地出 现了“一分钟读懂”“两分钟了解”“ 八张图让你知道” 等字眼。当然 , 这还只是移动阅读式的 ,不同场景信息阅读的个性化特点如何在呈现形式上做出述说还需要今后进一步探索。
当移动媒体在内容媒体 、 关系媒体、服务媒体三个方向上拓展时,
移动媒体的主要任务就是完成信息流 、关系流与服务流的形成与组织 。 拥有强势的 “流” 的平台,也就有成为 “入口的潜力”。当越来越多的信息与服务依赖场景这一变化时,场景本身可以成为信息组织、关系组织与服务组织的核心逻辑, 可以成为信息 - 关系 - 服务等几者联结的纽带,场景本身可能成为移动媒体的新入口 。
尽管今天我们讨论场景的意义时 ,更多的是试图把场景的分析作为设计新产品、提升服务质址的依据 。但应该看到的是,移动传播带来的信息消费场景或社交场景的变化 ,并非都是在向着更人性、更友 好的方向发展,甚至它可能是在一定程度上侵蚀人的良好天性, 破坏人与环境 (空间的或人际的)的友好关系 。因此 ,对场景的开发与应 用,也应该保持一定的警惕与节制 。未来的移动服务提供商,未必是要将自己侵入每个场景中的某些时候,场景分析的目标也许并不是渗透 ,而是规避。
⑶ 大数据在互联网用户系统中的应用
大数据在互联网用户系统中的应用
但是对于今日的互联网和移动互联网,大数据的规模和应用深度早已不次于传统的电信、民航等行业,甚至超过不少。因此笔者还是想写些东西浅谈一下互联网的大数据应用,权当抛砖引玉,也希望更多的朋友参与交流和讨论。
首先,第一篇想谈一下互联网的用户系统。无论互联网还是移动互联网,本身具有很大的特性就是互联,所以我们都可以称之为互联网,或者说移动互联网是互联网的一个子集和延伸。
在传统的电信、民航、能源等行业,企业的客户和主体用户构成都是有身份ID的。比如电信行业中身份证登记的手机卡号,比如民航用户乘坐航班登机的身份证或护照信息等,这些信息可以作为基本的用户身份ID,便于企业对其用户、客户进行身份辨别,并对后续的用户行为进行跟踪和分析。传统企业所存储的用户信息的很大优势在于完整性,很多先天的比如姓名、性别、年龄甚至籍贯等真实的基础身份信息都可以简单获得。而在互联网上,用户的访问都是匿名的,即使用户在接入互联网的时候使用的登记信息是实名的,但那主要是提供给电信服务商和公共安全机构备案而用。普通的互联网网站在用户面前是完全透明的被"围观"的,这个状况在web1.0 的主要产品--门户网站中最为典型。到了web2.0 时代,互联网开始变得互动起来,用户从简单的匿名浏览,变成了可以通过注册身份参与信息的制造和流通。这个时候,诞生了这个时代在谈的互联网大数据应用中非常重要的一个非决定性条件--用户身份系统。为什么说是"非决定性条件"呢?因为,在这之前,大量的数据分析也是可以做的,但是由于对用户缺乏身份缺乏甄别,因此数据分析能够应用的场景和得到的数据都相对很有限,但并不代表不能做大数据分析。而web2.0的用户身份系统诞生,则使互联网某种程度上具有了和传统行业同样的用户身份记录系统,数据统计和分析都可以更精准和深入。其中,以腾讯QQ、新浪UC等PC桌面产品为代表的互联网早期产品,应该是建立了互联网更早的用户身份系统,我们也可以看到这些系统在其后续的web产品铺开时同样被继承了过来。
那么,互联网的用户身份系统,一般都具有哪些信息呢?
打开任何一个网站,我们都可以看到注册页面需要填写用户名/email,性别,年龄 等基本信息。当然,不同的网站和互联网产品有不同的用户资料细化的程度。拿现在比较流行的几款产品做比较,其他互联网产品大多类似:1.新浪微博中用户可以填写自己的昵称、头像、真实姓名、所在地、性别、生日、博客地址、email、QQ/MSN、自我介绍、用户标签、教育信息、职业信息……;2.腾讯QQ客户端上可以填写头像、昵称、个性签名、姓名、性别、英文名、生日、血型、生肖、故乡、所在地、邮编、电话、学历、职业、语言、手机……
看起来还真不少,那么网站要用户的这些信息会被干嘛用呢?
这里笔者刘三德认为主要有以下几点:1. 展示自我;2.作为唯一的身份ID用作用户身份区别;3.搜索和推荐相关;4.网站自身可以做用户分析和用户行为跟踪。展现自我放到第一位是因为这是从产品满足用户需求的角度决定的,用户资料的首要任务就是为了作为用户唯一的可识别身份标识展示自我。其次,搜索和推荐相关这一点笔者刘三德计划在后续用专门的篇章来写,此处简单理解即可。最后一点,也就是本文所关注的一点,就是用用户身份来做数据分析。涉及到的用户分析主要维度为用户资料和用户行为。同样,用户行为也计划在后续篇章专门来写,本文着重讨论一下用户资料的分析。
可能行业内的一些文章和老前辈的观点,数据首先要量大、其次要有高的复杂度,才可以称为大数据。但笔者认为,大数据在一维的层次上不一定具有很强的复杂度,大部分是由最简单的数据形式构成。就譬如用户资料,一个网站如果有一千万的注册用户,如果每个用户的资料具有6个有效字段,就是6000万的有效数据。而将这6000万的有效数据通过一层或者几层简单的统计叠加分析、交叉分析等,在计算上本身就具有了不小的复杂度。何况现今的互联网产品,尤其社交类产品如FACEBOOK,腾讯QQ、新浪微博等动辄上亿的注册用户,本身用户系统就是一个非常具有价值的大数据。[page]
通过分析用户系统可以得到什么呢?
当然,用户填写的注册资料中包含的资料,都是最基础的分析数据。还是用数据说话,如下图:
以上图片来自互联网
以上数据是第三方机构公布的,而且都是最简单的一维数据,我们可以看到很多家网站的用户资料对比(上面引用的部分数据来源也可为线上调查问卷等形式)。对于独立的一个网站来说,用户资料的分析当然只是局限在自己的网站范围之内。进入互联网web2.0时代以后,大家都开始更加重视用户和用户体验,对于网站自身用户的特征进行分析,可以更好的网站的用户特性分布,方便针对网站的用户群特点更有针对性的进行对应的产品设计和研发。比如通过了解用户的消费层次等,也可以更好的提供用户消费相关展示和服务。
那么,无用户身份信息的互联网是否不再大数据?--不用注册的用户身份系统的。
可能有的朋友会对这个话题存疑问,也可能有的朋友会惊恐,认为隐私泄露了,其实这里的应用也非常简单。在类似传统的web1.0 门户类以展示为主的互联网产品中,也是可以做数据的分析和挖掘的,而且也有比较成熟的方案。是否有朋友曾经经历过以下场景:在网络上搜索汽车、查了半天汽车资料,一个小时以后再随手打开的一个图书阅读网站上居然出现了"汽车广告".其实,即使我们没有在这些网站上注册,网络等搜索引擎本身还是可以为用户标识一个唯一的身份信息,虽然这个身份信息只是临时的,可能有效期也只有几天左右。但是,这依然是一种唯一的用户身份,只不过是记录的信息有限而已,但是仍然为用户行为分析提供了很大的帮助。感兴趣的朋友可以搜索"google adsense隐私政策" 进行相关了解,此处不在赘述。
用户资料系统方便了一系列的大数据挖掘
除了传统的互联网桌面端和web端产品,最近几年突飞猛进的移动互联网以及终端应用,基本也都有完备的用户信息系统。apple苹果公司做了app store,迄今为止的应用下载次数突破250亿次,而每一次的下载都需要使用唯一的用户ID,通过分析,苹果可能比你父母更加了解你想要什么--这属于用户行为分析范畴,后续将专门讨论。
总之,用户身份和资料的分析是互联网大数据分析中最基础的分析,用户身份系统在互联网的大数据时代,为后续的用户行为分析和对应的企业产品、服务设计提供了基石,也为更加深入的数据挖掘奠定了基础。
⑷ 什么是用户行为分析怎么做用户行为分析
第一个问题,什么是用户行为分析:
过去的用户行为分析普遍的问题是:分专析不聚焦、采集不全属面、开发周期长、完全依靠人工埋点、事后分析、维度单一、指标传统。
所以当下可以把用户行为分析定义为:基于用户生命周期管理模型、全面采集所有数据、事中分析、提前预测、实时多维组合、科学维度划分、自定义指标的分析。
第二个问题:怎么做用户行为分析
你提出这个问题,证明你可能暂时没有数据分析团队,或者数据分析团队尚不成熟和完善,所以需要开展数据分析工作的话建议是借助第三方的平台。
这一块业务目前国内已经相对成熟,也有很多不错的合作伙伴可以选择了,硅谷的明星公司可以选择Google Analytics或者Mixpanel等,不过我最推荐的还是国内的数极客。
具体如何开展,我个人的建议是:
选择采用AARRR模型的平台,通过对用户全程行为的跟踪,让我们在经营中运营中,拥有Acquisition(获客)、Activation(激活与活跃)、Retention(留存)、Revenue(收入)、Refer(二次传播) 全程数据分析功能。
⑸ 大数据在网络优化中大有可为
大数据在网络优化中大有可为
网络优化是确保网络质量,提升网络资源利用率的有效手段。近年来,随着网络容量的不断提升、网络用户数的不断增加、网络设备的多样化,用新技术和新方法替代传统网络优化手段成为一种趋势,尤其是在大数据分析技术的兴起下,其在网络优化中的作用日渐突出。
网络优化的传统手段
网络优化是通过对现已投入运营的网络进行话务数据分析、现场测试数据采集、参数分析、硬件检查等,找出影响网络质量的原因,并且通过参数的修改、网络结构的调整、设备配置的调整和采取某些技术手段,确保系统高质量的运行,使现有网络资源获得最佳效益,以最经济的投入获得最大的收益。一般而言,传统的网络优化有以下几种方法:
一、话务统计分析法:通过话务统计报告中的各项指标,可以了解和分析基站的话务分布及变化情况,分析出网络逻辑或物理参数设置的不合理、网络结构的不合理、话务量不均、频率干扰及硬件故障等问题。
二、DT&CQT测试法:从用户的角度,借助测试仪表对网络进行驱车和定点测试。可分析空中接口的信令、覆盖服务、基站分布、呼叫失败、干扰、掉话等现象,定位异常事件的原因,为制定网络优化方案和实施网络优化提供依据。
三、用户投诉:通过用户投诉了解网络质量。即通过无处不在的用户通话发现的问题,进一步了解网络服务状况。
四、信令分析法:主要针对A接口、Abis等接口的数据进行跟踪分析。发现和定位切换局数据不全、信令负荷、硬件故障及话务量不均以及上、下行链路路径损耗过大的问题,还可以发现小区覆盖、一些无线干扰及隐性硬件故障等问题。
五、数据库核查与参数分析:对网络规划数据和现网配置参数、网络结构数据进行核查,找出网络数据中明显的数据错误,对参数设置策略进行合理性分析和总结。
六、网络设备告警的排查处理:硬件故障告警一般具有突发性,为了减小对用户的影响,需要快速的响应和处理。通过告警检查处理设备问题,保障设备的可用性,避免因设备告警导致网络性能问题。
在实际工作中,这几种方法都是相辅相成、互为印证的关系。网络优化就是利用上述几种方法,围绕接通率、掉话率、拥塞率和切换成功率等指标,通过性能统计测试数据分析制定实施优化方案系统调整重新制定优化目标性能统计测试的螺旋式循环上升,达到网络质量明显改善的目的。
网络优化亟待创新
当前,随着用户数的不断增长,随着网络容量的不断增加,随着网络复杂度的不断提升,以及网络设备的多样化,网络优化工作的难度正在不断提升,网络优化的方法和手段亟待创新。
首先,网络优化是一项技术难度大、涉及范围广、人员素质要求较高的工作,涉及的技术领域有交换技术、无线技术、频率配置、切换和和信令、话务统计分析等。传统网络优化工作多依赖于技术人员的经验,依赖人工进行统计分析。网络优化的自动化程度较低,优化过程需耗费大量的时间、人力、物力,造成了大量的资源浪费,影响网络问题解决的时效性。另外,优化工程师借助于个人经验对网络数据进行分析和对比,而非根据网络相关的数据综合得出优化方案,存在一定的局限性。
其次,随着我国移动通信事业迅速发展,我国移动互联网发展已正式进入全民时代,截至2014年1月,我国手机网民规模已达5亿。网络结构日益复杂,数据业务已经成为移动通信网络主要承载的业务,用户通过智能终端的即时互联通信行为,使移动网络成为大数据储存和流动的载体。高速变化的数据业务速率和巨大的网络吞吐量以及覆盖范围的动态实时变化,在很大程度上改变了现有网络规划和优化的模型,在网络优化工作中引入大数据是非常迫切和必要的。
最后,全球数据信息成为企业战略资产,市场竞争和政策管制要求越来越多的数据被长期保存。对于运营商的网络优化来说,也需要保存各类数据,以便进行用户行为分析和市场研究,通过大数据实践应用提升网络优化质量并助力市场决策,实现精细化营销策略,提升企业的核心竞争力。
面对上述挑战,运营商正尝试进行网络优化工作的创新,尝试在网络优化中引入新技术和新方法。而正在全球兴起的大数据分析技术,开始在网络优化中大显身手。
网络优化拥抱大数据
大数据(Big Data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、整理成为帮助企业经营决策目的的资讯。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。大数据具有数据量巨大、数据种类繁多、价值密度低及处理速度快的特点,同时具备规模性、高速性、多样性、价值性四大特征。
一般而言,利用大数据技术进行网络优化的过程可分为三个阶段:数据来源和获取、数据存储、数据分析。
数据来源和获取—对于运营商而言,通过现有网络可以收集大量的网络优化相关信令资源(含电路域、分组域)、DT测试&CQT测试数据,这些数据大都以用户的角度记录了终端与网络的信令交互,内含大量有价值的信息。如终端类型、小区位置、LAC、imsi、tmsi、用户业务使用行为、用户位置信息、通话相关信息、业务或信令、信令中包含的各种参数值。
设备层包含基站、BSC、核心网、传输网等配置参数和网络性能统计指标(呼叫成功率、掉话率、切换成功率、拥塞率、交换系统接通率等)、客户投诉数据等。
采集到的数据一般而言,经过IP骨干网传输到数据中心,进行存储。随着云计算技术的发展,未来数据中心将具备小型化、高性能、可靠性、可扩展性及绿色节能等特点。
数据存储—网络优化中涉及巨大的数据存储,包括信令层面的数据信息和设备存在的数据信息,这些数据只有妥善存储和长期运营,才能进一步挖掘其价值。传统数据仓库难以满足非结构化数据的处理需求。Google提出了GFS、BigTable、MapRece三项关键技术,推动了云计算的发展和运用。
源于云计算的虚拟资源池和并发计算能力,受到重视。2011年以来,中国移动、中国电信、中国联通相继推出“大云计划”、“天翼云”和“互联云”,大大缓解了数据中心IT资源的存储压力。
数据分析—数据的核心是发现价值,而驾驭数据的核心是分析,分析是大数据实践研究的最关键环节,尤其对于传统难以应对的非结构化数据。运营商利用自身在运营网络平台的优势,发展大数据在网络优化中的应用,可提高运营商在企业和个人用户中的影响力。
电信级的大数据分析可实现如下功能:第一,了解网络现状,包括网络的资源配置和使用情况,用户行为分析,用户分布等;第二,优化网络资源配置和使用,有针对性地进行网络维护优化和调整,提升网络运行质量,改善用户感知;第三,实施网络建设规划、网络优化性能预测,确保网络覆盖和资源利用最大化。对用户行为进行预测,提升用户体验,实现精细化网络运营。
网络优化相关的工具种类很多,针对不同的优化领域,常用的工具包括:路测数据分析软件、频率规划与优化软件、信令分析软件、话统数据分析平台、话单分析处理软件等。这些软件给网络优化工作带来了很大的便利,但往往只是针对网络优化过程中特定的领域,而网络优化是一个涉及全局的综合过程,因此需要引入大数据分析平台对这些优化工具所反映出来的问题进行集合并综合分析和判断,输出相关优化建议。
目前,大数据技术已经在网络优化工作中得到应用。中国电信就已经建设了引入大数据技术的网优平台,该平台可实现数据采集和获取、数据存储、数据分析,帮助中国电信利用分析结果优化网络质量并助力市场决策,实现精细化营销策略。利用信令数据支撑终端、网络、业务平台关联性分析,优化网络,实现网络价值的最大化。
总工点评
综合全球来看,对大数据认识、研究和应用还都处于初期阶段。中国三大电信运营商都在结合自身业务情况,积极推进大数据应用工作,目前还处于探索阶段,在数据采集、处理、应用方面仍处于初级阶段。电信运营商在国内拥有庞大的用户群和市场,利用自身海量的数据资源优势,探索以大数据为基础的网络优化解决方案,是推动产业升级、实现效率提升、提升企业核心竞争力、应对激烈市场竞争的重要手段。利用大数据将无线网、数据网、核心网、业务网优化进行整合,可以完整地优化整个业务生命期的所有网元,改善用户感知,是未来网络优化的趋势。
以上是小编为大家分享的关于大数据在网络优化中大有可为的相关内容,更多信息可以关注环球青藤分享更多干货
⑹ 大数据之如何进行“用户行为分析”
而消费者们作为这场游戏中的弱者,不断地被这些真假价格战挑逗着和引导着。然而,在当今的商场上,还有另外一类企业不是通过简单粗暴的价格战,而是通过对数据的充分使用和挖掘而在商战中获胜的。 最典型的当属全球电子商务的创始者亚马逊(Amazon.com)了,从 1995 年首创网上售书开始,亚马逊以迅雷不及掩耳之势,彻底颠覆了从图书行业开始的很多行业的市场规则及竞争关系,10 年之内把很多像 Borders 以及 Barnes and Noble 这样的百年老店被逼到破产或濒临破产。亚马逊在利润并不丰厚的图书行业竞争中取胜的根本原因在于对数据的战略性认识和使用,在大家还都不太明白什么是电子商务时,亚马逊已经通过传统门店无法比拟的互联网手段,空前地获取了极其丰富的用户行为信息,并且进行深度分析与挖掘。 何为“用户行为信息”(User Behavior Information)呢?简单地说,就是用户在网站上发生的所有行为,如搜索、浏览、打分、点评、加入购物筐、取出购物筐、加入期待列表(Wish List)、购买、使用减价券和退货等;甚至包括在第三方网站上的相关行为,如比价、看相关评测、参与讨论、社交媒体上的交流、与好友互动等。 和门店通常能收集到的购买、退货、折扣、返券等和最终交易相关的信息相比,电子商务的突出特点就是可以收集到大量客户在购买前的行为信息,而不是像门店收集到的是交易信息。 在电商领域中,用户行为信息量之大令人难以想象,据专注于电商行业用户行为分析的公司的不完全统计,一个用户在选择一个产品之前,平均要浏览 5 个网站、36 个页面,在社会化媒体和搜索引擎上的交互行为也多达数十次。如果把所有可以采集的数据整合并进行衍生,一个用户的购买可能会受数千个行为维度的影响。对于一个一天 PU 近百万的中型电商上,这代表着一天近 1TB 的活跃数据。而放到整个中国电商的角度来看,更意味着每天高达数千 TB 的活跃数据。 正是这些购买前的行为信息,可以深度地反映出潜在客户的购买心理和购买意向。例如,客户 A 连续浏览了 5 款电视机,其中 4 款来自国内品牌 S,1 款来自国外品牌 T;4 款为 LED 技术,1 款为 LCD 技术;5 款的价格分别为 4599 元、5199 元、5499 元、5999 元、7999 元;这些行为某种程度上反映了客户 A 对品牌认可度及倾向性,如偏向国产品牌、中等价位的 LED 电视。而客户 B 连续浏览了 6 款电视机,其中 2 款是国外品牌 T,2 款是另一国外品牌 V,2 款是国产品牌 S;4 款为 LED 技术,2 款为 LCD 技术;6 款的价格分别为 5999 元、7999 元、8300 元、9200 元、9999 元、11050 元;类似地,这些行为某种程度上反映了客户 B 对品牌认可度及倾向性,如偏向进口品牌、高价位的 LED 电视等。 亚马逊通过对这些行为信息的分析和理解,制定对客户的贴心服务及个性化推荐。例如:当客户浏览了多款电视机而没有做购买的行为时,在一定的周期内,把适合客户的品牌、价位和类型的另一款电视机促销的信息通过电子邮件主动发送给客户;再例如,当客户再一次回到网站,对电冰箱进行浏览行为时,可以在网页上给客户 A 推荐国产中等价位的冰箱,而对客户 B 推荐进口高档价位的商品。 这样的个性化推荐服务往往会起到非常好的效果,不仅可以提高客户购买的意愿,缩短购买的路径和时间,通常还可以在比较恰当的时机捕获客户的最佳购买冲动,也降低了传统的营销方式对客户的无端骚扰,还能提高用户体验,是一个一举多得的好手段。 纵观国内外成功的电商企业,对用户行为信息的分析和使用,无不在这个兵家必争之地做大量投入。他们对数据战略性的高度认识和使用,非常值得国内的电商学习和借鉴。
⑺ 大数据攻略案例分析及结论
大数据攻略案例分析及结论
我们将迎来一个“大数据时代”。与变化相始终的中国企业,距离这场革命还有多远?而追上领先者又需要多快的步伐?
{研究结论}
■大数据营销的本质是一个影响消费者购物前心理路径的问题,而这在大数据时代前很难做到。
■对于传统企业而言,要打通线上与线下营销,实现新的商业模式,如O2O等,离不开大数据。
■虽然大数据应用往往集中于大数据营销,但对于一些企业,大数据的应用早已超越了营销范畴,全面进入了企业供应链、生产、物流、库存、网站和店内运营等各个环节。
■对于大部分企业,由于数据分析人员与业务人员之间的彼此视角与思考方向不同,大数据分析和运营之间存在脱节情况,这是大数据无法用于企业运营最大的阻力
■对于大多数互联网公司来说,大数据量、大用户量是一个相互促进,强者越强的循环过程。
■对于大型互联网平台,大数据已经成为其生态循环中的血液,对于这些企业,最重要
的不是如何利用大数据改进自身运营,而是利用大数据更好地繁荣平台生态。
■对于平台企业,它们的大数据策略正逐渐从大数据运营,向运营大数据转变,前者和
后者的差别在于,前者只是运营改进的动力,而后者则成为企业实现未来战略的核心资源。
我们都已被反复告知:我们将迎来一个“大数据时代”。
大数据应用,将和云计算、3D打印这些技术变革一样,颠覆既有规则,并成为先行企业的制胜关键。
与变化相始终的中国企业,距离这场革命还有多远?而追上领先者又需要多快的步伐?
来自于互联网、移动互联网、物联网传感器、视频采集系统的数据正海量增长,汇成大数据的海洋,相伴的是海量数据存储、分析技术的突破性发展,所有这一切都给企业的应用带来了无限可能性。
中国企业家研究院对当前中国企业大数据应用的状况进行了归纳分类,以帮助企业了解实际应用大数据时的困局难点,并提供领先企业的典型案例以资借鉴。
表1
表2
大数据运营—企业提升效率的助推力
对于大多数企业而言,运营领域的应用是大数据最核心的应用,之前企业主要使用来自生产经营中的各种报表数据,但随着大数据时代的到来,来自于互联网、物联网、各种传感器的海量辩笑亏数据扑面而至。于是,一些企业开始挖掘和利用这些数据,来推动运营效率的提升。大数据运营应用中,大数据的应用分为三类:用于企业外部营销、用于内部运营,以及用于领导层决策。
一、大数据营销
大数据营销的本质是影响目标消费者购物前的心理路径,它主要应用在三个方面:1、大数据渠道优化,2、精准营销信息推送,3、线上与线下营销的连接。在消费者购物前,通过各种方式,直接介入其信息收集和决策过程。而这种介入,是建立在对于线上与线下海量用户数据分析的基础之上。相比传统狂轰滥炸或等客上门的营销,大数据营销无论在主动性和精准性方面,都有非常大的优势。它是目前主要的大数据应用领域。
大数据营销不仅仅是用大数据找出目标顾客,向其发布促销信息,它还可以做到:
实现渠道优化。根据用户的互联网痕迹进行渠道营销效果优化,就是根据互联网上顾客的行为轨迹来找出哪个营销渠道的顾客来源最多,哪个来源顾客实际购买量最多,是否是目标顾客等等,从而调整营销资源在各个渠道的投放。例如东风日产,它利用对顾客来源的追踪,来改进营销资源在各个网络渠道如门户网站、搜索和微博的投放。
精准营销信息携神推送。精准建立在对海量消费者的行为分析基础之上,消费者网络浏览、搜索行为被网络留下,线下的购买和查看等行为可以被门店的POS机和视频监控记录,再加上他们在购买和注册过程中留下的身份信息,在商家面前,正逐渐呈现出消费者信息的海洋。
一些企业通过收集海量的消费者信息,然后利用大数据建模技术,按消费者属升猛性(如所在地区、性别)和兴趣、购买行为等维度,挖掘目标消费者,然后进行分类,再根据这些,对个体消费者进行营销信息推送。比如孕妇装品牌十月妈咪通过对自己微博上粉丝评论的大数据分析,找出评论有“喜爱”相关关键词的粉丝,然后打上标签,对其进行营销信息推送。京东商城副总经理李曦表示:“用大数据找出不同细分的顾客需求群,然后进行相应的营销,是京东目前在做的事情。”小也化妆品将自身网站作为收集消费者信息的雷达,对不同消费者推荐相应的肌肤解决方案,创始人肖尚略希望在未来,大数据营销能替代网站的作用,真正成为面向顾客的前端。
打通线上线下营销。一些企业将互联网上海量消费者的行为痕迹数据与线下购买数据打通,实现了线上与线下营销的协同。比如东风日产,线上与线下的协同营销方式为:其门户网站带来订单线索,而通过这些线索,服务人员进行电话回访,从而推动顾客在线下交易。在此过程中,东风日产记录了消费者进入、浏览、点击、注册、电话回访和购买各个环节的数据,实现了一个横跨线上线下,以大数据分析为支持的,营销效果不断优化的闭环营销通路。而国双科技,衡量某一地区线下促销活动的效果,就是看互联网上,来自这个地区对于促销内容的搜索量。一些企业,通过鼓励线下顾客使用微信和Wi-Fi等可追踪消费者行为和喜好的设备,来打通线上与线下数据流,银泰百货计划铺设Wi-Fi,鼓励顾客在商场内使用,然后根据Wi-Fi账号,找出这个顾客,再通过与其它大数据挖掘公司合作,以大数据的手段,发掘这个顾客在互联网的历史痕迹,来了解这个顾客的需求类型。
二、大数据用于内部运营
相比大数据营销,大数据在内部运营中的应用更深入,对于企业内部的信息化水平,以及数据采集和分析能力的要求更高。本质上,是将企业外部海量消费者数据与企业内部海量运营数据联系起来,在分析中得到新的洞察,提升运营效率。(详见P96表5:大数据在内部运营中的应用)
表5
三、大数据用于决策
在大数据时代,企业面对众多新的数据源和海量数据,能否基于对这些数据的洞察,进行决策,进而将其变成一项企业竞争优势的来源?同大数据营销和大数据内部运营相比,运用大数据决策难度最高,因为它需要一种依赖数据的思维习惯。
已有少数企业开始尝试。比如国内一些金融机构在推出一个金融产品时,会广泛分析该金融产品的应用情况和效果、目标顾客群数据、各种交易数据和定价数据等,然后决定是否推出某个金融产品。
但是,中国企业家研究院在调研中发现,目前中国企业当中,大数据决策的应用非常之少,许多企业领导者进行决策时,仍习惯于凭借历史经验和直觉。
大数据产品——企业利润滋长的新源泉
大数据除了用于运营外,还能够与企业产品结合,成为企业产品背后竞争力的核心支持或者直接成为产品。提供大数据产品的企业分为两类,直接提供大数据产品的企业,以及将大数据作为产品和服务核心支撑的企业。前者主要为大数据产业链中提供数据服务的参与者,包括数据拥有者、存储企业,挖掘企业、分析企业等,后者则主要是那些以大数据为产品核心支撑的企业,它们大多是互联网企业,其产品和服务先天就有大数据基因,这些企业包括搜索引擎、在线杀毒、互联网广告交易平台以及众多植根于移动互联网之上,为用户提供生活和资讯服务的APP等。
表3
表4
一、大数据作为产品核心支持
它们主要在以下几方面使用大数据:
1、提供信息服务。很多互联网企业通过对海量互联网信息和线下信息的整合和分析,为个人和企业提供信息服务,典型的如网络、去哪儿、一淘、高德地图、春雨医生等等。在美国,一些互联网企业甚至根据大数据提供更深度的预测信息服务,美国科技创新公司farecast,通过分析特定航线机票的价格,帮助消费者预测机票价格走势。
2、分析用户的个性化需求,借此提供个性化产品和服务,或者实现更精准的广告。典型的有移动社交工具陌陌、网络、腾讯、广告交易平台品友互动以及一些互联网游戏商。这种应用往往先是收集海量用户的互联网行为数据,将用户分类,根据不同类型的用户,提供个性化的产品,或者提供个性化的促销信息。比如网易等门户网站推出了订阅模式,让使用者按照个人喜好方便地定制和整合不同来源的信息。
3、增强产品功能。对于很多互联网产品,如杀毒软件、搜索引擎等等,海量数据的处理能够让产品变得更聪明更强大,如果没有大数据,产品的功能就大大减弱。比如奇虎360公司的360杀毒软件,凭借每天海量的杀毒处理,建立了庞大的病毒库,这使它能够更快地发现病毒,而一些小的杀毒软件公司则无法做到这一点。
4、掌控信用状况,提供信贷服务。阿里巴巴上汇集了海量中小企业的日常资金与货品往来,通过对这些往来数据的汇总与分析,阿里巴巴能发现单个企业的资金流与收入情况,分析其信用,找出异常情况与可能发生的欺诈行为,控制信贷风险。
5、实现智能匹配。婚恋网站、交易平台等,利用大数据可以进行精准而高效的配对服务。网易花田会挖掘用户行为数据,比如点击哪些异性的页面,发表什么样的评论,建立用户兴趣模型,从而挖掘到用户所期待另一半的类型,然后主动推荐与对方匹配度比较高的人选。2010年,阿里巴巴尝试性地推出“轻骑兵”服务,由阿里巴巴将中国各产业集群地的供应商与海外买家的个性采购需求进行快速匹配,所凭借的,就是对供应商的海量交易数据信息的整合与挖掘。
二、大数据直接作为产品
对一些企业,大数据直接成为了产品,这些产品包括海量数据、分析、存储与挖掘的服务等,目前大数据产业链正在形成过程中,出现了一批开放、出售、授权大数据和提供大数据分析、挖掘的公司和机构,前者主要是一些拥有海量数据的公司,将数据服务作为新的盈利来源。如大型的互联网平台、民航、电信运营商、一些拥有大数据的政府机构等等,后者主要包括一些能够存储海量数据或者将海量数据与业务场景结合,进行分析和挖掘,或者提供相关产品的公司,如IBM、SAP、拓而思、天睿公司。它们为大数据应用者们提供海量数据存储、数据挖掘、图像视频、智能分析等服务以及相关系统产品。
大数据平台——企业群落繁荣的滋养剂
而网络已建成了包括网络指数、司南、风云榜、数据研究中心和网络统计在内的五大数据体系平台,帮助其营销平台上的企业了解消费者行为、兴趣变化,以及行业发展状况、市场动态和趋势、竞争对手动向等信息。
为解决这些问题,各个平台在积极地努力。比如阿里巴巴建立了数据委员会,在统一数据格式标准、从源头上保证数据的质量,采集和加工出精细化的数据,确保其能符合平台企业的应用场景等方面,不遗余力地尝试。尤其在大数据精细化方面,阿里巴巴更是作为其大数据战略的重点。这方面,腾讯目前也在加快步伐。比如新版腾讯网出现了“一键登录”的提示,用户可以在上面通过一些细分标签,订阅自己关注的内容。实际上,这也是腾讯收集更精细化的用户兴趣数据的一个有效手段。
Tips
大数据实战手册
将大数据应用于内部运营中时,企业会遇到一些常见问题
1企业如何获取与分析数据?
互联网是大数据的一个主要来源,一些线下的传统企业很难获得。但它们可以:
a和拥有或能抓取海量数据的平台、企业以及政府机构合作。比如淘宝上的电商就购买淘宝收集的海量数据中与自身运营相关的部分,用于自身业务。再如卡夫通过与IBM合作,在博客、论坛和讨论版的内容中抓取了47.9万条关于自己产品的讨论信息,通过大数据分析出消费者对卡夫食品的喜爱程度和消费方式。
b建立自己在互联网上的平台,比如朝阳大悦城利用自己的微信、微博等平台收集消费者评论数据。
c许多传统企业没有分析海量数据的能力,此时它们可以和大数据分析和挖掘公司合作,目前市场上已经有天睿公司、IBM、百分点、华胜天成等一批提供大数据分析和挖掘服务的公司,它们是传统企业进行大数据分析可以借助的力量。
2如何避免大数据应用时的部门分割?
对于许多企业,其信息流被各部门彼此分割,数据难以互通,对于这种情况下,大数据的共享和汇集就只是一个泡影,更难以实现大数据的深度应用。
要打通部门之间信息分割的局面,首先要建立统一的、集中的数据系统。就像立白信息与知识总监王永红所说的,“要真正用好大数据,企业要采用大集中的信息系统。”从更深入的角度来谈,企业信息流的部门分割,更在于企业部门之间的分割,比如有一些企业的营销按照渠道分割,导致对于顾客的大数据收集和分析效果大打折扣。
IBM智慧商务技术总监杨旭青认为,“很多时候由于组织结构问题,大数据分析有效性大大降低了。”这就需要组织与流程层面的重新设计,在这方面,阿里巴巴的部门负责人轮岗制度,对于打破部门壁垒无疑是一剂好药。而一些企业为了打破部门分割,建立了矩阵型的组织结构,强化部门间的横向合作,这些无疑为大数据的汇集、共享与应用创造了良好条件。
3如何让业务人员重视大数据的应用?
解决这个问题,一方面在于一把手对整个企业数据文化的倡导,比如1号店董事长于刚就要求业务人员无论在开会,还是汇报工作时,都以数据说话,而马云更是将大数据提升到了战略高度。
另一方面,也在于数据部门的带动,阿里巴巴数据委员会负责人车品觉分享了经验,“因为运营部门的业务人员很难看到大数据的潜力,可以首先从一些对业务见效快,见效显著的数据项目出发,通过一两个项目的成功,调动对方的积极性,然后再逐步一个个地引导。”
4为何大数据工作与运营需求脱节?
这往往是由于数据人员与业务人员视角、专业知识不同而导致的。大数据人员做了很多努力,但是业务人员却认为这些努力无关痛痒。如何解决这个问题?
有的企业从组织设计上发力,将大数据纳入业务分析部门的管理之下,用业务统驭数据。对于朝阳大悦城,由主要负责战略和经营分析的部门来管理大数据工作,其中的大数据分析人员则作为支持人员。在负责人张岩看来,大数据要靠商业法则指导,关键是找到业务需求的点,然后由数据分析和挖掘人员实现。在具体操作中,大悦城对微信的数据挖掘,挖掘什么样的关键词,由业务分析人员确定,而具体挖掘则由数据部门做;有的企业从流程设计上着手,推动业务部门与数据部门人员之间的沟通,建立数据人员工作与效果挂钩的考核机制。
例如阿里巴巴根据数据挖掘的成效(比如带来的商品转化率的提升)来考核数据挖掘师,考核数据分析师则看其分析结果能否出现在经营负责人的报告中。从数据部门自身角度则需要降低运营部门使用数据的障碍和门槛,比如立白集团的数据人员会努力尝试向运营部门提供更易懂、更生动的图形化数据分析界面,在立白老板办公室上,就有一份“客户运营健康体检表”,让老板对全国经销商的当月销售情况一目了然。再如阿里巴巴开发的无线Bi,让经营人员在手机上也可以看到大数据分析结果,拿车品觉的话说,“以数据之氧气包围经营人员。”
⑻ 十个有效的大数据分析途径让你更了解用户
十个有效的大数据分析途径让你更了解用户
我们正处于福雷斯特研究公司所描述的“用户时代”,这个时代中驱动业务决策的不再是公司,而是用户。基于这个原因,深度理解用户的重要性已经远胜以往,因此许多机构开始使用大数据技术来挖掘用户信息。
在这个时代,企图收获成功(甚至是求生存)的在线业务必须切实的理解顾客的体验和行为,因此海量数据的收集及挖掘能力成了这些机构的必备手段。当下,有许多机构的分析仍处于数据的收集上,组织能力的缺乏和技术的限制让这些收集来的数据失去了应有的价值。而在用户体验上也缺乏按部就班的计划,从而丧失了获取关键见解的途径。因此,这样的数据分析有很大的误导、不完整及不确定性。
收集和分析正确的数据、切实的理解用户体验及用户行为已成为当务之急,下面将分享10个大数据的使用方法,可以帮助机构从用户交互中获得见解、提高用户忠诚度并从根本上取得竞争优势:
1.将网络传输中的数据看做“金矿”并进行挖掘。你的网络中包含了大量其它公司无法从中获益的数据,收割这些数据中的价值是你真正理解用户体验的第一步。
2.不要总是用假设去了解你的用户,并且知道他们需要什么。拥抱用户,并且切实的了解用户行为,要比去假设要好的多。保持客观,从实际数据中获得见解。
3.尽可能的收集数据,从而减少盲点。盲点可能导致丢失关键信息,从而得到一个歪曲的用户体验观。确认你收集了一切可以影响到用户体验和行为分析的数据。
4.对比数据的体积,我们该更看重数量。收集好数据之后,专注于重要的数据来做分析方案。
5.迅速。用户需求优先级总是在变化的,技术需要迅速的做出分析并做调整。这样才能保证你分析出的不是过时结果,对于随时都在改变的需求,你需要迅速的收集数据并做出响应的处理。
6.实时的业务运作。这就需求对数据的实时分析并获取见解,从而在情况发生后可以实时的做出调整,从而保证最佳的用户体验及经营结果。
7.分析不应该给产品系统带来风险,也就是分析永远都不应该给用户体验带来负面的影响。所以尽可能多的捕捉数据,避免盲点才能让分析出的见解不会对业务有负效应。
8.利用好你数据的每一个字节,聚合数据可能会暗藏关键见解。这些信息片段可能会反应最有价值的见解,可以帮助持续的提升用户体验及经营效果。
9.着眼大局。捕捉与你站点或者网络应用程序交互的所有数据,不管是来自智能手机、平板或者是电脑。丰富数据,将不同储存形式之间的数据关联起来,确信这些点都被连接了起来。在处理中关联的越早,获得的见解就越完整、精准、及时和有效。
10.和平台无关,确保你的大数据分析能力不会受到设备的类型限制(笔记本、台式机、智能手机、平板等)。
以上是小编为大家分享的关于十个有效的大数据分析途径让你更了解用户的相关内容,更多信息可以关注环球青藤分享更多干货
⑼ 大数据技术中,关于用户行为分析方面的有哪些技术
做用户行为分析的基础是获得用户行为数据,例如用户页面停留时间、跳转来源等等。这些信息有些能直接拿到,有些是需要做一些计算才能拿到的。一般来说用户访问时的一些信息都是以日志的形式打到web容器的日志空间中去,这其中包含了最通用的一些访问信息以及一些自定义的日志打点。
题主提到了大数据技术中对用户行为进行分析,那么可以假定网站或者App的访问量是比较傲多的。由于系统流量比较大,计算维度又比较多,后续数据消费者的需求增长比较快,所以对计算分析平台有了一定的要求。具体表现为:
1.负载能力。流量增大以后带来的压力是多方面的,比如网络带宽的压力、计算复杂度带来的压力、存储上的压力等等。一般来说这些都是比较显而易见的,会对产生比较直接的影响,比如计算实时性下降、消息出现了堆积、OOM等等。为了解决这一现象,一般来说会选择一些分布式的框架来解决这个问题,比如引入分布式计算框架storm、spark,分布式文件系统hdfs等。
2.实时性。在系统资源捉襟见肘时消息的实时性会立即受到严重影响,这使得部分算法失效(例如对计算和收集上来的数据进行行为分析后,反馈到推荐系统上,当整体响应时间过场时会严重影响推荐效果和准确度)。对于这个情况来说可能会选择storm这种具有高实时性的分布式流式计算框架来完成任务。
3.系统管理和平台化相关技术手段。在大数据情景下,企业内数据环境和应用环境都是比较复杂的,用户行为分析应用不是一成不变的,那么就要求用户行为分析这种多变的应用在复杂环境中能有效生存,这包括算法数据材料的获得、系统运维、系统任务调度、系统资源调度等等,相关的技术很多时候要求团队自研,但也有ganglia、yarn、mesos这类开源系统可以参考或者直接使用。
4.数据链路。企业技术环境一般来说是非常复杂的,一层一层交错在一起,远不是一句MVC三层架构能够概括得了的,为了避免消息流通呈复杂的网状结构,一般会考虑应用服务化、企业服务总线(ESB)及消息总线来做传输,有兴趣的话题主可以网络一下这几个方向的技术和开源工具。
5.应用快速生成工具。我个人认为在大数据环境下应用都摆脱不了一个快速开发的要求,用户行为分析也是如此,这时候要考虑对接一些开源的分布式数据分析算法库而不是通过自己去实现,比如像spark ml,mahout这类的库用得好能减少很多工作量。