导航:首页 > 网络数据 > 大数据用户属性

大数据用户属性

发布时间:2023-03-18 09:39:02

大数据时代下的人群透视

人群透视又名人群分析,是按照用户的属性选取特定的人群,利用大数据的相关技术来探索数据背后的本质。常见的分析需求有观察特定地区的购买转化率、指定投放渠道新增用户数和转化率、发生业务行为的留存率等等。
我们先来看一个简单的例子,我们为昨天的活跃用户创建了一个指定的人群。产品人员想分析出用户中男性比例是否高于女性,利用相关的分析技术得到分布图。

未知是有些用户没有填写性别资料(利用身份证信息也可以自动补全或者通过其他的规则和模型识别)

读到这,想必大家对什么是人群透视有了一定的了解。那为什么要做人群透视?我先给大家描述一个场景,运营人员发送某个月的用户留存突然大幅降低了,看到这个数据后,接下来应该马上去找到是什么原因导致的。首先,运营人员会确认各个渠道的留存率情况(按照引流渠道进行人群的划分),发现某个渠道的新用户注册迅速增加,但留存率急剧下降;最后发现是由于渠道投放人员设置了针对特定人群的广告投放,但是这些用户却因为产品本身无法带来满足和愉悦而放弃。
上述就是一个由浅及深的人群透视分析场景,如果有这样一款数据分析工具,无需专业的数据分析师就能完成大部分的数据分析工作是不是很酷。
人群透视当前还有更多的场景。进行不同活动的效果分析对比、按照人群分析产品的走势、增长环节找到最优的决策点。

熟悉大数据相关或者数仓模型相关的同学肯定对事实表和维度表不陌生,事实表是指特定主题域下的业务行为,维度表中记录的是对某一个实体的描述信息。注册的行为表就是一张事实表,而用户画像表或者商品表我们可以称为维度表。人群透视就是按照用户属性维度表选取合适的取值来看在事实业务表上的表现情况。查看杭州地区女性的消费类型分布情况,其中“杭州地区女性”就是维度表的属性特征,消费类型则是消费记录事实表的记录。

首先明确我们要分析的业务指标。以渠道作为例子,我们想分析各个渠道的新用户增长、注册和登陆转化率情况。首先建立一张事实表,明确存储的粒度、业务字段集合。

按照渠道我们需要分析出每一个渠道的每天广告位点击情况、新增激活设备数、新增用户注册数、新增登陆用户数、设备激活转化率、注册激活转化率、登陆活跃用户转化率、激活成本、注册成本、活跃成本、总成本。
指标通常是数值类型,同时其计算规则应该满足可累性,比如sum、max、min、cnt,函数应该符合这样的关系:
f(A)=f(a,A-a) ,其中A是集合,a是A中的一个元素,即真对一个集合的计算可以进行迭代计算
比如mean、variance等就不是可累加的汇总函数

人群透视分析首先需要要按照属性圈选出人群集合,这是一个倒排索引的查询类别,市面上常用的倒排索引服务就是Eleastic Search。首先我们可以借助其倒排查询的能力快速勾选出用户ID列表。
指标的查询是一个正排索引查询的过程,根据用户ID查询出相应记录。常用的多维查询工具有Kylin、Druid、Presto、ES等,下面分别比较下各个框架的优缺点。

由于大部分的业务的转化需要一定时间的积累,大部分数据满足T+1的查询即可。同时T+1的数据可以利用数仓的数据直接进行汇总计算。如果一个业务分析指标的模型固定可以直接借助Kylin完成数据的分析存储。查询的指标如果是交互式、灵活多变的,则可以采用ES、Presto这样的存储查询方式。如上面的渠道分析模型,则直接可以采用Kylin进行存储。

目标:满足非大数据分析师日常的分析工作,帮助更快的发现问题、提出问题的方向和优先级、执行解决问题。另外提供一套标准的框架来便于用户导入合适的分析模型。
按照构建的生命周期我们可以分为五层,分别是人群指标定义、数据采集加工、数据存储、数据查询、数据图表化展示。
按照功能模块划分,我们可以得到如下架构图

场景的需求,明确要观察分析的业务场景和数据来源。渠道的注册转化分析需要收集广告的埋点点击、App的打开埋点、用户注册事件、点击成本统计等。最终借助于数据仓库加工成一张渠道转化事实表。同样的方式构建出渠道的维表信息。

人群 :符合某一个属性取值的用户集合。如借贷用户群、理财用户群体等。
人群组 :人群的组合,我们通常先真对不同的人群做对比,比如比较杭州和北京的借贷用户群,人群组的管理可以选取哪些维度作为区分条件组,地理位置、性别等等。人群组用户构建多维分析分析,划分组的属性列就是维度。对于一些连续数值列的属性可以按照区间值进行分类处理。

指标类型通常是数值的聚合函数,聚合函数最好要能满足可加性。
最常用的就是count,count函数无需构建在任何指标上,这种经常用于统计某一类人群的数量。
sum :统计某一列的数值的集合
max/min :统计数值最大/小的
distinct count :去重的数目统计
可以先根据表选取明确的指标列(只能是数值列,count的话数值取值默认为1),再勾选对应的聚合函数。这里可以选取不同表的不同数值列。
某一类维度的选取占整个人群的占比,比如杭州地区的高收入人群的购买量。

对上提供一层通用的库、表结构管理,提供一套统一的SQL给应用层面,对外根据具体的物理表存储介质翻译为具体的物理查询计划。查询接口的请求和响应分装为统一的结果,不对外体现具体的存储细节。

dashboard的管理,可以为指定的人群创建一个指定的分析模板,同时可以进行图标的新增、修改、删除等操作。
图表类型 :支持单维图表和二维图表。单维图表通常就是数量等,常见的有饼图、柱状图、仪表盘等
高级功能:选取一个图表,可以自己勾选要展示的维度(维度可以来源为维度表也可以来源于事实表,如时间可以来源于事实表)和指标,构建一个二维甚至是多维图形。

⑵ 基于大数据的用户标签体系建设思路和应用

基于大数据的用户标签体系建设思路和应用
在大数据时代,数据在呈现出海量化、多样化和价值化变化的同时,也改变了传统IT行业的市场竞争环境、营销策略和服务模式。
如何在ZB级的海量数据中获取并筛选有价值的信息,是对IT企业的一大挑战。通过构建客户标签,支撑精准营销服务,是应对上述挑战的有效解决方案。
但是怎么设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么使用用户标签创建商业价值?
这些都是产品设计层面需要解决的问题。
掌上医讯一直以来都致力于打造医生的今日头条和智能化的学习平台,通过大数据技术实现医生学习的智能化和个性化,而要构建这样一个学习平台,最基础的就是要建立用户的标签体系。
经过长时间的学习、思考、借鉴和实践,现在已经有了自己的标签构建思路,并且也已经提取出了符合自身业务的标签。我们十分重视用户行为日志的收集,现在已经有了亿万级别的日志数据,正在搭建数据处理和标签计算平台,以下是我们整理的建设思想。
标签系统的结构
标签系统可以分为三个部分:数据加工层、数据服务层和数据应用层。
每个层面向的用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。层级越往上,业务关联性就越强。
数据加工层
数据加工层收集、清洗和提取数据。掌上医讯有诸多的学习模块,同时又有网站、APP、小程序等多个产品形式,每个产品模块和产品端都会产生大量的业务数据和行为数据,这些数据极为相似又各不相同,为了搭建完善的用户标签体系,需要尽可能汇总最大范围的数据。收集了所有数据之后,需要经过清洗、去重、去无效、去异常等等。
数据业务层
数据加工层为业务层提供最基础的数据能力,提供数据原材料。业务层属于公共资源层,并不归属某个产品或业务线。它主要用来维护整个标签体系,集中在一个地方来进行管理。
在这一层,运营人员和产品能够参与进来,提出业务要求:将原材料进行切割。
主要完成以下核心任务:
定义业务方需要的标签。创建标签实例。执行业务标签实例,提供相应数据。数据应用层
应用层的任务是赋予产品和运营人员标签的工具能力,聚合业务数据,构建具体的数据应用场景。
(1)标签的类型
从数据提取维度来看,标签可分为:事实标签、模型标签和预测标签。
(2)事实标签
从生产系统获取数据,定性或定量描述用户的自然属性、产品属性、消费属性、资源属性等,以及根据工作人员经验积累的业务规则进行筛选、分析生产的标签,如是否活跃用户、是否是考生等。
(3)模型标签
对用户属性及行为等属性的抽象和聚类,通过剖析用户的基础数据为用户贴上相应的总结概括性标签及指数,标签代表用户的兴趣、偏好、需求等,指数代表用户的兴趣程度、需求程度、购买概率等。
(4)预测标签
基于用户的属性、行为、信令、位置和特征,挖掘用户潜在需求,针对这些潜在需求配合营销策略、规则进行打标,实现营销适时、适机、适景推送给用户。
从数据的时效性来看,标签可分为:静态属性标签和动态属性标签。
(5)静态属性标签
长期甚至永远都不会发生改变。比如性别,出生日期,这些数据都是既定的事实,几乎不会改变。
(6)动态属性标签
存在有效期,需要定期地更新,保证标签的有效性。比如:用户的购买力,用户的活跃情况。
标签的定义
给用户打标签,建立用户画像,最终都是为了去应用,所以我们要站在应用场景上去定义用户的标签体系,每个标签都有最终的用途。比如:我们做考试培训服务,我们需要建立“是否考生”的标签。
另外,不同的行业他们的用户特征也是有显著区别的,比如:医生用户相比普通用户来说,就多了像“科室”、“职称”、“所在医院等级”等特殊含义的标签。
而标签是有层级关系的,既是为了管理,更好的理解,又是为了控制粗细力度,方便最终的应用。标签深度一般控制在四级比较合适,到了第四级就是具体的标签实例。
我们根据公司的业务首先划分了人口属性、行为属性、用户分类和商业属性四个大的分类,下面又分了上网习惯、学习惯、人群属性、消费能力、消费习惯等分类,最末级精确到用户的活跃等级、阅读来源、考试偏好等具体的标签。
标签的维护
每个标签都不会凭空产生的,也不会一成不变,更不会凭空消失。标签的维护需要生成规则,需要定义权重,需要更新策略。
生成规则
如第一部分所说,标签分为事实标签,模型标签和预测标签三大类。对于这三类的标签,生成规则的难度和复杂性也是逐级递增的。事实标签只需要考虑从什么地方提取即可,它即包含明确的标签定义,又包含无法穷举的标签集,比如:关注的病种。
而模型标签需要进行数据的关联和逻辑关系的设计,通过一定的模型对数据进行计算得来。而预测标签相对就非常的复杂,无法从原始数据提取标签,标签的生成准确度就太依赖我们大数据分析和人工智能技术的应用。
定义权重
一个标签会在多个场景下出现,比如:一个疾病标签,它极可能在浏览过程中生成,也有可能在搜索场景下产生,但是对于这两个场景所对应的同一个标签,他们的权重是不同的。浏览相比搜索,权重要小得多,因为搜索的主动需求更大。
更新策略
上文我们从数据的时效性上对标签分为静态属性标签和动态属性标签,对于静态属性标签的处理相对比较简单,就不停的累加即可。但是对于动态属性标签,需要对过期标签进行降权甚至删除处理,比如:医生考试前和考试后,会影响“是否考生”这个标签的,这就需要制定更新策略。
标签建设的技术架构
标签体系的建设涉及很多环节,数据量也十分巨大,需要有一个健壮且高效的技术架构来支持数据的存储及计算,掌上医讯采用了sql数据库和no-sql数据库来满足结构化数据和非结构化数据的存储。
使用hadoop的分布式存储技术及hive和hbase组件作为数据仓库,使用MapRece和spark分布式计算来提高计算速度,使用kylin进行多维分析,通过BI工具和接口对外提供应用,使用sqoop和kettle进行数据的抽取及流程的调用。
更多的应用场景
用户标签建立已经基本应用在掌上医讯的内容智能推荐的学习场景中,但随着标签的完善以及智能化处理的提升,这套标签体系将有更广阔的应用场景。
(1)智能化学习场景的构建
通过用户学习需求的标签的分析进行用户分群,针对不同的用户群在APP的功能和内容上进行个性化展示,满足不同学习需求的用户个性化的学习服务。
(2)精准营销推广的建立
更细粒度的对用户进行筛选,同时能够精准预测可能存在的目标用户进行推广,从而扩大医生覆盖,提升推广的转化率。
(3)KOL用户画像的描绘
基于该标签模型,增加对外部数据的采集分析,更加完整的生成医生360度的用户画像,帮助企业寻找潜在的KOL用户,实现用户洞察,辅助市场决策。
标签的建设是一个看似高大上,其实很繁琐、纠结的过程,需要对业务抽丝剥茧,还要应对运营需求的各种变化,不过对公司发展的影响也是深远的。

⑶ 如何利用大数据技术构建用户画像

1、认识用户画像


用户画像简单来讲,就是用户信息标签化。即收集这个用户的各种数据和行为,从而得出这个用户的一些基本信息和典型特征,最后形成一个人物原型。一般用户画像会分析三个信息维度,分别是基本属性、消费购物以及社交圈。其中基本属性就是指用户的一些基本信息,比如年纪、性别、生日、学校、所在地等等。


2、利用大数据构建用户画像的好处


(1)精准营销:当企业和商家掌握了用户的一定信息后,就可以构建出清晰的用户画像,这样一来就可以根据用户的偏好、收入等标签,推荐给他们会感兴趣的商品和服务。


(2)用户统计:通过大数据我们可以对一些数据进行统计,比如我们经常会看到有一些APP的排行榜,甚至是渗透率、日活率这些具体数据都可以清晰统计出来。


(3)数据挖掘:构建智能推荐系统,利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌,利用聚类算法分析,喜欢红酒的人年龄段分布情况。


(4)进行效果评估:其实相当于市场调研、用户调研,迅速下定位服务群体,提供高水平的服务。比如你是一个买车的想要投放广告,但是不知道哪个渠道投放更好,就可以先尝试一下,看看数据反馈如何。


(5)私人订制:对服务或产品进行私人订制,然而不法商家也会利用用户画像来杀熟。


(6)业务经营分析:业务经营分析以及竞争分析,影响企业的商业决策,甚至发展战略。


3、构建用户画像的流程


(1)数据源端:一般来讲构建用户画像的数据来自于网站交易数据、用户行为数据、网络日志数据。当然也不仅限于这些数据,一些平台上还有个人征信数据。


(2)数据预处理:第一步是清洗,把一些杂乱无序的数据清洗一下,然后归纳为结构化的数据,最后是把信息标准化。我们可以把数据的预处理简单理解为把数据分类在一个表格中,这一步就是奠定数据分析的基石。


关于如何利用大数据技术构建用户画像,青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。

⑷ 大数据应用之“画像”

随着大数据技术的备受关注,有关“用户画像”、“商品画像”、“产品画像”、“资产画像”……的讨论就不绝于耳。那么,究竟什么是画像?又如何进行画像建设与画像分析呢?我们就从以下几个方面,着重探讨一下。

1、什么是画像?

用户画像,被定义为一种抽象出用户信息全貌的手段。

举个简单的例子,某个客户的特征描述为:500强企业,媒体行业,旗下产品覆盖网站、APP、微博、微信等端口,拥有受众9亿+,这就是一个典型的用户画像,我们据以便可以知道其存在大数据方面的需求。如果用一句话来描述,即:用户信息标签画。

大数据的时代背景下,画像被认作为企业应用大数据的根基,并直接跟企业经营能力、竞争优势的打造联系在一起。

有评论指出,要看一家企业的数据化运营程度,首当其冲地要看其“画像”构建情况:是否建设了“画像”?“画像”体系构建程度如何?针对什么对象进行了画像?构建画像的各种标签与指标情况如何?有没针对已建立起来的”画像”的应用?应用情况如何?等等

2、为什么要进行用户画像

这跟用户行为识别及数据应用直接相关。

各行各业都期待着,用户能主动告诉我们,他们的行为偏好。然而,事实既总非如愿,技术实现也非如此简单:首先,用户用以描述兴趣的自然语言很难为自然语言理解技术所理解;其次,用户的 兴趣是不断变化的,无法不停地提供兴趣描述;最后,很多时候用户并不知道自己喜欢什么,或很难清楚描述出自己喜欢什么。

于是,我们需要通过算法自动发掘用户行为数据,从用 户的行为中推测出用户的兴趣,从而给用户推荐满足他们兴趣的产品和服务,而画像,就是其中最重要的应用之一。

画像,通过为用户打标签的方式,使计算机能够程序化处理与人相关的信息。

如用户信息的分类统计:喜欢魅族的用户有多少?喜欢魅族的人群中,男、女比例是多少?如用户数据的挖掘工作:利用关联规划计算,购买该种商品的用户还购买了什么产品?利用聚类算法分析,喜欢该种产品的人年龄段分布情况如何等等?

3、构建用户画像的关键是什么?

从画像与标签的关系也可以窥见一斑,标签是画像建设的关键。同时,它也是大数据技术场景化的关键,因为如果没有针对场景构建出来标签,大数据的应用往往就很难“落地“。

一个标签通常是人为规定的高度精炼的特征指标,如年龄段标签:25-35岁;地域标签:北京、上海;设备标签:PC、移动;性别标签:男、女等等。

标签呈现出明显的语义化与短文本的特征:语义化,人能很方便地理解每个标签含义,使得用户画像模型具备实际意义,能够较好的满足业务需求;短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。

制定标签要遵循一定的规则,既要涵盖重要信息,又要方便机器做标签提取、聚合分析。

案例:用户的商品价格偏好标签建设过程

以某公司构建用户消费偏好画像为例,我们需要根据具体场景下用户的选择行为,将用户偏好画像拆分成几个不同数据标签:品牌、价格、购买时间、购买方式等

取用户历史购买消费记录,统计用户历史购买商品的价格,然后对价格进行区间划分。看用户购买的价格带主要集中在哪个区间中(价格带偏爱应该是一个相对动态的标签,更新频率可能一个月需要定期更,而且选择的时间段也应该是过去某个时间,不应该选择过长时间段。大家想想为什么?)。如何进行价格区间划分?

方法一:按统计学的方法

1、按分位数进行。例如:25%,50%,75%

2、按等箱原则。划分几等分

3、看数据的分布。

4、……

方法二:按业务知识经验

把价格带按业务经验,行业经验进行划分。

通过数据统计出来,我们可以看用户是否商品单价是否集中的某个区间范围内。例如,某用户购买的商品价格主要集中在30到40这个区间内,根据历史显示可以说,用户可能偏好于购买这个价格带的商品。当未来我们需要做促销商品推荐的时候,可以向该用户重点推荐打折后在这个价格区间的商品。

通过用户购买的价格区间,以及结合商品所归属的品类,可以看这个价格区间在这个品类中属于什么级别的。可以进一步给用户打上:注重品牌、注重高性价比等标签。

例如:如果某个品类商品的价格范围是(5,40],该用户购物商品主要集中(30,40]这个商品价格区间,用户在这个品类的消费上都是最高价格区间,说明这个用户在购买这个品类主要购买的高端商品。这样又可以为这个用户打上在这个品类的消费特征标签:品类高端用户。

4、构建用户画像的方法

从上面案例中,我们可以抽象出构建用户画像的方法,即用户画像模型的构建方法。

一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户、在什么时间、在什么地点、做了什么事。

其中用户的属性识别关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。时间的属性包括两个重要信息:时间戳和时间长度,时间戳指的是标识用户行为的时间点,通常精确到秒;时间长度指的是标识用户的停留时间。地点的属性也就是用户接触点,在互联网上,用户的接触点就包括了网址和内容两个重要信息。

用户行为属性有不同的类型,结合接触点的内容产生的标签信息,具有不同的权重。用户画像的数据模型可以概括为这样一个公式:用户标识+时间+行为类型+接触点(网址+内容),某个用户在某个时间、某个地点做了什么事情,就会被打上一个既定的标签。而用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子,行为类型、网址决定了权重,内容决策了标签,可以认为公式转变为标签权重=衰减因子×行为权重×网址子权重。

通过这样的计算才能够构建用户画像模型,进而能够逐步细化模型,从而最终制作出一个精准的用户模型。而每一个精准的用户模型都能够根据用户不断调整的互联网行为进行更新,从而精准把握用户心理,为每一个用户提供最完美的精细化服务,全面提升客户感知,最终实现客户满意度的不断提升。

⑸ 大数据时代的用户数据如何区别保护

大数据时代的用户数据如何区别保护
大数据时代,是物联网的时代,随着云存储和云计算的发展,以智能手机、智能家电、可穿戴设备为代表的智能终端的普及,通过各种智能终端上传和收集的用户数据将越来越多,对用户数据的分析和挖掘及利用,将是大数据的商业价值所在,蕴藏和巨大价值的用户数据的性质及使用规则是我们值得思考的问题。
用户数据的“区分所有权”构想
提到用户数据,我们首先想到的是用户的“隐私权”。民法大家王利明教授在其主编的《人格权法新论》一书中提到:隐私权是自然人享有的对其个人的与公共利益无关的个人信息、私人活动和私有领域进行支配的一种人格权。可见隐私权是一项“个体”权益,强调权利的身份和人格的属性。
用户数据的商业价值核心并不是“个人”的人格权益,其必要条件是具备足够多的用户个体样本,其更强调“集合”的权利,单个用户数据的商业价值是有限的。而用户数据的核心价值在于通过对云端存储的海量的用户个人状况、行为、需求的样本分析和挖掘,一方面为上游硬件商提供产品的开发依据,另一方面对用户的消费、生活提供“量身打造”的服务,从而形成物联网的全产业链循环,实现更高效的管理社会资源并创造更多的价值。
可见,虽然用户数据来源于“个体”数据,但最终使社会获益的是用户的“集合”数据。因此,在界定用户数据的性质方面,笔者建议根据单个数据是否具有身份属性,将用户数据分为身份数据和样本数据,并对这两类数据加以区别保护。
用户的身份数据是指可以通过单一的个体数据,即能锁定特定用户的数据。如姓名、身份证号、各种账号信息、联系方式等。比如我们通过一个电话,就能联系到一个特定的用户。因此,此类信息具有较强的身份属性,须定义为“隐私权”的范围,其权利主体应为用户个人所有,其使用和经营,须经过用户的许可,否则将被判定为侵权。现行法律法规如《全国人民代表大会常务委员会关于加强网络信息保护的决定》、工信部出台的《电信和互联网用户个人信息保护规定》以及消费者权益保护法、《网络交易管理办法》中规定的个人信息,当属于用户的身份数据范畴。
样本数据是指通过个体数据汇聚成的用户个人状况、行为、需求的数据库以及通过分析和挖掘以上数据获得的相关数据。此类数据的所有权应为用户和数据收集方共有,但经营使用权建议应掌握在能够发挥其价值的数据收集者手中。将所有权和经营权区分开来,既能从法律上保证用户的个体权益,又符合经济学的原理。
样本数据的经营规则
用户身份数据的使用规则可以依据现有的法律法规执行。我们仅需要通过立法明确以上法律所适用的数据的范围,并在执行层面的政策上制定可操作的保护用户身份数据和隐私权的规章制度。
对于样本数据的使用和经营规则,现有法律并没有明确依据。根据上文的阐述,笔者已将其所有权拟定为用户和数据收集者共有,经营使用权则建议应掌握在能够发挥其价值的数据收集者手中。这样设计的目的在于,一是保留用户的“被遗忘权”;二是发挥物尽其用的作用。
首先,保留用户的“被遗忘权”是用户数据使用的基础。
大数据时代到来,人们最担心的是自己将被暴露得一览无余,没有隐私可言。因此,个体信息是否公开,公开的程度,需要个体能够掌控,即用户自主决定其向外界公开的个人信息的广度和深度,也可随时自行或要求收集数据方,删除其掌握的任何关于用户个体的数据。用户要求收集者删除其样本信息时,须提供可以辨识其个体信息的依据(一般须为身份信息),以证明其要求删除的信息是属于自己的样本信息。
其次,数据收集者在收集样本数据时,须向用户群体公示其收集途径和方式,以及用户删除自己样本信息的途径和方法。只有这样,用户才能知晓其被收集者收集的数据是什么,以及自己的样本信息被经营者使用的状况是否安全,从而判断其是否愿意继续使用数据收集者的产品,并将自己的样本信息交给数据收集者经营。一旦用户选择使用某一数据收集者的产品,数据收集者将与用户共有其收集的用户样本数据。
第三,数据收集者在遵守法律对用户隐私保护前提下,无需用户授权,可自由地使用和经营其收集到的用户的样本数据,直至用户自行或要求其删除样本数据。
当前,各数据收集者之间进行不同程度的共享和授权数据的需求已是大数据的发展趋势。云与云的互联互通才能使数据样本变得足够庞大,使数据分析和挖掘的结果更有价值,使用户不同智能终端之间的连接变得可能,从而真正的实现大数据的物联网。
样本数据的共享和授权中涉及到大量个体信息,如果用户此类活动需要经过个体用户的授权,将会极大地阻碍商业效率,其数据和信息的收集是随时随地的,要求单个用户对单个的样本授权,也会影响用户的体验。因此最现实的方式是数据的收集者在经营和使用其收集的数据时,无需个体用户的单独授权。
最后,数据收集者通过样本数据所获取的收益,个体用户须有分配权。
个体用户对数据经营的收益分配权容易理解。数据的源头是个体,个体是样本数据的所有者,因此其理所应当得到经营数据的利益。分配的方式和数量可由数据收集者确定并公示,一旦用户使用特定数据收集者的产品,即表明其同意以此对价获取收益。当然,用户领取收益的前提是提供可以辨识其个体信息的依据(一般须为身份信息),以证明其是对应个体样本数据的提供者。

⑹ 听说个推有基于大数据的用户画像,想知道它的标签体系是怎样的。谁比较清楚呢,说说呗

标签是某一种用户特征的符号表示,每个标签都规定了观察、认识和描述用户的一个角内度,容用户画像是一个整体,各个维度不孤立,标签之间有联系,用户画像可以用标签的集合来表示。个推有几百个用户相关的标签,用户的性别,年龄,兴趣爱好,消费习惯,地理位置,用户设备等。

⑺ 神策大数据用户行为分析-1-入门知识

神策大数据用户行为分析入门,主要涉及的知识点:

神策分析是针对 企业级客户 推出的 深度用户行为分析产品 ,有以下特点:

产品角色作为产品规划者,重点关注产品

数据驱动产品优化

运营角色重点关注

渠道角色重点关注

技术角色重点关注

电商用户通常会经历以下 核心行为流程

产品核心流程可描述为

查看新客总数,同时按照日期、渠道等维度拆分下钻

查看各渠道新客的核心流程总转化率及各步骤间的转化率,寻找总转化率提升空间

神策支持查看特定用户群的历史行为序列,找到提交订单行为,对此之后的行为进行人工标注,以推测后续未进行支付环节的原因

解各渠道来源用户的活跃程度,以及目标行为——支付订单行为发生的频率

针对特定人群实现精准营销,支持将特定用户设备 List 同步到极光/小米,向流失用户进行 App 内的精准推送,以期重新激活挽回流失。

神策支持将分析结果添加到概览,使业务分析人员无需配置快速获得所关注的指标现状

神策分析中的所有数据均来自于客户的自有数据接入

神策分析主要支持采集客户的自有数据有三类,分别是 前端操作、后端日志及业务数据(包括历史数据) ,接入的方式主要是有3种:

日常工作中,我们遇到的实际问题:

为了回答以上问题,需要对产品上的各种行为进行分析和统计。

对上述的行为进行统计,得到的如下指标:

神策分析使用事件模型来描述(Event 模型)用户行为,描述用户行为的关键要素: 是谁、什么时间、什么地点、以什么方式、干了什么

主要是涉及到两个核心事件:

一个完成的事件包含几个关键要素:

每个 User 实体对应一个真实的用户

每个用户有各种属性,常见的属性例如: 年龄、性别 ,和业务相关的属性则可能有: 会员等级、当前积分、好友数 等。这些描述用户的字段,就是用户属性。

简单来说,在用户 未登录 的情况下,神策会 选取设备 ID 作为唯一标识

登录状态 下选取 登录 ID 或者 userid ,一个用户既有设备ID(亦称作“匿名ID”)又有登录ID

通过 用户关联 将同一个用户的设备ID 和登录 ID 关联到一起,这样不管用户是匿名和登录的状态发生的行为,我们都能准确识别到是同一个用户。

神策分析使用 神策 ID (即 events 表里的 user_id 和 users 表里的 id )来对每个产品的用户进行唯一的标识。

神策 ID 是基于 distinct_id 按照一定规则生成的,两种典型的 distinct_id :

users表中的fisrts_id指的是设备ID,second_id指的是登陆ID

1.特点

只要设备不变,那么设备ID不变,神策ID不变

2.案例说明

案例解释说明

关联设备 ID 和登录 ID 的方法虽然实现了更准确的用户追踪,但是也会增加埋点接入的复杂度。

1.适用场景

2. 局限性 *

3.案例说明

案例具体解释

1.使用场景

一个登陆ID绑定多个设备,比如 Web 端和 App 端可能都需要进行登录。

支持一个登录 ID 下关联多设备 ID 之后,用户在多设备下的行为就会贯通,被认为是一个神策 ID 发生的。

2.局限性

3.案例说明

操作同上面的流程,重点关注第七条记录

由于设备 Y 被关联到登录 ID A 下,修复设备 Y 上登录之前的数据:神策 ID 3 ->神策 ID 1

⑻ 在利用大数据技术进行营销时哪些数据属于用户的隐私信息

对大数据运用和安全保护的思考
万平:商务智能分析师,风险计量和模型研发专家
大数据时代,对于普通客户来讲,对于所谓隐私安全、信息安全的忧虑其实已经很难自行缓释了。笔者一直致力于企业数据分析和数据应用,特从企业数据用途角度来谈谈对于数据安全的思考。
一、专业分析数据,使用正确数据
在大数据运用过程中,企业要明确数据属性和数据用途。对于企业不经常用但涉及客户隐私的信息要严格保密,如姓名、身份证号、手机、邮箱、工作单位、家庭住址、车牌号码等基础信息,这些对于客户来讲绝对具有唯一性,是客户最为关键的私密信息,而本质上不具备任何的分析功能,对于企业研究消费者消费习惯、社交网络、市场偏好、产品研发、服务运营等来讲其意义并不直接,而从客户信息安全的角度来讲,这却是最为重要的,需严格加密,与一般常用信息隔离存储,以保证安全。
二、切不可随意滥用客户的唯一性信息
企业努力去获取并分析客户的消费习惯、交易行为、社会网络、产品偏好等数据,用以改善自己的运营服务、产品供给、定价策略无可厚非,这也是企业市场竞争力的表现,然而生活在互联网时代的人们已经被各种营销短信、欺诈电话困绕很长时间了。这种困局的出现,不管是企业自主还是被不法分子盗用,都是在随意、滥用客户的隐私信息,是对客户人身、财产、安全的一种不道德的践踏行为。
三、大数据时代,法律要强调保护弱者
尽管大数据时代对个人信息安全保护有各种先进的技术,但这是远远不够的。比如,有报道称储户遇到的银行账户内资金失踪、ATM机取假钞、信用卡盗刷时,掌握着音频、视频、交易记录等大数据的银行却要求客户举证,这无疑让客户沦为弱者,而法律却无条款规定,这显然是不科学的。同时,对于故意欺诈金融机构、欠债跑路的老赖们,公安机关要充分联合各行业大数据维护正义。
大数据,是时代进步的必然产物,但伴随而来的信息安全是考验企业道德和社会法制健全的重要方面。因此,我们一方面要借助大数据来提高企业的产品质量和服务品质;另一方面,也要切实保护客户的信息安全。
大数据时代,客户隐私会变得越来越少
石云:CC-CMM标准组织常务理事、研发总监
日前网上流传了这么一个段子:一个客户打电话订购比萨,客服人员根据他的会员卡号报出他的家庭住址和所有电话号码,根据他的医疗记录和图书馆借阅信息推荐适合他的披萨口味,根据他的信用卡和房贷欠款信息推荐现金支付,甚至还准确定位出他正在离比萨店30分钟路程的地方骑着一辆摩托车……
我们生活在大数据的时代,“大数据”之大,不仅仅是数据容量之大,更是数据抓取、整合和分析能力的强大。不可否认,大数据在为我们带来方便生活的同时也为企业带来了不可估量的商业价值,尤其是移动互联网的到来,让每个人无论何时何地都能以不同的终端入口连接在互联网上,一切数据都被企业以各种形式进行抓取、整合和分析。于是,我们的一举一动企业都了如指掌,根据你的兴趣爱好、你的定位信息,企业可以随时随地向你发送广告和促销活动。在这个时代,数据安全,尤其是个人隐私问题,正在日益困扰我们身边越来越多的人。毫无疑问,客户的数据越多,能够分析得到的信息量就越大,但其中客户的隐私就会变得越来越少。如何在大数据时代保护客户数据和隐私,是我们不得不面对的问题。
企业大数据与大数据安全初探
程学勇:华远智德(北京)科技有限公司总经理,企业绩效管理资深咨询顾问
大数据并不是一个新的概念,任何一个企业从一诞生开始便持续创造并拥有大数据。大数据环境下数据安全的首要任务仍然是对数据的非法访问和入侵的防范,但由于大数据的特点,其安全架构也异于传统的企业信息系统安全。针对大数据安全,企业将面临更多更加艰难的挑战,例如企业很难对文件丢失的原因进行追溯,很难确认一个包含敏感数据信息的非结构化文件(如Word,Excel文件)是否传递给了不应该拥有它的人。
即便如此,大数据技术的出现又为大数据安全带来契机。当前的大数据技术能够针对结构化、非结构化数据进行采集,按照预定规则进行数据采集、归类,并按照预定规则进行实时监控分析,这大大提高了企业对大数据非法访问和入侵检测的技术手段。在此背景带动下,未来的数据安全监控对象将不仅仅是信息系统账号、权限、数据的安全,在企业中存在于各种载体形式之下的数据都将成为安全管理对象,如电子邮件、标书报价单的内容等等。
在这一架构中,除了大数据技术,借助于商务智能的信息安全可视化同样为企业的信息安全防范带来帮助。建立企业统一的数据安全视图,使按照安全特性、安全对象、业务对象进行分类的多维度下的安全甄别线索、证据的展现更加容易让管理员了解安全问题发生的节点、原因及可能出现的安全风险趋势,以便制定更加完善的安全策略。
大数据时代的企业及个人隐私保护
黄成明:数据化管理咨询顾问、培训师
从2014年开始,大家真真正正地感觉到大数据时代的来临,每个人都能说出几个大数据的案例,例如大数据帮助奥巴马连任成功、微软大数据成功预测奥斯卡21项大奖、大数据测算出来的热播电视剧《纸牌屋》、网络预测2014年高考作文等等。
但是,大数据带来的副作用是个人的隐私无处遁形,我们每天产生各种数据,这些数据基本上都能被机器、程序等捕捉到。浏览网页记录会被机器追踪,买东西的消费记录会被商家利用,在大街上行走也会被无处不在的Wi-Fi跟踪……
那么,在大数据时代个人如何保护自己的隐私呢?
1、提高个人的安全防范意识,不要轻易将自己的个人信息上传到网络或留给商家。现在的商家办个会员卡都恨不得你把所有的家庭信息都填上,比如不久前笔者刚办过一张健身卡,申请登记时竟然要求填身份证号码,这当然被我拒绝。个人重要的信息包括手机号、微信微博号、QQ号、身份证号、银行卡号、社保号等。
2、养成随时清除无用信息的习惯,比如定时删除自己上网的历史记录,将记录了自己重要信息的文件(包括通话记录单,银行卡账单等)撕碎然后扔到不同的垃圾筐中等等。
3、不要随意下载陌生软件,不要添加如微信中的陌生账号,不要随意扫二维码,谨慎使用社交网络。
对于企业来说,保护企业的商业秘密也是重中之重:
1、需要建立一套企业信息保密制度,例如将重要信息分级管理,培训并监督员工认真执行。可能的情况下,企业可以设立一个隐私官的职位。
2、企业必须部署网络安全设备,一是防止被外部攻击,其次也可以追踪企业信息流向。

阅读原文

有用 
|


分享
客户数据管理系统,超值好物热卖,上淘宝,放心购!
客户数据管理系统,买东西上淘宝,海量必buy好物!物美好价,退换无忧,轻松购物!海量商品,品牌汇聚,省钱更省心!更多品质好货,尽在淘宝,淘你满意!
淘宝热卖广告
2022入驻网络爱采购-让您订单接到手软
值得一看的客户信息相关信息推荐
B2B平台-网络爱采购,旨在帮助用户直达商品信息和优质商家同时为卖家提供了丰富的匹配询价单信息,帮助卖家快速匹配买家,扩大有效交易量

⑼ 为什么用户属性在移动营销中如此重要呢

利用好用户属氏吵性在企业移动营销中发挥的作用歼清侍是非常大的,而在技术手段利用大数据理解正亏用户属性并不是所用企业可以比及的,使用营销工具则是最明智的选择。希望心鸽电商 手机能帮到你

⑽ 金融行业如何用大数据构建精准用户画像

用户画像的焦点工作就是为用户打“标签”,而一个标签通常是人为规定的高度精炼的特征标识,如年龄、性别、地域、用户偏好等,最后将用户的所有标签综合来看,就可以勾勒出该用户的立体“画像”了。

为了精准地描述用户特征,可以参考下面的思路,从用户微观画像的建立→用户画像的标签建模→用户画像的数据架构,我们由微观到宏观,逐层分析。

首先我们从微观来看,如何给用户的微观画像进行分级呢?如下图所示

总原则:基于一级分类上述分类逐级进行细分。

第一分类:人口属性、资产特征、营销特性、兴趣爱好、购物爱好、需求特征

市场上用户画像的方法很多,许多企业也提供用户画像服务,将用户画像提升到很有逼格一件事。金融企业是最早开始用户画像的行业,由于拥有丰富的数据,金融企业在进行用户画像时,对众多纬度的数据无从下手,总是认为用户画像数据纬度越多越好,画像数据越丰富越好,某些输入的数据还设定了权重甚至建立了模型,搞的用户画像是一个巨大而复杂的工程。但是费力很大力气进行了画像之后,却发现只剩下了用户画像,和业务相聚甚远,没有办法直接支持业务运营,投入精力巨大但是回报微小,可以说是得不偿失,无法向领导交代。

    事实上, 用户画像涉及数据的纬度需要业务场景结合 ,既要简单干练又要和业务强相关,既要筛选便捷又要方便进一步操作。用户画像需要坚持三个原则,分别是人口属性和信用信息为主,强相关信息为主,定性数据为主。下面就分别展开进行解释和分析。

描述一个用户的信息很多,信用信息是用户画像中重要的信息,信用信息是描述一个人在社会中的消费能力信息。任何企业进行用户画像的目的是寻找目标客户,其必须是具有潜在消费能力的用户。 信用信息可以直接证明客户的消费能力,是用户画像中最重要和基础的信息 。一句戏言,所有的信息都是信用信息就是这个道理。其包含消费者工作、收入、学历、财产等信息。

我们需要介绍一下强相关信息和弱相关信息。 强相关信息就是同场景需求直接相关的信息,其可以是因果信息 ,也可以是相关程度很高的信息。

如果定义采用0到1作为相关系数取值范围的化,0.6以上的相关系数就应该定义为强相关信息。例如在其他条件相同的前提下,35岁左右人的平均工资高于平均年龄为30岁的人,计算机专业毕业的学生平均工资高于哲学专业学生,从事金融行业工作的平均工资高于从事纺织行业的平均工资,上海的平均工资超过海南省平均工资。从这些信息可以看出来人的年龄、学历、职业、地点对收入的影响较大,同收入高低是强相关关系。简单的将,对信用信息影响较大的信息就是强相关信息,反之则是弱相关信息。

用户其他的信息,例如用户的身高、体重、姓名、星座等信息,很难从概率上分析出其对消费能力的影响,这些弱相关信息,这些信息就不应该放到用户画像中进行分析,对用户的信用消费能力影响很小,不具有较大的商业价值。

用户画像和用户分析时,需要考虑强相关信息,不要考虑弱相关信息,这是用户画像的一个原则。

例如可以将年龄段对客户进行划分,18岁-25岁定义为年轻人,25岁-35岁定义为中青年,36-45定义为中年人等。可以参考个人收入信息,将人群定义为高收入人群,中等收入人群,低收入人群。参考资产信息也可以将客户定义为高、中、低级别。定性信息的类别和方式方法,金融可以从自身业务出发,没有固定的模式。

将金融企业各类定量信息,集中在一起,对定性信息进行分类,并进行定性化,有利与对用户进行筛选,快速定位目标客户,是用户画像的另外一个原则。

下面内容将详细介绍,如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。

什么用户 :关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。

以上列举了互联网主要的用户标识方法,获取方式由易到难。视企业的用户粘性,可以获取的标识信息有所差异。

什么时间 :时间包括两个重要信息,时间戳+时间长度。时间戳,为了标识用户行为的时间点,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即可。因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也只能到毫秒。时间长度,为了标识用户在某一页面的停留时间。

什么地点 :用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址 + 内容。网址:每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是PC上某电商网站的页面url,也可以是手机上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信订阅号页面,某游戏的过关页。

内容 :每个url网址(页面/屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。

注:接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖1元,火车上卖3元,景区卖5元。 商品的售卖价值,不在于成本,更在于售卖地点。 标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即愿意支付的价值不同。

标签 权重

矿泉水 1 // 超市

矿泉水 3 // 火车

矿泉水 5 // 景区

类似的,用户在京东商城浏览红酒信息,与在品尚红酒网浏览红酒信息,表现出对红酒喜好度也是有差异的。这里的关注点是不同的网址,存在权重差异,权重模型的构建,需要根据各自的业务需求构建。

所以,网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。

什么事 :用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。

不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。如,购买权重计为5,浏览计为1

红酒 1 // 浏览红酒

红酒 5 // 购买红酒

综合上述分析,用户画像的数据模型,可以概括为下面的公式: 用户标识 + 时间 + 行为类型 + 接触点(网址+内容) ,某用户因为在什么时间、地点、做了什么事。所以会打上**标签。

如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。

标签: 红酒,长城

时间: 因为是昨天的行为,假设衰减因子为:r=0.95

行为类型: 浏览行为记为权重1

地点: 品尚红酒单品页的网址子权重记为 0.9(相比京东红酒单品页的0.7)

假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。

则用户偏好标签是:红酒,权重是0.95*0.7 * 1=0.665,即,用户A:红酒 0.665、长城 0.665。

上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考,去构建用户画像模型,进而能够逐步细化模型。

本文并未涉及具体算法,更多的是阐述了一种分析思想,在计划构建用户画像时,能够给您提供一个系统性、框架性的思维指导。

核心在于对用户接触点的理解,接触点内容直接决定了标签信息。内容地址、行为类型、时间衰减,决定了权重模型是关键,权重值本身的二次建模则是水到渠成的进阶。模型举例偏重电商,但其实,可以根据产品的不同,重新定义接触点。

比如影视产品,我看了一部电影《英雄本色》,可能产生的标签是:周润发 0.6、枪战 0.5、港台 0.3。最后,接触点本身并不一定有内容,也可以泛化理解为某种阈值,某个行为超过多少次,达到多长时间等。

比如游戏产品,典型接触点可能会是,关键任务,关键指数(分数)等等。如,积分超过1万分,则标记为钻石级用户。钻石用户 1.0。

百分点现已全面应用用户画像技术于推荐引擎中 ,在对某电商客户,针对活动页新访客的应用中,依靠用户画像产生的个性化效果,对比热销榜,推荐效果有显著提升:推荐栏点击率提升27%, 订单转化率提升34%。

金融企业内部的信息分布在不同的系统中,一般情况下, 人口属性信息主要集中在客户关系管理系统 , 信用信息主要集中在交易系统和产品系统之中 ,也集中在客户关系管理系统中, 消费特征主要集中在渠道和产品系统中 。

兴趣爱好和社交信息需要从外部引入 ,例如客户的行为轨迹可以代表其兴趣爱好和品牌爱好,移动设备到位置信息可以提供较为准确的兴趣爱好信息。社交信息,可以借助于金融行业自身的文本挖掘能力进行采集和分析,也是可以借助于厂商的技术能力在社交网站上直接获得。社交信息往往是实时信息,商业价值较高,转化率也较高,是大数据预测方面的主要信息来源。例如用户在社交网站上提出罗马哪里好玩的问题,就代表用户未来可能有出国旅游的需求;如果客户在对比两款汽车的优良,客户购买汽车的可能性就较大。金融企业可以及时介入,为客户提供金融服务。

客户画像数据主要分为五类, 人口属性、信用信息、消费特征、兴趣爱好、社交信息。 这些数据都分布在不同的信息系统,金融企业都上线了数据仓库(DW),所有画像相关的强相关信息都可以从数据仓库里面整理和集中,并且依据画像商业需求,利用跑批作业,加工数据,生成用户画像的原始数据。

数据仓库成为用户画像数据的主要处理工具,依据业务场景和画像需求将原始数据进行分类、筛选、归纳、加工等,生成用户画像需要的原始数据。

用户画像的纬度信息不是越多越好,只需要找到这五大类画像信息强相关信息,同业务场景强相关信息,同产品和目标客户强相关信息即可。根本不存在360度的用户画像信息,也不存在丰富的信息可以完全了解客户,另外数据的实效性也要重点考虑。

依据用户画像的原则,所有画像信息应该是五大分类的强相关信息。强相关信息是指同业务场景强相关信息,可以帮助金融行业定位目标客户,了解客户潜在需求,开发需求产品。

只有强相关信息才能帮助金融企业有效结合业务需求,创造商业价值 。例如姓名、手机号、家庭地址就是能够触达客户的强人口属性信息,收入、学历、职业、资产就是客户信用信息的强相关信息。差旅人群、境外游人群、汽车用户、旅游人群、母婴人群就是消费特征的强相关信息。摄影爱好者、游戏爱好者、健身爱好者、电影人群、户外爱好者就是客户兴趣爱好的强相关信息。社交媒体上发表的旅游需求,旅游攻略,理财咨询,汽车需求,房产需求等信息代表了用户的内心需求,是社交信息场景应用的强相关信息。

金融企业内部信息较多,在用户画像阶段不需要对所有信息都采用,只需要采用同业务场景和目标客户强相关的信息即可,这样有助于提高产品转化率,降低投资回报率(ROI),有利于简单找到业务应用场景,在数据变现过程中也容易实现。

千万不要将用户画像工作搞的过于复杂,同业务场景关系不大, 这样就让很多金融企业特别是领导失去用户画像的兴趣,看不到用户画像的商业,不愿意在大数据领域投资。为企业带来商业价值才是用户画像工作的主要动力和主要目的。

金融企业集中了所有信息之后,依据业务需求,对信息进行加工整理,需要对定量的信息进行定性,方便信息分类和筛选。这部分工作建议在数据仓库进行,不建议在大数据管理平台(DMP)里进行加工。

定性信息进行定量分类是用户画像的一个重要工作环节,具有较高的业务场景要求,考验用户画像商业需求的转化。其主要目的是帮助企业将复杂数据简单化,将交易数据定性进行归类,并且融入商业分析的要求,对数据进行商业加工。例如可以将客户按照年龄区间分为学生,青年,中青年,中年,中老年,老年等人生阶段。源于各人生阶段的金融服务需求不同,在寻找目标客户时,可以通过人生阶段进行目标客户定位。企业可以利用客户的收入、学历、资产等情况将客户分为低、中、高端客户,并依据其金融服务需求,提供不同的金融服务。可以参考其金融消费记录和资产信息,以及交易产品,购买的产品,将客户消费特征进行定性描述,区分出电商客户,理财客户,保险客户,稳健投资客户,激进投资客户,餐饮客户,旅游客户,高端客户,公务员客户等。利用外部的数据可以将定性客户的兴趣爱好,例如户外爱好者,奢侈品爱好者,科技产品发烧友,摄影爱好者,高端汽车需求者等信息。

将定量信息归纳为定性信息,并依据业务需求进行标签化 ,有助于金融企业找到目标客户,并且了解客户的潜在需求,为金融行业的产品找到目标客户,进行精准营销,降低营销成本,提高产品转化率。另外金融企业还可以依据客户的消费特征、兴趣爱好、社交信息及时为客户推荐产品,设计产品,优化产品流程。提高产品销售的活跃率,帮助金融企业更好地为客户设计产品。

利用数据进行画像目的主要是为业务场景提供数据支持,包括寻找到产品的目标客户和触达客户。金融企业自身的数据不足以了解客户的消费特征、兴趣爱好、社交信息。

金融企业可以引入外部信息来丰富客户画像信息,例如引入银联和电商的信息来丰富消费特征信息,引入移动大数据的位置信息来丰富客户的兴趣爱好信息,引入外部厂商的数据来丰富社交信息等。

外部信息的纬度较多,内容也很丰富,但是如何引入外部信息是一项具有挑战的工作。外部信息在引入时需要考虑几个问题,分别是外部数据的覆盖率,如何和内部数据打通,和内部信息的匹配率,以及信息的相关程度,还有数据的鲜活度,这些都是引入外部信息的主要考虑纬度。外部数据鱼龙混杂,数据的合规性也是金融企业在引入外部数据时的一个重要考虑, 敏感的信息例如手机号、家庭住址、身份证号在引入或匹配时都应该注意隐私问题 , 基本的原则是不进行数据交换,可以进行数据匹配和验证。

外部数据不会集中在某一家,需要金融企业花费大量时间进行寻找。外部数据和内部数据的打通是个很复杂的问题, 手机号/设备号/身份证号的MD5数值匹配是一种好的方法 ,不涉及隐私数据的交换,可以进行唯一匹配。依据行业内部的经验,没有一家企业外部数据可以满足企业要求,外部数据的引入需要多方面数据。一般情况下,数据覆盖率达到70%以上,就是一个非常高的覆盖率。覆盖率达到20%以上就可以进行商业应用了。

金融行业外部数据源较好合作方有 银联、芝麻信用、运营商、中航信、腾云天下、腾讯、微博、前海征信,各大电商平台等 。市场上数据提供商已经很多,并且数据质量都不错,需要金融行业一家一家去挖掘,或者委托一个厂商代理引入也可以。独立第三方帮助金融行业引入外部数据可以降低数据交易成本,同时也可以降低数据合规风险,是一个不错的尝试。另外各大城市和区域的大数据交易平台,也是一个较好的外部数据引入方式。

用户画像主要目的是让金融企业挖掘已有的数据价值,利用数据画像技术寻找到目标客户和客户的潜在需求,进行产品推销和设计改良产品。

用户画像从业务场景出发,实现数据商业变现重要方式。 用户画像是数据思维运营过程中的一个重要闭环,帮助金融企业利用数据进行精细化运营和市场营销,以及产品设计。用户画像就是一切以数据商业化运营为中心,以商业场景为主,帮助金融企业深度分析客户,找到目标客户。

DMP(大数据管理平台)在整个用户画像过程中起到了一个数据变现的作用。从技术角度来讲,DMP将画像数据进行标签化,利用机器学习算法来找到相似人群,同业务场景深度结合,筛选出具有价值的数据和客户,定位目标客户,触达客户,对营销效果进行记录和反馈。大数据管理平台DMP过去主要应用在广告行业,在金融行业应用不多,未来会成为数据商业应用的主要平台。

DMP可以帮助信用卡公司筛选出未来一个月可能进行分期付款的客户,电子产品重度购买客户,筛选出金融理财客户,筛选出高端客户(在本行资产很少,但是在他行资产很多),筛选出保障险种,寿险,教育险,车险等客户,筛选出稳健投资人,激进投资人,财富管理等方面等客户,并且可以触达这些客户,提高产品转化率,利用数据进行价值变现。DMP还可以了解客户的消费习惯、兴趣爱好、以及近期需求,为客户定制金融产品和服务,进行跨界营销。利用客户的消费偏好,提高产品转化率,提高用户黏度。

DMP还作为引入外部数据的平台,将外部具有价值的数据引入到金融企业内部,补充用户画像数据,创建不同业务应用场景和商业需求,特别是移动大数据、电商数据、社交数据的应用,可以帮助金融企业来进行数据价值变现,让用户画像离商业应用更加近一些,体现用户画像的商业价值。

用户画像的关键不是360度分析客户,而是为企业带来商业价值 ,离开了商业价值谈用户画像就是耍流氓。金融企业用户画像项目出发点一定要从业务需求出发,从强相关数据出发,从业务场景应用出发。用户画像的本质就是深度分析客户,掌握具有价值数据,找到目标客户,按照客户需求来定制产品,利用数据实现价值变现。

银行具有丰富的交易数据、个人属性数据、消费数据、信用数据和客户数据,用户画像的需求较大。但是缺少社交信息和兴趣爱好信息。

到银行网点来办业务的人年纪偏大,未来消费者主要在网上进行业务办理。银行接触不到客户,无法了解客户需求,缺少触达客户的手段。分析客户、了解客户、找到目标客户、为客户设计其需要的产品,成了银行进行用户画像的主要目的。银行的主要业务需求集中在消费金融、财富管理、融资服务,用户画像要从这几个角度出发,寻找目标客户。

银行的客户数据很丰富,数据类型和总量较多,系统也很多。可以严格遵循用户画像的五大步骤。先利用数据仓库进行数据集中,筛选出强相关信息,对定量信息定性化,生成DMP需要的数据。利用DMP进行基础标签和应用定制,结合业务场景需求,进行目标客户筛选或对用户进行深度分析。同时利用DMP引入外部数据,完善数据场景设计,提高目标客户精准度。找到触达客户的方式,对客户进行营销,并对营销效果进行反馈,衡量数据产品的商业价值。利用反馈数据来修正营销活动和提高ROI。形成市场营销的闭环,实现数据商业价值变现的闭环。另外DMP还可以深度分析客户,依据客户的消费特征、兴趣爱好、社交需求、信用信息来开发设计产品,为金融企业的产品开发提供数据支撑,并为产品销售方式提供场景数据。

简单介绍一些DMP可以做到的数据场景变现。

A 寻找分期客户

利用发卡机构数据+自身数据+信用卡数据,发现信用卡消费超过其月收入的用户,推荐其进行消费分期。

B 寻找高端资产客户

利用发卡机构数据+移动位置数据(别墅/高档小区)+物业费代扣数据+银行自身数据+汽车型号数据,发现在银行资产较少,在其他行资产较多的用户,为其提供高端资产管理服务。

C 寻找理财客户

利用自身数据(交易+工资)+移动端理财客户端/电商活跃数据。发现客户将工资/资产转到外部,但是电商消费不活跃客户,其互联网理财可能性较大,可以为其提供理财服务,将资金留在本行。

D 寻找境外游客户

利用自身卡消费数据+移动设备位置信息+社交好境外强相关数据(攻略,航线,景点,费用),寻找境外游客户为其提供金融服务。

E 寻找贷款客户

利用自身数据(人口属性+信用信息)+移动设备位置信息+社交购房/消费强相关信息,寻找即将购车/购房的目标客户,为其提供金融服务(抵押贷款/消费贷款)。

来源: 钱塘大数据二次整理,TalkingData的鲍忠铁原文出处,

阅读全文

与大数据用户属性相关的资料

热点内容
韩版6sa1688网络支持 浏览:716
java中如何新建数组 浏览:302
电脑打开文件的软件 浏览:369
买鞋应该去哪个网站 浏览:972
看门狗2游戏文件名 浏览:105
js中判断是否包含字符串中 浏览:363
查看网络并设置连接 浏览:624
win10玩奇迹掉线 浏览:305
爱思助手电脑版在哪个网站下 浏览:814
文件夹排序怎么按顺序 浏览:54
飞猪app有什么功能 浏览:593
求生之路2开服破解文件 浏览:42
javaforeach输出数组 浏览:851
编程bug怎么修改 浏览:630
苹果5s屏修一下多钱 浏览:523
java获取上传文件名 浏览:156
网站添加微博 浏览:593
flash播放mp4代码 浏览:766
word页脚奇偶页不同 浏览:728
backboxlinux安装 浏览:67

友情链接