导航:首页 > 网络数据 > 银行与大数据应用案例

银行与大数据应用案例

发布时间:2023-04-19 19:54:43

㈠ 科普文:银行业9大数据科学应用案例解析!

在银行业中使用数据科学不仅仅是一种趋势,它已成为保持竞争的必要条件。 银行必须认识到,大数据技术可以帮助他们有效地集中资源,做出更明智的决策并提高绩效。

以下我们罗列银行业使用的数据科学用例清单,让您了解如何处理大量数据以及如何有效使用数据。

(1)欺诈识别

(2)管理客户数据

(3)投资银行的风险建模

(4)个性化营销

(5)终身价值预测

(6)实时和预测分析

(7)客户细分

(8)推荐引擎

(9)客户支持

(10)结论

1、欺诈识别

机器学习对于有效检测和防范涉及信用卡,会计,保险等的欺诈行为至关重要。 银行业务中的主动欺诈检测对于为客户和员工提供安全性至关重要。 银行越早检测到欺诈行为,其越快可以限制帐户活动以减少损失。 通过实施一系列的欺诈检测方案,银行可以实现必要的保护并避免重大损失。

欺诈检测的关键步骤包括:

获取数据样本进行模型估计和初步测试 模型估计 测试阶段和部署。

由于每个数据集都不同,每个数据集都需要由数据科学家进行个别训练和微调。 将深厚的理论知识转化为实际应用需要数据挖掘技术方面的专业知识,如关联,聚类,预测和分类。

高效欺诈检测的一个例子是,当一些异常高的交易发生时,银行的欺诈预防系统被设置为暂停,直到账户持有人确认交易。对于新帐户,欺诈检测算法可以调查非常高的热门项目购买量,或者在短时间内使用类似数据打开多个帐户。

2、管理客户数据

银行有义务收集,分析和存储大量数据。但是,机器学习和数据科学工具不是将其视为合规性练习,而是将其转化为更多地了解其客户以推动新的收入机会的可能性。

如今,数字银行越来越受欢迎并被广泛使用。这创建了TB级的客户数据,因此数据科学家团队的第一步是分离真正相关的数据。之后,通过准确的机器学习模型帮助数据专家掌握有关客户行为,交互和偏好的信息,可以通过隔离和处理这些最相关的客户信息来改善商业决策,从而为银行创造新的收入机会。

3、投资银行的风险建模

风险建模对投资银行来说是一个高度优先考虑的问题,因为它有助于规范金融活动,并在定价金融工具时发挥最重要的作用。投资银行评估公司在企业融资中创造资本,促进兼并和收购,进行公司重组或重组以及用于投资目的的价值。

这就是为什么风险模型对于银行来说显得非常重要,最好是通过掌握更多信息和储备数据科学工具来评估。现在,通过大数据的力量,行业内的创新者正在利用新技术进行有效的风险建模,从而实现更好的数据驱动型决策。

4、个性化营销

市场营销成功的关键在于制定适合特定客户需求和偏好的定制化报价。数据分析使我们能够创建个性化营销,在适当的时间在正确的设备上为合适的人员提供合适的产品。数据挖掘广泛用于目标选择,以识别新产品的潜在客户。

数据科学家利用行为,人口统计和历史购买数据建立一个模型,预测客户对促销或优惠的反应概率。因此,银行可以进行高效,个性化的宣传并改善与客户的关系。

5、终身价值预测

客户生命周期价值(CLV)预测了企业从与客户的整个关系中获得的所有价值。 这项措施的重要性正在快速增长,因为它有助于创建和维持与特定客户的有利关系,从而创造更高的盈利能力和业务增长。

获得和维系有利可图的客户对银行来说是一个不断增长的挑战。 随着竞争越来越激烈,银行现在需要360度全方位了解每位客户,以便有效地集中资源。 这就是数据科学进入的地方。首先,必须考虑大量数据:如客户获得和流失的概念,各种银行产品和服务的使用,数量和盈利能力以及其他客户的特点 如地理,人口和市场数据。

这些数据通常需要大量清洗和操作才能变得可用和有意义。 银行客户的概况,产品或服务差异很大,他们的行为和期望也不尽相同。 数据科学家的工具中有许多工具和方法来开发CLV模型,如广义线性模型(GLM),逐步回归,分类和回归树(CART)。 建立一个预测模型,以确定基于CLV的未来营销策略,这对于在每个客户的一生中与该公司保持良好的客户关系,实现更高的盈利能力和增长是具有非常有价值的过程。

6、实时和预测分析

分析在银行业中的重要性不可低估。机器学习算法和数据科学技术可以显着改善银行的分析策略,因为银行业务的每个使用案例都与分析密切相关。随着信息的可用性和多样性迅速增加,分析变得更加复杂和准确。

可用信息的潜在价值非常惊人:指示实际信号的有意义的数据量(不仅仅是噪声)在过去几年呈指数级增长,而数据处理器的成本和规模一直在下降。区分真正相关的数据和噪音有助于有效解决问题和制定更明智的战略决策。实时分析有助于了解阻碍业务的问题,而预测分析有助于选择正确的技术来解决问题。通过将分析整合到银行工作流程中,可以实现更好的结果,以提前避免潜在的问题。

7、客户细分

客户细分意味着根据他们的行为(对于行为分割)或特定特征(例如区域,年龄,对于人口统计学分割的收入)挑选出一组客户。数据科学家的一系列技术如聚类,决策树,逻辑回归等等,因此它们有助于了解每个客户群的CLV并发现高价值和低价值的细分市场。

没有必要证明客户的这种细分允许有效地分配营销资源,并且为每个客户群提供基于点的方法的最大化以及销售机会。不要忘记,客户细分旨在改善客户服务,并帮助客户忠诚和留住客户,这对银行业是非常必要的。

8、推荐引擎

数据科学和机器学习工具可以创建简单的算法,分析和过滤用户的活动,以便向他建议最相关和准确的项目。这种推荐引擎即使在他自己搜索它之前也会显示可能感兴趣的项目。要构建推荐引擎,数据专家需要分析和处理大量信息,识别客户配置文件,并捕获显示其交互的数据以避免重复提供。

推荐引擎的类型取决于算法的过滤方法。协同过滤方法既可以是基于用户的,也可以是基于项目的,并且可以与用户行为一起分析其他用户的偏好,然后向新用户提出建议。

协同过滤方法面临的主要挑战是使用大量数据,导致计算问题和价格上涨。基于内容的过滤与更简单的算法一起工作,其推荐与用户参考先前活动的项目相似的项目。如果行为复杂或连接不清,这些方法可能会失败。还有一种混合类型的引擎,结合了协作和基于内容的过滤。

没有任何方法是普适的,它们每个都有一些优点和缺点,正确的选择取决于你的目标和情况。

9、客户支持

杰出的客户支持服务是保持与客户长期有效关系的关键。作为客户服务的一部分,客户支持是银行业中一个重要但广泛的概念。实质上,所有银行都是基于服务的业务,因此他们的大部分活动都涉及服务元素。它包括全面及时地回应客户的问题和投诉,并与客户互动。

数据科学使这一过程更好地实现了自动化,更准确,个性化,直接和高效,并且降低了员工时间成本。

结论

为了获得竞争优势,银行必须承认数据科学的重要性,将其融入决策过程,并根据客户数据中获得可操作的见解制定战略。 从小型可管理的步骤开始,将大数据分析整合到您的运营模式中,并领先于竞争对手。

由于这种快速发展的数据科学领域以及将机器学习模型应用于实际数据的能力,因此可以每天扩展此用例列表,从而获得更多更准确的结果。

㈡ 【案例分享】某银行用这20件事,实现数字化转型

【案例分享】某银行用这20件事,实现数字化转型

1.项目背景

随着银行各业务的精细化运营,经营活动从批量式逐步向互动式、个性化、场景化方式转变,越来越多的银行都在运用数据来构建自己的精准营销渠道和场景,某银行零售事业部在此潮流之下希望能够尽快突破现状,建立数字化的解决方案来应对竞争和客户流失。

2.痛点分析

某银行零售事业部现在面临的两大问题,一方面是来自客户的,另一方面是来自竞争者的。

客户对银行的期望发生了变化,他们希望银行能够实现定制化的服务,提高服务的协作性、便利性、一致性以及控制性。

与此同时,竞争者正积极利用数字创新重新定义价值创造,以便更好地满足被忽略或未获满足的客户需求。这就出现了同一区域的不同银行利用数字化技术来抢占本地客户的现象。

另外,该银行零售事业部的高管存在对数智化理解不多的情况,对如何实现银行的数智化转型缺乏认知,甚至束手无措,即使花费了大量的钱也没有获得想要的效果。

3.解决方案

面对这些问题和挑战,该银行牵手国云数据一起为该银行零售部定制应对自身发展的解决方案。

第一步:国云数据通过对该银行全面的调研,帮助其打造战略、业务、需求、应用、算法、数据等六大地图,从而帮助其找到问题症结。

图片

第二步:在确定完战略地图后,把战略转化成能执行的20件事情,做好这个20件事情意味着转型基本成功,让事业部有明确的目标感。

(1)建设新零售数字化中台。打通个金、互金、CRM、数据仓库及外部购买三方数据、政府数据、互联网数据;

(2) 建立新零售用户,建立产品、网点等数据资产池,建立新零售数据组织,实现数据自助分析和提升,大大提高运营效率,让数据看得见、用的到,

(3) 建立数据驱动运营体系;

精细化运营:用户分群;重点客群画像:中老、商贷、亲子等不同客户的不同运营策略和方法;

存量运营:代发工资用户贡献提升。对代发工资用户做用户画像,智能交叉销售

(4) 产品推荐:建立客腊正户分层差异化营销服务体系,定位和聚焦重点战略客群

(5) 提升客户经营服务能力,深度经营实现价值提升,提升流失客户挽回能力,并利用大数据技术建立高效的客户流失预警体系,实现流失预警、提示、催促提前挽回、自动挽回

(6) 建立客户画像。建立网易贷获客模型和风险模型,自动智能筛贺饥选个贷客户白名单

(7) 建立客户裂变系统。通过客户推荐客户的方式实现客户高质量裂变,画出主推客户的画像以及主推客户的关系链,实现一键推荐,推荐有奖;

(8) 建立竞争情报系统。实时监控竞争对手及竞品的动态,帮助更合理更实时的定价调价、制定营销策略、爆品调整、产品组禅局返合推荐策略等;

(9) 理财用户。做大理财用户规模、精准获客模型,做强财富管理,加速扩张信用卡,丰富财富管理产品线。利用技术模型实现精准获客模型,给一线员工精准推荐财务管理潜在白名单,通过给财富管理客户建立实时动态画像,让一线员工提供定制、贴身、以咨询为导向的营销服务模式;

(10) 推动精细化销售管理体系,建立总-分-支常态化检视督导,实现军事化目标管理;

(11) 打造新零售总部数据化运营和指挥系统:以战略目标为导向,梳理业务详细关键指标,全链路闭环运营,实现精细化运营实时动态管控;

(12) 实时预警:调整分行零售总行数字化管理系统、根据总行策略,实时可下发任务系统;

(13) 网点画像:实现网点数字化、经营状况、健康指数分析,基于网点画像指导网点优化,对不同网点进行排名、相互学习、经验分享;

(14) 推动线下渠道优化:建立网点选址系统提供个性精准的选址方案、建立网点周边白名单用户精准推荐系统,根据内外部数据精准获取用户并让网点精准;

(15) 对销售一线人员实现数字化客户管理;

(16) 迭代创新线上渠道:建立手机银行端到端的客户行为追踪系统,从用户登陆到转化每个环境,指导手机银行优化,提供转化率;

(17) 基于数据分析和精准营销推荐:将结果推荐手机银行,客服中心转型为重要的线上渠道,承接营销和客户经营职能,成为半利润中心;

(18) 线上线下一体化经营:线上精准定位高潜客户并向线下推送,线下网点引流客户至线上虚拟店,从单一、各自孤立的渠道向融合渠道转型;

(19) 前线赋能系统:利用数据分析、客户推荐和销售激励实现自动化过程管理,并建设高产能,专业化前线团队实现数字化绩效,让每个员工知道今天的动作,动作换来的收入,以及收入状况;

(20) 数智化用户管理系统:让前线员工清楚的看到自己客户的动态、实现复购提醒、自动定制方案等方案。

第三步:基于这20件事情,快速帮助该行零售事业部构建了该部门数字化平台,包含数据中台、智能营销云平台等,并和该银行的科技部无缝对接,一方面快速满足了零售部的需求,又避免了过去投入大而效果不明显的状况,用20%的预算完成了既定目标。同时针对银行零售部的高管、中层人员等都做了不同程度的数字化转型课程培训,帮助他们迅速理解数字化转型的方法论及相关实现路径和产品。

4.最终效果

通过数据中台构建,解决了该银行因传统方式反复重建,每个烟囱投入大,建设周期长、无法快速响应业务等方面的问题。帮助银行深化客户经营、丰富产品服务、推动综合营销、加速渠道转型。新客获取成本比以往降低了5个百分点,同时挽回了上万个流失客户,实现不同渠道间轻松转化,年度初步统计降低投入及人员成本500万。

5.关于国云数据

国云数据集团是由原阿里数据团队建立的以独创的“数字化转型合伙人”的方式为客户提供数字化转型服务的公司,也是一家能为客户提供“战略+技术+人才”三位一体全方位、高标准数字化转型落地综合服务的供应商。

国云数据独创数字化转型方法论指导客户数字化转型落地,该方法论最近已衍生为《数字化转型方法论:落地路径与数据中台》,由机械工业出版社出版,作者为公司创始人马晓东,该书现在已全面发售。《数字化转型方法论:落地路径与数据中台》是一部从战略、技术、人才和管理4个维度全面阐述企业数字化转型方法论的著作,是国云数据服务7万余家企业的经验总结。

㈢ 大数据技术有在工业领域的成功应用案例吗

. 深圳市儿童医院成功部署IBM集成平台与商业智能分析系统
IBM利用其行业领先的大数据与分析技术,支持深圳市儿童医院搭建信息集成平台,整合原有分散在多系统中的海量数据,实现各部门的信息共享;同时通过商业智能分析对集成数据进行深入挖掘,为医院各部门人员的科学决策提供全面的辅助,提升医院的服务水平和管理能力。
2. Informatica帮助紫金农商银行深挖数据价值
紫金农商银行ODS数据仓库项目建设使用Informatica产品完成数据的加载、清洗、转换工作显得尤为简单,图形化、流程化设计使维护人员能够快速、顺畅的操作,即使数据源结构发生变化,也不会像以前必须修改大量的程序代码,只需要在PowerCenter中配置一下即可。
3. 华为大数据一体机服务于北大重点实验室
经过大量的前期调查,比较和分析准备工作,北大重点实验室选择了华为基于高性能服务器RH5885 V2的HANA数据处理平台。HANA提供的对大量实时业务数据进行快速查询和分析以及实时数据计算等功能,在很大程度上得益于华为RH5885 V2服务器的高可靠、高性能和高可用性的支撑。
4. IBM携手汉端科技为飞鹤乳业打造全产业链可追溯体系
IBM、汉端科技与中国飞鹤乳业联合宣布,通过利用IBM业界领先的全面大数据与分析能力,和汉端科技在商业智能领域丰富的行业经验,飞鹤乳业实现了产品的可追溯与食品安全的数字化管理,完成了系统数字化、透明化、服务化的升级
5. 浪潮大数据平台大大提升了济南的警务工作能力
浪潮在帮助济南公安局在搭建云数据中心的基础上构建了大数据平台,以开展行为轨迹分析、社会关系分析、生物特征识别、音视频识别、银行电信诈骗行为分析、舆情分析等多种大数据研判手段的应用,为指挥决策、各警种情报分析、研判提供支持,做到围绕治安焦点能够快速精确定位、及时全面掌握信息、科学指挥调度警力和社会安保力量迅速解决问题。
6. 英特尔携杭州诚道科技构建智能交通
面对大数据挑战,杭州市和杭州诚道科技有限公司紧密合作,部署了基于英特尔大数据解决方案的诚道重点车辆动态监管系统,通过集中的数据中心将全市卡口、电子警察、视频监控、流量检测设备、信号机、诱导设备等有效地连接起来,从交通案件侦破能力、交通警察对机动车辆的监管能力到利用关联车辆的数据分析能力,都得到了极大提升。
7. 步步高集团借Oracle Exadata 大大提高了IT投资回报率
步步高集团采用 Oracle Exadata数据库云服务器搭建信息化平台,凭借Oracle Exadata数据库云服务器的高扩展性、安全性和冗余性,步步高集团得以在该基础架构上运行一系列Oracle零售行业以及Oracle的应用软件。此外,基于Oracle Exadata的步步高IT新架构比传统架构拥有更好的性价比,最大限度地增加了IT的投资回报率。
8. 华为Anti-DDoS助阿里巴巴检测DDoS变革
阿里巴巴现网多个数据中心出口都部署了华为的Anti-DDoS解决方案,平均每天防护的DDoS攻击次数超过100次,每年达数万次,峰值防护的DDoS攻击流量超过100Gbps。如今,DDoS攻击在阿里巴巴安全工程师眼里已经习以为常,由华为Anti-DDoS方案自动调度进行清洗防护即可。“双11”期间,华为Anti-DDoS方案一如既往地成功防护了多轮DDoS攻击事件,有力保障了阿里巴巴网络交易的顺畅平稳。
9. 华为大数据方案在福建移动的应用
为进一步提升外呼成功率,从2014年初开始,福建移动联合华为公司开展基于大数据的精准营销工作,采用大数据分析的方法选择外呼目标价值用户。基于大数据分析方法和传统外呼方法分别提供20万目标客户清单,在前台无感知下进行对比验证,确保对比效果不受人为因素影响,经过外呼验证,基于大数据分析方法较传统方法外呼成功率提升50%以上,有效支撑了福建移动4G用户发展战略。
10. 北京市人民政府“12345”便民电话中心选择Oracle Exadata 实现便携服务
为了进一步提升部门的调度能力、办理水平和群众满意度,北京市人民政府“12345”便民电话中心选择Oracle Exadata数据库云服务器,升级成为北京市非紧急救助服务综合受理调度平台,通过Oracle Exadata Database Machine支撑起新平台的数据库访问需求。升级后的平台能够整合全市的便民呼叫服务,支撑来自群众的各类诉求、求助、批评和建议,并可为公众提供方便、快捷的公共信息服务,真正成为全市的舆情中心、信息汇集中心和城市名片。

11. 民生银行借IBM BigInsights应对金融业的大数据挑战
IBM BigInsights大数据解决方案和企业级NoSQL数据库SequoiaDB合作,为民生银行搭建低成本、高性能、高可靠且水平扩张的数据平台,帮助民生银行通过大数据分析应对金融业的大数据挑战,完善交易流水查询分析系统,产业链金融管理系统,以及私人银行产品货架管理系统。
12. 中信银行信用卡实施EMC Greenplum 数据仓库解决方案
中信银行信用卡中心选择实施EMC Greenplum 数据仓库解决方案。Greenplum 数据仓库解决方案为中信银行信用卡中心提供了统一的客户视图,借助客户统一视图,中信银行信用卡中心可以更清楚地了解其客户价值体系,从而能够为客户提供更有针对性和相关性的营销活动。基于数据仓库,中信银行信用卡中心现在可以从交易、服务、风险、权益等多个层面分析数据。通过提供全面的客户数据,营销团队可以对客户按照低、中、高价值来进行分类,根据银行整体经营策略积极地提供相应的个性化服务。
13. 惠普助力雅昌集团掘金大数据
成立于1993年的雅昌集团首创“传统印刷+IT技术+文化艺术”的商业模式,形成环环相扣的文化产业链,为艺术市场提供全面、综合的一站式服务。基于企业内容数据管理体系,惠普为雅昌搭建了从数据采集、处理、管理到应用的全过程处理流程,使雅昌可以快速利用所需数据,缩短新品上线时间,快速响应市场变化。
14. 德国足球队采用SAP大数据方案迎战世界杯
德国足协和SAP公司通过联合创新引入SAP Match Insights解决方案,该方案基于SAP HANA平台运行处理海量数据,可以为球员和教练提供一个简明的用户界面,帮助双方开展互动性更强的对话,分析球队训练、备战和比赛情况,从而提升球员和球队的成绩。
15. 1号店借Oracle Exadata改善终端客户体验
1号店采用Oracle Exadata数据库云服务器成功优化统一整合的数据平台,满足了不断增长的业务处理需求,并进一步改善了终端客户体验。经过Oracle Exadata整合后的新平台采用混合负载互备架构,将平均处理性能提升7倍,既可以支持目前规划业务量的业务处理,还能够随着业务量的增长进行在线升级、扩容,满足处理能力和数据量的增长需求。软、硬件集成设计的Oracle Exadata 协助解决了1号店的I/O瓶颈问题,实现了比传统架构更高的性能和可扩展性。同时,基于Exadata的1号店IT新架构比传统架构拥有更好的性价比,最大限度地发挥了IT投资回报率。
16. 大数据在青岛银行:提升银行交易性能、简化运营和管理
利用IBM大数据专家PureData,青岛银行能够高效集成业务数据,简化运维。PureData for Transactions作为青岛银行重要业务处理系统,能够在一个系统中整合超过几十个数据库,同时提供良好的性能、可用性和可扩展性支持实现广泛的业务目标,例如地域扩张,突发的业务交易高峰,新柜面、流程银行等大规模的业务上线等。
17. Informatica方案帮助南京儿童医院实现信息互通共享
南京市儿童医院目前已建成包括HIS、LIS、PACS、电子病历EMR、医生工作站、移动护理、病案、财务管理、库房管理和手术麻醉等几十个应用系统,这些异构系统间数据调用分散,不能集中统一标准化管理。通过采用Informatica ETL工具构建数据仓库系统,并基于数据仓库建设医院数据调用公共资源中心库,南京市儿童医院实现了实时的数据交互和信息共享,干净、标准的数据为跨应用系统数据关联分析打下扎实基础。
18. 东吴大学采用达索系统EXALEAD启动大数据应用暨产学合作
台湾东吴大学采用达索系统EXALEAD大数据智能应用开发解决方案,全方位地整合校务信息,积极开发校务经营发展的各项应用。此外还将启动三方产学合作计划,协助建立校内大数据相关课程、人才培训和实习机制,使学生自入学就开始不断提升其未来职场所需的关键竞争力,学用合一,实现学校、学生、企业三赢。
19. 网络大脑PK人脑 大数据押高考作文题
为了帮助考生更好地备考,网络高考作文预测通过对过去八年高考作文题及作文范文、海量年度搜索风云热词、历年新闻热点等原始数据与实时更新的“活数据”进行深度挖掘分析,以“概率主题模型”模拟人脑思考,反向推导出作文主题及关联词汇,为考生预测出2014年高考作文的六大命题方向。

20. IBM助力同仁医院构筑强大的分析体系
同仁医院通过与IBM合作,同仁医院建立起了强大的分析能力和体系,包括对临床、运营、科研、考核等信息的分析,实现智慧的医院管理与考核;同时也能看到医疗设备的平均故障间隔周期,从而降低了设备的故障率、平均维修时间。这一切都让工作效率稳步提升,也缓解了病人看病难的问题,提高了患者就医满意度。
21. 微软助上海市浦东新区卫生局更加智能化
作为上海市公共卫生的主导部门,浦东新区卫生局在微软SQL Server 2012的帮助之下,积极利用大数据,推动卫生医疗信息化走上新的高度:公共卫生部门可通过覆盖区域的居民健康档案和电子病历数据库,快速检测传染病,进行全面的疫情监测,并通过集成疾病监测和响应程序,快速进行响应。与此同时,得益于非结构化数据的分析能力的日益加强,大数据分析技术也使得临床决策支持系统更智能。
22. 湖南电信通过分析掌握电信市场动向、针对性定制营销计划
利用IBM大数据专家PureData,湖南电信实现了通过分析掌握市场整体经营情况、快速制定市场策略以及加强客户经理营销维系的高效执行。PureData for Analytics作为湖南电信本地数据集市建设工程重要组成部分,高效整合了湖南电信旗下各本地网数据,为进一步分析创造先机。
23. 携程借SQL Server增强了数据采集和掌控
作为国内领先的综合性旅行服务公司,携程计算机技术有限公司曾面临分支机构、服务城市和员工数量的增长所带来的运营数据分散和数据集成难的 IT 问题。借助微软SQL Server 2012 商业智能解决方案,携程增强了其对所有下属分支机构的数据采集和掌控,大大减少了计划性停机时间以及非计划性停机的时间,灵活的部署选项也可以根据携程的需要实现从服务器到云的扩展。
24. 上海公共研发平台部署Oracle Exadata应对扩展需求
上海公共研发平台部署Oracle Exadata数据库云服务器,以应对其系统和应用的扩展需求。Oracle Exadata融合了一系列同类最佳的预配置的服务器、网络、存储和软件,能为数据仓库和在线事务处理应用程序提供超强性能。上海公共研发平台运行Oracle Exadata期间相对稳定,CPU占用率控制在5%以内,极大改善了用户应用体验。同时,Exadata平台的可扩展性极好的满足了上海公共研发平台的系统需求,目前整个公共研发平台的20多个应用系统已经全部迁移到Exadata上,应用部署量增长1倍,且运行十分稳定。
25. 360手机卫士10KB解决iPhone骚扰
360手机卫士通过对海量数据的运算和精准匹配下发,将一组大小仅为10KB的数据即1000个骚扰号码同步到用户手机上,打造个性化的骚扰号码数据库,此外,每天更新的骚扰号码库数据,会依据标记趋势调整骚扰号码库中各类数据比例,即每一位360手机卫士用户手机中的1000个骚扰号码都是动态的,随地域、身份以及骚扰趋势的变化而变化。
26. 神州数码助张家港市更“智慧”
在张家港实践的城市案例中,市民登录这款“神州数码”研发的市民公共信息服务平台后,市民只要凭借自己的身份证和密码,即可通过该系统平台进行240余项“在线预审”服务、130余项“网上办事”服务等,还可通过手机及时查看办事状态。相比于以前来说,市民办事的时间最少可以节省一半以上。

27. IBM助中网组委会构建安全和敏捷的内联网
IBM专门为中网设计了具有实时大数据分析功能的MatchTracker(赛事追踪系统),可以为球迷提供数据呈现、计分等功能。 MatchTracker基于IBM SlamTracker分析技术,使球迷能够利用历史和实时性数据,洞悉比分之后的态势和策略。此外,IBM还为中网组委会构建了安全和敏捷的内联网。
28. Cortana基于微软Bing大数据预测世界杯
微软为Cortana增加了世界杯预测的功能,基于微软Bing大数据,并综合考虑世界杯各支球队的过往比赛结果、比赛时间、天气情况、主场优势以及其他因素,使用大量的博彩市场公开数据、民意调查、社交媒体以及其它在线数据,利用大数据分析来判断每场比赛的结果。
29. 中科曙光助同济大学科研领域再创新高
为了满足爆炸式增长的用户和数据量,同济大学携手中科曙光,在全面整合云计算平台和现有资产的基础上,采用 DS800-F20存储系统、Gridview集群管理系统,以及Hadoop分布式计算平台构建出了业内领先的大数据柔性处理平台,使得同济大学在信息学科及其交叉学科研究领域迈上一个新台阶。
30. 华为助农行完成海量数据分布式处理的需求
华为向农行提供了良好的计算平台,基于华为RH2288 V2服务器的分布式并行计算集群进行测试,以及还提供了快速响应客户需求的研发能力,以及业界最快捷的售后服务。农行的测试结果表明,华为解决方案完全满足农行对海量数据进行分布式处理的要求。

㈣ 大数据分析技术在财经领域的应用

大数据分析技术在财经领域的应用如下:

1、银行大数据应用

国内不少银行已经开始尝试通过大数据来驱动业务运营,如中信银行信用卡中心使用大数据技术实现了实时营销,光大银行建立了社交网络信息数据库,招商银行则利用大数据发展小微贷款。

财经领域的大数据应用依然有很多的问题需要克服,同时需要国家出台促进金融大数据发展的产业规划和扶持政策,也需要行业分阶段推动金融数据开放、共享和统一平台建设,强化行业标准和安全规范。

㈤ 大数据十大商业应用场景

大数据十大商业应用场景

大数据时代,在未来的几十年里,大数据都将会是一个重要都话题。大数据影响着每一个人,并在可以预见的未来继续影响着。大数据冲击着许多主要行业,包括零售业、金融行业、医疗行业等等,大数据也在彻底地改变着我们的生活。现在我们就来看看大数据给中国带来的十商业应用场景,未来大数据产业将会是一个万亿市场。

1、智慧城市

如今,世界超过一半的人口生活在城市里,到2050年这一数字会增长到75%。政府需要利用一些技术手段来管理好城市,使城市里的资源得到良好配置。既不出现由于资源配置不平衡而导致的效率低下以及骚乱,又要避免不必要的资源浪费而导致的财政支出过大。大数据作为其中的一项技术可以有效帮助政府实现资源科学配置,精细化运营城市,打造智慧城市。

城市的道路交通,完全可以利用GPS数据和摄像头数据来进行规划,包括道路红绿灯时间间隔和关联控制,包括直行和左右转弯车道的规划、单行道的设置。利用大数据技术实施的城市交通智能规划,至少能够提高30%左右的道路运输能力,并能够降低交通事故率。在美国,政府依据某一路段的交通事故信息来增设信号灯,降低了50%以上的交通事故率。机场的航班起降依靠大数据将会提高航班管理的效率,航空公司利用大数据可以提高上座率,降低运行成本。铁路利用大数据可以有效安排客运和货运列车,提高效率、降低成本。

城市公共交通规划、教育资源配置、医疗资源配置、商业中心建设、房地产规划、产业规划、城市建设等都可以借助于大数据技术进行良好规划和动态调整。

大数据技术可以了解经济发展情况,各产业发展情况,消费支出和产品销售情况,依据分析结果,科学地制定宏观政策,平衡各产业发展,避免产能过剩,有效利用自然资源和社会资源,提高社会生产效率。大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。大数据及大数据技术带给政府的不仅仅是效率提升、科学决策、精细管理,更重要的是数据治国、科学管理的意识改变,未来大数据将会从各个方面来帮助政府实施高效和精细化管理,具有极大的想象空间。

2、金融行业

大数据在金融行业应用范围较广,典型的案例有花旗银行利用IBM沃森电脑为财富管理客户推荐产品,美国银行利用客户点击数据集为客户提供特色服务。中国金融行业大数据应用开展得较早,但都是以解决大数据效率问题为主,很多金融行业建立了大数据平台,对金融行业的交易数据进行采集和处理。

金融行业过去的大数据应用以分析自身财务数据为主,以提供动态财务报表为主,以风险管理为主。在大数据价值变现方面,开展的不够深入,这同金融行业每年上万亿的净利润相比是不匹配的。现在已经有一些银行和证券开始和移动互联网公司合作,一起进行大数据价值变现,其中招商银行、平安集团、兴业银行、国信证券、海通证券和Talking Data在移动大数据精准营销、获客、用户体验等方面进行了不少的尝试,大数据价值变现效果还不错,大数据正在帮助金融行业进行价值变现。大数据在金融行业的应用可以总结为以下五个方面:

(1)精准营销:依据客户消费习惯、地理位置、消费时间进行推荐

(2)风险管控:依据客户消费和现金流提供信用评级或融资支持,利用客户社交行为记录实施信用卡反欺诈

(3)决策支持:利用抉策树技术进抵押贷款管理,利用数据分析报告实施产业信贷风险控制

(4)效率提升:利用金融行业全局数据了解业务运营薄弱点,利用大数据技术加快内部数据处理速度

(5)产品设计:利用大数据计算技术为财富客户推荐产品,利用客户行为数据设计满足客户需求的金融产品

3、医疗行业

医疗行业拥有大量病例、病理报告、医疗方案、药物报告等。如果这些数据进行整理和分析,将会极大地帮助医生和病人。在未来,借助于大数据平台我们可以收集疾病的基本特征、病例和治疗方案,建立针对疾病的数据库,帮助医生进行疾病诊断。

如果未来基因技术发展成熟,可以根据病人的基因序列特点进行分类,建立医疗行业的病人分类数据库。在医生诊断病人时可以参考病人的疾病特征、化验报告和检测报告,参考疾病数据库来快速帮助病人确诊。在制定治疗方案时,医生可以依据病人的基因特点,调取相似基因、年龄、人种、身体情况相同的有效治疗方案,制定出适合病人的治疗方案,帮助更多人及时进行治疗。同时这些数据也有利于医药行业开发出更加有效的药物和医疗器械。

医疗行业的数据应用一直在进行,但是数据没有打通,都是孤岛数据,没有办法起大规模应用。未来需要将这些数据统一收集起来,纳入统一的大数据平台,为人类健康造福。政府是推动这一趋势的重要动力,未来市场将会超过几千亿元。

4、农牧业

农产品不容易保存,合理种植和养殖农产品对农民非常重要。借助于大数据提供的消费能力和趋势报告,政府将为农牧业生产进行合理引导,依据需求进行生产,避免产能过剩,造成不必要的资源和社会财富浪费。大数据技术可以帮助政府实现农业的精细化管理,实现科学决策。在数据驱动下,结合无人机技术,农民可以采集农产品生长信息,病虫害信息。

农业生产面临的危险因素很多,但这些危险因素很大程度上可以通过除草剂、杀菌剂、杀虫剂等技术产品进行消除。天气成了影响农业非常大的决定因素。过去的天气预报仅仅能提供当地的降雨量,但农民更关心有多少水分可以留在他们的土地上,这些是受降雨量和土质来决定的。Climate公司利用政府开放的气象站的数据和土地数据建立了模型,他们可以告诉农民可以在哪些土地上耕种,哪些土地今天需要喷雾并完成耕种,哪些正处于生长期的土地需要施肥,哪些土地需要5天后才可以耕种,大数据技术可以帮助农业创造巨大的商业价值。

5、零售行业

零售行业比较有名气的大数据案例就是沃尔玛的啤酒和尿布的故事,以及Target通过向年轻女孩寄送尿布广告而告知其父亲,女孩怀孕的故事。

零售行业可以通过客户购买记录,了解客户关联产品购买喜好,将相关的产品放到一起增加来增加产品销售额,例如将洗衣服相关的化工产品例如洗衣粉、消毒液、衣领净等放到一起进行销售。根据客户相关产品购买记录而重新摆放的货物将会给零售企业增加30%以上的产品销售额。

零售行业还可以记录客户购买习惯,将一些日常需要的必备生活用品,在客户即将用完之前,通过精准广告的方式提醒客户进行购买。或者定期通过网上商城进行送货,既帮助客户解决了问题,又提高了客户体验。

电商行业的巨头天猫和京东,已经通过客户的购买习惯,将客户日常需要的商品例如尿不湿,卫生纸,衣服等商品依据客户购买习惯事先进行准备。当客户刚刚下单,商品就会在24小时内或者30分钟内送到客户门口,提高了客户体验,让客户连后悔等时间都没有。

利用大数据的技术,零售行业将至少会提高30%左右的销售额,并提高客户购买体验。

6、大数据技术产业

进入移动互联网之后,非结构化数据和结构化数据呈指数方式增长。现在人类社会每两年产生的数据将超过人类历史过去所有数据之和。进入到2015年,人类社会所有的数据之和有望突破5泽B(5ZB),这些数据如何存储和处理将会成为很大的问题。

这些大数据为大数据技术产业提供了巨大的商业机会。据估计全世界在大数据采集、存储、处理、清晰、分析所产生的商业机会将会超过2000亿美金,包括政府和企业在大数据计算和存储,数据挖掘和处理等方面等投资。中国2014年大数据产业产值已经超过了千亿人民币,本届贵阳大数据博览会就吸引了400多家厂商来参展,充分说明大数据产业的未来的商业价值巨大。

未来中国的大数据产业将会呈几何级数增长,在5年之内,中国的大数据产业将会形成万亿规模的市场。不仅仅是大数据技术产品的市场,也将是大数据商业价值变现的市场。大数据将会在企业的精准营销、决策分析、风险管理、产品设计、运营优化等领域发挥重大的作用。

大数据技术产业将会解决大数据存储和处理的问题,大数据服务公司将利用自身的数据将解决大数据价值变现问题,其所带来的市场规模将会超过千亿人民币。中国目前拥有大数据,并提供大数据价值变现服务的公司除了我们众所周知的BAT和移动运营商之外,360、小米、京东、Talking Data、九次方等都会成为大数据价值变现市场的有力参与者,市场足够大,期望他们将市场做大,帮助所有企业实现大数据价值变现。

7、物流行业

中国的物流产业规模大概有5万亿左右,其中公里物流市场大概有3万亿左右。物流行业的整体净利润从过去的30%以上降低到了20%左右,并且下降的趋势明显。物流行业很多的运力浪费在返程空载、重复运输、小规模运输等方面。中国市场最大等物流公司所占的市场份额不到1%。因此资源需要整合,运送效率需要提高。

物流行业借助于大数据,可以建立全国物流网络,了解各个节点的运货需求和运力,合理配置资源,降低货车的返程空载率,降低超载率,减少重复路线运输,降低小规模运输比例。通过大数据技术,及时了解各个路线货物运送需求,同时建立基于地理位置和产业链的物流港口,实现货物和运力的实时配比,提高物流行业的运输效率。借助于大数据技术对物流行业进行的优化资源配置,至少可以增加物流行业10%左右的收入,其市场价值将在5000亿左右。

8、房地产业

中国房地产业发展的高峰已经过去,其面临的挑战逐渐增加,房地产业正从过去的粗放发展方式转向精细运营方式,房地产企业在拍卖土地、住房地产开发规划、商业地产规划方面也将会谨慎进行。

借助于大数据,特别是移动大数据技术。房地产业可以了解开发土地所在范围常驻人口数量、流动人口数量、消费能力、消费特点、年龄阶段、人口特征等重要信息。这些信息将会帮助房地商在商业地产开发、商户招商、房屋类型、小区规模进行科学规划。利用大数据技术,房地产行业将会降低房地产开发前的规划风险,合理制定房价,合理制定开发规模,合理进行商业规划。大数据技术可以降低土地价格过高,实际购房需求过低的风险。已经有房地产公司将大数据技术应用于用户画像、土地规划、商业地产开发等领域,并取得了良好的效果。

9、制造业

制造业过去面临生产过剩的压力,很多产品包括家电、纺织产品、钢材、水泥、电解铝等都没有按照市场实际需要生产,造成了资源的极大浪费。利用电商数据、移动互联网数据、零售数据,我们可以了解未来产品市场都需求,合理规划产品生产,避免生产过剩。

例如依据用户在电商搜索产品的数据以及物流数据,可以推测出家电产品和纺织产品未来的实际需求量,厂家将依据这些数据来进行生产,避免生产过剩。移动互联网的位置信息可以帮助了解当地人口进出的趋势,避免生产过多的钢材和水泥。

大数据技术还可以根据社交数据和购买数据来了解客户需求,帮助厂商进行产品开发,设计和生产出满足客户需要的产品。

10、互联网广告业

2014年中国互联网广告市场迎来发展高峰,市场规模预计达到1500亿元左右,较2013年增长56.5%。数字广告越来越受到广告主的重视,其未来市场规模越来越大。2014年美国的互联网广告市场规模接近500亿美元,参考中国的人口消费能力,其市场规模会很快达到2000亿人民币左右。

过去到广告投放都是以好的广告渠道+广播式投放为主,广告主将广告交给广告公司,由广告公司安排投放,其中SEM广告市场最大,其他的广告投放方式也是以页面展示为主,大多是广播式广告投放。广播式投放的弊端是投入资金大,没有针对目标客户,面对所有客户进行展示,广告的转化率较低,并存在数字广告营销陷阱等问题。

大数据技术可以将客户在互联网上的行为记录下来,对客户的行为进行分析,打上标签并进行用户画像。特别是进入移动互联网时代之后,客户主要的访问方式转向了智能手机和平台电脑,移动互联网的数据包含了个人的位置信息,其360度用户画像更加接近真实人群。360度用户画像可以帮助广告主进行精准营销,广告公司可以依据用户画像的信息,将广告直接投放到用户的移动设备,通过用户经常使用的APP进行广告投放,其广告的转化可以大幅度提高。利用移动互联网大数据技术进行的精准营销将会提高十倍以上的客户转化率,广告行业的程序化购买正在逐步替代广播式广告投放。大数据技术将帮助广告主和广告公司直接将广告投放给目标用户,其将会降低广告投入,提高广告的转化率。

目前,影响大数据产业发展主要有两个大问题,一个是大数据应用场景,一个是大数据隐私保护问题。

大数据商业价值的应用场景,大数据公司和企业正在寻找,目前在移动互联网的精准营销和获客、360度用户画像、房地产开发和规划、互联网金融的风险管理、金融行业的供应链金融,个人征信等方面已经取得了进步,拥有了很多经典案例。

但在有关大数据隐私保护以及大数据应用过程中个人信息保护方面还停滞不前,大家都在摸石头过河,不知道哪些事情可以做,哪些事情不可以做。国家在大数据隐私保护方面正在进行立法,估计不久的将来,大数据服务公司和企业将会了解大数据隐私保护方面的具体要求。在没有明确有关大数据隐私保护法规前,我们可以参考国外的隐私法,严格遵守国际上通用的个人隐私保护法,在实施大数据价值变现的过程中,充分保护所有相关方的个人利益。

最后纵观人类历史,在任何领域,如果我们可以拿到数据进行分析,我们就会取得进步。如果我们拿不到数据,无法进行分析,我们注定要落后。我们过去因数据不足导致的错误远远好过那些根本不用数据的错误,因此我们需要掌握大数据这个武器,利用好它,帮助人类社会加速进化,帮助企业实现大数据的价值变现。

以上是小编为大家分享的关于大数据十大商业应用场景的相关内容,更多信息可以关注环球青藤分享更多干货

㈥ [恒丰银行]基于大数据的精准营销模型应用

【案例】恒丰银行——基于大数据的精准营销模型应用 https://mp.weixin.qq.com/s?src=3&timestamp=1500159788&ver=1&signature=-86itFcexY XKcX3Vb1ypwGo8v0IU6fkNgcs *=

本篇案例为数据猿推出的大型 “金融大数据主题策划” 活动 (查看详情) 第一部分的系列案例/征文;感谢** 恒丰银行** 的投递

作为整体活动的第二部分,2017年6月29日,由数据猿主办,上海金融信息行业协会、互联网普惠金融研究院合办,中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联盟、中国大数据技术与应用联盟协办的 《「数据猿·超声波」之金融科技·商业价值探索高峰论坛》 还将在上海隆重举办 【论坛详情】 【上届回顾(点击阅读原文查看)】

在论坛现场,也将颁发 “技术创新奖”、“应用创新奖”、“最佳实践奖”、“优秀案例奖” 四大类案例奖

本文长度为 6000 字,建议阅读 12 分钟

如今,商业银行信息化的迅速发展,产生了大量的业务数据、中间数据和非结构化数据,大数据随之兴起。要从这些海量数据中提取出有价值的信息,为商业银行的各类决策提供参考和服务,需要结合大数据和人工智能技术。国外的汇丰、花旗和瑞士银行是数据挖掘技术应用的先行者。在国内的商业银行中,大数据的思想和技术逐步开始在业务中获得实践和尝试。

面对日趋激烈的行业内部竞争及互联网金融带来的冲击,传统的上门营销、电话营销,甚至是扫街营销等方式跟不上时代的节奏。利用精准营销可节约大量的人力物力、提高营销精准程度,并减少业务环节,无形中为商业银行节约了大量的营销成本。

虽然恒丰银行内部拥有客户的基本信息和交易等大量数据,但是传统的营销系统并没有挖掘出行内大量数据的价值,仍然停留在传统的规则模型。当下,恒丰银行接入了大量的外部数据,有着更多的维度,如果将内部数据与外部数据进行交叉,则能产生更大的价值。客户信息收集越全面、完整,数据分析得到的结论就越趋向于合理和客观。利用人工智能技术,建立精准营销系统变得可能且必要。

恒丰银行基于大数据的精准营销方案是利用大数据平台上的机器学习模型深入洞察客户行为、客户需求,客户偏好,挖掘潜出在客户,实现可持续的营销计划。

周期/节奏

2016.4-2016.5 完成需求梳理和业务调研,并在此基础上进行总体方案设计。
2016.5-2016.8 整理银行内、外部数据,根据营销需求制定客户标签和设计文档,实施用户画像。
2016.8-2016.10 在用户画像的基础上,构建理财产品个性化推荐系统。其中包括个性化推荐算法调研,模型对比等一系列工作。
2016.10-2017.1 客户需求预测并对客户价值进行建模,并完善整合精准营销应用模型。
2017.1-2017.3 用户画像、个性化推荐、客户价值预测等精准营销模型上线。

客户名称/所属分类

恒丰银行/客户管理

任务/目标

根据零售业务营销要求,运用多种数据源分析客户行为洞察客户需求,实现精准营销与服务,提高银行客户满意度和忠诚度。

针对不同的客户特征、产品特征和渠道特征,制定不同市场推广策略。为了完成以上任务,主要从以下几个方面构建精准营销系统:

1.用户画像: 结合用户的历史行为和基本属性给用户打标签。

2.精准推荐系统: 给用户推荐个性化理财产品, 例如在微信银行中给每个客户推荐他喜欢的产品,帮客户找到其最适合的产品,增加产品的购买率。

3.需求预测和客户价值: 新产品发售的时候,找到最有可能购买该产品的客户,进行短信营销,进而提高产品响应率。客户价值精准定位,根据客户价值水平制定不同的推荐策略。银行通过计算客户使用其产品与服务后所形成的实际业务收益,充分了解每一个客户的贡献度,为管理层提供决策支撑。

挑战

项目实施过程由用户画像,精准推荐系统,需求预测和客户价值建模三部分组成,采用TDH机器学习平台Discover所提供的算法和模型库进行开发和验证。

(一)用户画像的建立

客户标签主要包含客户基本属性,客户等级标签,客户偏好标签,客户交易特征,客户流失特征,客户信用特征,客户终身价值标签,客户潜在需求标签。

(二)精准推荐系统的建立

由于系统复杂,且篇幅有限,仅对其中最重要的理财推荐系统做详细阐述。精准推荐系统架构图如下。

2.1业务问题转化为机器学习问题

业务问题

银行理财产品个性化推荐给客户。 例如在微信银行中给每个客户推荐此客户喜欢的产品,帮客户找到其最适合的产品,增加产品的购买率。

将业务问题转化为机器学习问题

理财产品种类繁多,产品迭代速度很快,客户在繁多的产品中不能快速找到适合自己的产品,因此有必要建立一个自动化推荐模型,建立客户理财偏好,给客户推荐最适合的产品。

将银行理财产品推荐业务问题转化为机器学习问题,进而利用人工智能技术提高推荐产品的点击率和购买率。例如在恰当的时间,通过用户偏好的渠道给用户推荐产品,推荐的结果为用户购买或者未购买。这个问题可以看作一个典型机器学习二分类问题:基于历史营销数据来训练模型,让模型自动学到客户购买的产品偏好,并预测客户下次购买理财产品的概率。对模型预测出所有客户对所有产品的响应概率进行排序,可选择客户购买概率最高的topN个产品推荐给客户。

下面将叙述如何构建该推荐预测模型。

2.2数据源准备

在建立的一个理财推荐模型之前,可以预见到相似的客户可能会喜好相似的产品(需要表征客户和产品的数据),同一个人的喜好可能具有连续性(购买历史交易数据,包括基金国债等),他的存款、贷款资金可能决定了他能购买什么档次的理财等等。因此,我们需要准备以下数据。

客户基本属性:客户性别,年龄,开户时间,评估的风险等级等等。
产品基本属性:产品的逾期收益率,产品周期,保本非保本,风险等级等。
客户购买理财产品的历史:在什么时候购买什么产品以及购买的金额。
客户的存款历史: 客户历史存款日均余额等。
客户的贷款历史: 客户历史贷款信息等。
客户工资:客户工资的多少也决定了客户购买理财的额度和偏好。
用户画像提取的特征:用户的AUM等级,贡献度,之前购买基金,国债的金额等。

2.3特征转换和抽取

有了这么多数据,但是有一部分特征是算法不能直接处理的,还有一部分数据是算法不能直接利用的。

特征转换

把不能处理的特征做一些转换,处理成算法容易处理的干净特征。举例如下:

开户日期。就时间属性本身来说,对模型来说不具有任何意义,需要把开户日期转变成到购买理财时的时间间隔。

产品特征。从理财产品信息表里面可以得到风险等级,起点金额等。但是并没有标志这款产品是否是新手专属,是否是忠诚客户专属。这就需要我们从产品名字抽取这款产品的上述特征。

客户交易的时间信息。同客户的开户日期,孤立时间点的交易信息不具有任何意义,我们可以把交易时间转变为距离上次购买的时间间隔。

特征抽取

还有一部分数据算法不能直接利用,例如客户存款信息,客户交易信息。我们需用从理财交易和存款表中抽取可能有用的信息。

用户存款信息:根据我们的经验,客户购买理财之前的存款变动信息更能表明客户购买理财的真实想法,因此我们需要从客户历史存款数据抽取客户近三个月,近一个月,近一周的日均余额,以体现客户存款变化。

客户交易信息:客户最近一次购买的产品、购买的金额、及其相关属性,最近一个月购买的产品、购买的金额及其相关属性等等。

以上例举的只是部分特征。

2.4构造、划分训练和测试集

构造

以上说明了如何抽取客户购买理财的相关特征,只是针对正样本的,即客户购买某种理财时候的特征。隐藏着的信息是,此客户当时没有购买其他在发售的产品。假设把客户购买了产品的标签设为1,没有购买的产品样本设为0,我们大致有如下训练样本(只列举部分特征)。

其中客户是否购买产品是我们在有监督训练的标签,也就是我们建立的是一个预测客户是否会购买产的模型。

划分训练集和测试集

考虑到最终模型会预测将来的某时间客户购买某种产品的概率,为了更真实的测试模型效果,以时间来切分训练集和测试集。具体做法如下。假设我们有2016-09-01 ~ 2017-03-20 的理财购买相关数据。以2016-09-01 ~ 2017-03-19的理财交易数据作为训练,2017-03-20这一天的客户对每个产品是否购买的数据作为测试。以2016-09-01 ~ 2017-03-18的理财交易数据作为训练,2017-03-19这一天的客户对每个产品是否购买的数据作为测试,以此类推。

2.5模型训练

根据提取的特征,组成样本宽表,输入到分类模型,这里选择了TDH平台机器学习组件Discover所提供的近百个分布式算法进行建模和训练,同时我们还使用了特征的高阶交叉特性进行推荐的预测和分析。

2.6模型评估

评价推荐好坏的指标很多,比较常用的有

1.ROC曲线下面积(AUC)
2.logloss
3.推荐产品第一次命中rank的倒数(MRR)
4.TopN

针对银行的理财推荐实际业务,客户当天绝大多数是只购买了某一款理财,MRR(Mean Average Precision 的特殊情况)能反应这种情况下推荐的好坏。另一种直观的评价指标是TopN,假定我们只推荐N个模型认为客户最有可能购买的产品,并和真实情况比较,就能得到当天推荐的结果的混淆矩阵,TN,TP,FN,FP,recall,precision等。

我们在生产上验证了最近十天的推荐效果,即测试了2017-03-20, 2017-03-19,…… , 2017-03-11等十天的推荐效果,以下是这些结果的评价。

AUC

Logloss

MRR

0.89

0.45

0.78

也可以把新客户(之前没有购买理财)和老客户(至少购买过一次)分开评估效果。 新客户的购买占了整个理财购买的1/3 以上。

测试新客户的预测效果,可以看出模型对冷启动问题解决的好坏。

对新客户的预测效果

AUC

Logloss

MRR

0.80

0.73

0.32

对老客户的预测效果

AUC

Logloss

MRR

0.92

0.38

0.88

2.7模型优化

1.上线之前的优化:特征提取,样本抽样,参数调参
2.上线之后的迭代,根据实际的A/B testing和业务人员的建议改进模型

(三)需求预测和客户价值

“顾客终生价值”(Customer Lifetime Value)指的是每个购买者在未来可能为企业带来的收益总和。研究表明,如同某种产品一样,顾客对于企业利润的贡献也可以分为导入期、快速增长期、成熟期和衰退期。

经典的客户终身价值建模的模型基于客户RFM模型。模型简单的把客户划分为几个状态,有一定意义但不一定准确,毕竟RFM模型用到的特征不全面,不能很好的表征客户的价值以及客户银行关系管理。

为了方便的对客户终身价值建模,有几个假定条件。其一把客户的购买价值近似为客户为企业带来的总收益,其二把未来时间定义在未来一个季度、半年或者一年。也就是我们通过预测客户在下一个时间段内的购买价值来定义客户的终身价值。因此,我们将预测的问题分为两个步骤:第一步预测这个客户在下一个阶段是否会发生购买(需求预测)。第二步对预测有购买行为的客户继续建模预测会购买多大产品价值。

3.1需求预测

提取客户定活期存款、pos机刷卡、渠道端查询历史等特征,以这些特征作为输入预测用户在当前时间节点是否有购买需求,训练和测试样本构造如下:

1.历史用户购买记录作为正样本。
2.抽样一部分从未购买的理财产品的用户作为负样本集合Un,对于每一个正样本Un中随机选取一个用户构造负样本。
3.选取2016.04-201610 的购买数据作为训练样本,2016.11的数据作为测试样本。

使用机器学习算法进行分类训练和预测,重复上述实验,得到下列结果:

AUC: 0.930451274
precision: 0.8993963783
recall: 0.8357507082
fmeasure: 0.8664062729

进一步对客户分群之后,可以更好的对新客户进行建模,对于老客户我们可以进一步提取他们的历史购买特征,预测他们在下一段时间内购买的产品价值(数量,金额等),对于新客户,可以进根据他的存款量预测其第一次购买的产品价值,把存款客户变成理财客户。通过分析客户存款变动于客户购买理财的关系,我们发现客户购买理财的前一段时间内定活期的增加的有不同的模式,如下图。

根据需求预测模型,我们给出新客户最有可能购买的top N 列表,然后由业务人员进行市场推广。

3.2客户价值预测

进一步预测有购买需求的客户的购买价值高低。这是个回归问题,但是预测变量从二分类变量变为预测连续的金额值。训练的时候预测值取训练周期内(一个月或者季度)客户所购买的总金额。

算出客户的当前价值(即当前阶段购买的产品价值)和未来价值(预测的下一个阶段的客户价值)可以帮助我们鉴定客户处于流失阶段,或者上升阶段,或者是稳定阶段。当前价值取的是当前时间前三个月的交易量。对流失阶段高价值客户可以适当给予营销优惠,对于有购买意向的客户适当引导。如下图所示。

结果/效果

一是提高银行营销准确性。随着客户不断增加,理财产品也在不断推陈出新,在实时精准营销平台的帮助下,银行从以前盲目撒网式的营销方式转变到对不同客户精准触达,提高了理财产品的营销成功率,降低销售和运作成本。理财产品推荐的上线以来,产品推荐成功率比专家经验排序模型最高提升10倍。

二是增加银行获客数量。精准营销系统洞察客户潜在需求和偏好,提高了银行获取目标客户群的准确率。从数百万客户中,通过机器学习模型,找到最有可能购买产品的客户群,通过渠道营销,实现响应率提升。相比传统盲发模式,发送原38%的短信即可覆盖80%的客户。

通过构建基于大数据的精准营销方案,恒丰银行深入洞察客户行为、需求、偏好,帮助银行深入了解客户,并打造个性化推荐系统和建立客户价值预测模型,实现可持续的营销计划。

㈦ 大数据和人工智能在互联网金融领域有哪些应用


数据从四个方面改变了金融机构传统的数据运作方式,从而实现了巨大的商业价值。这四个方面(“四个C”)包括:数据质量的兼容性
(Compatibility)、数据运用的关联性(Connectedness)、数据分析的成本(Cost)以及数据价值的转化
(Capitalization)。


大数据在金融业的应用场景正在逐步拓展。在海外,大数据已经在金融行业的风险控制、运营管理、销售支持和商业模式创新等领域得到了全面尝试。在国内,金
融机构对大数据的应用还基本处于起步阶段。数据整合和部门协调等关键环节的挑战仍是阻碍金融机构将数据转化为价值的主要瓶颈。


数据技术与数据经济的发展是持续实现大数据价值的支撑。深度应用正在将传统IT从“后端”不断推向“前台”,而存量架构与创新模块的有效整合是传统金融
机构在技术层面所面临的主要挑战。此外,数据生态的发展演进有其显著的社会特征。作为其中的一员,金融机构在促进数据经济的发展上任重道远。

为了驾驭大数据,国内金融机构要在技术的基础上着重引入以价值为导向的管理视角,最终形成自上而下的内嵌式变革。其中的三个关键点(“TMT”)包括:团队(Team)、机制(Mechanism)和思维(Thinking)。

1.价值导向与内嵌式变革—BCG对大数据的理解

“让数据发声!”—随着大数据时代的来临,这个声音正在变得日益响亮。为了在喧嚣背后探寻本质,我们的讨论将从大数据的定义开始。

1.1成就大数据的“第四个V”

大数据是什么?在这个问题上,国内目前常用的是“3V”定义,即数量(Volume)、速度(Velocity)和种类(Variety)。


虽然有着这样的定义,但人们从未停止讨论什么才是成就大数据的“关键节点”。人们热议的焦点之一是“到底多大才算是大数据?”其实这个问题在“量”的层
面上并没有绝对的标准,因为“量”的大小是相对于特定时期的技术处理和分析能力而言的。在上个世纪90年代,10GB的数据需要当时计算能力一流的计算机
处理几个小时,而这个量现在只是一台普通智能手机存储量的一半而已。在这个层面上颇具影响力的说法是,当“全量数据”取代了“样本数据”时,人们就拥有了
大数据。


另外一个成为讨论焦点的问题是,今天的海量数据都来源于何处。在商业环境中,企业过去最关注的是ERP(Enterprise Resource
Planning)和CRM(Customer Relationship
Management)系统中的数据。这些数据的共性在于,它们都是由一个机构有意识、有目的地收集到的数据,而且基本上都是结构化数据。随着互联网的深
入普及,特别是移动互联网的爆发式增长,人机互动所产生的数据已经成为了另一个重要的数据来源,比如人们在互联网世界中留下的各种“数据足迹”。但所有这
些都还不是构成“大量数据”的主体。机器之间交互处理时沉淀下来的数据才是使数据量级实现跨越式增长的主要原因。“物联网”是当前人们将现实世界数据化的
最时髦的代名词。海量的数据就是以这样的方式源源不断地产生和积累。

“3V”的定义专注于对数据本身的特征进行描述。然而,是否是量级庞大、实时传输、格式多样的数据就是大数据?

BCG认为,成就大数据的关键点在于“第四个V”,即价值(Value)。当量级庞大、实时传输、格式多样的全量数据通过某种手段得到利用并创造出商业价值,而且能够进一步推动商业模式的变革时,大数据才真正诞生。

1.2变革中的数据运作与数据推动的内嵌式变革

多元化格式的数据已呈海量爆发,人类分析、利用数据的能力也日益精进,我们已经能够从大数据中创造出不同于传统数据挖掘的价值。那么,大数据带来的“大价值”究竟是如何产生的?


无论是在金融企业还是非金融企业中,数据应用及业务创新的生命周期都包含五个阶段:业务定义需求;IT部门获取并整合数据;数据科学家构建并完善算法与
模型;IT发布新洞察;业务应用并衡量洞察的实际成效。在今天的大数据环境下,生命周期仍维持原样,而唯一变化的是“数据科学家”在生命周期中所扮演的角
色。大数据将允许其运用各种新的算法与技术手段,帮助IT不断挖掘新的关联洞察,更好地满足业务需求。


因此,BCG认为,大数据改变的并不是传统数据的生命周期,而是具体的运作模式。在传统的数据基础和技术环境下,这样的周期可能要经历一年乃至更长的时
间。但是有了现在的数据量和技术,机构可能只需几周甚至更短的时间就能走完这个生命周期。新的数据运作模式使快速、低成本的试错成为可能。这样,商业机构
就有条件关注过去由于种种原因而被忽略的大量“小机会”,并将这些“小机会”累积形成“大价值”。

具体而言,与传统的数据应用相比,大数据在四个方面(“4C”)改变了传统数据的运作模式,为机构带来了新的价值。

1.2.1数据质量的兼容性(Compatibility):大数据通过“量”提升了数据分析对“质”的宽容度


在“小数据”时代,数据的获取门槛相对较高,这就导致“样本思维”占据统治地位。人们大多是通过抽样和截取的方式来捕获数据。同时,人们分析数据的手段
和能力也相对有限。为了保证分析结果的准确性,人们通常会有意识地收集可量化的、清洁的、准确的数据,对数据的“质”提出了很高的要求。而在大数据时代,
“全量思维”得到了用武之地,人们有条件去获取多维度、全过程的数据。但在海量数据出现后,数据的清洗与验证几乎成为了不可能的事。正是这样的困境催生了
数据应用的新视角与新方法。类似于分布式技术的新算法使数据的“量”可以弥补“质”的不足,从而大大提升了数据分析对于数据质量的兼容能力。

1.2.2数据运用的关联性(Connectedness):大数据使技术与算法从“静态”走向“持续”


在大数据时代,对“全量”的追求使“实时”变得异常重要,而这一点也不仅仅只体现在数据采集阶段。在云计算、流处理和内存分析等技术的支撑下,一系列新
的算法使实时分析成为可能。人们还可以通过使用持续的增量数据来优化分析结果。在这些因素的共同作用下,人们一贯以来对“因果关系”的追求开始松动,而
“相关关系”正在逐步获得一席之地。

1.2.3数据分析的成本(Cost):大数据降低了数据分析的成本门槛


大数据改变了数据处理资源稀缺的局面。过去,数据挖掘往往意味着不菲的投入。因此,企业希望能够从数据中发掘出“大机会”,或是将有限的数据处理资源投
入到有可能产生大机会的“大客户、大项目”中去,以此获得健康的投入产出比。而在大数据时代,数据处理的成本不断下降,数据中大量存在的“小机会”得见天
日。每个机会本身带来的商业价值可能并不可观,但是累积起来就会实现质的飞跃。所以,大数据往往并非意味着“大机会”,而是“大量机会”。

1.2.4数据价值的转化(Capitalization):大数据实现了从数据到价值的高效转化


在《互联网金融生态系统2020:新动力、新格局、新战略》报告中,我们探讨了传统金融机构在大变革时代所需采取的新战略思考框架,即适应型战略。采取
适应型战略有助于企业构筑以下五大优势:试错优势、触角优势、组织优势、系统优势和社会优势,而大数据将为金融机构建立这些优势提供新的工具和动力。从数
据到价值的转化与机构的整体转型相辅相成,“内嵌式变革”由此而生。


例如,金融机构传统做法中按部就班的长周期模式(从规划、立项、收集数据到分析、试点、落地、总结)不再适用。快速试错、宽进严出成为了实现大数据价值
的关键:以低成本的方式大量尝试大数据中蕴藏的海量机会,一旦发现某些有价值的规律,马上进行商业化推广,否则果断退出。此外,大数据为金融机构打造“触
角优势”提供了新的工具,使其能够更加灵敏地感知商业环境,更加顺畅地搭建反馈闭环。此外,数据的聚合与共享为金融机构搭建生态系统提供了新的场景与动
力。

2.应用场景与基础设施—纵览海内外金融机构的大数据发展实践


金融行业在发展大数据能力方面具有天然优势:受行业特性影响,金融机构在开展业务的过程中积累了海量的高价值数据,其中包括客户身份、资产负债情况、资
金收付交易等数据。以银行业为例,其数据强度高踞各行业之首—银行业每创收100万美元,平均就会产生820GB的数据。

2.1大数据的金融应用场景正在逐步拓展

大数据发出的声音已经在金融行业全面响起。作为行业中的“巨无霸”,银行业与保险业对大数据的应用尤其可圈可点。

2.1.1海外实践:全面尝试

2.1.1.1银行是金融行业中发展大数据能力的“领军者”


在发展大数据能力方面,银行业堪称是“领军者”。纵观银行业的六个主要业务板块(零售银行、公司银行、资本市场、交易银行、资产管理、财富管理),每个
业务板块都可以借助大数据来更深入地了解客户,并为其制定更具针对性的价值主张,同时提升风险管理能力。其中,大数据在零售银行和交易银行业务板块中的应
用潜力尤为可观。


BCG通过研究发现,海外银行在大数据能力的发展方面基本处于三个阶段:大约三分之一的银行还处在思考大数据、理解大数据、制定大数据战略及实施路径的
起点阶段。还有三分之一的银行向前发展到了尝试阶段,也就是按照规划出的路径和方案,通过试点项目进行测验,甄选出许多有价值的小机会,并且不停地进行试
错和调整。而另外三分之一左右的银行则已经跨越了尝试阶段。基于多年的试错经验,他们已经识别出几个较大的机会,并且已经成功地将这些机会转化为可持续的
商业价值。而且这些银行已经将匹配大数据的工作方式嵌入到组织当中。他们正在成熟运用先进的分析手段,并且不断获得新的商业洞察。


银行业应用举例1:将大数据技术应用到信贷风险控制领域。在美国,一家互联网信用评估机构已成为多家银行在个人信贷风险评估方面的好帮手。该机构通过分
析客户在各个社交平台(如Facebook和Twitter)留下的数据,对银行的信贷申请客户进行风险评估,并将结果卖给银行。银行将这家机构的评估结
果与内部评估相结合,从而形成更完善更准确的违约评估。这样的做法既帮助银行降低了风险成本,同时也为银行带来了风险定价方面的竞争优势。


相较于零售银行业务,公司银行业务对大数据的应用似乎缺乏亮点。但实际上,大数据在公司银行业务的风险领域正在发挥着前所未有的作用。在传统方法中,银
行对企业客户的违约风险评估多是基于过往的营业数据和信用信息。这种方式的最大弊端就是缺少前瞻性,因为影响企业违约的重要因素并不仅仅只是企业自身的经
营状况,还包括行业的整体发展状况,正所谓“覆巢之下,焉有完卵”。但要进行这样的分析往往需要大量的资源投入,因此在数据处理资源稀缺的环境下无法得到
广泛应用,而大数据手段则大幅减少了此类分析对资源的需求。西班牙一家大型银行正是利用大数据来为企业客户提供全面深入的信用风险分析。该行首先识别出影
响行业发展的主要因素,然后对这些因素一一进行模拟,以测试各种事件对其客户业务发展的潜在影响,并综合评判每个企业客户的违约风险。这样的做法不仅成本
低,而且对风险评估的速度快,同时显著提升了评估的准确性。


银行业应用举例2:用大数据为客户制定差异化产品和营销方案。在零售银行业务中,通过数据分析来判断客户行为并匹配营销手段并不是一件新鲜事。但大数据
为精准营销提供了广阔的创新空间。例如,海外银行开始围绕客户的“人生大事”进行交叉销售。这些银行对客户的交易数据进行分析,由此推算出客户经历“人生
大事”的大致节点。人生中的这些重要时刻往往能够激发客户对高价值金融产品的购买意愿。一家澳大利亚银行通过大数据分析发现,家中即将有婴儿诞生的客户对
寿险产品的潜在需求最大。通过对客户的银行卡交易数据进行分析,银行很容易识别出即将添丁的家庭:在这样的家庭中,准妈妈会开始购买某些药品,而婴儿相关
产品的消费会不断出现。该行面向这一人群推出定制化的营销活动,获得了客户的积极响应,从而大幅提高了交叉销售的成功率。


客户细分早已在银行业得到广泛应用,但细分维度往往大同小异,包括收入水平、年龄、职业等等。自从开始尝试大数据手段之后,银行的客户细分维度出现了突
破。例如,西班牙的一家银行从Facebook和Twitter等社交平台上直接抓取数据来分析客户的业余爱好。该行把客户细分为常旅客、足球爱好者、高
尔夫爱好者等类别。通过分析,该行发现高尔夫球爱好者对银行的利润度贡献最高,而足球爱好者对银行的忠诚度最高。此外,通过分析,该行还发现了另外一个小
客群:“败家族”,即财富水平不高、但消费行为奢侈的人群。这个客群由于人数不多,而且当前的财富水平尚未超越贵宾客户的门槛,因此往往被银行所忽略。但
分析显示这一人群能够为银行带来可观的利润,而且颇具成长潜力,因此该行决定将这些客户升级为贵宾客户,深入挖掘其潜在价值。


在对公业务中,银行同样可以借助大数据形成更有价值的客户细分。例如,在BCG与一家加拿大银行的合作项目中,项目组利用大数据分析技术将所有公司客户
按照行业和企业规模进行细分,一共建立了上百个细分客户群。不难想象,如果没有大数据的支持,这样深入的细分是很难实现的。然后,项目组在每个细分群中找
出标杆企业,分析其银行产品组合,并将该细分群中其他客户的银行产品组合与标杆企业进行比对,从而识别出差距和潜在的营销机会。项目组将这些分析结果与该
行的对公客户经理进行分享,帮助他们利用这些发现来制定更具针对性的销售计划和话术,并取得了良好的效果。客户对这种新的销售方式也十分欢迎,因为他们可
以从中了解到同行的财务状况和金融安排,有助于对自身的行业地位与发展空间进行判断。


银行业应用举例3:用大数据为优化银行运营提供决策基础。大数据不仅能在前台与中台大显身手,也能惠及后台运营领域。在互联网金融风生水起的当
下,“O2O”(OnlineToOffline)成为了银行的热点话题。哪些客户适合线上渠道?哪些客户不愿“触网”?BCG曾帮助西班牙一家银行通过
大数据技术应用对这些问题进行了解答。项目组对16个既可以在网点也可以在网络与移动渠道上完成的关键运营活动展开分析,建立了12个月的时间回溯深度,
把客户群体和运营活动按照网点使用强度以及非网点渠道使用潜力进行细分。分析结果显示,大约66%的交易活动对网点的使用强度较高,但同时对非网点渠道的
使用潜力也很高,因此可以从网点迁移到网络或移动渠道。项目组在客户细分中发现,年轻客户、老年客户以及高端客户在运营活动迁移方面潜力最大,可以优先作
为渠道迁徙的对象。通过这样的运营调整,大数据帮助银行在引导客户转移、减轻网点压力的同时保障了客户体验。


BCG还曾利用专有的大数据分析工具NetworkMax,帮助一家澳大利亚银行优化网点布局。虽然银行客户的线上活动日渐增多,但金融业的铁律在互联
网时代依然适用,也就是说在客户身边设立实体网点仍然是金融机构的竞争优势。然而,网点的运营成本往往不菲,如何实现网点资源的价值最大化成为了每家银行
面临的问题。在该项目中,项目组结合银行的内部数据(包括现有的网点分布和业绩状况等)和外部数据(如各个地区的人口数量、人口结构、收入水平等),对
350多个区域进行了评估,并按照主要产品系列为每个区域制定市场份额预测。项目组还通过对市场份额的驱动因素进行模拟,得出在现有网点数量不变的情况下
该行网点的理想布局图。该行根据项目组的建议对网点布局进行了调整,并取得了良好的成效。这个案例可以为许多银行带来启示:首先,银行十分清楚自身的网点
布局,有关网点的经营业绩和地址的信息全量存在于银行的数据库中。其次,有关一个地区的人口数量、人口结构、收入水平等数据都是可以公开获取的数据。通过
应用大数据技术来把这两组数据结合在一起,就可以帮助银行实现网点布局的优化。BCG基于大数据技术而研发的Network
Max正是用来解决类似问题的工具。


银行业应用举例4:创新商业模式,用大数据拓展中间收入。过去,坐拥海量数据的银行考虑的是如何使用数据来服务其核心业务。而如今,很多银行已经走得更
远。他们开始考虑如何把数据直接变成新产品并用来实现商业模式,进而直接创造收入。例如,澳大利亚一家大型银行通过分析支付数据来了解其零售客户的“消费
路径”,即客户进行日常消费时的典型顺序,包括客户的购物地点、购买内容和购物顺序,并对其中的关联进行分析。该银行将这些分析结果销售给公司客户(比如
零售业客户),帮助客户更准确地判断合适的产品广告投放地点以及适合在该地点进行推广的产品。这些公司客户过去往往需要花费大量金钱向市场调研公司购买此
类数据,但如今他们可以花少得多的钱向自己的银行购买这些分析结果,而且银行所提供的此类数据也要可靠得多。银行通过这种方式获得了传统业务之外的收入。
更重要的是,银行通过这样的创新为客户提供了增值服务,从而大大增强了客户粘性。

㈧ 金融大数据平台应该如何搭建及应用是否有金融案例可以借鉴的

金融大数据平台的搭建和应用是两个部分,对于金融大数据平台来说,这两个部分都很重要。所以以下的部分我们从大数据平台和银行可以分析哪些指标这两个角度来阐述。

一、大数据平台

大数据平台的整体架构可以由以下几个部分组成:

1.一个客户

客户主题:客户属性(客户编号、客户类别)、指标(资产总额、持有产品、交易笔数、交易金额、RFM)、签约(渠道签约、业务签约)组成宽表

2.做了一笔交易

交易主题:交易金融属性、业务类别、支付通道组成宽表。

3.使用哪个账户

账户主题:账户属性(所属客户、开户日期、所属分行、产品、利率、成本)组成宽表

4.通过什么渠道

渠道主题:

渠道属性、维度、限额组成宽表

5.涉及哪类业务&产品

产品主题:产品属性、维度、指标组成宽表

三、案例

鉴于篇幅问题,此处可以参考这篇文章:

华夏银行:大数据技术服务业务需求,实现销售高速增长

㈨ 大数据技术在金融行业中的典型应用

大数据技术在金融行业中的典型应用
近年来,我国金融科技快速发展,在多个领域已经走在世界前列。大数据、人工智能、云计算、移动互联网等技术与金融业务深度融合,大大推动了我国金融业转型升级,助力金融更好地服务实体经济,有效促进了金融业整体发展。在这一发展过程中,又以大数据技术发展最为成熟、应用最为广泛。从发展特点和趋势来看,“金融云”快速建设落地奠定了金融大数据的应用基础,金融数据与其他跨领域数据的融合应用不断强化,人工智能正在成为金融大数据应用的新方向,金融行业数据的整合、共享和开放正在成为趋势,给金融行业带来了新的发展机遇和巨大的发展动力。
大数据在金融行业的典型应用场景
大数据涉及的行业过于广泛,除金融外,还包括政治、教育、传媒、医学、商业、工农业、互联网等多个方面,各行业对大数据的定义目前尚未统一。大数据的特点可归纳为“4V”。第一,数据体量大(Volume),海量性也许是与大数据最相关的特征。第二,数据类型繁多(Variety),大数据既包括以事务为代表的传统结构化数据,还包括以网页为代表的半结构化数据和以视频、语音信息为代表的非结构化数据。第三,价值密度低(Value),大数据的体量巨大,但数据中的价值密度却很低。比如几个小时甚至几天的监控视频中,有价值的线索或许只有几秒钟。第四,处理速度快(Velocity),大数据要求快速处理,时效性强,要进行实时或准实时的处理。
金融行业一直较为重视大数据技术的发展。相比常规商业分析手段,大数据可以使业务决策具有前瞻性,让企业战略的制定过程更加理性化,实现生产资源优化分配,依据市场变化迅速调整业务策略,提高用户体验以及资金周转率,降低库存积压的风险,从而获取更高的利润。
当前,大数据在金融行业典型的应用场景有以下几个方面:
在银行业的应用主要表现在两个方面:一是信贷风险评估。以往银行对企业客户的违约风险评估多基于过往的信贷数据和交易数据等静态数据,内外部数据资源整合后的大数据可提供前瞻性预测。二是供应链金融。利用大数据技术,银行可以根据企业之间的投资、控股、借贷、担保及股东和法人之间的关系,形成企业之间的关系图谱,利于企业分析及风险控制。
在证券行业的应用主要表现为:一是股市行情预测。大数据可以有效拓宽证券企业量化投资数据维度,帮助企业更精准地了解市场行情,通过构建更多元的量化因子,投研模型会更加完善。二是股价预测。大数据技术通过收集并分析社交网络如微博、朋友圈、专业论坛等渠道上的结构化和非结构化数据,形成市场主观判断因素和投资者情绪打分,从而量化股价中人为因素的变化预期。三是智能投资顾问。智能投资顾问业务提供线上投资顾问服务,其基于客户的风险偏好、交易行为等个性化数据,依靠大数据量化模型,为客户提供低门槛、低费率的个性化财富管理方案。
在互联网金融行业的应用,一是精准营销。大数据通过用户多维度画像,对客户偏好进行分类筛选,从而达到精准营销的目的。二是消费信贷。基于大数据的自动评分模型、自动审批系统和催收系统可降低消费信贷业务违约风险。
金融大数据的典型案例分析
为实时接收电子渠道交易数据,整合银行内系统业务数据。中国交通银行通过规则欲实现快速建模、实时告警与在线智能监控报表等功能,以达到实时接收官网业务数据,整合客户信息、设备画像、位置信息、官网交易日志、浏览记录等数据的目的。
该系统通过为交通银行卡中心构建反作弊模型、实时计算、实时决策系统,帮助拥有海量历史数据,日均增长超过两千万条日志流水的银行卡中心,形成电子渠道实时反欺诈交易监控能力。利用分布式实时数据采集技术和实时决策引擎,帮助信用卡中心高效整合多系统业务数据,处理海量高并发线上行为数据,识别恶意用户和欺诈行为,并实时预警和处置;通过引入机器学习框架,对少量数据进行分析、挖掘构建并周期性更新反欺诈规则和反欺诈模型。
系统上线后,该银行迅速监控电子渠道产生的虚假账号、伪装账号、异常登录、频繁登录等新型风险和欺诈行为;系统稳定运行,日均处理逾两千万条日志流水、实时识别出近万笔风险行为并进行预警。数据接入、计算报警、案件调查的整体处理时间从数小时降低至秒级,监测时效提升近3000倍,上线3个月已帮助卡中心挽回数百万元的风险损失。
网络的搜索技术正在全面注入网络金融。网络金融使用的梯度增强决策树算法可以分析大数据高维特点,在知识分析、汇总、聚合、提炼等多个方面有其独到之处,其深度学习能力利用数据挖掘算法能够较好地解决大数据价值密度低等问题。网络“磐石”系统基于每日100亿次搜索行为,通过200多个维度为8.6亿账号精确画像,高效划分人群,能够为银行、互联网金融机构提供身份识别、反欺诈、信息检验、信用分级等服务。该系统累计为网络内部信贷业务拦截数十万欺诈用户,拦截数十亿不良资产、减少数百万人力成本,累计合作近500家社会金融机构,帮助其提升了整体风险防控水平。
金融大数据应用面临的挑战及对策
大数据技术为金融行业带来了裂变式的创新活力,其应用潜力有目共睹,但在数据应用管理、业务场景融合、标准统一、顶层设计等方面存在的瓶颈也有待突破。
一是数据资产管理水平仍待提高。主要体现在数据质量不高、获取方式单一、数据系统分散等方面。
二是应用技术和业务探索仍需突破。主要体现在金融机构原有的数据系统架构相对复杂,涉及的系统平台和供应商较多,实现大数据应用的技术改造难度很大。同时,金融行业的大数据分析应用模型仍处于起步阶段,成熟案例和解决方案仍相对较少,需要投入大量的时间和成本进行调研和试错。系统误判率相对较高。
三是行业标准和安全规范仍待完善。金融大数据缺乏统一的存储管理标准和互通共享平台,对个人隐私的保护上还未形成可信的安全机制。
四是顶层设计和扶持政策还需强化。体现在金融机构间的数据壁垒较为明显,各自为战问题突出,缺乏有效的整合协同。同时,行业应用缺乏整体性规划,分散、临时、应激等特点突出,信息价值开发仍有较大潜力。
以上问题,一方面需要国家出台促进金融大数据发展的产业规划和扶持政策,同时,也需要行业分阶段推动金融数据开放、共享和统一平台建设,强化行业标准和安全规范。只有这样,大数据技术才能在金融行业中稳步应用发展,不断推动金融行业的发展提升。

㈩ 如何用大数据分析金融数据

任何数据分析的前提是首先要理解业务模型,从你的金融数据是怎么产内生的,包括哪些容指标哪些数据,你的分析是要为什么业务服务的,也就是你的目的。比如你分析金融数据的目的是要找出最有价值的金融产品,还是最有价值的客户,还是寻找最有效的成本节约途径等

在弄清楚你的分析目的,和理解清楚你的业务模式等之后,再考虑你需要采用哪些数据,采用什么方法来进行分析,这才涉及到如何进行具体的分析过程。

从整个大数据分析来看,前期的业务理解和数据整理大概要耗费一大半的精力和时间,弄清楚前期,后期的分析则会很快。

阅读全文

与银行与大数据应用案例相关的资料

热点内容
缓冲文件怎么找不到 浏览:657
文件夹与库 浏览:376
学校的人防的文件是哪些 浏览:333
北银消费贷app 浏览:376
签证后需要带哪些文件 浏览:797
什么app能看所有动漫免费 浏览:84
win10手柄助手 浏览:470
exe如何解绑数据 浏览:140
cad文件后边的名字 浏览:668
微软哈希值校验工具 浏览:519
统计db2数据库表的大小写 浏览:382
project2003使用教程 浏览:819
编程什么水平才能在猿急送上接单 浏览:356
电信卡免费流量的app有哪些 浏览:176
桂林市地形cad文件 浏览:536
为什么网络突然全部消失 浏览:373
iphone怎样安装软件 浏览:189
租婚车去哪个网站 浏览:519
linux批量修改文件权限 浏览:911
初学者学习编程语言从什么开始学 浏览:662

友情链接