『壹』 代码合规系列Vol.1:浅谈推荐算法合规
前言:
豆瓣评分曾达到9.4的科幻神剧《西部世界》,收获了无数粉丝的膝盖。在《西部世界》中,通过编程实现的人工智能,人们体验着由代码打造的虚拟现实世界。而在 游戏 《我的世界》里,人们也可以通过编程来打造属于自己的世界。曾有人预言,未来的世界是软件的世界,是代码的世界。我们无法预知未来,但是活在当下明显感觉到代码正在深刻改变我们的生活、改造现实世界。但代码又似乎与我们的生活不直接相关,它是一种由字符、符号或信号码元以离散形式表示信息的明确的规则体系,并非自然语言,普通人不可直接读懂。目前的代码世界尚处于早期野蛮生长时代,代码难以约束,相关的 社会 规范几乎不存在,仿佛游离于 社会 规范之外,拒绝接受法律的约束和道德的审视。但是最近几年文明之光开始显现,代码合规开始进入大家的视线,大家开始讨论算法合规、开源代码合规等前沿话题。敲过几年代码、学过几年法律、正在做企业合规的笔者,有意加入代码合规的讨论中来,开通代码合规这个栏目,分享自己的合规心得。
我们常说代码的灵魂是算法,因为代码的核心在于算法。算法是对解题方案的准确而完整的描述,是一系列解决问题的清晰指令。形象比喻,如果把算法理解为一种思路,那代码就是算法(思路)的具体表现形式。所以我们常说防止代码泄露,实则是保护自己的核心算法思路不给他人所知。2021年8月27日,国家互联网信息办公室发布《互联网信息服务算法推荐管理规定》(征求意见稿)发布,该规定旨在规范互联网信息服务算法推荐活动,维护国家安全和 社会 公共利益,保护公民、法人和其他组织的合法权益,促进互联网信息服务 健康 发展。代码合规的系列Vol.1将围绕该算法推荐管理规定进行册瞎指解析讨论。
一、推荐算法州配的介绍
推荐算法是指利用用户的一些行为,通过一些算法,推测出用户可能喜欢的东西。它作为算法中的一种,源于个性化推荐,经过多年的理论研究和商业实践,已经被越来越多的互联网企业所运用到用户推荐场景中。截止目前推荐算法已经延伸出生成合成类(图片视频生成)、个性化推送类(推荐)、排序精选类(排名)、检索过滤类(搜索)、调度决策类(外卖、打车)等。举例来说,我们在天猫上购物,经常会被推送一些我们之前浏览过的同类型产品,这里面就是用到了推荐算法,属于个性化推送类。
笔者曾在本科期间,参加过阿里举办的首届天猫大数据算法竞赛,竞赛的内容是关于推荐算法的研究开发。基于天猫用户的数据(匿名化处理)—数据内容主要是一定时间内用户购买产品的时间、次数、产品相似度等用户行为—运用基于内容、协同过滤、关联规则等推荐算法对用户行为进行分析,预测下一个时段用户的行为,对比实际数据得出相似度,以相似度高低决定算法优良。经过几年的发展,推荐算法在商业实践中的运用已经变得十分广泛,但是也因此给我们的生活带来了许多困扰,出现如数据杀熟、隐私保护等问题。这次国家推出对推荐算法的监管规定,是十分及时和必要的。企业要想继续进行推荐算法的研究和实践,就必须要满足国家对于推荐算法的规定。因此笔者基于《互联网信息服务算法推荐管理规定》(征求意见稿),多维度谈谈企业的算法合规义务和合规化建议。
二、算法服务提供者的合规义务
合规,是比合法更大范围的存在,即符合、遵守、执行适用于企业的合规规范。这里所说的合规规范按照国内外出台的标准、办法和指引,可以总结为外部合规规范和内部合规规范。其中外部合规规范可以理解为合规要求,包括但不限于法律规范、行业准则、商业惯例、法院判决以及行政决定、强制性标准、道德规范等。内部合规规范可以理解为合规承诺,主要是指合同协议、行业自律性规则、非强制性标准、对外承诺、章程以及内部规章和各项决议等。所以对于合规工作来说,首神银要的就是要收集合规规范,从中识别出合规义务。本文立足于《互联网信息服务算法推荐管理规定》(征求意见稿),识别出具体的合规义务,分别从强制性义务、禁止性义务、原则性义务进行展开,如下表所示。
上表所示,可以较为清晰的区分算法合规义务。我们发现,强制性义务几乎占据了大半,大部分的条款都是企业应当履行的合规义务。
三、推荐算法的合规化建议
从概念上说,合规可以理解为一种理想状态,或者说是最终目标。在通往合规的道路上,我们需要做的是将“外规内化”。上述表格总结的企业合规义务更像是粗糙的条文堆砌,我们还需要将具体的合规义务进一步内化于企业的内部管理行为中。结合我们团队在企业合规管理体系的搭建上的实践经验,我认为可以从合规管理制度、合规运行和保障机制角度提出我们的合规化建议。
可能上述视角过于专业化,也有点复杂化。如果从技术人员的角度看,可以从前端和后端的视角来解析具体的合规义务:
上述两个视角,可能对合规义务有了些许的了解,但是对于企业来说,合规义务需要嵌入到公司的制度中去才算是完成了制度层面的建设工作,这是个繁琐和专业的事情。同时制度层面完成后,要落实制度就需要让员工懂法知规,这就需要对员工进行必要的合规培训工作,这里面就涉及对于治理层、经理层、员工层不同的培训要求。所以对于企业合规化建设,比较省力和经济的方式就是引入第三方专业机构,帮助企业去做合规化建设,帮助组建企业内部的合规团队,指导合规团队去做具体的合规化建设工作,授人以渔。
『贰』 网友拿出证据,天猫超市大数据是否存在“杀熟”
这是一个发生在2020年3月8日的一件事,在天猫3·8活动期间,由于“新人专享价”的标识没有正常显示,造成了很多用户产生同款商品不同价的误解,被广大网友认为了大数据“杀熟”。当然,这个问题也得到了官方很快的修复,不过在天猫超市,只要是88VIP用户,始终都可以在结算的时候,获得9.5折的优惠,因此不存在所谓的大数据杀熟。
因此调查的结果显示出,在遭遇到“大数据杀熟”之后,一般很难维护自己的正常权益,主要是由于“大数据杀熟”具有隐蔽性,维权的时候很难取证,因此维权道路举步维艰。而过半数的调查者都存在被“大数据杀熟”的经历,但因为经营者通常会以不同的商品型号和不同的套餐优惠程度或是配置,或是时间点等理由进行辩解,同时又不对外公布他们具体采用的算法、规则和数据,因而当消费者们在遇到这些类似问题的时候,很难找到证据来证明。
『叁』 淘宝是如何利用大数据进行预测的
用户所有的淘宝使用记录,就是大数据,就是数字时代的资产,这些数据,通过筛选和运算,就能创建每一位用户的用户画像,分析出每个人的不同爱好与需求,从而做到精准推送,营销成本大大降低但却能获得更好的结果。淘宝大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
『肆』 天池比赛数怎么算
开发者社区小网络
关注
天池大赛算法教程及获奖选手答辩 原创
2018-09-25 10:15:37
开发者社区小网络
码龄5年
关注
天池大数据竞赛是由阿里巴巴集团主办,面向全球科研工作者的高端算法竞赛。通过开放海量数据和分布式计算资源,大赛让所有参与者有机会运用其设计的算法解决各类社会问题或业务问题。特别优秀的解决方案将有机会直接上线阿里巴巴旗下各电商网站(含淘宝、天猫等)或第三方合作伙伴平台,服务中国乃至世界数以亿计的用户。
2014年3月,阿里巴巴集团董事局主席马云在北京大学发起“天池大数据竞赛”。首届大赛共有来自全球的7276支队伍参赛,海外参赛队伍超过148支。阿里巴巴集团为此开放了5.7亿条经过严格脱敏处理的数据。2014年赛季的数据提供方为贵阳市政府,参赛者根据交通数据模拟控制红绿灯时间,寻找减轻道路拥堵的方法。
课程链接:天池大赛算法教程及获奖选手答辩
本课程主要讲解天池新手入门赛的参赛技巧、常用算法,以及获奖选手答辩视频。
应用意义:
大数据专家、阿里巴巴集团副总裁涂子沛介绍,比赛中胜出的优秀数据模型,不仅可用于参赛者的学术研究成果,还有机会走出实验室,直接应用于淘宝、支付宝等真实的商业场景,影响中国乃至世界数以亿计的用户。在此前的“天猫推荐算法大赛”中,6名90后大学生研发的个性化推荐算法,在“双11”当天的实战效果超过天猫原有算法的16.9%,赢得100万元奖金。
涂子沛说,数据经济的时代正在到来,中国2015年拥有的数据量占全球的14%,到2020年这一比例将上升至21%。但我们的数据利用率不到0.4%,更多的数据仍然沉睡在各个角落。中国需要有效的数据处理方法,更需要大数据人才。阿里云天池大赛将成为一个数据众智众创平台,吸引更多政府、公司开放数据资源,创新数据商业模式,引爆新生代力量和数据经济的能量。
『伍』 天猫数据分析,主要分析店铺数据,推广数据,还有什么
行业数据和一些店铺数据:品牌、店铺、产品、用户数据,可以用数据魔方;店铺分析:流量分析,销售分析,客户分析,推广效果,来源分析,可以用量子横道;
『陆』 天猫在电商节如何处理大数据技术架构上采用了哪些策略
对于这个问题,我们先了解下天猫电商节的数据:2019年双十一最终交易额是2135亿!其专有云计算平台阿察轿里云将在高峰期处理每秒数十万笔交易和付款。
阿里在电商节的技术框架可将一个库吞吐达到将近3wTPS(每秒钟request/事务数量),RT(响应时间)在1ms以内完成基本上与本地相当,很好的支撑了天猫节的电商大促销活动。
据了解和自己的分析终结得出,阿里在天猫电商节上对大数据的的处理上基本的技术框架简单来讲就是计算存储分离+高宽带+AI技败团肆术+云或羡计算
1,实现计算存储分离,计算存储分离后,再将计算节点与离线资源分布,解决了大数据量存储的问题。
2,高宽带保证了大数据的实时交互不延时。
3,通过大量的图像识别和机器学习,增加AI技术对商品的智能识别功能。
4,通过互联网提供虚拟化计算资源的云计算,改善了物流部门。
『柒』 高级大数据开发课程大纲那个最好
魔据条件不错,基础教育不错,有经验真正做到为学生负责到底,其它的,说实在的真的不敢保证。未来一定是大数据时代,现在选择还不迟,只要努力一定会有更好的发展前景,希望你能为有一个好的前程。