1. 体量大还跑的快 亚马逊如何随时把想法变成速度
如果说2003年的非典,加速了国内电商的发展;而现在国外疫情,则促进了跨境电商的发展,当线上购物需求的再次暴增时,亚马逊暴涨的股价再次赢得人们的眼球。
去年在美国传统购物节“黑色星期五”前夕,纽约时报发表了一篇文章,标题是:Chasing Amazon, Retailers Are in a Never-Ending Arms Race.面对亚马逊的压倒性优势,老牌连锁店奋起直追,却似乎很难扭转局面。
正当他们看起来陷入困境时,亚马逊却再次提高了门槛,不仅组建自己的飞机快递队伍,加上亚马逊自身的云计算业务AWS和人工智能技术的应用,传统行业更是压力倍增,似乎,传统行业与亚马逊的竞争从来都不是公平的竞争。
但换个角度,亚马逊其实在革新传统行业,不断激发行业通过智能技术实现现代化改造,加速人工智能和机器学习技术在世界不同地区、不同领域、不同行业的创新应用。
在中国,亚马逊并没有对美国经验进行简单复制,而是着眼本地化不断创新实践,不仅使中国跨境电商行业实现跃升,还基于本地需求的创新构筑全球创新的基石。
在亚马逊中国举行的“2020亚马逊创新日“上,亚马逊中国副总裁李岩川总结出“中国公式”的内涵:技术创新本土化、客户体验定制化、商业模式轻量化。
技术打底 一切皆智能
从成立至今,亚马逊从电商平台发展到电子书Kindle、云计算AWS、Prime Air无人机、智能语音助手Alexa、无人超市Amazon Go等。截至2019年,亚马逊全球拥有逾120,000项技术专利。亚马逊不断打破边界,成为一个特立独行的存在。
远的不说,两年前无人商店Amazon Go正式对公众开放,截止到2020年3月31日,亚马逊在美国已开设25家Amazon Go商店,通过Just Walk Out技术能自动监测商品从货架上取下或放回,并在虚拟购物车中进行追踪。在消费者完成购物时,直接离开商店即可。随后,亚马逊将通过亚马逊帐号与用户结账,并提供发票。Amazon Go使用的是与无人驾驶 汽车 同样类型的技术:计算机视觉、传感器和深度学习。
在智能设备领域,亚马逊Echo Dot利用人机对话让亚马逊塑造出了未来的生活场景。这款智能设备可以称作为“家中星际迷航计算机”, Echo Dot找对了产品的消费环境,保证了语音交互的纯粹性和继续性,看似只是一款玩具,但通过Alexa语音助手和用户交流,成为智能家居的必备小能手。
现在,每个月已经有数千万用户在应用Alexa智能语音助手,每周用户与Alexa互动次数达到数十亿次数量级,除此之外Alexa在全球包括中国有数十万的合作伙伴。Alexa现在可以提供超过10万项应用,覆盖智能家居、 汽车 、移动设备、音乐、语音购物、打车软件等等。
从技术上来说,人工智能和大数据、深度学习等创新技术不断支撑Echo的升级。语音识别和自然语言理解是在计算机科学中的最具挑战的难题之一,需要复杂的深度学习算法和大量的数据及基础设施来进行训练。
在物流领域,亚马逊最早在全球开启了智能物流的变革,最具颠覆性举措包括智能仓储和智能配送。比如通过在香港的跨境前置仓实现最优化的配送,通过大数据分析,挑选重复购买率高的商品,提前将货物存储在跨境前置仓,在交付过程中省去了国际物流中转的环节。
这些创新实例背后体现了亚马逊的技术力量,尤其是亚马逊云服务(AWS)在大数据、人工智能、深度学习上的创新和实践。
目前AWS拥有遍及全球24 个地理区域的77个可用区的基础设施覆盖。从基础设施的投入开始,AWS持续在产品和技术上的研究和落地近乎极致,提供了超过175项全功能的服务,涵盖计算、存储、数据库、联网、分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面。
围绕软件应用将硬件不断优化以创造用户价值,不仅为亚马逊的一系列革命性创新提供了技术支撑,更在以云服务为载体,围绕用户应用打磨产品技术,最终实现体量大还跑得快。
更快更智能 一切客户驱动
在创新的最前沿,亚马逊坚持卓越运营和长远思考,不仅保持对前沿技术和趋势的 探索 和落地应用,更关心最终用户的体验,以用户需求为导向进行技术研发。因为,在亚马逊,研发目的并不是仅仅局限于技术本身,而是致力于打造最优质的用户体验。
比如去年的“黑五”大促,因为时差关系,中国消费者可以在前一天的夜里11点开始同步抢购日本促销商品的库存,紧接着是第二天早晨英国8点的促销,随之而来的是德国9点的促销,而美国开始促销时已经是第二天中国的下午3点了。也就是说,当外国消费者还在睡梦中的时候,中国消费者可以“先人一步”抢购爆款。
对接四大海外站点的商品和优惠,需要跨国界、跨时区、跨品牌的全球促销同步技术的支撑。让中国消费者享受到更丰富的折扣商品和促销优惠,以及时间超长的跨境购物狂欢节,其背后就是亚马逊业界领先的全球促销同步技术,也是亚马逊中国本土化技术创新的典范。
据亚马逊海外购中国技术负责人王毅介绍,亚马逊将人工智能、机器学习、神经网络等先进的大数据统计与分析方法,落地于亚马逊网站中页面自动生成布局、后台日常运营、商品个性化推荐、尺码智能推荐、信息精准推送等大量智能化应用场景。
在电商领域,“千人千面”比较常见,目前业内实现个性化推荐的手段普遍为运营人员为商品或者消费者打标签的模式,这种模式有太多的人工干预因素,亚马逊通过技术手段,围绕用户行为、商品特征两个向量进行计算,包括对用户浏览 历史 、用户搜索习惯、用户购买 历史 、商品颜色与尺码等各个维度的综合分析,向客户推出个性化内容。进而智能化打造真正的“千人千面”客户体验。
针对页面布局,亚马逊借助大数据体系,根据当前客户特征以及业务数据,从频道池中自动选取频道;在精准推荐商品方面,亚马逊中国搭建了自身特有的信息流、瀑布流推荐,受最前沿计算机视觉技术的启发,亚马逊使用深度卷积神经网络,准确的量化商品视觉相似度,从而有效的感知客户对服装类商品的偏好,并精准推荐商品;而在推荐促销信息方面,亚马逊“瀑布流”会根据消费者兴趣推荐不同类型的镇店之宝,秒杀等折扣信息及购物主题,并同时增加推荐内容的多样性,打造更丰富的线上购物体验。
在后台运营方面,亚马逊利用强大的后台系统,构建了自动化运营体系,通过用户、商品和运营等方面的数据、模型分析,实现自动化、智能化的页面生成。
今年,亚马逊中国运营流程自动化项目(Merchandising Process Automation),结合机器人流程自动化技术(RoboticProcess Automation),使用智能表单(Smart Forms)及自动化脚本(Auto Script)等实现方式,使亚马逊中国海外购系统运营环节中涉及到的人工操作流程演进为标准化及自动化处理,预计每年可节省1800个工时,平均节省15%的运营工作时间。
可以说,亚马逊利用全球资源,将创新技术应用于中国市场并进行推广,同时亚马逊中国技术研发成果会反向应用于全球跨境网购领域。比如“智能尺码助手”就是由中国团队研发,并快速迭代,进而对亚马逊全球的尺码推荐功能起到了引领和推动的作用。
轻量运营 让需求快速变为服务
基于全球运营网络,亚马逊中国海外购已形成独有的轻量化运营模式,为亚马逊其他国家提供了非常有益的借鉴,引领着全球跨境电商行业的快速发展。
具体来讲,轻量运营体现在两个层面:
别人有的,亚马逊会做的更好,别人没有的,客户想要的,亚马逊都有能力进行创新并落地。疫情之下,当全球运转按下暂停键,跨境电商已经成为推动经济复苏的重要抓手之一,同时人工智能创新技术推动全世界迈向数字化革命的新高峰时。正如李岩川所说:“互联网技术和客户需求不断发生着变化,但唯一不变的是亚马逊创新的脚步“。
2. aws(亚马逊WEB服务)详细资料大全
AWS即Amazon Web Services,是亚马逊(Amazon)公司的云计算IaaS和PaaS平台服务。AWS面向用户提供包括弹性计算、存储、资料库、应用程式在内的一整套云计算服务,能够帮助企业降低IT投入成本和维护成本。
AWS提供了一整套基础设施和应用程式服务,使几乎能够在云中运行一切应用程式:从企业应用程式和大数据项目,到社交游戏和移动应用程式。
基本介绍 中文名 :aws 外文名 :Amazon Web Services 程式类别 :应用程式 项目基础 :大数据项目 官网 ::aws.amazon// 服务介绍,分类,竞争对手,存储辞汇表, 服务介绍 很多公司选择AWS作为其IT解决方案,AWS有很多云服务,以下介绍AWS中几类比较重要的服务。 分类 计算类: EC2(Elastic Compute Cloud) 是一种弹性云计算服务,可为用户提供弹性可变的计算容量,通常用户可以创建和管理多个虚拟机,在虚拟机上部署自己的业务,虚拟机的计算能力(CPU、记忆体等)可以根据业务需求随时调整。 Elastic IP Addresses(弹性IP位址) – 弹性IP位址是为动态云计算设计的静态IP位址。一个弹性IP位址是和你的账户相关,而不是和你的一个特定实例相关。不像传统的静态IP位址,弹性IP位址可以通过重新匹配你的共有IP位址到你账户任意的实例,从而让你可以忽略实例或者可用区域的错误。 连线本质上是通过NAT1:1的匹配每个Elastic IP和Private IP。 Elastic MapRece :EMR采用运行在亚马逊EC2和S3的托管Hadoop框架上。以立即获得满足需要的计算能力,例如网页索引、数据挖掘等数据密集型任务,轻松、经济地处理海量数据,不用担心对Hadoop集群耗时的设定、管理或调优。 AS(Auto Scaling)自动伸缩服务 :允许用户根据需要控制亚马逊EC2自动扩大或减小计算能力。用户利用AS可以无缝地增加EC2的实例数量,以保证使用高峰期的性能,也可以在需求停滞时自动减少以降低成本。AS特别适合那些需求按小时、天或周规律变化的应用程式。 AS由亚马逊CloudWatch控制,并且用户不必支付CloudWatch以外的其他服务费用。 ELB (Elastic Load Balancing)弹性负载平衡 :自动将入口流量分配到多个亚马逊EC2实例上。弹性负载平衡在实例池中不断检测不正常的实例,并自动引导路由流量到正常的实例上,直到不正常的实例恢复正常。客户可以在单一的数据中心进行负载平衡,更可以在跨中心的套用上获得相同的功能。 兼容IPv6,数据来自于CloudWatch 部署&管理类:
3. 亚马逊云科技推云数智一体服务,这是个什么样的服务
亚马逊云科技在北京举办大数据与人工智能技术新闻媒体沟通交流会,公布发布“云、数、智三位一体”的大数据与机器学习结合服务项目组成。亚马逊云科技还联合乐我无尽(Joyme)、上海欣兆阳(Convertlab)等合作方共享了亚马逊云科技在推动公司数智结合领域的有关实例。
上海欣兆阳根据亚马逊云科技的统一的数据基本基座,上海欣兆阳构建了一体化数据智能湖仓架构DataHub和一体化高效率机器学习服务平台AIHub。这两项运用能将数据运转的及时性提高了32%,实体模型发布高效率提高了30%。
亚马逊云科技依据自己的操作及其对制造行业的观查,打造了一套“云、数、智三位一体”服务项目组成,为用户提供结合人工智能技术和大数据的解决方法。
不仅人工智能技术、大数据技术性在颠覆式创新公司企业战略转型,更高效率发展趋势,也有如物联网技术、数字孪生这些智能化科技一起推动公司更快发展趋势。
4. 如何用亚马逊弹性MapRece分析大数据
首先,打开Amazon Elastic MapRece控制台。然后点击 Create Cluster ,在五个步骤中完成配置设置。
第一步,配置一个集群
在 Cluster name 字段中,输入一个描述性的名称。它可以是非唯一的。
在Termination protection 字段中,其默认值为Yes。这一设置可确保集群不会因为意外或错误而关闭。
在Logging 字段中,其默认值为Enabled。日志数据将被发送至亚马逊S3。
在Log folder S3 location 字段中,请以如下格式输入存储桶名称和文件夹信息:s3://<bucket name>/<folder>/。
在Debugging 字段中,其默认值为Enabled。
Tag 部分是可选的。你可以为你的EMR集群添加最多10个标签。在一个标签中,包括了一个区分大小写的键值对。
第二步,设置软件配置
在Hadoop distribution 多选框中,选择Amazon 为默认值。
在 AMI version 多选框中,选择 2.4.2 (Hadoop 1.0.3)
在Application to be installed 多选框中,保留选中Hive 和 deletePig。
第三步,设置硬件配置
在 Network 字段中,选择Launch into EC-2 Classic。
在EC2 Subnet 字段中,选择 No preference。
在Master、Core 以及 Task 字段中,默认EC2实例类型为m1.small。对于低工作负载的应用,你可以为所有节点选择使用小实例(可确保降低你的使用成本)。相应地,Count
的默认值分别为1、 2、 0。同时,对于所有三个字段,确保不选中 Request Spot Instances 。
注意:20是每个AWS帐户的最大节点数。如果你运行了2个集群,那么2个集群运行的节点总数必须为20或以下。如果你确实需要节点数超过20,那么你必须提交一个请求以便于提高你的亚马逊EC2实例上限。
第四步,设置安全和访问配置
在EC2 key pair 字段中,从列表中选择一个亚马逊EC2密钥对。这一设置可以让你使用Secure Shell(SSH)来连接主节点。
在IAM user access 字段中,其默认值为 No other IAM users。
在EC2 role 多选框中,其默认值为 no roles found。
在Bootstrap Actions 部分,你可以不做任何操作。
第五步,指定集群参数
在Steps 部分,从列表中选择Hive Program,并点击 Configure and add。
在Name 字段中,其默认值为Hive Program。
在 Script s3 Location 字段中(必选项),以BucketName/path/ScriptName的格式输入相关信息,例如
s3n://elasticmaprece/samples/hive-ads/libs/model-build。
在 Input s3 Location 字段中(可选项),以BucketName/path的格式输入相关信息,例如
s3n://elasticmaprece/samples/hive-ads/tables。该输入值会作为名为INPUT的参数发送给Hive脚
本程序。
Output S3 Location 字段(可选项),以BucketName/path的格式输入相关信息,例如
s3n://myawsbucket/hive-ads/output/2014-4-14。该输入值会作为名为OUTPUT的参数发送给Hive脚本程
序。
在 Arguments 字段,输入相关信息,如 - d LIBS=s3n://elasticrecemap/samples/hive-ads/libs。HIVE脚本程序需要额外的库。
在 Action on Failure 字段中,选择 Continue。如果当前步骤失败,它将继续至下一个步骤。
当你完成后,点击Add,然后点击Create Cluster。你将会看到Summary 信息。
如上例,在你继续查询操作和分析大数据前,你需要在主节点上准备一个HIVE会话。
你将需要每隔五分钟向亚马逊S3推送 Impression 和 Click Log Files。每次添加一个条目,就会向客户显示一条广告。每次添加一个Click
Log Files的条目,客户一条广告。类似于SQL的查询操作简化了关联客户点击数据和特定广告的过程。
总之,分析大数据的最佳方法就是在Hadoop上运行Hive,并使用SQL查询以简化日志数据分析。
5. 亚马逊云科技容器可以应用在哪些方面
大概有三个方面,一个是在混合环境中部署,在混合环境中管理Kubernetes集群和应用程序,并在数据中心运行Kubernetes。另一个是机器学习(ML)建模工作流,可以使用由GPU提供支持的最新Amazon Elastic Compute Cloud(EC2)实例高效地运行分布式训练作业。还有一个是大数据,Amazon EMR与EKS集成,因此,可以直接在Kubernetes上运行Apache Spark、Hadoop和其他大数据应用程序。这可以自动预置和管理资源,以便进行数据处理、分析和机器学习。
6. 什么是“大数据”的真正含义
如果你说大数据就是数据大,或者侃侃而谈4个V,也许很有深度的谈到BI或预测的价值,又或者拿Google和Amazon举例,技术流可能会聊起Hadoop和Cloud puting,不管对错,只是无法勾勒对大数据的整体认识,不说是片面,但至少有些管窥蠡测、隔衣瘙痒了。
也许,“解构”是最好的方法。
怎样结构大数据?
首先,大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。
其次,想要系统的认知大数据,必须要全面而细致的分解它,我们着手从三个层面来展开:
第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。
我会从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;从对大数据的现在和未来去洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。
第二层面是技术,技术是大数据价值体现的手段和前进的基石。
我将分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。
第三层面是实践,实践是大数据的最终价值体现。
我将分别从互联网的大数据, *** 的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。
和大数据相关的理论?
1、 特征定义
最早提出大数据时代到来的是麦肯锡:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。
人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
业界(IBM 最早定义)将大数据的特征归纳为4个“V”(量Volume,多样Variety,价值Value,速Velocity),或者说特点有四个层面:第一,数据体量巨大。
大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T);第二,数据类型繁多。
比如,网络日志、视频、图片、地理位置信息等等。
第三,价值密度低,商业价值高。
第四,处理速度快。
最后这一点也是和传统的数据挖掘技术有着本质的不同。
古语云:三分技术,七分数据,得数据者得天下。
先不论谁说的,但是这句话的正确性已经不用去论证了。
维克托·迈尔-舍恩伯格在《大数据时代》一书中举了百般例证,都是为了说明一个道理:在大数据时代已经到来的时候要用大数据思维去发掘大数据的潜在价值。
书中,作者提及最多的是Google如何利用人们的搜索记录挖掘数据二次利用价值,比如预测某地流感爆发的趋势;Amazon如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐,以此有效提升销售量;Farecast如何利用过去十年所有的航线机票价格打折数据,来预测用户购买机票的时机是否合适。
那么,什么是大数据思维?维克托·迈尔-舍恩伯格认为,1-需要全部数据样本而不是抽样;2-关注效率而不是精确度;3-关注相关性而不是因果关系。
阿里巴巴的王坚对于大数据也有一些独特的见解,比如,
“今天的数据不是大,真正有意思的是数据变得在线了,这个恰恰是互联网的特点。”
“非互联网时期的产品,功能一定是它的价值,今天互联网的产品,数据一定是它的价值。”
“你千万不要想着拿数据去改进一个业务,这不是大数据。
你一定是去做了一件以前做不了的事情。”
特别是最后一点,我是非常认同的,大数据的真正价值在于创造,在于填补无数个还未实现过的空白。
7. 亚马逊的AWS大数据课程介绍
亚马逊的Big Data on AWS 介绍基于云的大数据解决方案及 Amazon Elastic MapRece (EMR) 与 AWS 大数据平台 。
8. 亚马逊大数据存在哪些问题
亚马逊大数据存在产品损坏,产品质量问题,退货。亚马逊通过多种工具在云端扩展其大数据应用,如数据储存、数据收集、数据处理、数据分享和数据合作。
9. 亚马逊是如何成为世界级大数据企业的
亚马逊拥有强大的基础设施,才能成为世界级大数据企业的。
亚马逊公司,外文名是Amazon。成立时间是1994年7月5日,总部地点是西雅图,经营范围有书籍、电子产品、家居产品等,年营业额是2805.22 亿美元(2020年) ,员工一共有647500人(2019年),CEO是安迪·贾西。它是是美国最大的一家网络电子商务公司,也是网络上最早开始经营电子商务的公司之一。在2021年7月,杰夫·贝索斯正式卸任亚马逊首席执行官,由安迪·贾西继任。
10. 亚马逊云科技的云存储,最应该知道的有这三点
传统存储在以各种方式对接公有云生态,公有云的云上服务类型也在不断完善,作为企业信息化负责人要做的是更多地了解公有云,然后,考虑如何充分利用公有云的优势。
本文通过介绍亚马逊云 科技 存储服务的三个关键点,带您认识云存储的现状。
正文:
乘着互联网产业的春风,云存储在过去近二十年走过了可遇不可求的发展历程。也让从90年代开始,就一直坐着冷板凳,负责数据归档的对象存储,一跃成为整个互联网数据的基石。
如今,绝大部分互联网上可访问的数据都靠对象存储来存,偶尔曝出的数据泄露事件也大多都跟对象存储有关,当然,问题不在于对象存储本身。
从2006年,亚马逊云 科技 的对象存储服务Amazon S3发布,到现在,算起来也有十六年的时间了,这也是亚马逊云 科技 推出的第一款云服务。
从市场表现来看,Amazon S3是非常成功的,前两年有人推测说,亚马逊云 科技 在存储方面的营收规模非常大,甚至被称作是全球最大的存储公司,Amazon S3无疑是功劳最大的一个。
有人说,许多亚马逊云 科技 用户使用的第一个产品就是Amazon S3对象存储,在所有亚马逊云 科技 的用户案例,在所有技术文档里,Amazon S3的出镜率都非常高。
云上原生存储Amazon S3的主线任务:不断降低成本
如果亚马逊云 科技 的用户没用过Amazon S3,就好比去包子铺吃饭没点包子,光顾烧烤店没吃烤串一样,令人费解。
Amazon S3的易用性高、可用性高,开发者很喜欢,Amazon S3几乎不丢数据的可靠性,稳定性也很高,运维管理人员很喜欢,Amazon S3在互联网应用场景被普遍应用。
如今,Amazon S3上存着超过100万亿个对象,每秒需要处理上千百万次请求。
Amazon S3一开始解决了可靠性和可用性以及安全方面的基本问题,性能也一直在提升,多年看下来,最大的工作重点就是不断降低成本。
亚马逊云 科技 大中华区产品部总经理 陈晓建介绍称,同样存储一份数据,如果2006年需要100块钱,而在2022年就只需要大概15块钱,16年间,Amazon S3的存储成本降低了大约7倍。
2021年12月,亚马逊云 科技 宣布在全球九大区域,将Amazon S3 Standard In Frequent Access和Amazon S3 One Zone In Frequent Access的价格降低了31%。
Amazon S3存储分了八个层级。
对于需要经常访问的数据,首选标准版的Amazon S3,它具有毫秒级的访问表现,而不太经常访问的数据就选Amazon S3 Standard-IA上,相较于前者能节省大概40%的费用。
而对于那些很少访问的数据,则可以选择放在Amazon S3 Glacier DeepArcihve上,它的成本非常低,大约1美刀1个TB,但代价是,想把数据拿回来就得多等等,大概需要12到48个小时。
有人觉得这等的时间也太长了,于是,亚马逊云 科技 又推出了Amazon S3 Glacier Flexible Retrieval,只需要等上几分钟到几小时。
就没有一种,既可以便宜,访问性能又高的存储吗?还真有。
这就是Amazon S3 Glacier Instant Retrieval,它是最新的一个存储层级,拿回数据的速度是毫秒级的,成本与Amazon S3 Glacier相当,适合每季度才访问一次、又需要毫秒级取回的海量数据。
另外,Amazon S3 One Zone-IA的成本也很低,顾名思义,数据只存在单个可用区上,而其他S3存储的数据都在多个可用区上存着好几分,相比之下,理论上丢数据的风险高了些。
最后,出于合规的要求,用户有些数据不能上云,亚马逊云 科技 可以提供Amazon Outposts,把云的硬件放到了用户的数据中心里。使用Amazon S3 on Outposts,就像在云上使用S3一样。
总的来说,Amazon S3的存储层级还是挺多的,但问题是,这给选型和管理也带来了负担。
为此,亚马逊云 科技 推出了Amazon S3 Intelligent-Tiering(智能分层),它会根据对象被访问的次数在多个存储层级间进行自动化迁移。
如果不能确定要选什么或者存储需求会变,那就选它,它不仅能解除选择困难症,还能避免用户自行管理数据分层的麻烦。
一家在东南亚和北美市场非常有影响力的互联网公司,在亚马逊云 科技 上存放了大约几十PB的数据,原本主要使用的是Amazon S3 Standard—IA,在使用Amazon S3智能分层后,没有进行任何额外操作,就将存储成本降低了62%。
亚马逊云 科技 最早在2018年就推出了Amazon S3智能分层功能,如今,Amazon S3智能分层已经涵盖了Amazon S3家族的几乎所有存储类别,最多可节省68%的成本。
不仅如此,如今数据分层还拓展到文件存储Amazon EFS,Amazon EFS提供四种文件存储等级,数据分层能节省高达72%的存储成本。
打通云应用与传统应用的隔阂:靠多种文件存储
如果说,对象存储是云存储的标配的话,那文件存储就是云存储连接本地存储的桥梁。
如今常见的应用分为两类。
一类是云原生的现代化应用,也就是在云上开发的、充分利用云架构优势的应用,比如电商、 游戏 、社交媒体等平台。对应需要的存储,大部分是对象存储Amazon S3来满足,少部分需要文件存储Amazon EFS。
另一类是传统企业应用,它诞生在公有云之前,常见的有高性能计算、EDA、视频渲染等场景,通常由本地的文件存储系统,比如NAS来支撑的,为提升安全性和可靠性,通常都带有快照、镜像、远程复制等功能特性。
这类工作负载并没有根据云架构的特点来设计,如果强行上云,不仅需要调整应用本身,而且还可能出现兼容性的问题,为了避免此类问题,亚马逊云 科技 推出了FSx文件存储家族。
从2018年开始,陆续推出了面向Windows环境的Amazon FSx for Windows,面向高性能计算场景的Amazon FSx for Lustre,面向大数据分析场景推出了Amazon FSx for OpenZFS。
金风慧能采用了亚马逊云 科技 构建HPC高性能计算系统,其中使用了Amazon FSx for Lustre共享存储系统,不仅使气象预测系统性能提升了10%,气象计算时间缩短了1/3,还将成本降低了70%,运维复杂度也大大降低。
此外,还与知名存储厂商NetApp合作推出了Amazon FSx for NetApp ONTAP,把NetApp的经典NAS文件存储系统NetApp ONTAP放到了公有云上。
NetApp在2015年就提出了Data Fabric的概念,大意就是想要实现数据在云上和云下的自由流动,是比较早积极拥抱混合云的存储厂商之一。
与一些存储厂商的云上托管服务不同,Amazon FSx for NetApp ONTAP没有删减任何功能,它是云上唯一完整且全托管的NetApp ONTAP文件存储系统,能够无缝地跟企业本地的ONTAP系统对接,所以,用户的IT系统不需要做任何改动,就能使用云上服务。
2019年,NetApp与联想成立合资公司——联想凌拓,联想凌拓在中国区提供相关服务,联想凌拓产品管理与营销高级总监林佑声表示,从发布到现在,Amazon FSx for NetApp ONTAP得到了非常多客户的认可,包括金融、医疗、石油以及高 科技 行业客户。
嘉里物流原本是本地存储NetApp ONTAP的用户,随着业务全球化发展,在数据扩容以及数据共享方面碰到的问题越来越多,通过使用亚马逊云 科技 提供的Amazon FSx for NetApp ONTAP,将数据从本地迁到云上,解决了这些问题。
上云之后,不仅可以使用原来NetApp ONTAP自带的快照和备份等功能,同时,还可以使用亚马逊云 科技 遍布全球的数据中心,实现跨区域的灾备。
补足数据保护方面的短板:Amazon Backup
一直以来,云存储被诟病的点还在于缺少数据灾备功能,在如何维持业务连续性方面有一些争议,而亚马逊云 科技 正在试着消除这一顾虑,这就是Amazon Backup。
由于缺少与业务价值的强关联性,数据保护经常容易被忽视,同时,由于数据保护系统本身很复杂,合规的要求还特别多,实践起来也特别麻烦,所以,数据保护的实践相对落后。
可能也是基于这样的考虑,亚马逊云 科技 的数据保护服务Amazon Backup才特别喜欢强调“一站式”“操作简单”的特点,让用户知道,数据保护也没有那么麻烦。
于是我们看到,Amazon Backup能覆盖旗下的几乎所有存储产品,包括块存储(Amazon EBS)、对象存储、文件存储、数据库,以及计算和存储网关等相关产品。
Amazon Backup的操作比较简单,通过图形的界面即可完成大部分操作,用户还可以通过预设的策略进行自动化的备份,降低手动备份带来的问题。
安全合规的问题让许多用户头疼,Amazon Backup深度集成了亚马逊云 科技 自带的KMS数据加密服务,整个备份操作权限、数据访问权限都可以用IAM进行细颗粒度监控,满足个人信息安全规范、信息安全等级保护等方面的合规要求。
Amazon Backup避免让数据保护带来太多的成本负担,因此也用上了智能分层技术,用户通过冷热分层策略可以有效降低约75%的成本。
澳大利亚石油天然气的供应商Santos要对Amazon EBS块存储做备份,原本都是用手动备份的方案,但随着业务量的发展,备份的出错率越来越高,成功率越来越低。
而在用了Amazon Backup后,平均备份任务用时和运营成本均有大幅降低,备份成功率到了100%,而且还完全做到企业数据合规。
结束语
确实如陈晓建所言,亚马逊云 科技 存储服务已经成为IT行业的“水”和“电”,让各行各业的业务都能从存储服务中获得价值。
亚马逊云 科技 的存储服务类型和存储的相关实践都非常有代表性,而且,很多做法已经成了上云的参考实践,企业用户应该多少了解亚马逊云 科技 的云存储,特别是有上云打算的企业。
当然,上云带来的便捷和灵活,稳定性和安全性,以及对运维的解放都很吸引人。
还有顾虑?据我个人了解,亚马逊云 科技 非常在意企业在云上的成功和成本节省,不仅会帮企业不断优化。除此之外,市场上有一些专门的服务,帮助企业做规划实施,让你充分利用云的优势。