1. 體量大還跑的快 亞馬遜如何隨時把想法變成速度
如果說2003年的非典,加速了國內電商的發展;而現在國外疫情,則促進了跨境電商的發展,當線上購物需求的再次暴增時,亞馬遜暴漲的股價再次贏得人們的眼球。
去年在美國傳統購物節「黑色星期五」前夕,紐約時報發表了一篇文章,標題是:Chasing Amazon, Retailers Are in a Never-Ending Arms Race.面對亞馬遜的壓倒性優勢,老牌連鎖店奮起直追,卻似乎很難扭轉局面。
正當他們看起來陷入困境時,亞馬遜卻再次提高了門檻,不僅組建自己的飛機快遞隊伍,加上亞馬遜自身的雲計算業務AWS和人工智慧技術的應用,傳統行業更是壓力倍增,似乎,傳統行業與亞馬遜的競爭從來都不是公平的競爭。
但換個角度,亞馬遜其實在革新傳統行業,不斷激發行業通過智能技術實現現代化改造,加速人工智慧和機器學習技術在世界不同地區、不同領域、不同行業的創新應用。
在中國,亞馬遜並沒有對美國經驗進行簡單復制,而是著眼本地化不斷創新實踐,不僅使中國跨境電商行業實現躍升,還基於本地需求的創新構築全球創新的基石。
在亞馬遜中國舉行的「2020亞馬遜創新日「上,亞馬遜中國副總裁李岩川總結出「中國公式」的內涵:技術創新本土化、客戶體驗定製化、商業模式輕量化。
技術打底 一切皆智能
從成立至今,亞馬遜從電商平台發展到電子書Kindle、雲計算AWS、Prime Air無人機、智能語音助手Alexa、無人超市Amazon Go等。截至2019年,亞馬遜全球擁有逾120,000項技術專利。亞馬遜不斷打破邊界,成為一個特立獨行的存在。
遠的不說,兩年前無人商店Amazon Go正式對公眾開放,截止到2020年3月31日,亞馬遜在美國已開設25家Amazon Go商店,通過Just Walk Out技術能自動監測商品從貨架上取下或放回,並在虛擬購物車中進行追蹤。在消費者完成購物時,直接離開商店即可。隨後,亞馬遜將通過亞馬遜帳號與用戶結賬,並提供發票。Amazon Go使用的是與無人駕駛 汽車 同樣類型的技術:計算機視覺、感測器和深度學習。
在智能設備領域,亞馬遜Echo Dot利用人機對話讓亞馬遜塑造出了未來的生活場景。這款智能設備可以稱作為「家中星際迷航計算機」, Echo Dot找對了產品的消費環境,保證了語音交互的純粹性和繼續性,看似只是一款玩具,但通過Alexa語音助手和用戶交流,成為智能家居的必備小能手。
現在,每個月已經有數千萬用戶在應用Alexa智能語音助手,每周用戶與Alexa互動次數達到數十億次數量級,除此之外Alexa在全球包括中國有數十萬的合作夥伴。Alexa現在可以提供超過10萬項應用,覆蓋智能家居、 汽車 、移動設備、音樂、語音購物、打車軟體等等。
從技術上來說,人工智慧和大數據、深度學習等創新技術不斷支撐Echo的升級。語音識別和自然語言理解是在計算機科學中的最具挑戰的難題之一,需要復雜的深度學習演算法和大量的數據及基礎設施來進行訓練。
在物流領域,亞馬遜最早在全球開啟了智能物流的變革,最具顛覆性舉措包括智能倉儲和智能配送。比如通過在香港的跨境前置倉實現最優化的配送,通過大數據分析,挑選重復購買率高的商品,提前將貨物存儲在跨境前置倉,在交付過程中省去了國際物流中轉的環節。
這些創新實例背後體現了亞馬遜的技術力量,尤其是亞馬遜雲服務(AWS)在大數據、人工智慧、深度學習上的創新和實踐。
目前AWS擁有遍及全球24 個地理區域的77個可用區的基礎設施覆蓋。從基礎設施的投入開始,AWS持續在產品和技術上的研究和落地近乎極致,提供了超過175項全功能的服務,涵蓋計算、存儲、資料庫、聯網、分析、機器人、機器學習與人工智慧、物聯網、移動、安全、混合雲、虛擬現實與增強現實、媒體,以及應用開發、部署與管理等方面。
圍繞軟體應用將硬體不斷優化以創造用戶價值,不僅為亞馬遜的一系列革命性創新提供了技術支撐,更在以雲服務為載體,圍繞用戶應用打磨產品技術,最終實現體量大還跑得快。
更快更智能 一切客戶驅動
在創新的最前沿,亞馬遜堅持卓越運營和長遠思考,不僅保持對前沿技術和趨勢的 探索 和落地應用,更關心最終用戶的體驗,以用戶需求為導向進行技術研發。因為,在亞馬遜,研發目的並不是僅僅局限於技術本身,而是致力於打造最優質的用戶體驗。
比如去年的「黑五」大促,因為時差關系,中國消費者可以在前一天的夜裡11點開始同步搶購日本促銷商品的庫存,緊接著是第二天早晨英國8點的促銷,隨之而來的是德國9點的促銷,而美國開始促銷時已經是第二天中國的下午3點了。也就是說,當外國消費者還在睡夢中的時候,中國消費者可以「先人一步」搶購爆款。
對接四大海外站點的商品和優惠,需要跨國界、跨時區、跨品牌的全球促銷同步技術的支撐。讓中國消費者享受到更豐富的折扣商品和促銷優惠,以及時間超長的跨境購物狂歡節,其背後就是亞馬遜業界領先的全球促銷同步技術,也是亞馬遜中國本土化技術創新的典範。
據亞馬遜海外購中國技術負責人王毅介紹,亞馬遜將人工智慧、機器學習、神經網路等先進的大數據統計與分析方法,落地於亞馬遜網站中頁面自動生成布局、後台日常運營、商品個性化推薦、尺碼智能推薦、信息精準推送等大量智能化應用場景。
在電商領域,「千人千面」比較常見,目前業內實現個性化推薦的手段普遍為運營人員為商品或者消費者打標簽的模式,這種模式有太多的人工干預因素,亞馬遜通過技術手段,圍繞用戶行為、商品特徵兩個向量進行計算,包括對用戶瀏覽 歷史 、用戶搜索習慣、用戶購買 歷史 、商品顏色與尺碼等各個維度的綜合分析,向客戶推出個性化內容。進而智能化打造真正的「千人千面」客戶體驗。
針對頁面布局,亞馬遜藉助大數據體系,根據當前客戶特徵以及業務數據,從頻道池中自動選取頻道;在精準推薦商品方面,亞馬遜中國搭建了自身特有的信息流、瀑布流推薦,受最前沿計算機視覺技術的啟發,亞馬遜使用深度卷積神經網路,准確的量化商品視覺相似度,從而有效的感知客戶對服裝類商品的偏好,並精準推薦商品;而在推薦促銷信息方面,亞馬遜「瀑布流」會根據消費者興趣推薦不同類型的鎮店之寶,秒殺等折扣信息及購物主題,並同時增加推薦內容的多樣性,打造更豐富的線上購物體驗。
在後台運營方面,亞馬遜利用強大的後台系統,構建了自動化運營體系,通過用戶、商品和運營等方面的數據、模型分析,實現自動化、智能化的頁面生成。
今年,亞馬遜中國運營流程自動化項目(Merchandising Process Automation),結合機器人流程自動化技術(RoboticProcess Automation),使用智能表單(Smart Forms)及自動化腳本(Auto Script)等實現方式,使亞馬遜中國海外購系統運營環節中涉及到的人工操作流程演進為標准化及自動化處理,預計每年可節省1800個工時,平均節省15%的運營工作時間。
可以說,亞馬遜利用全球資源,將創新技術應用於中國市場並進行推廣,同時亞馬遜中國技術研發成果會反向應用於全球跨境網購領域。比如「智能尺碼助手」就是由中國團隊研發,並快速迭代,進而對亞馬遜全球的尺碼推薦功能起到了引領和推動的作用。
輕量運營 讓需求快速變為服務
基於全球運營網路,亞馬遜中國海外購已形成獨有的輕量化運營模式,為亞馬遜其他國家提供了非常有益的借鑒,引領著全球跨境電商行業的快速發展。
具體來講,輕量運營體現在兩個層面:
別人有的,亞馬遜會做的更好,別人沒有的,客戶想要的,亞馬遜都有能力進行創新並落地。疫情之下,當全球運轉按下暫停鍵,跨境電商已經成為推動經濟復甦的重要抓手之一,同時人工智慧創新技術推動全世界邁向數字化革命的新高峰時。正如李岩川所說:「互聯網技術和客戶需求不斷發生著變化,但唯一不變的是亞馬遜創新的腳步「。
2. aws(亞馬遜WEB服務)詳細資料大全
AWS即Amazon Web Services,是亞馬遜(Amazon)公司的雲計算IaaS和PaaS平台服務。AWS面向用戶提供包括彈性計算、存儲、資料庫、應用程式在內的一整套雲計算服務,能夠幫助企業降低IT投入成本和維護成本。
AWS提供了一整套基礎設施和應用程式服務,使幾乎能夠在雲中運行一切應用程式:從企業應用程式和大數據項目,到社交遊戲和移動應用程式。
基本介紹 中文名 :aws 外文名 :Amazon Web Services 程式類別 :應用程式 項目基礎 :大數據項目 官網 ::aws.amazon// 服務介紹,分類,競爭對手,存儲辭匯表, 服務介紹 很多公司選擇AWS作為其IT解決方案,AWS有很多雲服務,以下介紹AWS中幾類比較重要的服務。 分類 計算類: EC2(Elastic Compute Cloud) 是一種彈性雲計算服務,可為用戶提供彈性可變的計算容量,通常用戶可以創建和管理多個虛擬機,在虛擬機上部署自己的業務,虛擬機的計算能力(CPU、記憶體等)可以根據業務需求隨時調整。 Elastic IP Addresses(彈性IP位址) – 彈性IP位址是為動態雲計算設計的靜態IP位址。一個彈性IP位址是和你的賬戶相關,而不是和你的一個特定實例相關。不像傳統的靜態IP位址,彈性IP位址可以通過重新匹配你的共有IP位址到你賬戶任意的實例,從而讓你可以忽略實例或者可用區域的錯誤。 連線本質上是通過NAT1:1的匹配每個Elastic IP和Private IP。 Elastic MapRece :EMR採用運行在亞馬遜EC2和S3的託管Hadoop框架上。以立即獲得滿足需要的計算能力,例如網頁索引、數據挖掘等數據密集型任務,輕松、經濟地處理海量數據,不用擔心對Hadoop集群耗時的設定、管理或調優。 AS(Auto Scaling)自動伸縮服務 :允許用戶根據需要控制亞馬遜EC2自動擴大或減小計算能力。用戶利用AS可以無縫地增加EC2的實例數量,以保證使用高峰期的性能,也可以在需求停滯時自動減少以降低成本。AS特別適合那些需求按小時、天或周規律變化的應用程式。 AS由亞馬遜CloudWatch控制,並且用戶不必支付CloudWatch以外的其他服務費用。 ELB (Elastic Load Balancing)彈性負載平衡 :自動將入口流量分配到多個亞馬遜EC2實例上。彈性負載平衡在實例池中不斷檢測不正常的實例,並自動引導路由流量到正常的實例上,直到不正常的實例恢復正常。客戶可以在單一的數據中心進行負載平衡,更可以在跨中心的套用上獲得相同的功能。 兼容IPv6,數據來自於CloudWatch 部署&管理類:
3. 亞馬遜雲科技推雲數智一體服務,這是個什麼樣的服務
亞馬遜雲科技在北京舉辦大數據與人工智慧技術新聞媒體溝通交流會,公布發布「雲、數、智三位一體」的大數據與機器學習結合服務項目組成。亞馬遜雲科技還聯合樂我無盡(Joyme)、上海欣兆陽(Convertlab)等合作方共享了亞馬遜雲科技在推動公司數智結合領域的有關實例。
上海欣兆陽根據亞馬遜雲科技的統一的數據基本基座,上海欣兆陽構建了一體化數據智能湖倉架構DataHub和一體化高效率機器學習服務平台AIHub。這兩項運用能將數據運轉的及時性提高了32%,實體模型發布高效率提高了30%。
亞馬遜雲科技依據自己的操作及其對製造行業的觀查,打造了一套「雲、數、智三位一體」服務項目組成,為用戶提供結合人工智慧技術和大數據的解決方法。
不僅人工智慧技術、大數據技術性在顛覆式創新公司企業戰略轉型,更高效率發展趨勢,也有如物聯網技術、數字孿生這些智能化科技一起推動公司更快發展趨勢。
4. 如何用亞馬遜彈性MapRece分析大數據
首先,打開Amazon Elastic MapRece控制台。然後點擊 Create Cluster ,在五個步驟中完成配置設置。
第一步,配置一個集群
在 Cluster name 欄位中,輸入一個描述性的名稱。它可以是非唯一的。
在Termination protection 欄位中,其默認值為Yes。這一設置可確保集群不會因為意外或錯誤而關閉。
在Logging 欄位中,其默認值為Enabled。日誌數據將被發送至亞馬遜S3。
在Log folder S3 location 欄位中,請以如下格式輸入存儲桶名稱和文件夾信息:s3://<bucket name>/<folder>/。
在Debugging 欄位中,其默認值為Enabled。
Tag 部分是可選的。你可以為你的EMR集群添加最多10個標簽。在一個標簽中,包括了一個區分大小寫的鍵值對。
第二步,設置軟體配置
在Hadoop distribution 多選框中,選擇Amazon 為默認值。
在 AMI version 多選框中,選擇 2.4.2 (Hadoop 1.0.3)
在Application to be installed 多選框中,保留選中Hive 和 deletePig。
第三步,設置硬體配置
在 Network 欄位中,選擇Launch into EC-2 Classic。
在EC2 Subnet 欄位中,選擇 No preference。
在Master、Core 以及 Task 欄位中,默認EC2實例類型為m1.small。對於低工作負載的應用,你可以為所有節點選擇使用小實例(可確保降低你的使用成本)。相應地,Count
的默認值分別為1、 2、 0。同時,對於所有三個欄位,確保不選中 Request Spot Instances 。
注意:20是每個AWS帳戶的最大節點數。如果你運行了2個集群,那麼2個集群運行的節點總數必須為20或以下。如果你確實需要節點數超過20,那麼你必須提交一個請求以便於提高你的亞馬遜EC2實例上限。
第四步,設置安全和訪問配置
在EC2 key pair 欄位中,從列表中選擇一個亞馬遜EC2密鑰對。這一設置可以讓你使用Secure Shell(SSH)來連接主節點。
在IAM user access 欄位中,其默認值為 No other IAM users。
在EC2 role 多選框中,其默認值為 no roles found。
在Bootstrap Actions 部分,你可以不做任何操作。
第五步,指定集群參數
在Steps 部分,從列表中選擇Hive Program,並點擊 Configure and add。
在Name 欄位中,其默認值為Hive Program。
在 Script s3 Location 欄位中(必選項),以BucketName/path/ScriptName的格式輸入相關信息,例如
s3n://elasticmaprece/samples/hive-ads/libs/model-build。
在 Input s3 Location 欄位中(可選項),以BucketName/path的格式輸入相關信息,例如
s3n://elasticmaprece/samples/hive-ads/tables。該輸入值會作為名為INPUT的參數發送給Hive腳
本程序。
Output S3 Location 欄位(可選項),以BucketName/path的格式輸入相關信息,例如
s3n://myawsbucket/hive-ads/output/2014-4-14。該輸入值會作為名為OUTPUT的參數發送給Hive腳本程
序。
在 Arguments 欄位,輸入相關信息,如 - d LIBS=s3n://elasticrecemap/samples/hive-ads/libs。HIVE腳本程序需要額外的庫。
在 Action on Failure 欄位中,選擇 Continue。如果當前步驟失敗,它將繼續至下一個步驟。
當你完成後,點擊Add,然後點擊Create Cluster。你將會看到Summary 信息。
如上例,在你繼續查詢操作和分析大數據前,你需要在主節點上准備一個HIVE會話。
你將需要每隔五分鍾向亞馬遜S3推送 Impression 和 Click Log Files。每次添加一個條目,就會向客戶顯示一條廣告。每次添加一個Click
Log Files的條目,客戶一條廣告。類似於SQL的查詢操作簡化了關聯客戶點擊數據和特定廣告的過程。
總之,分析大數據的最佳方法就是在Hadoop上運行Hive,並使用SQL查詢以簡化日誌數據分析。
5. 亞馬遜雲科技容器可以應用在哪些方面
大概有三個方面,一個是在混合環境中部署,在混合環境中管理Kubernetes集群和應用程序,並在數據中心運行Kubernetes。另一個是機器學習(ML)建模工作流,可以使用由GPU提供支持的最新Amazon Elastic Compute Cloud(EC2)實例高效地運行分布式訓練作業。還有一個是大數據,Amazon EMR與EKS集成,因此,可以直接在Kubernetes上運行Apache Spark、Hadoop和其他大數據應用程序。這可以自動預置和管理資源,以便進行數據處理、分析和機器學習。
6. 什麼是「大數據」的真正含義
如果你說大數據就是數據大,或者侃侃而談4個V,也許很有深度的談到BI或預測的價值,又或者拿Google和Amazon舉例,技術流可能會聊起Hadoop和Cloud puting,不管對錯,只是無法勾勒對大數據的整體認識,不說是片面,但至少有些管窺蠡測、隔衣瘙癢了。
也許,「解構」是最好的方法。
怎樣結構大數據?
首先,大數據就是互聯網發展到現今階段的一種表象或特徵而已,沒有必要神話它或對它保持敬畏之心,在以雲計算為代表的技術創新大幕的襯托下,這些原本很難收集和使用的數據開始容易被利用起來了,通過各行各業的不斷創新,大數據會逐步為人類創造更多的價值。
其次,想要系統的認知大數據,必須要全面而細致的分解它,我們著手從三個層面來展開:
第一層面是理論,理論是認知的必經途徑,也是被廣泛認同和傳播的基線。
我會從大數據的特徵定義理解行業對大數據的整體描繪和定性;從對大數據價值的探討來深入解析大數據的珍貴所在;從對大數據的現在和未來去洞悉大數據的發展趨勢;從大數據隱私這個特別而重要的視角審視人和數據之間的長久博弈。
第二層面是技術,技術是大數據價值體現的手段和前進的基石。
我將分別從雲計算、分布式處理技術、存儲技術和感知技術的發展來說明大數據從採集、處理、存儲到形成結果的整個過程。
第三層面是實踐,實踐是大數據的最終價值體現。
我將分別從互聯網的大數據, *** 的大數據,企業的大數據和個人的大數據四個方面來描繪大數據已經展現的美好景象及即將實現的藍圖。
和大數據相關的理論?
1、 特徵定義
最早提出大數據時代到來的是麥肯錫:「數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。
人們對於海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈餘浪潮的到來。」
業界(IBM 最早定義)將大數據的特徵歸納為4個「V」(量Volume,多樣Variety,價值Value,速Velocity),或者說特點有四個層面:第一,數據體量巨大。
大數據的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T);第二,數據類型繁多。
比如,網路日誌、視頻、圖片、地理位置信息等等。
第三,價值密度低,商業價值高。
第四,處理速度快。
最後這一點也是和傳統的數據挖掘技術有著本質的不同。
古語雲:三分技術,七分數據,得數據者得天下。
先不論誰說的,但是這句話的正確性已經不用去論證了。
維克托·邁爾-舍恩伯格在《大數據時代》一書中舉了百般例證,都是為了說明一個道理:在大數據時代已經到來的時候要用大數據思維去發掘大數據的潛在價值。
書中,作者提及最多的是Google如何利用人們的搜索記錄挖掘數據二次利用價值,比如預測某地流感爆發的趨勢;Amazon如何利用用戶的購買和瀏覽歷史數據進行有針對性的書籍購買推薦,以此有效提升銷售量;Farecast如何利用過去十年所有的航線機票價格打折數據,來預測用戶購買機票的時機是否合適。
那麼,什麼是大數據思維?維克托·邁爾-舍恩伯格認為,1-需要全部數據樣本而不是抽樣;2-關注效率而不是精確度;3-關注相關性而不是因果關系。
阿里巴巴的王堅對於大數據也有一些獨特的見解,比如,
「今天的數據不是大,真正有意思的是數據變得在線了,這個恰恰是互聯網的特點。」
「非互聯網時期的產品,功能一定是它的價值,今天互聯網的產品,數據一定是它的價值。」
「你千萬不要想著拿數據去改進一個業務,這不是大數據。
你一定是去做了一件以前做不了的事情。」
特別是最後一點,我是非常認同的,大數據的真正價值在於創造,在於填補無數個還未實現過的空白。
7. 亞馬遜的AWS大數據課程介紹
亞馬遜的Big Data on AWS 介紹基於雲的大數據解決方案及 Amazon Elastic MapRece (EMR) 與 AWS 大數據平台 。
8. 亞馬遜大數據存在哪些問題
亞馬遜大數據存在產品損壞,產品質量問題,退貨。亞馬遜通過多種工具在雲端擴展其大數據應用,如數據儲存、數據收集、數據處理、數據分享和數據合作。
9. 亞馬遜是如何成為世界級大數據企業的
亞馬遜擁有強大的基礎設施,才能成為世界級大數據企業的。
亞馬遜公司,外文名是Amazon。成立時間是1994年7月5日,總部地點是西雅圖,經營范圍有書籍、電子產品、家居產品等,年營業額是2805.22 億美元(2020年) ,員工一共有647500人(2019年),CEO是安迪·賈西。它是是美國最大的一家網路電子商務公司,也是網路上最早開始經營電子商務的公司之一。在2021年7月,傑夫·貝索斯正式卸任亞馬遜首席執行官,由安迪·賈西繼任。
10. 亞馬遜雲科技的雲存儲,最應該知道的有這三點
傳統存儲在以各種方式對接公有雲生態,公有雲的雲上服務類型也在不斷完善,作為企業信息化負責人要做的是更多地了解公有雲,然後,考慮如何充分利用公有雲的優勢。
本文通過介紹亞馬遜雲 科技 存儲服務的三個關鍵點,帶您認識雲存儲的現狀。
正文:
乘著互聯網產業的春風,雲存儲在過去近二十年走過了可遇不可求的發展歷程。也讓從90年代開始,就一直坐著冷板凳,負責數據歸檔的對象存儲,一躍成為整個互聯網數據的基石。
如今,絕大部分互聯網上可訪問的數據都靠對象存儲來存,偶爾曝出的數據泄露事件也大多都跟對象存儲有關,當然,問題不在於對象存儲本身。
從2006年,亞馬遜雲 科技 的對象存儲服務Amazon S3發布,到現在,算起來也有十六年的時間了,這也是亞馬遜雲 科技 推出的第一款雲服務。
從市場表現來看,Amazon S3是非常成功的,前兩年有人推測說,亞馬遜雲 科技 在存儲方面的營收規模非常大,甚至被稱作是全球最大的存儲公司,Amazon S3無疑是功勞最大的一個。
有人說,許多亞馬遜雲 科技 用戶使用的第一個產品就是Amazon S3對象存儲,在所有亞馬遜雲 科技 的用戶案例,在所有技術文檔里,Amazon S3的出鏡率都非常高。
雲上原生存儲Amazon S3的主線任務:不斷降低成本
如果亞馬遜雲 科技 的用戶沒用過Amazon S3,就好比去包子鋪吃飯沒點包子,光顧燒烤店沒吃烤串一樣,令人費解。
Amazon S3的易用性高、可用性高,開發者很喜歡,Amazon S3幾乎不丟數據的可靠性,穩定性也很高,運維管理人員很喜歡,Amazon S3在互聯網應用場景被普遍應用。
如今,Amazon S3上存著超過100萬億個對象,每秒需要處理上千百萬次請求。
Amazon S3一開始解決了可靠性和可用性以及安全方面的基本問題,性能也一直在提升,多年看下來,最大的工作重點就是不斷降低成本。
亞馬遜雲 科技 大中華區產品部總經理 陳曉建介紹稱,同樣存儲一份數據,如果2006年需要100塊錢,而在2022年就只需要大概15塊錢,16年間,Amazon S3的存儲成本降低了大約7倍。
2021年12月,亞馬遜雲 科技 宣布在全球九大區域,將Amazon S3 Standard In Frequent Access和Amazon S3 One Zone In Frequent Access的價格降低了31%。
Amazon S3存儲分了八個層級。
對於需要經常訪問的數據,首選標准版的Amazon S3,它具有毫秒級的訪問表現,而不太經常訪問的數據就選Amazon S3 Standard-IA上,相較於前者能節省大概40%的費用。
而對於那些很少訪問的數據,則可以選擇放在Amazon S3 Glacier DeepArcihve上,它的成本非常低,大約1美刀1個TB,但代價是,想把數據拿回來就得多等等,大概需要12到48個小時。
有人覺得這等的時間也太長了,於是,亞馬遜雲 科技 又推出了Amazon S3 Glacier Flexible Retrieval,只需要等上幾分鍾到幾小時。
就沒有一種,既可以便宜,訪問性能又高的存儲嗎?還真有。
這就是Amazon S3 Glacier Instant Retrieval,它是最新的一個存儲層級,拿回數據的速度是毫秒級的,成本與Amazon S3 Glacier相當,適合每季度才訪問一次、又需要毫秒級取回的海量數據。
另外,Amazon S3 One Zone-IA的成本也很低,顧名思義,數據只存在單個可用區上,而其他S3存儲的數據都在多個可用區上存著好幾分,相比之下,理論上丟數據的風險高了些。
最後,出於合規的要求,用戶有些數據不能上雲,亞馬遜雲 科技 可以提供Amazon Outposts,把雲的硬體放到了用戶的數據中心裡。使用Amazon S3 on Outposts,就像在雲上使用S3一樣。
總的來說,Amazon S3的存儲層級還是挺多的,但問題是,這給選型和管理也帶來了負擔。
為此,亞馬遜雲 科技 推出了Amazon S3 Intelligent-Tiering(智能分層),它會根據對象被訪問的次數在多個存儲層級間進行自動化遷移。
如果不能確定要選什麼或者存儲需求會變,那就選它,它不僅能解除選擇困難症,還能避免用戶自行管理數據分層的麻煩。
一家在東南亞和北美市場非常有影響力的互聯網公司,在亞馬遜雲 科技 上存放了大約幾十PB的數據,原本主要使用的是Amazon S3 Standard—IA,在使用Amazon S3智能分層後,沒有進行任何額外操作,就將存儲成本降低了62%。
亞馬遜雲 科技 最早在2018年就推出了Amazon S3智能分層功能,如今,Amazon S3智能分層已經涵蓋了Amazon S3家族的幾乎所有存儲類別,最多可節省68%的成本。
不僅如此,如今數據分層還拓展到文件存儲Amazon EFS,Amazon EFS提供四種文件存儲等級,數據分層能節省高達72%的存儲成本。
打通雲應用與傳統應用的隔閡:靠多種文件存儲
如果說,對象存儲是雲存儲的標配的話,那文件存儲就是雲存儲連接本地存儲的橋梁。
如今常見的應用分為兩類。
一類是雲原生的現代化應用,也就是在雲上開發的、充分利用雲架構優勢的應用,比如電商、 游戲 、社交媒體等平台。對應需要的存儲,大部分是對象存儲Amazon S3來滿足,少部分需要文件存儲Amazon EFS。
另一類是傳統企業應用,它誕生在公有雲之前,常見的有高性能計算、EDA、視頻渲染等場景,通常由本地的文件存儲系統,比如NAS來支撐的,為提升安全性和可靠性,通常都帶有快照、鏡像、遠程復制等功能特性。
這類工作負載並沒有根據雲架構的特點來設計,如果強行上雲,不僅需要調整應用本身,而且還可能出現兼容性的問題,為了避免此類問題,亞馬遜雲 科技 推出了FSx文件存儲家族。
從2018年開始,陸續推出了面向Windows環境的Amazon FSx for Windows,面向高性能計算場景的Amazon FSx for Lustre,面向大數據分析場景推出了Amazon FSx for OpenZFS。
金風慧能採用了亞馬遜雲 科技 構建HPC高性能計算系統,其中使用了Amazon FSx for Lustre共享存儲系統,不僅使氣象預測系統性能提升了10%,氣象計算時間縮短了1/3,還將成本降低了70%,運維復雜度也大大降低。
此外,還與知名存儲廠商NetApp合作推出了Amazon FSx for NetApp ONTAP,把NetApp的經典NAS文件存儲系統NetApp ONTAP放到了公有雲上。
NetApp在2015年就提出了Data Fabric的概念,大意就是想要實現數據在雲上和雲下的自由流動,是比較早積極擁抱混合雲的存儲廠商之一。
與一些存儲廠商的雲上託管服務不同,Amazon FSx for NetApp ONTAP沒有刪減任何功能,它是雲上唯一完整且全託管的NetApp ONTAP文件存儲系統,能夠無縫地跟企業本地的ONTAP系統對接,所以,用戶的IT系統不需要做任何改動,就能使用雲上服務。
2019年,NetApp與聯想成立合資公司——聯想凌拓,聯想凌拓在中國區提供相關服務,聯想凌拓產品管理與營銷高級總監林佑聲表示,從發布到現在,Amazon FSx for NetApp ONTAP得到了非常多客戶的認可,包括金融、醫療、石油以及高 科技 行業客戶。
嘉里物流原本是本地存儲NetApp ONTAP的用戶,隨著業務全球化發展,在數據擴容以及數據共享方面碰到的問題越來越多,通過使用亞馬遜雲 科技 提供的Amazon FSx for NetApp ONTAP,將數據從本地遷到雲上,解決了這些問題。
上雲之後,不僅可以使用原來NetApp ONTAP自帶的快照和備份等功能,同時,還可以使用亞馬遜雲 科技 遍布全球的數據中心,實現跨區域的災備。
補足數據保護方面的短板:Amazon Backup
一直以來,雲存儲被詬病的點還在於缺少數據災備功能,在如何維持業務連續性方面有一些爭議,而亞馬遜雲 科技 正在試著消除這一顧慮,這就是Amazon Backup。
由於缺少與業務價值的強關聯性,數據保護經常容易被忽視,同時,由於數據保護系統本身很復雜,合規的要求還特別多,實踐起來也特別麻煩,所以,數據保護的實踐相對落後。
可能也是基於這樣的考慮,亞馬遜雲 科技 的數據保護服務Amazon Backup才特別喜歡強調「一站式」「操作簡單」的特點,讓用戶知道,數據保護也沒有那麼麻煩。
於是我們看到,Amazon Backup能覆蓋旗下的幾乎所有存儲產品,包括塊存儲(Amazon EBS)、對象存儲、文件存儲、資料庫,以及計算和存儲網關等相關產品。
Amazon Backup的操作比較簡單,通過圖形的界面即可完成大部分操作,用戶還可以通過預設的策略進行自動化的備份,降低手動備份帶來的問題。
安全合規的問題讓許多用戶頭疼,Amazon Backup深度集成了亞馬遜雲 科技 自帶的KMS數據加密服務,整個備份操作許可權、數據訪問許可權都可以用IAM進行細顆粒度監控,滿足個人信息安全規范、信息安全等級保護等方面的合規要求。
Amazon Backup避免讓數據保護帶來太多的成本負擔,因此也用上了智能分層技術,用戶通過冷熱分層策略可以有效降低約75%的成本。
澳大利亞石油天然氣的供應商Santos要對Amazon EBS塊存儲做備份,原本都是用手動備份的方案,但隨著業務量的發展,備份的出錯率越來越高,成功率越來越低。
而在用了Amazon Backup後,平均備份任務用時和運營成本均有大幅降低,備份成功率到了100%,而且還完全做到企業數據合規。
結束語
確實如陳曉建所言,亞馬遜雲 科技 存儲服務已經成為IT行業的「水」和「電」,讓各行各業的業務都能從存儲服務中獲得價值。
亞馬遜雲 科技 的存儲服務類型和存儲的相關實踐都非常有代表性,而且,很多做法已經成了上雲的參考實踐,企業用戶應該多少了解亞馬遜雲 科技 的雲存儲,特別是有上雲打算的企業。
當然,上雲帶來的便捷和靈活,穩定性和安全性,以及對運維的解放都很吸引人。
還有顧慮?據我個人了解,亞馬遜雲 科技 非常在意企業在雲上的成功和成本節省,不僅會幫企業不斷優化。除此之外,市場上有一些專門的服務,幫助企業做規劃實施,讓你充分利用雲的優勢。