⑴ 浜戣$畻婕旇茬
銆銆2015騫10鏈7鏃ワ紝鏈騫村害鐨勪簹椹閫夾WS re:Invent 2015澶т細鍦ㄧ編鍥芥媺鏂緇村姞鏂鍙寮銆傛潵鑷鍏ㄧ悆鐨1涓9鍗冧漢鍜屽悇鍥芥妧鏈濯掍綋鍙傚姞浜嗘湰嬈″ぇ浼氾紝灝嗘湁270涓鍐呭瑰垎浜錛屽叾涓涓夊垎涔嬩竴鐨勮棰樼敱AWS鐨勫悎浣滀紮浼存壙鍔炪傝窡鍘誨勾涓鏍 涓婚樻紨璁茬敱AWS楂樼駭鍓鎬昏丄ndy Jassy涓昏詫紝涓涓鍗婂皬鏃剁殑鍐呭瑰己璋冩渶澶氱殑鏄錛孉WS鎬庢牱甯鍔╁㈡埛鏇村姞涓嶅彈鏉熺細鍦頒嬌鐢ㄤ簯璁$畻鏈嶅姟銆
銆銆鏉ヨ嚜Gartner鐨勬姤鍛婃樉紺猴紝AWS鐜板湪鏈変竴鐧懼氫竾媧昏穬鐢ㄦ埛錛屽湪榪囧幓鐨勫嚑騫撮噷錛孍C2鐢ㄦ埛姣忓勾澧炲箙涓95%錛孲3鐨勭敤鎴鋒瘡騫村炲姞120%錛屾ゅ栵紝鍏舵暟鎹搴撲嬌鐢ㄥ炲箙涓127%銆傝嚜棣栨″叕寮2014騫碅WS涓氬姟璐㈡姤浠ユ潵錛孉ndy Jassy鍦ㄦ紨璁蹭腑閫忛湶AWS鐨勮勬ā淇濇寔浜80%鐨勫勾澧為暱錛屽凡杈73浜跨編鍏冦
銆銆寮規ц祫婧愭樉鐒舵槸鍚勮屽悇涓氶兘鍦ㄤ嬌鐢ㄤ簯璁$畻鐨勯噸瑕佸師鍥狅紝浣嗗湪Andy Jassy鐪嬫潵榪樻湁涓涓鏇翠負閲嶈佺殑鍥犵礌鈥斺旈偅灝辨槸鈥滆嚜鐢扁濄備負浜嗗疄鐜拌繖縐嶁滆嚜鐢扁濓紝鍦ㄨ繃鍘葷殑涓夊勾閲岋紝AWS鏍規嵁鎴愬崈涓婁竾瀹㈡埛鐨勪笉鍚岄渶奼傚圭郴緇熻繘琛屼簡閲嶅戱紝 澶ч噺鐨処SV鍏鍙搞佷笂鍗冧釜緋葷粺闆嗘垚鍟嗕互鍙婃洿澶氱殑鍒涗笟鍏鍙稿湪AWS涓婂緱浠ラ珮閫熷彂灞曘傚叿浣撴潵璇達紝榪欎釜搴炲ぇ鐨勭敓鎬佺郴緇熸湁浠ヤ笅鍑犱釜鐗圭偣銆
銆銆浣跨敤IT鍩虹璁炬柦鐨勮嚜鐢憋細鏄捐屾槗瑙佺殑鏄錛岀敤鎴峰笇鏈涗簯鍘傚晢鍩虹璁炬柦鐨勬敮鎸佽兘鍔涘嶮鍒嗗己澶э紝甯屾湜鑳芥湁緇熶竴鐨勫鉤鍙版彁渚涙墍鏈夌殑鏀鎸併俁ob Alexander鈥斺旂編鍥芥渶澶х殑閾惰屼箣涓Capital One鐨 CIO鍦ㄦ湰嬈″ぇ浼欿eynote涓鐧誨彴銆傛牴鎹瓹apital One鐨勭粺璁★紝縐誨姩絝宸茬粡瓚呰繃鍏朵粬騫沖彴鎴愪負瀹㈡埛鏈闈掔潗鐨勪嬌鐢ㄦ柟寮忥紝鍥犳や粬浠闇瑕佷笉鏂浼樺寲鐢ㄦ埛浣撻獙銆侰apital One鏈韜鏈夊緢濂界殑鎶鏈璧勬簮錛屽叾
銆銆鍐呴儴鐩涜屽紑婧愭枃鍖栵紝寮鍙戣呰嚦涓婄殑鐞嗗康娣卞叆浜哄績錛屼嬌鐢ˋWS涓篊apital One鍚稿紩浜嗗緢澶氫紭縐鐨勪漢鎵嶃傚脊鎬ц祫婧愬歸噾鋙嶆満鏋勮嚦鍏抽噸瑕侊紙灝ゅ叾鏄鐢靛晢鍙戝睍甯︽潵鐨勬敮浠橀渶奼傦級錛岄櫎姝や箣澶栵紝AWS鍦ㄥ畨鍏ㄥ拰楂樺彲鐢ㄦ柟闈涔熷ぇ澶ф弧瓚充簡 Capital One鐨勯渶奼傘傗淢obile is the new wallet銆傗濇渶鍚嶳ob Alexander濡傛槸璇淬 鎸栨帢鏁版嵁鐨刞鑷鐢憋細浜戣$畻浣垮緱鏁版嵁鐨勮幏鍙栧拰鑾峰彇鏇翠負瀹規槗錛岃繎鏈烝WS鎺ㄥ嚭浜嗗緢澶氭暟鎹搴撴柟闈㈢殑鏂版湇鍔°備互鍓嶅彧鏈夋妧鏈浜哄憳鎺屾彙鏁版嵁鍒嗘瀽鐨勮兘鍔涳紝鐜板湪浠諱綍鐨勯潪鎶鏈浜哄憳錛堝備笟鍔′漢鍛橈級鍊熷姪AWS涔熻兘澶熸嫢鏈夎繖鏂歸潰鐨勮兘鍔涖傞殢鐫Andy Jassy瀹e竷鎺ㄥ嚭浜咥mozon QuickSight錛 鐜板満鎺屽0鍜屾㈠懠涓鍚屽搷璧楓侫mozonQuickSight浣垮緱鏁版嵁澶勭悊閫熷害鏋佸ぇ鎻愬崌錛屾暟鎹鍙瑙嗗寲鏁堟灉澶т負鏀硅傦紝闄ゆや箣澶栫敤鎴峰彲浠ュ熷姪鎺屼笂璁懼囩Щ鍔ㄥ寲澶勭悊鍜屽垎鏋愭暟鎹銆傜敱浜庨噰鐢ㄦ瀬綆鐨勮捐″師鐞嗭紝 瀵笰mozonQuickSight鐨勭幇鍦烘紨紺鴻╀漢鍗佸垎鎯婅躲備笉鍚岀殑鏁版嵁婧愮殑鑷鍔ㄨ瘑鍒銆佷笉鍚屾暟鎹綾誨瀷鐨勮嚜鍔ㄥ叧鑱斻佹渶浣寵櫄鎷熷寲鏂規堢殑鑷鍔ㄩ夋嫨銆佸垎鏋愬伐鍏風殑鏅鴻兘鎺ㄨ崘寮曠殑澶у 鐫佸ぇ浜嗙溂鐫涳紝瀵瑰垎鏋愮粨鏋滅殑鍏ㄦ搷浣滅郴緇熸敮鎸佸拰鍥㈤槦鍏變韓鏇存槸浠や漢縐拌禐銆傛諱箣錛屽摢閲屼笉浼氱偣鍝閲岋紝鏁版嵁鍒嗘瀽灝辨槸榪欎箞綆鍗曘 璁╂暟鎹鍦ㄤ簯闂寸┛姊鐨勮嚜鐢憋細闅忕潃鐗╄仈緗戠殑鍙戝睍錛岃秺鏉ヨ秺澶氱殑鏁版嵁姝e湪浠庡悇綾葷粓絝浜х敓錛岃繖浜涙暟鎹涔熻佷笉鏂琚浼犺緭鍒頒簯涓婏紝鎵鏈夌殑榪囩▼閮藉簲璇ユ槸鑷鍔ㄥ寲鐨勶紝褰撶劧榪欎釜榪囩▼涔熷緱鏄鍔犲瘑鐨勩傞殢鍗矨ndy Jassy瀹e竷浜嗗疄鏃舵暟鎹嫻佸伐鍏
銆銆Amozon Kinesis Firehose銆傞拡瀵瑰ぇ鏁版嵁閲忕殑鎯呭喌錛屼漢浠鍙堣ュ備綍搴斿逛笂浜戠殑闂棰樺憿錛熷彟涓涓浠や漢鎺変笅宸寸殑鏂規堝彨Amazon Snowball錛屼綘鑳芥兂璞UPS鎶婁竴涓涓淇濋櫓綆卞ぇ灝忕殑鐩掑瓙蹇閫掑埌AWS灝卞畬鎴愪簡PB綰у埆鏁版嵁涓婁簯浼犺緭鐨勯毦棰樺悧錛烝mazon Snowball涔嬮棿鍙浠ラ氳繃100G緗戠粶浜掕仈錛屽綋鐒朵篃鏀鎸佸姞瀵嗐
銆銆闃茬℃敼銆侀槻鎾炲嚮絳夊畨鍏ㄧ壒鎬с傞氳繃瀵250PB鏁版嵁浼犺緭鐨勭粨鏋滄樉紺猴紝鍏舵垚鏈闄嶄綆浜80%銆傛ゅ栵紝Amazon Snowball榪樻敮鎸佷紶緇熸暟鎹鐨勮縼縐匯傝繕絳変粈涔堬紵蹇鍒頒簹椹閫婁笅鍗曞惂銆
銆銆閫夋嫨鏁版嵁搴撶殑鑷鐢憋細浼楁墍鍛ㄧ煡錛屾暟鎹搴撶殑鎶鏈鍙橀潻闈炲父緙撴參錛屽湪鏁版嵁縐繪嶆柟闈浼犵粺鍘傚晢瀵圭敤鎴鋒湁鐫璇稿氶檺鍒訛紝鍐嶅姞涓婃暟鎹涓鑷存у拰姝g『鎬х殑瑕佹眰錛屽挨鍏舵槸涓嶅悓鏁版嵁搴撳紩鎿庝箣闂寸殑榪佺Щ鍙樺緱鍗佸垎鍥伴毦銆傚敖綆℃湁浜咥mazon Aurora榪欐牱鐨勪駭鍝侊紝浜氶┈閫婃樉鐒跺苟涓嶆弧瓚籌紝Amazon MariaDB浠婂ぉ姝e紡鎺ㄥ嚭錛孉ndy Jassy鎺ョ潃璇達紝鈥滄斁蹇冿紝錛圓mazon MariaDB錛夋垜浠浼氫竴鐩村紑鏀俱傗濇帉澹板垰鍒氳惤涓嬶紝鍙瀹炴椂鐩戞祴鏁版嵁搴撹縼縐葷姸鍐電殑AWS DataBase Migration Server鍜屽彲杞鎹涓嶅悓鏁版嵁搴撶被鍨嬬殑Amazon Schema Conversion Tools鍙堝紩璧蜂簡涓闃靛彨濂姐
銆銆閫夋嫨榪佺Щ鏂規堢殑鑷鐢憋細鐢變簬涓氬姟鐨勫樊寮傦紝姣忎釜鍏鍙稿線浜戣$畻榪佺Щ鐨勬柟妗堟槸涓嶅敖鐩稿悓鐨勶紝寰堝氬㈡埛鎯沖弬鑰冮偅浜涙垚鍔熺殑妗堜緥銆傞氱敤鐢墊皵鐨凜IO Jim Fowler鍥為【浜嗕笌AWS鍚堜綔4騫寸殑鍘嗗彶錛屼粬鍧﹁█錛孏E鐨勬暟鎹涓蹇冩槸鍒嗘暎鍜岀嫭絝嬬殑錛屽叾2000浜虹殑鎶鏈鍥㈤槦鎵寮鍙戠殑杞浠剁畻娉曞氨鏄疓E鏍稿績鐨勭珵浜夊姏錛岃繖浜 搴炲ぇ鐨勮祫浜ч兘闇瑕佸叆浜戙傚皾鍒扮敎澶寸殑GE璁″垝鎶婄幇鏈夌殑9000澶氫釜workload榪佺Щ鍒癆WS錛屽彧淇濈暀4000涓鍦ㄨ嚜宸辯殑鏁版嵁涓蹇冦傚湪鎰熸叏鈥滆蔣浠跺悶鍣涓 鐣屸濇椂Jim Fowler璇撮亾錛屼笟鍔″叆浜戜笉鍐嶆槸涓涓瀹為獙鎴栨祴璇曪紝鑰屾槸涓涓蹇呯劧鐨勮秼鍔褲傚叾浠栧傚焹媯鍝層佸己鐢熺瓑鍏鍙鎬篃璺烝WS鏈夌潃娣卞害鐨勫悎浣滐紝涓嶇℃槸縐佹湁浜戙佸叕鏈変簯榪樻槸娣峰悎浜戱紝鐢ㄦ埛閮藉彲浠ヨ嚜鐢遍夋嫨銆
銆銆浜鍙楀畨鍏ㄧ殑鑷鐢憋細鏇懼嚑浣曟椂錛屽畨鍏ㄥ拰涓氬姟鏄涓瀵瑰啢瀹訛紙騫朵笖璺榪樼獎錛夛紝鍒涗笟鍨嬪叕鍙稿挨鐢氥侫ndy Jassy緗楀垪浜咥WS閫氳繃鐨勮稿氬畨鍏ㄨよ瘉錛屾帴鐫浠栬達紝鈥滄槰澶╂垜浠鍙戝竷浜嗚嚜宸辯殑WAF闃茬伀澧欙紱姝ゅ栨垜浠榪樻湁韜浠界$悊銆佸箍鍙楁㈣繋鐨凜onfig妯℃澘銆傗濇f槸鍥犱負榪欎簺瀹夊叏浜у搧鍜屾湇鍔″嶮鍒嗗彈嬈㈣繋錛孉WS鎺ㄥ嚭浜咥WS Config Rules鍜孉mazon Inspector鏉ユ弧瓚崇敤鎴峰瑰畨鍏ㄧ殑闇奼傘傗滀粠姝や綘涓嶅繀綰犵粨涓氬姟鍙戝睍鍜屽畨鍏ㄩ棶棰樼殑騫寵銆傗滱ndy Jassy楠勫偛鍦拌淬傛f槸鏈変簡AWS鐨勬敮鎸侊紝Stripe浣滀負涓瀹朵笓娉ㄧ綉涓婃敮浠樼殑鍒涗笟鍏鍙稿湪榪囧幓4騫撮噷鍏朵笟鍔℃瘡騫撮兘鍦ㄧ炕鍊嶅為暱銆
銆銆璇磞es鐨勮嚜鐢憋細閫氬父鎯呭喌涓嬶紝涓涓鍏鍙鎬笟鍔$殑鍙戝睍浼氶亣鍒板叾鐜版湁IT璧勬簮鐨勯檺鍒訛紝閭d簺鍏呮弧鎯寵薄鍔涘拰鍒涢犲姏鐨勫壋鏂頒細鍥犳ゅき鎶樸傝繖鏄鈥滄渶澶х殑涓瀹朵綘浠庢湭鍚璇磋繃鐨勫獟浣撳叕鍙糕濓紝銆婄忓竷鏂銆嬫潅蹇楁浘鍦ㄦ姤閬撲腑濡傛槸褰㈠筸lbam鍏鍙革紝鍏舵棗涓嬫妧鏈涓氬姟鐨勪及鍊煎彲杈50浜跨編鍏冦傚熷姪AWS寮哄ぇ鐨勬敮鎸侊紝闄や簡嫻佸獟浣撴湇鍔★紝mlbam涓嶯HL鍚堜綔姝e湪璁″垝鍋氭洿澶氣滀笉鍙鎬濊鈥濈殑涓氬姟銆
銆銆褰撶劧錛岃嚜鐢變笉姝㈡槸AWS鐨勮拷奼傦紝鏇存槸騫垮ぇ浜戣$畻鐢ㄦ埛鐨勮拷奼傘傚湪琚闂閬撲腑鍥藉競鍦虹殑鎯呭喌鏃禔ndy Jassy琛ㄧず錛屽浗鍐呬簯鍘傚晢璧鋒ヨ緝鏅氾紝鍥犳や駭鍝佸拰鏈嶅姟騫朵笉鍋ュ叏錛岀敓鎬佺郴緇熻勬ā涔熻緝灝忋傚逛簬AWS鍦ㄤ腑鍥藉競鍦虹殑琛ㄧ幇錛屼粬琛ㄧず鍩烘湰絎﹀悎浜氶┈閫婄殑棰勬湡銆傛ゅ栦粬榪 鎸囧嚭錛屼腑鍥芥斂搴滃瑰備綍鐩戠′簯璁$畻灝氭棤鏄庣『鐨勬満鍒訛紝榪欎篃涓瀹氱▼搴︿笂褰卞搷浜嗗浗澶栦簯鍘傚晢鍦ㄤ腑鍥藉競鍦虹殑榪愯惀銆
⑵ 大數據三分鍾演講稿範文
大數據三分鍾演講稿範文(一)
大數據,或稱巨量數據、海量數據、大資料,指的是所涉及的數據量規模巨大到無法通過人工,在合理時間內達到截取、管理、「大數據」在互聯網行業指的是這樣一種現象:互聯網公司在日常運營中生成、累積的用戶網路行為數據。這些數據的規模是如此龐大,以至於不能用G或T來衡量。
Facebook
中國的大數據
大數據的特點:
具體來說,大灶野數據具有4個基本特徵:
一是數據體量巨大。網路資料表明,其新首頁導航每天需要提供的數據超過
1、5PB(1PB=1024TB),這些數據如果列印出來將超過5千億張A4紙。有資料證實,到目前為止,人類生產的所有印刷材料的數據量僅為200PB。
演繹歷史僅需133天
二是數據類型多樣。現在的數據類型不僅是文本形式,
更多的是圖片、視頻、音頻、地理位置信息等多類型的數據,個性化數據占絕對多數。
三是處理速度快。
數據處理遵循「1秒定律」,可從各種類型的數據中快速獲得高價值的信息。四是價值密度低。以視頻為例,一小時的視頻,在不間斷的監控過程中,可能有用的數據僅僅只有一兩秒。
有用數據僅為3600分之一面臨大數據時代的到來,你准備好了嗎?
大數據時代到來
最早提出「大數據」時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:「數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對於海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈餘浪潮的到來。」
進入20XX年,大數據(bigdata)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,並命名與之相關的技術發展與創新。它已經上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮的新聞,現身在國內一些互聯網主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。
2、數據正在迅速膨脹並變大,它決定著企業的未來發展,雖然很多企業可能並沒有意識到數據爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數據對企業的重要性。正如《紐約時報》20XX年2月的一篇專欄中所稱,「大數據」時代已經降臨,在商業、經濟及其他領域中,決策將日益基於數據和分析而作出,而並非基於經驗和直覺。哈佛大學社會學教授加里·金說:「這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。」
大數據應用案例:
1、醫療行業
在加拿大多倫多的一家醫院,針對早產嬰兒,每秒鍾有超過3000次的數據讀取。通過這些數據分析,醫院能夠提前知道哪些早產兒出現問題並且有針對性地採取措施,避免早產嬰兒夭折。
2、能源行業智能電網現在歐洲已經做到了終端,也就是所謂的智能電表。在德國,為了鼓勵利用太陽能,會在家庭困敗安裝太陽能,除了賣電給你,當你的太陽能有多餘電的時候還可以買回來。通過電網收集每隔五分鍾或十分鍾收集一次數據,收集來的這些數據可以用來預測客戶的用電習慣等,從而推斷出在未來2~3個月時間里,整個電網大概需要多少電。有了這個預測後,就可以向發電或者供電企業購買一定數量的電。因為電有點像期貨一樣,如果提前買就會比較便宜,買現貨就比較貴。通過這汪辯顫個預測後,可以降低采購成本。
3、通信行業
電信業者透過數以千萬計的客戶資料,能分析出多種使用者行為和趨勢,賣給需要的企業,這是全新的資料經濟。中國移動通過大數據分析,對企業運營的全業務進行針對性的監控、預警、跟蹤。系統在第一時間自動捕捉市場變化,再以最快捷的方式推送給指定負責人,使他在最短時間內獲知市場行情,結合自己的經歷,移動推出夜間流量包。
4、零售業
零售企業也監控客戶的店內走動情況以及與商品的互動。它們將這些數據與交易記錄相結合來展開分析,從而在銷售哪些商品、如何擺放貨品以及何時調整售價上給出意見,此類方法已經幫助某零售企業減少了17%的存貨,同時在保持市場份額的前提下,增加了高利潤率自有品牌商品的比例。
大數據三分鍾演講稿範文(二)
既然說到大數據,就得先了解大數據地定義。什麼是大數據。試想如果未來我們一個人擁有的電腦設備超過現在全球現在計算能力的總和,一個人產生的數據量超過現在全球數據量的總和,甚至你的寵物小狗產生的信息量都超過現在全球數據量的總和,世界會發生什麼呢?那麼就先來看一些官方網站給出的大數據的定義。
為導出對事業起作用的數據。對於大數據商務有目的性的定義:「利用大數據解決經濟和社會的問題。提高業務附加的價值。或者是支援事業」大數據不只指它的規模是多少,還有這些數據是由那些數據構成的,還有可以怎樣利用大數據。由此是與到現在的系統是不同的。 用被賣出的數據基礎管理工具或者是到現在為止處理數據的應用程序,來處理巨大困難的復雜數據集合,這樣的詞語。
再來看兩個中文的。
那麼大數據到底是啥。其實就是很多數據。它是把很多信息用數據的方式儲存起來,然後不斷累積,一直到這些數據大的沒辦法用簡單進行利用。大數據並不是很神奇的事情。就如同電影《永無止境》提出的問題:人類通常只使用了20%的大腦,如果剩餘80%大腦潛能被激發出來,世界會變得怎樣?在企業、行業和國家的管理中,通常只有效使用了不到20%的數據(甚至更少),如果剩餘80%數據的價值激發起來,世界會變得怎麼樣呢?特別是隨著海量數據的新摩爾定律,數據爆發式增長,然後數據又得到更有效應用,世界會怎麼樣呢?發揮想像去思考一下。
那麼大數據是怎麼形成的呢?
以前我們關注的都是交易系統和業務系統產生的數據,通過數據倉庫去分析展現,其實終端,尤其是個人各種流水操作,例如購買物品清單,上網瀏覽歷史,照片,微博等也有,但是不關注,而大數據時代,更多的是關注這些大量的數據,期望分析這些數據來發現價值,因此大數據其實以前在系統,終端,個人等等都在產生,只是沒有加以利用而已,現在要分析這些數據從中發現價值。這才是大數據形成的原因和意義。數據再多,但如果被屏蔽或者沒有被使用,也是沒有價值的。中國的航班晚點非常多,相比之下美國航班准點情況好很多。這其中,美國航空管制機構一個的好做法發揮了積極的作用,說起來也非常簡單,就是美國會公布每個航空公司、每一班航空過去一年的晚點率和平均晚點時間,這樣客戶在購買機票的時候就很自然會選擇准點率高的航班,從而通過市場手段牽引各航空公司努力提升准點率。這個簡單的方法比任何管理手段(如中國政府的宏觀調控手段)都直接和有效。
先說一下這個列印的課本,它裡面舉了兩個例子。對於福島核電站的事,以及對於便利店的優勢,都是利用了大數據。比如說超市,要進好多貨,然後有的買的人少可能就堆積,即使減價處理也不一定能賣得掉,從而造成虧損。那麼便利店,就會根據平時周圍生活的人們來選擇性的進貨。在上班族公寓附近就多進快餐,在老年人或者中年人多一點的地方,就進一些生活用品。對於福島核電站,如果將監測核電站的信息及時收集,並且分析就可能發現它有問題,可能會泄露,進而去解決問題避免損失。這就是預測未來可能發生的事故,這樣的話可以有效的避免。再比如說,天文學家們研究天體的運動軌跡,發現更多的行星。將這些數據收集在一起就是大數據,對這些數據分析整理,就有可能計算出,未來某個行星可能會撞上地球。然後採取一些必要的措施,來將這種毀滅性的打擊消除。如何認清現在呢?比如說在醫學上,通過醫療設備對細胞進行觀察,並根據其他測試進而推測出該細胞是不是癌細胞。如果把判斷的依據變成數據化,輸入到電腦中,並且再賦予她一定的學習能力,比如給他一個癌細胞,他會記住這些細胞的特徵,久而久之,他的准確度會越來越高。在醫學上的作用也會越快越明顯。這就是對他的應用進行簡單的了解。之後趙飛會更深入更仔細的講一下這方面的內容。
那麼,大數據對我們帶來的都是好的么。不是的。就比如剛剛那個醫學的例子。研究出的機器會讓診斷癌細胞的工作人員逝去工作。就像是80年代工廠逐漸自動化一樣,工人失業會
很嚴重。如果你是一匹馬,那麼你肯定不喜歡工業革命。
接下來說一下大數據現在面臨的難題,就是如何利用好這些大數據,進而為人們服務,造福我們。就個例子就拿LSST來說。他是一個廣域的天文望遠鏡,是由多個國家參與研發,現在在智利的一個山上,20XX年開始動工,並在20XX年啟用查爾斯·西蒙尼和比爾·蓋茲分別捐贈20XX萬美金和1000萬美金給LSST計劃。LSST計劃至今仍尋求美國國家科學基金會能撥發將近4億美金的贊助費。。它每三天可以拍攝整個天一次。到20XX年,它會搭載一個超級數碼相機,拍攝出的照片達到32億像素。這樣的照片需要1500塊高清電視屏才能展示出來。LSST的照相機每年要拍攝超過人員所能分析的超過20萬張影像。如果利用好了這些數據會是很大的一筆財富,但是目前還沒有一個很有效的解決方法。沒有那麼多人力能去分析它,也沒有那樣的設備直接分析。所以這堆數據就是沒用的數據,沒有價值的。所以大數據是很有潛力的一門科學。接下來跟大家一起看一段TED的演講視頻。
演講人是肯尼斯-庫克耶《經濟學人》數據我,曾任職於《華爾街日報》(亞洲版)和《國際先驅論壇報》。他是美國外交關系協會成員,CNN、BBC和NPR的定期商業和技術評論員之一。對大數據有很深的研究,聽一下他是如何評價大數據的。看完這個演講之後,在有請趙飛帶來對大數據更深入的認識。