導航:首頁 > 網路數據 > 大數據計算引擎

大數據計算引擎

發布時間:2023-09-06 20:12:47

大數據的應用領域有哪些

1.了解和定位客戶
這是大數據目前最廣為人知的應用領域。很多企業熱衷於社交媒體數據、瀏覽器日誌、文本挖掘等各類數據集,通過大數據技術創建預測模型,從而更全面地了解客戶以及他們的行為、喜好。
利用大數據,美國零售商Target公司甚至能推測出客戶何時會有Baby;電信公司可以更好地預測客戶流失;沃爾瑪可以更准確的預測產品銷售情況;汽車保險公司能更真實的了解客戶實際駕駛情況。
滑雪場利用大數據來追蹤和鎖定客戶。如果你是一名狂熱的滑雪者,想像一下,你會收到最喜歡的度假勝地的邀請;或者收到定製化服務的簡訊提醒;或者告知你最合適的滑行線路。。。。。。同時提供互動平台(網站、手機APP)記錄每天的數據——多少次滑坡,多少次翻越等等,在社交媒體上分享這些信息,與家人和朋友相互評比和競爭。
除此之外,政府競選活動也引入了大數據分析技術。一些人認為,奧巴馬在2012年總統大選中獲勝,歸功於他們團隊的大數據分析能力更加出眾。
2.了解和優化業務流程
大數據也越來越多地應用於優化業務流程,比如供應鏈或配送路徑優化。通過定位和識別系統來跟蹤貨物或運輸車輛,並根據實時交通路況數據優化運輸路線。
人力資源業務流程也在使用大數據進行優化。Sociometric Solutions公司通過在員工工牌里植入感測器,檢測其工作場所及社交活動——員工在哪些工作場所走動,與誰交談,甚至交流時的語氣如何。美國銀行在使用中發現呼叫中心表現最好的員工——他們制定了小組輪流休息制度,平均業績提高了23%。
如果在手機、鑰匙、眼鏡等隨身物品上粘貼RFID標簽,萬一不小心丟失就能迅速定位它們。假想一下未來可能創造出貼在任何東西上的智能標簽。它們能告訴你的不僅是物體在哪裡,還可以反饋溫度,濕度,運動狀態等等。這將打開一個全新的大數據時代,「大數據」領域尋求共性的信息和模式,那麼孕育其中的「小數據」著重關注單個產品。
3.提供個性化服務
大數據不僅適用於公司和政府,也適用於我們每個人,比如從智能手錶或智能手環等可穿戴設備採集的數據中獲益。Jawbone的智能手環可以分析人們的卡路里消耗、活動量和睡眠質量等。Jawbone公司已經能夠收集長達60年的睡眠數據,從中分析出一些獨到的見解反饋給每個用戶。從中受益的還有網路平台「尋找真愛」,大多數婚戀網站都使用大數據分析工具和演算法為用戶匹配最合適的對象。
4.改善醫療保健和公共衛生
大數據分析的能力可以在幾分鍾內解碼整個DNA序列,有助於我們找到新的治療方法,更好地理解和預測疾病模式。試想一下,當來自所有智能手錶等可穿戴設備的數據,都可以應用於數百萬人及其各種疾病時,未來的臨床試驗將不再局限於小樣本,而是包括所有人!
蘋果公司的一款健康APP ResearchKit有效將手機變成醫學研究設備。通過收集用戶的相關數據,可以追蹤你一天走了多少步,或者提示你化療後感覺如何,帕金森病進展如何等問題。研究人員希望這一過程變得更容易、更自動化,吸引更多的參與者,並提高數據的准確度。
大數據技術也開始用於監測早產兒和患病嬰兒的身體狀況。通過記錄和分析每個嬰兒的每一次心跳和呼吸模式,提前24小時預測出身體感染的症狀,從而及早干預,拯救那些脆弱的隨時可能生命危險的嬰兒。
更重要的是,大數據分析有助於我們監測和預測流行性或傳染性疾病的暴發時期,可以將醫療記錄的數據與有些社交媒體的數據結合起來分析。比如,谷歌基於搜索流量預測流感爆發,盡管該預測模型在2014年並未奏效——因為你搜索「流感症狀」並不意味著真正生病了,但是這種大數據分析的影響力越來越為人所知。
5.提高體育運動技能
如今大多數頂尖的體育賽事都採用了大數據分析技術。用於網球比賽的IBM SlamTracker工具,通過視頻分析跟蹤足球落點或者棒球比賽中每個球員的表現。許多優秀的運動隊也在訓練之外跟蹤運動員的營養和睡眠情況。NFL開發了專門的應用平台,幫助所有球隊根據球場上的草地狀況、天氣狀況、以及學習期間球員的個人表現做出最佳決策,以減少球員不必要的受傷。
還有一件非常酷的事情是智能瑜伽墊:嵌入在瑜伽墊中的感測器能對你的姿勢進行反饋,為你的練習打分,甚至指導你在家如何練習。
6.提升科學研究
大數據帶來的無限可能性正在改變科學研究。歐洲核子研究中心(CERN)在全球遍布了150個數據中心,有65,000個處理器,能同時分析30pb的數據量,這樣的計算能力影響著很多領域的科學研究。比如政府需要的人口普查數據、自然災害數據等,變的更容易獲取和分析,從而為我們的健康和社會發展創造更多的價值。
7.提升機械設備性能
大數據使機械設備更加智能化、自動化。例如,豐田普銳斯配備了攝像頭、全球定位系統以及強大的計算機和感測器,在無人干預的條件下實現自動駕駛。Xcel Energy在科羅拉多州啟動了「智能電網」的首批測試,在用戶家中安裝智能電表,然後登錄網站就可實時查看用電情況。「智能電網」還能夠預測使用情況,以便電力公司為未來的基礎設施需求進行規劃,並防止出現電力耗盡的情況。在愛爾蘭,雜貨連鎖店Tescos的倉庫員工佩戴專用臂帶,追蹤貨架上的商品分配,甚至預測一項任務的完成時間。
8.強化安全和執法能力
大數據在改善安全和執法方面得到了廣泛應用。美國國家安全局(NSA)利用大數據技術,檢測和防止網路攻擊(挫敗恐怖分子的陰謀)。警察運用大數據來抓捕罪犯,預測犯罪活動。信用卡公司使用大數據來檢測欺詐交易等等。
2014年2月,芝加哥警察局對大數據生成的「名單」——有可能犯罪的人員,進行通告和探訪,目的是提前預防犯罪。
9.改善城市和國家建設
大數據被用於改善我們城市和國家的方方面面。目前很多大城市致力於構建智慧交通。車輛、行人、道路基礎設施、公共服務場所都被整合在智慧交通網路中,以提升資源運用的效率,優化城市管理和服務。
加州長灘市正在使用智能水表實時檢測非法用水,幫助一些房主減少80%的用水量。洛杉磯利用磁性道路感測器和交通攝像頭的數據來控制交通燈信號,從而優化城市的交通流量。據統計目前已經控制了全市4500個交通燈,將交通擁堵狀況減少了約16%。
10.金融交易
大數據在金融交易領域應用也比較廣泛。大多數股票交易都是通過一定的演算法模型進行決策的,如今這些演算法的輸入會考慮來自社交媒體、新聞網路的數據,以便更全面的做出買賣決策。同時根據客戶的需求和願望,這些演算法模型也會隨著市場的變化而變化。

❷ 大數據中Hadoop的核心技術是什麼

Hadoop核心架構,分為四個模塊:

1、Hadoop通用:提供Hadoop模塊所需要的Java類庫和工具。

2、Hadoop YARN:提供任務調度和集群資源管理功能。

3、Hadoop HDFS:分布式文件系統,提供高吞吐量的應用程序數據訪問方式。

4、Hadoop MapRece:大數據離線計算引擎,用於大規模數據集的並行處理。

特點:

Hadoop的高可靠性、高擴展性、高效性、高容錯性,是Hadoop的優勢所在,在十多年的發展歷程當中,Hadoop依然被行業認可,占據著重要的市場地位。

Hadoop在大數據技術框架當中的地位重要,學大數據必學Hadoop,還要對Hadoop核心技術框架掌握扎實才行。

❸ 大數據運算的三種引擎是什麼有什麼區別

現在流行的開源引擎可不止三個,先羅列5個給你:
1)Hive,披著SQL外衣的Map-Rece。Hive是為方便用戶使用Map-Rece而在外面封裝了一層SQL,由於Hive採用了SQL,它的問題域比Map-Rece更窄,因為很多問題,SQL表達不出來,比如一些數據挖掘演算法,推薦演算法、圖像識別演算法等,這些仍只能通過編寫Map-Rece完成。
2) Impala:Google Dremel的開源實現(Apache Drill類似),因為互動式實時計算需求,Cloudera推出了Impala系統,該系統適用於互動式實時處理場景,要求最後產生的數據量一定要少。
3)Shark/Spark:為了提高Map-Rece的計算效率,Berkeley的AMPLab實驗室開發了Spark,Spark可看做基於內存的Map-Rece實現,此外,伯克利還在Spark基礎上封裝了一層SQL,產生了一個新的類似Hive的系統Shark。
4) Stinger Initiative(Tez optimized Hive):Hortonworks開源了一個DAG計算框架Tez,Tez可以理解為Google Pregel的開源實現,該框架可以像Map-Rece一樣,可以用來設計DAG應用程序,但需要注意的是,Tez只能運行在YARN上。Tez的一個重要應用是優化Hive和PIG這種典型的DAG應用場景,它通過減少數據讀寫IO,優化DAG流程使得Hive速度提供了很多倍。
5)Presto:FaceBook於2013年11月份開源了Presto,一個分布式SQL查詢引擎,它被設計為用來專門進行高速、實時的數據分析。它支持標準的ANSI SQL,包括復雜查詢、聚合(aggregation)、連接(join)和窗口函數(window functions)。Presto設計了一個簡單的數據存儲的抽象層,來滿足在不同數據存儲系統(包括HBase、HDFS、Scribe等)之上都可以使用SQL進行查詢。

❹ 大數據專業需要用到什麼軟體啊

1,分步閱讀
數據分析報告類:Microsoft Office軟體等,如果連excel表格基本的處理操作都不會,連PPT報告都不會做,那我只好說離數據分析的崗位還差的很遠。現在的數據呈現不再單單只是表格的形式,而是更多需要以可視化圖表去展示你的數據結果,因此數據可視化軟體就不能少,BDP個人版、ECharts等這些必備的,就看你自己怎麼選了。
2,專業數據分析軟體:Office並不是全部,要從在數據分析方面做的比較好,你必須會用(至少要了解)一些比較常用的專業數據分析軟體工具,比如SPSS、SAS、Matlab等等,這些軟體可以很好地幫助我們完成專業性的演算法或模型分析,還有高級的python、R等。
3,資料庫:hive、hadoop、impala等資料庫相關的知識可以學習;
4,輔助工具:比如思維導圖軟體(如MindManager、MindNode Pro等)也可以很好地幫助我們整理分析思路。

❺ 數據開發是什麼

大數據開發,是運用大數據計算引擎,比如spark來進行數據業務開發。穗櫻或者數據平台開發嫌明。大數據環境下的數據開芹族告發就是運用數據平台做一下數據加工。

❻ 大數據分析引擎是什麼

這是一個統稱,大數據分析,顧名思義,就是通過眾多的數據來分析得出有專用的結論,而這些數屬據哪裡來的呢?通過一種技術手段做成一個系統來收集的,這個系統,就叫做大數據引擎!
我這么說會不會太抽象,舉個例子:米多大數據引擎系統,他們家的技術手段就是通過一物一碼獲得數據,一物一碼,就是一件商品貼一個二維碼,二維碼里有商品的全部信息。每個消費者買了商品後,掃描二維碼可以知道商品的真偽、商品生產的歷程(溯源)。這時,大數據引擎系統就會收集掃描二維碼的用戶的信息。而商家也會通過消費者在哪裡掃描的二維碼可以分析出商品在哪個地點賣的好,哪個地點賣的少,或者這個編號的商品不應該出現在那裡(商品防竄)。等等……這些就是大數據分析!而這個系統就成為大數據引擎系統。還是不懂的話可以搜湖北米多科技看看,應該就懂了,望採納^_^

❼ 轉載:阿里巴巴為什麼選擇Apache Flink

本文主要整理自阿里巴巴計算平台事業部資深技術專家莫問在雲棲大會的演講。

合抱之木,生於毫末

隨著人工智慧時代的降臨,數據量的爆發,在典型的大數據的業務場景下數據業務最通用的做法是:選用批處理的技術處理全量數據,採用流式計算處理實時增量數據。在絕大多數的業務場景之下,用戶的業務邏輯在批處理和流處理之中往往是相同的。但是,用戶用於批處理和流處理的兩套計算引擎是不同的。

因此,用戶通常需要寫兩套代碼。毫無疑問,這帶來了一些額外的負擔和成本。阿里巴巴的商品數據處理就經常需要面對增量和全量兩套不同的業務流程問題,所以阿里就在想,我們能不能有一套統一的大數據引擎技術,用戶只需要根據自己的業務邏輯開發一套代碼。這樣在各種不同的場景下,不管是全量數據還是增量數據,亦或者實時處理,一套方案即可全部支持, 這就是阿里選擇Flink的背景和初衷

目前開源大數據計算引擎有很多選擇,流計算如Storm,Samza,Flink,Kafka Stream等,批處理如Spark,Hive,Pig,Flink等。而同時支持流處理和批處理的計算引擎,只有兩種選擇:一個是Apache Spark,一個是Apache Flink。

從技術,生態等各方面的綜合考慮。首先,Spark的技術理念是基於批來模擬流的計算。而Flink則完全相反,它採用的是基於流計算來模擬批計算。

從技術發展方向看,用批來模擬流有一圓輪定的技術局限性,並且這個局限性可能很難突破。而Flink基於流來模擬批,在技術上有更好的擴展性。從長遠來看,阿里決定用Flink做一個統一的、通用的大數據引擎作為未來的選型。

Flink是一個低延遲、高吞吐、統一的大數據計算引擎。在阿里巴巴的生產環境中,Flink的計算平台可以實現毫秒級的延遲情況下,每秒鍾處理上億次的消息或者事件。同時Flink提供了一個Exactly-once的一致性語義。保證了數據的正確性。這樣就使得Flink大數據引擎可以提供金融級的數據處理能力橘仿信。

Flink在阿里的現狀

基於Apache Flink在阿里巴巴搭建的平台於2016年正式上線,並從阿里巴巴的搜索和推薦這兩大場景開始實現。目前阿里巴巴所有的業務,包括阿里巴巴所有子公司都採用了基於Flink搭建的實時計算平台。同時Flink計算平台運行在開源的Hadoop集群之上。採用Hadoop的YARN做為資源管理調度,以 HDFS作為數據存儲。因此,Flink可以和開源大數據軟體Hadoop無縫對接。

目前,這套基於Flink搭建的實時計算平台不僅服務於阿里巴巴集團內部,而且通過阿里雲的雲產品API向整個開發者生態提供基於Flink的雲產品支持。

Flink在阿里巴巴的大規模應用,表現如何?

規模: 一個系統是否成熟,規模是重要指標,Flink最初上線阿里巴巴只有數百台伺服器,目前規模已達上萬台,此等規模在全球范圍內也是屈指可數;

狀態數據: 基於Flink,內部積累起來的狀態數據已經是PB級別規模;

Events: 如今每天在Flink的計算平台上,處理的數據已經超過萬億條;

PS: 在峰值期間可以承擔每秒超過4.72億次的訪問,最典型的應用場景是阿里巴巴雙11大屏;

Flink的發展之路

接下來從開源技術的角度,來談一談Apache Flink是如何誕生的,它是如何成長的大帆?以及在成長的這個關鍵的時間點阿里是如何進入的?並對它做出了那些貢獻和支持?

Flink誕生於歐洲的一個大數據研究項目StratoSphere。該項目是柏林工業大學的一個研究性項目。早期,Flink是做Batch計算的,但是在2014年,StratoSphere裡面的核心成員孵化出Flink,同年將Flink捐贈Apache,並在後來成為Apache的頂級大數據項目,同時Flink計算的主流方向被定位為Streaming,即用流式計算來做所有大數據的計算,這就是Flink技術誕生的背景。

2014年Flink作為主攻流計算的大數據引擎開始在開源大數據行業內嶄露頭角。區別於Storm,Spark Streaming以及其他流式計算引擎的是:它不僅是一個高吞吐、低延遲的計算引擎,同時還提供很多高級的功能。比如它提供了有狀態的計算,支持狀態管理,支持強一致性的數據語義以及支持Event Time,WaterMark對消息亂序的處理。

Flink核心概念以及基本理念

Flink最區別於其他流計算引擎的,其實就是狀態管理。

什麼是狀態?例如開發一套流計算的系統或者任務做數據處理,可能經常要對數據進行統計,如Sum,Count,Min,Max,這些值是需要存儲的。因為要不斷更新,這些值或者變數就可以理解為一種狀態。如果數據源是在讀取Kafka,RocketMQ,可能要記錄讀取到什麼位置,並記錄Offset,這些Offset變數都是要計算的狀態。

Flink提供了內置的狀態管理,可以把這些狀態存儲在Flink內部,而不需要把它存儲在外部系統。這樣做的好處是第一降低了計算引擎對外部系統的依賴以及部署,使運維更加簡單;第二,對性能帶來了極大的提升:如果通過外部去訪問,如Redis,HBase它一定是通過網路及RPC。如果通過Flink內部去訪問,它只通過自身的進程去訪問這些變數。同時Flink會定期將這些狀態做Checkpoint持久化,把Checkpoint存儲到一個分布式的持久化系統中,比如HDFS。這樣的話,當Flink的任務出現任何故障時,它都會從最近的一次Checkpoint將整個流的狀態進行恢復,然後繼續運行它的流處理。對用戶沒有任何數據上的影響。

Flink是如何做到在Checkpoint恢復過程中沒有任何數據的丟失和數據的冗餘?來保證精準計算的?

這其中原因是Flink利用了一套非常經典的Chandy-Lamport演算法,它的核心思想是把這個流計算看成一個流式的拓撲,定期從這個拓撲的頭部Source點開始插入特殊的Barries,從上游開始不斷的向下游廣播這個Barries。每一個節點收到所有的Barries,會將State做一次Snapshot,當每個節點都做完Snapshot之後,整個拓撲就算完整的做完了一次Checkpoint。接下來不管出現任何故障,都會從最近的Checkpoint進行恢復。

Flink利用這套經典的演算法,保證了強一致性的語義。這也是Flink與其他無狀態流計算引擎的核心區別。

下面介紹Flink是如何解決亂序問題的。比如星球大戰的播放順序,如果按照上映的時間觀看,可能會發現故事在跳躍。

在流計算中,與這個例子是非常類似的。所有消息到來的時間,和它真正發生在源頭,在線系統Log當中的時間是不一致的。在流處理當中,希望是按消息真正發生在源頭的順序進行處理,不希望是真正到達程序里的時間來處理。Flink提供了Event Time和WaterMark的一些先進技術來解決亂序的問題。使得用戶可以有序的處理這個消息。這是Flink一個很重要的特點。

接下來要介紹的是Flink啟動時的核心理念和核心概念,這是Flink發展的第一個階段;第二個階段時間是2015年和2017年,這個階段也是Flink發展以及阿里巴巴介入的時間。故事源於2015年年中,我們在搜索事業部的一次調研。當時阿里有自己的批處理技術和流計算技術,有自研的,也有開源的。但是,為了思考下一代大數據引擎的方向以及未來趨勢,我們做了很多新技術的調研。

結合大量調研結果,我們最後得出的結論是:解決通用大數據計算需求,批流融合的計算引擎,才是大數據技術的發展方向,並且最終我們選擇了Flink。

但2015年的Flink還不夠成熟,不管是規模還是穩定性尚未經歷實踐。最後我們決定在阿里內部建立一個Flink分支,對Flink做大量的修改和完善,讓其適應阿里巴巴這種超大規模的業務場景。在這個過程當中,我們團隊不僅對Flink在性能和穩定性上做出了很多改進和優化,同時在核心架構和功能上也進行了大量創新和改進,並將其貢獻給社區,例如:Flink新的分布式架構,增量Checkpoint機制,基於Credit-based的網路流控機制和Streaming SQL等。

阿里巴巴對Flink社區的貢獻

我們舉兩個設計案例,第一個是阿里巴巴重構了Flink的分布式架構,將Flink的Job調度和資源管理做了一個清晰的分層和解耦。這樣做的首要好處是Flink可以原生的跑在各種不同的開源資源管理器上。經過這套分布式架構的改進,Flink可以原生地跑在Hadoop Yarn和Kubernetes這兩個最常見的資源管理系統之上。同時將Flink的任務調度從集中式調度改為了分布式調度,這樣Flink就可以支持更大規模的集群,以及得到更好的資源隔離。

另一個是實現了增量的Checkpoint機制,因為Flink提供了有狀態的計算和定期的Checkpoint機制,如果內部的數據越來越多,不停地做Checkpoint,Checkpoint會越來越大,最後可能導致做不出來。提供了增量的Checkpoint後,Flink會自動地發現哪些數據是增量變化,哪些數據是被修改了。同時只將這些修改的數據進行持久化。這樣Checkpoint不會隨著時間的運行而越來越難做,整個系統的性能會非常地平穩,這也是我們貢獻給社區的一個很重大的特性。

經過2015年到2017年對Flink Streaming的能力完善,Flink社區也逐漸成熟起來。Flink也成為在Streaming領域最主流的計算引擎。因為Flink最早期想做一個流批統一的大數據引擎,2018年已經啟動這項工作,為了實現這個目標,阿里巴巴提出了新的統一API架構,統一SQL解決方案,同時流計算的各種功能得到完善後,我們認為批計算也需要各種各樣的完善。無論在任務調度層,還是在數據Shuffle層,在容錯性,易用性上,都需要完善很多工作。

篇幅原因,下面主要和大家分享兩點:

● 統一 API Stack

● 統一 SQL方案

先來看下目前Flink API Stack的一個現狀,調研過Flink或者使用過Flink的開發者應該知道。Flink有2套基礎的API,一套是DataStream,一套是DataSet。DataStream API是針對流式處理的用戶提供,DataSet API是針對批處理用戶提供,但是這兩套API的執行路徑是完全不一樣的,甚至需要生成不同的Task去執行。所以這跟得到統一的API是有沖突的,而且這個也是不完善的,不是最終的解法。在Runtime之上首先是要有一個批流統一融合的基礎API層,我們希望可以統一API層。

因此,我們在新架構中將採用一個DAG(有限無環圖)API,作為一個批流統一的API層。對於這個有限無環圖,批計算和流計算不需要涇渭分明的表達出來。只需要讓開發者在不同的節點,不同的邊上定義不同的屬性,來規劃數據是流屬性還是批屬性。整個拓撲是可以融合批流統一的語義表達,整個計算無需區分是流計算還是批計算,只需要表達自己的需求。有了這套API後,Flink的API Stack將得到統一。

除了統一的基礎API層和統一的API Stack外,同樣在上層統一SQL的解決方案。流和批的SQL,可以認為流計算有數據源,批計算也有數據源,我們可以將這兩種源都模擬成數據表。可以認為流數據的數據源是一張不斷更新的數據表,對於批處理的數據源可以認為是一張相對靜止的表,沒有更新的數據表。整個數據處理可以當做SQL的一個Query,最終產生的結果也可以模擬成一個結果表。

對於流計算而言,它的結果表是一張不斷更新的結果表。對於批處理而言,它的結果表是相當於一次更新完成的結果表。從整個SOL語義上表達,流和批是可以統一的。此外,不管是流式SQL,還是批處理SQL,都可以用同一個Query來表達復用。這樣以來流批都可以用同一個Query優化或者解析。甚至很多流和批的運算元都是可以復用的。

Flink的未來方向

首先,阿里巴巴還是要立足於Flink的本質,去做一個全能的統一大數據計算引擎。將它在生態和場景上進行落地。目前Flink已經是一個主流的流計算引擎,很多互聯網公司已經達成了共識:Flink是大數據的未來,是最好的流計算引擎。下一步很重要的工作是讓Flink在批計算上有所突破。在更多的場景下落地,成為一種主流的批計算引擎。然後進一步在流和批之間進行無縫的切換,流和批的界限越來越模糊。用Flink,在一個計算中,既可以有流計算,又可以有批計算。

第二個方向就是Flink的生態上有更多語言的支持,不僅僅是Java,Scala語言,甚至是機器學習下用的Python,Go語言。未來我們希望能用更多豐富的語言來開發Flink計算的任務,來描述計算邏輯,並和更多的生態進行對接。

最後不得不說AI,因為現在很多大數據計算的需求和數據量都是在支持很火爆的AI場景,所以在Flink流批生態完善的基礎上,將繼續往上走,完善上層Flink的Machine Learning演算法庫,同時Flink往上層也會向成熟的機器學習,深度學習去集成。比如可以做Tensorflow On Flink, 讓大數據的ETL數據處理和機器學習的Feature計算和特徵計算,訓練的計算等進行集成,讓開發者能夠同時享受到多種生態給大家帶來的好處。

閱讀全文

與大數據計算引擎相關的資料

熱點內容
javaweb面試 瀏覽:4
qq空間說說點不進去 瀏覽:772
nodejscms系統 瀏覽:822
追星數據組是什麼東西 瀏覽:3
文件的格式怎麼建立 瀏覽:529
免費yoosee蘋果下載 瀏覽:447
網路大國與大數據 瀏覽:770
怎麼學plc的編程 瀏覽:643
javadnf輔助源碼 瀏覽:973
什麼app可以畫二維圖像 瀏覽:125
手機如何設置副路由器設置密碼 瀏覽:592
如何讓已經壓縮的文件恢復 瀏覽:344
網路atm取款支出是什麼意思 瀏覽:942
ios查看wifi密碼插件 瀏覽:742
win10因藍屏 瀏覽:322
app病毒是如何植入的 瀏覽:384
hadoop文件系統查看 瀏覽:317
熱門app免流都有哪些 瀏覽:619
cad怎麼轉換mpgis文件 瀏覽:631
win10照片不能用了 瀏覽:878

友情鏈接