Cloudera將Spark劃入Hadoop

發(fā)布者：zdsjwz發(fā)布時間：2014-04-10瀏覽次數(shù)：204

Spark內(nèi)存計(jì)算框架適合各種迭代算法和交互式數(shù)據(jù)分析，能夠提升大數(shù)據(jù)處理的實(shí)時性和準(zhǔn)確性。而MapReduce處理框架則擅長復(fù)雜的批處理操作、登陸過濾、ETL(數(shù)據(jù)抽取、轉(zhuǎn)換、加載)、網(wǎng)頁索引等應(yīng)用，MapReduce在低延遲業(yè)務(wù)上一直被人所詬病。

　　圖一：Spark內(nèi)存計(jì)算框架
　　“Spark記錄著數(shù)據(jù)產(chǎn)生的每一個操作，能夠可靠地將這些數(shù)據(jù)存儲在內(nèi)存之中，這使得它非常適用于第掩飾的計(jì)算和有效的迭代算法。”Cloudera表示。
　　據(jù)悉，Cloudera Enterprise Data Hub版本提供多種先進(jìn)的組件的無限支持，如交互式SQL分析的Impala、交互式搜索、導(dǎo)航數(shù)據(jù)管理以及Hbase NoSQL。Enterprise Flex版本則提供可選擇組件版本，Enterprise Basic版本則是僅僅提供Hadoop基礎(chǔ)核心組件。
　　根據(jù)Cloudera介紹，Cloudera將會在兩個版本中安裝支持Spark組件。用戶可以利用它作為Enterprise Flex版本中一個可選組件，或者作為Enterprise Data Hub版本中包含的組件。

　　圖二：Spark On YARN
　　據(jù)悉，該產(chǎn)品采用了Spark 0.9.0，Spark獨(dú)立模式已經(jīng)在Cloudera Enterprise Data Hub4.4.0中測試過。在不久的將來，Cloudera表示Enterprise 5.0和YARN中也將支持Spark。

波多野结衣久久久,aaa三级片黄色,超碰啪啪网,后入风骚美少妇

Cloudera將Spark劃入Hadoop