无码人妻A片一区二区三区_18禁裸乳无遮挡啪啪无码免费_91精品亚?影视在线?看_人人妻人人爽人人澡AV_国产精品人妻一区二区三区四区_午夜免费影视

中培偉業(yè)IT資訊頻道
您現(xiàn)在的位置:首頁(yè) > IT資訊 > 大數(shù)據(jù) > 詳解hadoop與spark區(qū)別與未來(lái)發(fā)展趨勢(shì)

詳解hadoop與spark區(qū)別與未來(lái)發(fā)展趨勢(shì)

2016-07-11 11:32:09 | 來(lái)源:中培企業(yè)IT培訓(xùn)網(wǎng)

對(duì)于大數(shù)據(jù)來(lái)說(shuō),hadoop與spark無(wú)疑是兩大組成架構(gòu)。中培偉業(yè)《大數(shù)據(jù)Hadoop與Spark架構(gòu)應(yīng)用實(shí)戰(zhàn)》專(zhuān)家鐘老師指出,hadoop與spark作為大數(shù)據(jù)的兩大架構(gòu)系統(tǒng),二者有著競(jìng)爭(zhēng)與承前啟后的關(guān)系。對(duì)于二者之間的區(qū)別以及后期的發(fā)展趨勢(shì),鐘老師給出了自己的看法。

首先,spark對(duì)于海量數(shù)據(jù)計(jì)算,尤其是迭代運(yùn)算,圖計(jì)算運(yùn)算速度相比與hadoop有著量級(jí)上的增長(zhǎng)。spark計(jì)算的時(shí)候?qū)⒃紨?shù)據(jù)及中間結(jié)果都存儲(chǔ)在內(nèi)存中,而hadoop每輪迭代都要講原始數(shù)據(jù)讀入,中間結(jié)果寫(xiě)出到硬盤(pán)上。這樣一來(lái)由于spark省去了IO的時(shí)間,所以相比于hadoop,其運(yùn)算速率有這量級(jí)上的增長(zhǎng)。

其次,spark的容錯(cuò)性很好,spark將海量數(shù)據(jù)抽象成RDD這種數(shù)據(jù)結(jié)構(gòu),并且其存在兩種算子,一種叫transformation,主要是用于對(duì)RDD進(jìn)行數(shù)據(jù)轉(zhuǎn)換,一種叫action,是要將轉(zhuǎn)換好的RDD再轉(zhuǎn)換成原始數(shù)據(jù)。spark運(yùn)算是一種懶惰運(yùn)算,其程序執(zhí)行邏輯是,對(duì)于一系列transformation算子,在遇到action算子之前,這些transformation是不會(huì)執(zhí)行的,而會(huì)生成一個(gè)運(yùn)算邏輯圖,當(dāng)遇到一個(gè)action算子的時(shí)候,才根據(jù)前面的運(yùn)算邏輯圖執(zhí)行程序。這樣如果有臺(tái)機(jī)器宕機(jī)了之后,只需要根據(jù)邏輯圖將宕機(jī)中的RDD進(jìn)行重新計(jì)算就可以了(窄依賴(lài)的情況下,寬依賴(lài)的情況下計(jì)算代價(jià)要更高。)

同時(shí),spark與HDFS、Yarn/Mesos以及pregel有著很好的兼容性。但是畢竟spark起步晚,在性能、穩(wěn)定性方面還有待提高;同時(shí)spark不能很好的處理細(xì)粒度、異步的數(shù)據(jù)。 

而Hadoop,性質(zhì)和Spark并不一樣,它不僅僅是一個(gè)框架,而致力于發(fā)展成一個(gè)分布式計(jì)算的平臺(tái)。所以,現(xiàn)在的Spark是可以運(yùn)行在YARN(Yet another Resource Negotiator)上的,而其他的一些框架也可以運(yùn)行在這個(gè)平臺(tái)上,達(dá)到資源共享的目的。

spark相對(duì)hadoop編程模型簡(jiǎn)單,能進(jìn)行迭代操作,利用內(nèi)存(甚至是堆外內(nèi)存)緩存數(shù)據(jù),能進(jìn)行流水線(xiàn)優(yōu)化,上層封裝了sql、streaming、mlib、graphx等或成熟或不成熟的框架,明顯有取hadoop而代之的傾向。

1. 相同的算法,Spark比Hadoop快數(shù)倍,如果是一些迭代或者要對(duì)數(shù)據(jù)反復(fù)讀取的算法,Spark比Hadoop快數(shù)十倍至上百倍

2. Spark對(duì)于數(shù)據(jù)的操作種類(lèi)更多,對(duì)于一些比較特殊的計(jì)算需求,比如求兩個(gè)集合的交集并集,Spark都有函數(shù)直接計(jì)算,而Hadoop實(shí)現(xiàn)這樣的計(jì)算無(wú)比繁瑣

3. Spark的開(kāi)發(fā)效率比Hadoop高很多

最后,鐘老師對(duì)二者的發(fā)展趨勢(shì)進(jìn)行了預(yù)測(cè),他認(rèn)為雖然Spark目前還不夠成熟,但是今后一定會(huì)代替Hadoop。

標(biāo)簽: 大數(shù)據(jù)
主站蜘蛛池模板: 免费网站国产 | 国产日产免费高清欧美一区 | 强奷乱码中文字幕熟女导航 | 免费毛片看 | 50岁熟妇的呻吟声对白 | 亚洲精品大片www | 色综合视频一区二区三区高清 | 日韩欧美亚洲综合久久 | 黄色成人免费在线观看 | 亚洲av日韩av无码大全 | 91嫩草香蕉| 日产精品卡一卡2卡三卡四 日韩欧美永久中文字幕视频 | 色爱综合另类图片av | 又粗又硬进去好爽A片视频野花 | 日韩好片一区二区在线看 | 亚洲综合熟女久久久30p | 日本少妇被添爽A片动漫 | 最新国产免费AV片在线观看 | 18禁无码无遮挡h动漫免费看 | 无码国产精品一区二区高潮 | 斗破苍穹在线免费 | 校园都市经典激情另类 | 国产欧美成人精品?二区 | 在线观看日韩中文字幕 | 99久久无码一区人妻 | 日韩二区精品 | 黄色在线免费观看网站 | 少妇被粗大的猛烈进出96影院 | 男人进女人下部全黄大色视频 | 国产一区二区三区影院 | 亚洲欧洲美洲一区二区三区 | 污视频免费看网站 | 污污的视频在线免费观看 | 国产精品久久久久久粉嫩 | 国产第一页视频在线播放 | 四虎久草 | 日韩成人在线看 | 中日韩VA无码中文字幕 | 在线观看日韩中文字幕 | 日韩中文字幕1 | 96精品在线视频 |