无码人妻A片一区二区三区_18禁裸乳无遮挡啪啪无码免费_91精品亚?影视在线?看_人人妻人人爽人人澡AV_国产精品人妻一区二区三区四区_午夜免费影视

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 從基礎到深度解析Hadoop與Spark

從基礎到深度解析Hadoop與Spark

2017-02-06 16:53:12 | 來源:中培企業IT培訓網

Hadoop與Spark是當前兩個流行的大數據架構,也是非常重要的開源技術。對于Hadoop與Spark,業內很多專業人士都進行了對比分析。中培偉業《大數據平臺搭建與高性能計算最佳實踐》培訓蔣老師在這里就Hadoop與Spark兩大架構的認識發表了自己的看法。

Hadoop——Apache Hadoop 是受Google 的兩篇Paper( Mapreduce , Google File System )啟發誕生的。最早在Nutch項目里,2006年移入Hadoop,命名也成為行業內的一段談資。

Hadoop 主要包括兩步分,** Hadoop Distributed File System (HDFS) Hadoop MapReduce**。很 明顯了HDFS解決了存儲,MapReduce 更多情況下是一個編程框架。入門者最開始使用MapReduce 的例子基本都是進行詞頻統計。使用Map進行分詞,然后Reduce得到詞頻。

那經常聽到的Hive,Hbase 是什么? Hive 是建立在Hadoop 之上的數據倉庫,可以通過Sql查詢和實現一些MapReduce 操作。 Hbase 是建立在Hadoop之上的一種分布式非關系型數據庫。模型也是產生于Google的一篇research Bigtable: A Distributed Storage System for Structured Data 。用過的Cassandra也是一種Bigtable的實現。

你可能會聽到 Hadoop YARN ,YARN 是作業管理框架,蔣老師認為MapReduce 是建立在YARN上的。

Spark——在Spark 出來之后看到有人說Spark會代替Hadoop 。但經老師根據自己的認識給出了不同的觀點。蔣老師指出, Spark 的重點在于數據的處理和計算能力,它并沒有解決數據存儲問題。換句話說它相當于Hadoop Mapreduce的升級版。通常Spark都是和Hadoop 一起使用的。因為Spark需要HDFS這樣的存儲系統,Spark又比Hadoop Mapreduce 更快,個人感覺Api更豐富,對于機器學習算法來說更友好。 當然Spark 可以不需要Hadoop ,Hadoop 也可以不需要Spark. Spark 還提供了Spark Sql, Spark Stream,Spark Mlib, Spark GraphX 一些豐富的功能,而且支持Java, Scala, Python,R等多種語言。

標簽: 大數據平臺
主站蜘蛛池模板: 久久久久久久久久久久久女国产乱 | 从大树开始的进化动漫免费观看 | 日本一区二区三区免费高清 | 亚洲国产免费看 | 国产一级片av大片 | 国产欧美日本在线 | 久久九九视频 | 亚洲第一精品导航 | 爱爱视频在线看 | 狠狠久久综合 | 国产一区二区三区四区福利 | 亚洲精品久久久久久久小说 | 91看片免费在线?看 九九热播视频在线精品6 | 亚洲AV片无码久久五月 | 三年成全免费观看国语高清 | 最新在线黄色网址 | 美女一级毛片免费视频 | 日本美女视频网址 | 亚洲综合久久一本伊一区 | 91久操 | 成人精品一区二区三区中文字幕 | 欧美国产在线不卡 | 91色在线观看视频 | 黄片毛片一级 | 国产乱子轮XXX农村 婷婷五月综合国产激情 | 中文字幕人妻在线中文乱码怎么解决 | 成人无码免费一区二区三区 | 少妇裸体淫交视频免费看 | 色噜噜狠狠色综无码久久合 | 亚洲国产另类久久久精品极度 | 亚洲乱码国产乱码精品精98午夜 | 你好李焕英免费高清在线播放 | 亚洲欧美高清视频 | 一级黄色录像免费的 | 国产乱码一区二区三区在线观看 | 国产小受被做到哭咬床单GV | 边摸边吃奶边做爽免费视频99 | 91精品美利坚合众国 | 日韩成人免费视频 | 国产精品呻吟高潮 | 超碰福利久久 |