<blockquote id="evg5y"><p id="evg5y"></p></blockquote>
<thead id="evg5y"></thead>
    <style id="evg5y"></style>

    <u id="evg5y"><li id="evg5y"></li></u>
    av图片小说,2020日韩无码,91福利姬,无限A片,精品自拍网,小泽玛利亚一区,午夜拍拍,日本中文字幕在线
    首頁 >服務(wù)支持 > 中企之家 > 程序員 > spark基礎(chǔ)知識介紹

    spark基礎(chǔ)知識介紹

    spark基礎(chǔ)知識介紹

    Spark是一種開源集群計算環(huán)境,與Hadoop相似但又有所不同。Apache Spark最初是由加州大學(xué)伯克利分銷的AMP實驗室開發(fā)出來的,后來成為Apache的開源項目之一,作為專門為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用型計算引擎來使用。與MapReduce技術(shù)相比,Spark有著多種優(yōu)勢,如提供了統(tǒng)一全面的框架、大大提高了應(yīng)用運行速度、可以快速使用Java等語言來編寫程序等,目前Spark形成一個應(yīng)用廣泛、發(fā)展高速的生態(tài)系統(tǒng)。接下來就讓我們一起來了解下Spark的性能特點、運行模式、運行特點以及體系架構(gòu)等知識。

    目錄

    1. spark性能特點

    2. spark運行模式

    3. spark運行特點

    4. spark體系架構(gòu)

    5. spark與hadoop的關(guān)系

    • spark性能特點

      spark性能特點

      1、專注性。由于高級API剝離了對于集群本身的關(guān)注,所以spark開發(fā)者可以專注于應(yīng)用所需要做的計算本身。
      2、速度快。Spark支持復(fù)雜算法和交互式計算,運行速度快。
      3、通用性。Spark是一個通用引擎,因此可以用來完成如文本處理、SQL查詢等運算。
      4、支持多種資源管理器。如Hadoop YARN、Apache Mesos等管理器都支持使用。

    • spark運行模式

      spark運行模式

      1、spark的運行模式是多種多樣的,并不限于一種,可以按需選擇。
      2、以單機方式部署時,spark可以用本地模式運行或者偽分布模式運行。
      3、部署在分布式集群時,也可以根據(jù)集群的實際選擇不同的運行模式。底層資源調(diào)度既可以使用spark內(nèi)建的獨立集群運行模式,也可以依賴外部資源調(diào)度框架。

    • spark運行特點

      spark運行特點

      1、除非在外部存儲系統(tǒng)寫入數(shù)據(jù),否則Spark Application就不能跨應(yīng)用共享數(shù)據(jù)。
      2、spark的運行和資源管理器是沒有關(guān)系的,只需獲取executor進程并保持通信即可。
      3、提交SparkContext的Client需靠近運行Executor的節(jié)點,而且最好在同一個Rack里。
      4、Task采用的優(yōu)化機制是數(shù)據(jù)本地性和準(zhǔn)側(cè)執(zhí)行。

    • spark體系架構(gòu)

      spark體系架構(gòu)

      Spark體系架構(gòu)主要有三個組件。
      1、數(shù)據(jù)存儲。Spark使用HDFS文件系統(tǒng)來存儲數(shù)據(jù)。
      2、資源管理。Spark有多種不同的部署方式,可以部署在一個單獨服務(wù)器上,也可以部署在分布式計算框架上,如Mesos等。
      3、API。Spark提供三種程序設(shè)計語言的API,分別是Java、Scala和Python。開發(fā)者可以利用標(biāo)準(zhǔn)的API接口來創(chuàng)建基于Spark的應(yīng)用。

    • spark與hadoop的關(guān)系

      spark與hadoop的關(guān)系

      1、spark自身是沒有提供分布式文件系統(tǒng)的,其分析大部分都需要依賴于Hadoop的分布式文件系統(tǒng),也就是HDFS。
      2、Mapreduce是Hadoop的分布式計算模塊,Mapreduce和spark都可以計算數(shù)據(jù),但Mapreduce比spark速度要慢一些,且功能也不如spark豐富。
      3、spark可以看作是Hadoop MapReduce的替代品,用來提供一個全面、統(tǒng)一的管理大數(shù)據(jù)用例和需求的解決方案。

    img

    在線咨詢

    建站在線咨詢

    img

    微信咨詢

    掃一掃添加
    動力姐姐微信

    img
    img

    TOP

    主站蜘蛛池模板: 一区二区在线欧美日韩中文| 小13箩利洗澡无码视频网站| 黄浦区| 国产成人精品午夜2022| 色综合久久综合欧美综合网| 国产主播第一页| 精品人伦一二三区| 亚洲欧洲一区二区免费| 久久成人亚洲香蕉草草| 亚洲一区二区三区av无码| 十八禁成人网站| 日韩成人一区二区三区在线观看| AV一区二区三区| 色综合色国产热无码一| 宅男噜噜噜66一区二区| 科尔| 久久人人爽人人爽人人片| 曰韩一级| 日韩第一页浮力| AV最新高清无码专区| 久久午夜av一区二区| 国产精品久久久久久无毒不卡| 伊人激情综合| 国产成人A∨| 内射在线播放| 三上悠亚ssⅰn939无码播放| 日韩人妻精品无码制服| 镇远县| 免费观看日本污污ww网站 | 精品国产又大又黄又粗av| 国产亚州精品女人久久久久久| 顺平县| 亚洲欧美一区二区三区在线| 尉犁县| 顶级欧美熟妇xx| 欧美777| 中文字幕无码专区亚洲一区18P| 一区二区三区四区五区自拍| 麻豆精品人妻一区二区三区蜜桃| 国产无码av| 男女性高爱潮久久|