什么是Apache Spark?
網(wǎng)友解答: Apache Spark 是一款常用于大數(shù)據(jù)工作負載的分布式開源處理系統(tǒng)。Apache Spark 利用內(nèi)存中緩存和經(jīng)過優(yōu)化的執(zhí)行方式以實現(xiàn)高速性能,并支持常規(guī)批處理、流式分
Apache Spark 是一款常用于大數(shù)據(jù)工作負載的分布式開源處理系統(tǒng)。Apache Spark 利用內(nèi)存中緩存和經(jīng)過優(yōu)化的執(zhí)行方式以實現(xiàn)高速性能,并支持常規(guī)批處理、流式分析、機器學習、圖形數(shù)據(jù)庫和臨時查詢。請參閱此處,了解有關 Apache Spark 的更多信息。
Amazon EMR 本身支持 Apache HBase,因此您可以快速輕松地通過 AWS 管理控制臺、AWS CLI 或 Amazon EMR API 創(chuàng)建托管的 Apache HBase 群集。此外,您還可以利用其他 Amazon EMR 功能,包括使用 Amazon EMR 文件系統(tǒng) (EMRFS) 快速連接 Amazon S3、與 Amazon EC2 Spot 市場和 AWS Glue 數(shù)據(jù)目錄集成,以及使用 Auto Scaling 在群集中添加或移除實例。此外,您還能使用 Apache Zeppelin 來創(chuàng)建交互式協(xié)作筆記本,以便使用 Apache Spark 挖掘數(shù)據(jù),并將 Apache MXNet 等深度學習框架用于 Spark 應用程序。
網(wǎng)友解答:Apache Spark是一種閃電般的群集計算技術,專為快速計算而設計。它基于Hadoop MapReduce,它擴展了MapReduce模型以便將其用于更多類型的計算,其中包括交互式查詢和流處理。Spark的主要特點是其 內(nèi)存集群計算 ,可提高應用程序的處理速度。
Spark旨在涵蓋各種工作負載,如批處理應用程序,迭代算法,交互式查詢和流式處理。除了在各自的系統(tǒng)中支持所有這些工作負載之外,它還減少了維護單獨工具的管理負擔。教程http://codingdict.com/article/8118