Spark与MapReduce的比较--688IT编程网

Spark与MapReduce的⽐较

Spark和MapReduce都是⽤来处理海量数据，但是在处理⽅式和处理速度上却不同。

第⼀，spark处理数据是基于内存的，⽽MapReduce是基于磁盘处理数据的。

MapReduce是将中间结果保存到磁盘中，减少了内存占⽤，牺牲了计算性能。

Spark是将计算的中间结果保存到内存中，可以反复利⽤，提⾼了处理数据的性能。

第⼆，Spark在处理数据时构建了DAG有向⽆环图，减少了shuffle和数据落地磁盘的次数

Spark 计算⽐ MapReduce 快的根本原因在于 DAG 计算模型。⼀般⽽⾔，DAG 相⽐MapReduce 在⼤多数情况下可以减少 shuffle 次数。Spark 的 DAGScheduler 相当于⼀个改进版的 MapReduce，如果计算不涉及与其他节点进⾏数据交换，Spark 可以在内存中⼀次性完成这些操作，也就是中间结果⽆须落盘，减少了磁盘 IO 的操作。但是，如果计算过程中涉及数据交换，Spark 也是会把 shuffle 的数据写磁盘的！

Spark 是基于内存的计算，但这不是快的主要原因，要对数据做计算，必然得加载到内存，Hadoop 也是如此，只不过 Spark ⽀持将需要反复⽤到的数据给 Cache 到内存中，减少数据加载耗时，所以 Spark 更适⽤于跑机器学习算法（需要对数据进⾏反复迭代）。

第三，Spark是粗粒度资源申请，⽽MapReduce是细粒度资源申请

hadoop与spark的区别与联系粗粒度申请资源指的是在提交资源时，spark会提前向资源管理器（yarn，mess）将资源申请完毕，如果申请不到资源就等待，如果申请到就运⾏task任务，⽽不需要task再去申请资源。

MapReduce是细粒度申请资源，提交任务，task⾃⼰申请资源⾃⼰运⾏程序，⾃⼰释放资源，虽然资源能够充分利⽤，但是这样任务运⾏的很慢。

发表评论

688IT编程网

Spark与MapReduce的比较

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

Spark与MapReduce的比较

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式