windows下spark开发环境配置--688IT编程网

windows下spark开发环境配置

--本篇随笔由同事葛同学提供。

windows下spark开发环境配置

特注：windows下开发spark不需要在本地安装hadoop，但是需要、hadoop.dll等⽂件，前提是你已经安装了eclipse、maven、jdk等软件

spark⽀持jdk版本建议是1.8及以上，如果开发spark建议将jdk编译版本设置为1.8

我选择的spark是spark-1.4.，故以该版本为例

第⼀步：下载spark-1.4.到本地，并解压在本地⽬录

第⼆步：下载windows下hadoop⼯具包（分为32位和64位的），在本地新建⼀个hadoop⽬录，必须有 bin⽬录例如：D:\spark\hadoop-2.6.0\bin

然后将winutil等⽂件放在bin⽬录下

第三步：配置hadoop和spark的环境变量：

HADOOP_HOME 例如：D:\spark\hadoop-2.6.0

SPARK_HOMEmaven打包本地jar包

SPARK_CLASSPATH

path中加⼊spark和hadoop

⾄此，在cmd命令下输⼊spark-shell ⾄此windows下配置ok了

搭建⾃⼰的spark maven项⽬hello world程序

对于已经安装了eclipse环境的程序员来说，不⽤再单独安装saprk的开发环境，由于spark是基于scala语⾔的，所以如果要想看源代码，需要安装scala的eclipse插件

第⼀步：安装scala的eclipse插件

第⼀步：创建⾃⼰的spark maven项⽬

勾选create a simple project

第⼆步：选则maven⽣成的包，这⾥⼀定要选这jar，因为spark程序⼀般是打包为jar包的其他必填⾃⼰按需填

第三步：添加spark的jar包到刚才新建的maven项⽬中

到集安装的spark安装⽬录，在lib⽬录下会看到

将加到maven项⽬的build path下

第四步：pom中添加⾃⼰的spark，hadoop maven依赖

例如：

<groupId>org.apache.spark</groupId>

<artifactId>spark-core_2.10</artifactId>

</dependency>

<groupId>org.apache.spark</groupId>

<artifactId>spark-sql_2.10</artifactId>

</dependency>

<groupId>org.apache.hadoop</groupId>

<artifactId>hadoop-client</artifactId>

</dependency>

第五部：spark程序的⼊⼝是main函数，⾄此可以编写⾃⼰的hello world并让它跑起来和调试public class SparkMain implements Serializable {

public static void main(String[] args) throws Exception {

//编写⾃⼰的spark程序

System.out.println(“hello spark!”);

}

Now everything is ready for you to run your main Class. Enjoy!

688IT编程网

windows下spark开发环境配置

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

windows下spark开发环境配置

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行