pyspark读取文件路径和文件--688IT编程网

pyspark读取⽂件路径和⽂件代码：

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# @author : 何⼩义

import sys

reload(sys)

import nerspark

sys.setdefaultencoding('utf8')

import os

import json

# 本地spark （ps：要改成读者的spark路径）

sys.path.append("/usr/spark-2.0.1/python")

sys.path.append("/usr/spark-2.0.1/python/bin")

try:

from pyspark import SparkContext

from pyspark import SparkConf

from pyspark.sql import SparkSession

from pyspark.sql import SQLContext

from pyspark.sql import DataFrame

from pyspark.sql import Row

session如何设置和读取

print("Successfully imported Spark Modules")

except ImportError as e:

print("Can not import Spark Modules", e)

from pyspark.sql import SparkSession

# === spark读取⽂件 ====================================================

# 配置spark(服务器)

# spark = SparkSession.builder.master(服务器_URL).appName("hzy_test_script").getOrCreate()

# 配置spark(本机)

spark = SparkSession.builder.master('local').appName("hzy_test_script").getOrCreate()

sc = spark.sparkContext

# rdd_data = sc.textFile("xxx.t*xt") # ⽂件内容

rdd_data = sc.wholetextFile("xxx.t*xt") # ⽂件path + 内容

result = rdd_data.take(10)

print(result)

print('完成...')

注：

1. data_rdd = sc.textFiles('') # 读⼊⽂件内容，返回的东西是rdd

2. path_data_rdd = sc.wholeTextFile(('')) # 不仅读⼊⽂件内容，还会读⼊⽂件的路径path

发表评论

688IT编程网

pyspark读取文件路径和文件

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

pyspark读取文件路径和文件

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式