集菜单图标
集页面
然后输入集的名称以及该集的配置。菜单图标
创建笔记本
将显示“创建笔记本”对话框:
(1)为您的笔记本输入唯一的名称。
(2)对于语言,单击下拉列表并选择您喜欢的任何语言。
(3)对于集,单击下拉列表并选择您在上述步骤中创建的集。
3 使用Notebooks
我们需要将已创建的notebook附加到集。在notebook中可以运行一些示例命令。
3.1 预定义变量
在Databricks中,notebook已经具备了我们需要的一些最有用的Apache Spark变量。
注意
不要在Databricks中自己创建SparkSession,SparkContext或SQLContext。不支持创建多个上下文,并可能导致不一致的行为。使用笔记本提供的现有上下文。
描述变量名
火花语境sc
SQL上下文/ Hive上下文sqlContext
SparkSession(仅限2.0)spark
3.2 运行一些代码
请键入要在单元格中执行的代码,然后单击单元格右上角的下拉箭头或按shift+Enter。这将执行这个代码单元格。
#Spark Spark已经为您创建了。
#不要创建另一个或未指定的行为可能会发生。
spark
#也已经为您创建了一个SQLContext。
#不要创建另一个或未指定的行为可能会发生。
#如下所示,提供的sqlContext是一个HiveContext。
sqlContext
scala python#Spark Spark已经为您创建了。
#不要创建另一个或未指定的行为可能会发生。
SC
现在我们已经看到了预定义的变量,让我们继续运行一些真正的代码!
1 + 1 #=> 2
我们可以通过文件下拉菜单访问查和替换工具
可以通过单击来替换个人的比赛。当前的比赛以橙突出显示,所有其他比赛都以黄
3.6 从另个notebook运行notebook
例如,给notebook A和notebook B。A包含1个具有以下python代码的单元格:
x=5
在notebook B中运行下面的代码即使x没有明确创建也可以运行。
%run/Users/path/to/notebookA
如果要指定相对路径,则需要使用./或前缀../。例如,如果notebook A和notebook B位于相同的目录中,那么我们也可以从相对路径运行它们。
%run ./A
4 导入Notebooks
进入workspace。单击如下图所示的下拉箭头,点击import,
notebooks
5 创建一个DataFrame(简单示例)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论