当--688IT编程网

当

able.doAs这个参数表⽰，当连接hiveserver2或者spark thriftserver时，模拟连接的⽤户进⾏操作。⽐如使⽤hive⽤户启动hiveserver2，jdbc连接HiveServer2时输⼊的⽤户是hdfs，则在该连接内，所有操作都是hdfs⽤户的权限。该参数在hive中完全正常使⽤，但在spark thriftserver中却不可⽤。测试过程如下：

前置条件：使⽤spark 2.3版本，HDFS的unmask是022，HDP平台，able.doAs为true

使⽤spark⽤户启动thriftserver，JDBC连接时输⼊的⽤户是hdfs

建表：表存储路径的owner是hdfs，但在元数据中owner却是spark。假设表名为tab01，在hdfs上对应的⽬录

建表：

为/warehouse/tab01，则该⽬录的owner为hdfs，但是在hive元数据TBLS表中，该表的owner却是spark。

插⼊数据：插⼊失败，错误显⽰spark⽤户对/warehouse/tab01没有权限，说明是spark⽤户执⾏的插⼊操作。

插⼊数据：

使⽤setfacl命令对spark⽤户赋予权限（hdfs dfs setfacl -m user:spark:rwx /warehouse/tab01），插⼊扔失败，原因是在插⼊过程中创建了⼦⽬录，⼦⽬录的owner扔是hdfs。继续对spark加上default acl（hdfs dfs setfacl -m default:user:spark:rwx

/warehouse/tab01），插⼊数据还是失败，原因是spark没有向临时⽂件w的权限。

查询数据：⾸先去掉/warehouse/tab01上spark⽤户的acl权限，并将该⽬录设置为700。执⾏查询，错误显⽰spark⽤户对该查询数据：

⽬录⽆X权限，说明select是spark⽤户

总结：以上为⾮kerberos环境下的测试。使⽤spark thriftserver时，最好不要将able.doAs设置为true，否则就会发⽣⽤户混乱的问题。该⽂使⽤spark 2.3做测试，spark更低版本应该都有同样的问题

在kerberos环境下，启动spark thriftserver，认证⽤户是在l中配置的，如下所⽰：

kerberos环境下，able.doAs设为true，启动spark thriftserver后，在集某节点kinit hi

ve⽤户，再⽤beeline连接spark thriftserver，报错：Error: Failed to open new session: java.lang.RuntimeException: java.lang.RuntimeException: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.authorize.AuthorizationException): User:

spark/online-slave1@HADOOP.COM is not allowed to impersonate hive (state=,code=0)

总结：kerberos环境下，doAs为true时，beeline连接存在问题

另外⼀个spark-thriftserver的使⽤注意点：使⽤JDBC连接spark thriftserver时，创建的临时函数是对当前Connection有效的，对其他Connection不可见。猜测可能是因为spark thriftserver对每个连接新建了⼀个sparksession，⽽临时函数是属于sparksession的，所以各个连接的临时函数不互见

thrift

688IT编程网

当

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

当

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式