hive常用的的函数
Hive提供了一种简单的SQL查询语言称为HiveQL,它允许数据工程师、数据分析师和应用程序开发人员查询和管理大规模数据。
以下是Hive中常用的一些函数:
1. 字符串函数:
`length(string)`: 返回字符串的长度。
`concat(string1, string2, ...)`: 连接两个或多个字符串。
`substr(string, start, length)`: 返回字符串的子串。
unix时间戳转换日期格式 `trim(string)`: 去除字符串两端的空格。
`ltrim(string)`: 去除字符串左端的空格。
`rtrim(string)`: 去除字符串右端的空格。
2. 数值函数:
`abs(bigint)`: 返回整数的绝对值。
`ceil(double)`: 返回大于或等于给定数字的最小整数。
`floor(double)`: 返回小于或等于给定数字的最大整数。
`round(double, ndigits)`: 返回四舍五入的值,其中ndigits是精度。
`mod(int, int)`: 返回第一个参数除以第二个参数的余数。
3. 日期函数:
`current_date()`: 返回当前日期。
`from_unixtime(unix_timestamp[, format])`: 将UNIX时间戳转换为指定格式的日期时间。
`unix_timestamp()`: 将当前日期和时间转换为UNIX时间戳(以秒为单位)。
`date_format(date, format)` or `date_format(timestamp, format)`: 将日期/时间值格式化为指定的字符串格式。
4. 聚合函数:
`count(), count(column)`: 计算行数或非NULL值的数量。
`sum(column)`: 计算列的总和。
`avg(column)`: 计算列的平均值。
`min(column)`: 返回列中的最小值。
`max(column)`: 返回列中的最大值。
5. 条件函数:
`when(condition, valueIfTrue, valueIfFalse)`: 如果条件为真,则返回valueIfTrue,否则返回valueIfFalse。也被称为CASE函数。
`case key when value1 then result1 when value2 then result2 ... else defaultResult end`: 多条件CASE语句。
6. 其他常用函数:
`parse_url(url, partToExtract[, key])`: 从URL中提取部分内容。
`regexp_extract(string subject, string pattern, int index)`: 从字符串中基于正则表达式提取内容。
7. 转换函数:
`from_json(string, schema)`: 将JSON格式的字符串转换为指定的数据类型。
`to_json(struct/map/array/string col)`: 将结构化数据/映射/数组/字符串转换为JSON格式的字符串。
8. 数组函数:
`array_length(array)`: 返回数组的长度。
`array_sort(array)`: 对数组元素进行排序并返回排序后的数组。
9. Map函数:
`map_keys(map)`: 返回Map中的所有键。
`map_values(map)`: 返回Map中的所有值。
10. 其他常用函数:
`explode(map/array/string col)`: 将映射、数组或字符串分解为多行,并为每行返回一个部分作为列值。例如,对于一个map类型的列,它会将键和值作为两个单独的列返回。对于数组和字符串类型的列,它会将每个元素或字符作为单独的列返回。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论