CUME_DIST()是一个窗口函数,它返回一组值中值的累积分布。它表示值小于或等于行的值除以总行数的行数。
DENSE_RANK()是一个窗口函数,它为分区或结果集中的每一行分配排名,而排名值没有间隙。
FIRST_VALUE()是一个窗口函数,允许您选择窗口框架,分区或结果集的第一行。
LAG()函数返回expression当前行之前的行的值,其值为offset 其分区或结果集中的行数。
LAST_VALUE()函数是一个窗口函数,允许您选择有序行集中的最后一行。
LEAD()函数是一个窗口函数,允许您向前看多行并从当前行访问行的数据。
NTH_VALUE()是一个窗口函数,允许您从有序行集中的第N行获取值。
NTILE()函数将排序分区中的行划分为特定数量的组。从每个组分配一个从一开始的桶号。对于每一行,NTILE()函数返回一个桶号,表示行所属的组。
PERCENT_RANK()是一个窗口函数,用于计算分区或结果集中行的百分位数。
RANK()函数为结果集的分区中的每一行分配一个排名。行的等级由一加上前面的等级数指定。
ROW_NUMBER()是一个窗口函数或分析函数,它为从1开始应用的每一行分配一个序号。
select
-- 替换法 replace(string, '被替换部分','替换后的结果') -- device_id, replace(blog_url,'http:/url/','') as user_name ` -- 截取法 substr(string, start_point, length*可选参数*) -- device_id, substr(blog_url,11,length(blog_url)-10) as user_nam ` -- 删除法 trim('被删除字段' from 列名) -- device_id, trim('http:/url/' from blog_url) as user_name ` -- 字段切割法 substring_index(string, '切割标志', 位置数(负号:从后面开始)) device_id, substring_index(blog_url,'/',-1) as user_name```
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10