order by,全排序
出于安全原因,不加limit是禁用的。(非严格模式下nostrict)
两个order by就是MR中的二次排序;
sort by,只能保证每个reduce是排序的,部分排序,使用是需要指定reduce个数
排序列必须出现在结果集中
distribute by,类似于分组,也就是MR中的分区过程,必须在sort by语句之前出现
cluster by,r如果sort by和distribute by使用的同一字段,就可以使用cluster by
order by,全排序
出于安全原因,不加limit是禁用的。(非严格模式下nostrict)
两个order by就是MR中的二次排序;
sort by,只能保证每个reduce是排序的,部分排序,使用是需要指定reduce个数
排序列必须出现在结果集中
distribute by,类似于分组,也就是MR中的分区过程,必须在sort by语句之前出现
cluster by,r如果sort by和distribute by使用的同一字段,就可以使用cluster by