• Hive的order by和sort by


    0.创建数据库

      hive>create table hive.test(id int);

      hive>load data local inpath '/home/hyxy/test_order.txt' into table hive.test;

    1.order by 全局排序

      hive>select * from hive.test order by id;

    2.sort by 局部排序(reduce)

      hive>set mapreduce.job.reduces=3;

      hive>select * from hive.test sort by id;

    索引

      1.创建索引

        hive>create index test_id_index on table hive.test(id) as 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler' with deferred rebuild;

      2.默认查询索引表:在hive数据库的INDEX_TABLE下自动生成索引表

        hive>select * from hive.hive__test_test_test_id_index__;

        说明:默认生成的索引表无数据,空白状态;

        索引表有三个字段:  

          id:表示index字段

          _bucketname:表示数据所在的location位置

          _offsets:表示当前数据所处的偏移量

      3.重构index表,目的生成index数据

        hive>alter index test_id_index on hive.test rebuild;

        hive>select * from hive.hive__test_test_id_index__;

      4.删除索引

        hive>drop index stocks_id_index on table stocks;

  • 相关阅读:
    原来触发器不是单行数据触发
    C#-Json-抽象类的反序列化
    vs项目模板创建和使用
    c#-Json-Json字符串字段递归排序
    C# 递增操作符 ++ --
    C# in 参数修饰符
    C# 改变控制台背景颜色
    第一篇不知道说什么
    爬取性感小姐姐
    windows + Eclipse 汉化
  • 原文地址:https://www.cnblogs.com/lyr999736/p/9473985.html
Copyright © 2020-2023  润新知