• TPCH测试工具


    TPC现有的测试标准为:TPC-E、TPC-C、TPC-H、TPC-App。根据这4个测试基准,目前TPC主要包括的4个技术小组委员会:TPC-E 技术小组委员会、TPC-C 技术小组委员会、TPC-H技术小组委员会、TPC-App技术小组委员会。前期TPC使用过但目前已经停止使用的测试标准有:TPC-A、TPC-B(数据库处理能力测试标准)、TPC-D、TPC-R(决策支持系统测试标准,类TPC-H)、TPC-W(Web处理能力测试标准)。

    TPC测试标准分类
    联机在线事务处理系统(OLTP)测试标准:TPC-C、TPC-E(最新)
    决策支持/大数据(DS)测试标准:TPC-H、TPC-DS(最新)
    服务器虚拟化(VMS)测试标准:TPC-VMS
    OLTP测试标准
    由于数据库的应用一般有两种,一种是OLTP,即在线联机事务处理,另一种是数据挖掘。就目前来说,OLTP仍然是主流应用。所以从一定程度来说,TPC-C和TPC-E的结果对于数据库系统采购都有一定的参考价值,比如银行、证券、税务报税系统、电子商务网站、电信业务等都是比较典型的OLTP应用。

    TPC-H
    TPC-H(商业智能计算测试) 是美国交易处理效能委员会(TPC,Transaction Processing Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集.目前,在学术界和工业界普遍采用它来评价决策支持技术方面应用的性能. 这种商业测试可以全方位评测系统的整体商业计算综合能力,对厂商的要求更高,同时也具有普遍的商业实用意义,目前在银行信贷分析和信用卡分析、电信运营分析、税收分析、烟草行业决策分析中都有广泛的应用。

    TPC-H 基准测试是由 TPC-D(由 TPC 组织于 1994 年指定的标准,用于决策支持系统方面的测试基准)发展而来的.TPC-H 用 3NF 实现了一个数据仓库,共包含 8 个基本关系,其数据量可以设定从 1G~3T 不等。TPC-H 基准测试包括 22 个查询(Q1~Q22),其主要评价指标是各个查询的响应时间,即从提交查询到结果返回所需时间.TPC-H 基准测试的度量单位是每小时执行的查询数( QphH@size),其中 H 表示每小时系统执行复杂查询的平均次数,size 表示数据库规模的大小,它能够反映出系统在处理查询时的能力.TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数.总而言之,TPC 组织颁布的TPC-H 标准满足了数据仓库领域的测试需求,并且促使各个厂商以及研究机构将该项技术推向极限。


    ---------------------
    https://blog.csdn.net/xfg0218/article/details/82785187

     TPC-H 基准测试是由 TPC-D(由 TPC 组织于 1994 年指定的标准,用于决策支持系统方面的测试基准)发展而来的.TPC-H 用 3NF 实现了一个数据仓库,共包含 8 个基本关系,其数据量可以设定从 1G~3T 不等。TPC-H 基准测试包括 22 个查询(Q1~Q22),其主要评价指标是各个查询的响应时间,即从提交查询到结果返回所需时间.TPC-H 基准测试的度量单位是每小时执行的查询数( QphH@size),其中 H 表示每小时系统执行复杂查询的平均次数,size 表示数据库规模的大小,它能够反映出系统在处理查询时的能力.TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数.总而言之,TPC 组织颁布的TPC-H 标准满足了数据仓库领域的测试需求,并且促使各个厂商以及研究机构将该项技术推向极限。

    (*)详细介绍:https://blog.csdn.net/woshisap/article/details/44427899
    ---------------------

    TPCH 里的表格对一个配件销售管理系统进行建模。细节参考 TPCH Specification
    TPCH 的 Query 定义参考 Specification 的 2.4 节,里面详细说明了每个 Query 的内涵。本文过一遍表定义,记住这些表的意思,有利于理解 Query。

    suplier
    供应商信息:key + 姓名、地址、电话、国家代码
    其中国家代码需要和 nation 表做 join 以获得详细国家信息。

    CREATE TABLE `supplier` (
    `s_suppkey` bigint(20) NOT NULL,
    `s_name` char(25) DEFAULT NULL,
    `s_address` varchar(40) DEFAULT NULL,
    `s_nationkey` bigint(20) DEFAULT NULL,
    `s_phone` char(15) DEFAULT NULL,
    `s_acctbal` bigint(20) DEFAULT NULL,
    `s_comment` varchar(101) DEFAULT NULL,
    PRIMARY KEY (`s_suppkey`)
    ) partition by hash(s_suppkey) partitions 128
    1
    nation
    国家信息:key + 国家名、地区代号
    其中地区代号需要和 region 表做 join 以获得地区详细信息

    CREATE TABLE `nation` (
    `n_nationkey` bigint(20) NOT NULL,
    `n_name` char(25) DEFAULT NULL,
    `n_regionkey` bigint(20) DEFAULT NULL,
    `n_comment` varchar(152) DEFAULT NULL,
    PRIMARY KEY (`n_nationkey`)
    )
    region
    地区信息:key + 地区名

    CREATE TABLE `region` (
    `r_regionkey` bigint(20) NOT NULL,
    `r_name` char(25) DEFAULT NULL,
    `r_comment` varchar(152) DEFAULT NULL,
    PRIMARY KEY (`r_regionkey`)
    )

    customer
    用户表:key + 姓名、地址、国家代号、电话等
    用户表按照 key 做 64 个 hash 分区

    CREATE TABLE `customer` (
    `c_custkey` bigint(20) NOT NULL,
    `c_name` varchar(25) DEFAULT NULL,
    `c_address` varchar(40) DEFAULT NULL,
    `c_nationkey` bigint(20) DEFAULT NULL,
    `c_phone` char(15) DEFAULT NULL,
    `c_acctbal` decimal(10,2) DEFAULT NULL,
    `c_mktsegment` char(10) DEFAULT NULL,
    `c_comment` varchar(117) DEFAULT NULL,
    PRIMARY KEY (`c_custkey`),
    UNIQUE KEY `i_c_custkey` (`c_custkey`) LOCAL BLOCK_SIZE 16384
    ) partition by hash(c_custkey) partitions 64
    part
    配件表:key + 配件名、厂商、品牌、类型、大小、包装、零售价

    CREATE TABLE `part` (
    `p_partkey` bigint(20) NOT NULL,
    `p_name` varchar(55) DEFAULT NULL,
    `p_mfgr` char(25) DEFAULT NULL,
    `p_brand` char(10) DEFAULT NULL,
    `p_type` varchar(25) DEFAULT NULL,
    `p_size` bigint(20) DEFAULT NULL,
    `p_container` char(10) DEFAULT NULL,
    `p_retailprice` decimal(10,2) DEFAULT NULL,
    `p_comment` varchar(23) DEFAULT NULL,
    PRIMARY KEY (`p_partkey`)
    ) partition by hash(p_partkey) partitions 64;

    partsupp
    配件供应表:配件key + 供应商key + 供应数量、批发价

    CREATE TABLE `partsupp` (
    `ps_partkey` bigint(20) NOT NULL,
    `ps_suppkey` bigint(20) NOT NULL,
    `ps_availqty` bigint(20) DEFAULT NULL,
    `ps_supplycost` decimal(10,2) DEFAULT NULL,
    `ps_comment` varchar(199) DEFAULT NULL,
    PRIMARY KEY (`ps_partkey`, `ps_suppkey`),
    UNIQUE KEY `ps_pkey_skey` (`ps_partkey`, `ps_suppkey`) LOCAL BLOCK_SIZE 16384
    ) partition by hash(ps_partkey) partitions 64

    orders
    零售订单表:订单key + 客户key + 订单状态、订单总价、下单日期、优先级、收银员、发货优先级

    CREATE TABLE `orders` (
    `o_orderkey` bigint(20) NOT NULL,
    `o_custkey` bigint(20) NOT NULL,
    `o_orderstatus` char(1) DEFAULT NULL,
    `o_totalprice` decimal(10,2) DEFAULT NULL,
    `o_orderdate` date NOT NULL,
    `o_orderpriority` char(15) DEFAULT NULL,
    `o_clerk` char(15) DEFAULT NULL,
    `o_shippriority` bigint(20) DEFAULT NULL,
    `o_comment` varchar(79) DEFAULT NULL,
    PRIMARY KEY (`o_orderkey`, `o_orderdate`, `o_custkey`),
    KEY `o_orderkey` (`o_orderkey`) LOCAL BLOCK_SIZE 16384
    ) partition by range columns(o_orderdate)
    subpartition by hash(o_custkey) subpartitions 64
    (partition ord1 values less than ('1992-01-01'),
    partition ord2 values less than ('1992-02-01'),
    partition ord3 values less than ('1992-03-01'),
    ...
    ...
    partition ord77 values less than ('1998-05-01'),
    partition ord78 values less than ('1998-06-01'),
    partition ord79 values less than ('1998-07-01'),
    partition ord80 values less than ('1998-08-01'),
    partition ord81 values less than (MAXVALUE))

    lineitem
    订单明细表:订单key + 配件key + 供应商key + 流水号、数量、价格、折扣、税、明细状态、发货日期、预计到达日期、实际到达日期、运单处理策略(原返?拒收退回?等)、运输途径(火车、汽运、邮寄等)

    CREATE TABLE `lineitem` (
    `l_orderkey` bigint(20) NOT NULL,
    `l_partkey` bigint(20) NOT NULL,
    `l_suppkey` bigint(20) NOT NULL,
    `l_linenumber` bigint(20) NOT NULL,
    `l_quantity` bigint(20) NOT NULL,
    `l_extendedprice` decimal(10,2) NOT NULL,
    `l_discount` decimal(10,2) NOT NULL,
    `l_tax` decimal(10,2) NOT NULL,
    `l_returnflag` char(1) DEFAULT NULL,
    `l_linestatus` char(1) DEFAULT NULL,
    `l_shipdate` date NOT NULL,
    `l_commitdate` date DEFAULT NULL,
    `l_receiptdate` date DEFAULT NULL,
    `l_shipinstruct` char(25) DEFAULT NULL,
    `l_shipmode` char(10) DEFAULT NULL,
    `l_comment` varchar(44) DEFAULT NULL,
    PRIMARY KEY (`l_orderkey`, `l_linenumber`, `l_shipdate`, `l_partkey`),
    KEY `i_l_orderkey` (`l_orderkey`) LOCAL BLOCK_SIZE 16384
    ) partition by range columns(l_shipdate)
    subpartition by hash(l_partkey) subpartitions 64
    (partition item1 values less than ('1992-01-01'),
    partition item2 values less than ('1992-02-01'),
    partition item3 values less than ('1992-03-01'),
    partition item4 values less than ('1992-04-01'),
    ...
    ...
    partition item81 values less than ('1998-09-01'),
    partition item82 values less than ('1998-10-01'),
    partition item83 values less than ('1998-11-01'),
    partition item84 values less than (MAXVALUE))
    1
    总体上看,围绕销售数据可以做各种进销存查询,围绕客户数据,可以做各种销售分析。更多 BI 相关内容,参考 http://www.tpc.org/tpc_documents_current_versions/pdf/tpc-h_v2.17.3.pdf


    ---------------------
    作者:maray
    来源:CSDN
    原文:https://blog.csdn.net/maray/article/details/80450990
    版权声明:本文为博主原创文章,转载请附上博文链接!

  • 相关阅读:
    面试题3(百思教育面试软件开发岗位笔试题)
    python开发工具安装
    涉及 委托事件 程序运行越来越慢
    整理收藏
    数据库作业创建
    剑指offer-面试题37:序列化二叉树及二叉树的基本操作和测试
    剑指offer-面试题41:数据流中的中位数
    快速排序及其优化
    冒泡排序算法及相应的优化
    leetcode问题:缺失数字
  • 原文地址:https://www.cnblogs.com/klb561/p/10995086.html
Copyright © 2020-2023  润新知