TPC-H on Hive

TPC-H是数据库/数据仓库选型决策用的benchmark。它是世界公认的benchmark,由一套面向业务的数据查询和并发数据更新组成。百度文库里有个文档写的还不错。

 

Jia, Yuntao在HIVE-600中提交了TPC-H的hive driver。Driver由shell脚本作为bootstrap,由一系列HQL文件组成,总共22个benchmark。Driver中并不包含原始数据,需要使用TPC-H的DBGEN生成。

你可能感兴趣的:(hive,performance,Benchmark)