SysBench长期以来一直被认为是衡量MySQL性能的实际标准。SysBench附带了几个预定义的基准测试。这些测试是用一种易于理解的脚本语言Lua编写的。其中一些测试称为:oltp_read_write、oltp_point_select、tpcc、oltp_insert。有十多个这样的脚本来模拟标准OLTP应用程序中的各种行为。
但是,如果您的应用程序不符合传统OLTP的模式怎么办?如何继续利用SysBench的负载测试、基准测试和结果分析功能?只需编写自己的lua脚本!
Sysbench API
首先,您创建的每个Lua脚本必须实现三个核心的SysBench Lua API函数。这些是thread_init,thread_done, 和event。您可以阅读下面代码中的注释,了解每个函数的含义以及内部发生的事情。
-- Called by sysbench one time to initialize this script
function thread_init()
-- Create globals to be used elsewhere in the script
-- drv - initialize the sysbench mysql driver
drv = sysbench.sql.driver()
-- con - represents the connection to MySQL
con = drv:connect()
end
-- Called by sysbench when script is done executing
function thread_done()
-- Disconnect/close connection to MySQL
con:disconnect()
end
-- Called by sysbench for each execution
function event()
-- If user requested to disable transactions,
-- do not execute BEGIN statement
if not sysbench.opt.skip_trx then
con:query("BEGIN")
end
-- Run our custom statements
execute_selects()
execute_inserts()
-- Like above, if transactions are disabled,
-- do not execute COMMIT
if not sysbench.opt.skip_trx then
con:query("COMMIT")
end
end
这一切都非常简单,应该在脚本中起到很好的模板作用。现在让我们看一下脚本的其余部分。
健康检查和选项
现在让我们进入核心代码。在顶部,您将看到以下部分:
if sysbench.cmdline.command == nil then
error("Command is required. Supported commands: run")
end
sysbench.cmdline.options = {
point_selects = {"Number of point SELECT queries to run", 5},
skip_trx = {"Do not use BEGIN/COMMIT; Use global auto_commit value", false}
}
第一部分是一个检查,以确保用户实际上想要运行这个测试。上面提到的其他测试脚本支持诸如prepare、run和cleanup等命令。我们的脚本只支持run,我们使用的数据由我们的核心应用程序预先填充。
第二部分允许脚本编写者让用户传递一些特定于测试脚本的选项。在上面的代码中,我们可以看到将在每个线程/迭代上运行的select语句数的选项(默认值为5),另一个选项允许用户根据需要禁用begin/commit(默认值为false)。如果您想要在脚本中进行更多的定制,只需添加更多的选项。稍后您将看到如何引用这些参数。
查询
现在是时候定义要在脚本中执行的自定义查询了。
-- Array of categories to be use in the INSERTs
localpage_types={"actor","character","movie"}
-- Array of COUNT(*) queries
localselect_counts={
"SELECT COUNT(*) FROM imdb.title"
}
-- Array of SELECT statements that have 1 integer parameter
localselect_points={
"SELECT * FROM imdb.title WHERE id = %d",
"SELECT * FROM imdb.comments ORDER BY id DESC limit 10",
"SELECT AVG(rating) avg FROM imdb.movie_ratings WHERE movie_id = %d",
"SELECT * FROM imdb.users ORDER BY RAND() LIMIT 1"
}
-- Array of SELECT statements that have 1 string parameter
localselect_string={
"SELECT * FROM imdb.title WHERE title LIKE '%s%%'"
}
-- INSERT statements
localinserts={
"INSERT INTO imdb.users (email_address, first_name, last_name) VALUES ('%s', '%s', '%s')",
"INSERT INTO imdb.page_views (type, viewed_id, user_id) VALUES ('%s', %d, %d)"
}
上面的代码定义了几个不同查询的数组/列表。为什么要这样做?稍后在代码中,我们将不得不解析每个SQL语句,并用随机生成的值填充/替换各种参数。每次重复SELECT * FROM fooTable WHERE id = 44对我们没有好处,现在是不是?当然不是。我们希望生成随机数,并让我们的查询从整个数据集中进行选择。
有些查询没有参数,有些查询基于整数,有些查询基于字符串。我们将在下面以不同的方式处理这些问题,这就是为什么它们在上面的不同数组中的原因。这种方法还允许将来扩展。当您想在脚本中运行其他查询时,只需向每个数组添加另一行;不需要更改任何其他代码。
解析和执行
下面的函数execute_selects将从父函数event调用,这是我们在本文前面讨论过的。您可以看到上面创建的三个选择类别的循环。内联注释应该有助于解释正在发生的事情。注意在下面的第二个循环中使用了用户提供的选项–point-selects,这是我们之前在“健康检查和选择”部分创建的。
function execute_selects()
-- Execute each simple, no parameters, SELECT
for i,oinipairs(select_counts)do
con:query(o)
end
-- Loop for however many queries the
-- user wants to execute in this category
for i=1,sysbench.opt.point_selects do
-- select random query from list
localrandQuery=select_points[math.random(#select_points)]
-- generate random id and execute
localid=sysbench.rand.pareto(1,3000000)
con:query(string.format(randQuery,id))
end
-- generate random string and execute
for i,oinipairs(select_string)do
localstr=sysbench.rand.string(string.rep("@",sysbench.rand.special(2,15)))
con:query(string.format(o,str))
end
end
这段代码还有两件事要提。首先,您将注意到使用sysbench.rand.pareto来生成一个介于1和3000000之间的随机数。对于我们的数据集,我们知道在所有与where id=?相关的查询中引用的每个表,至少有这么多行。这是取决于我们的数据,你的值肯定会有所不同。其次,注意使用sysbench.rand.string和string.rep.thestring.repsegment将生成一个由“@”符号组成的字符串,长度介于2到15个字符之间。然后将“@”符号的字符串传递到sysbench.rand.string,它将把每个“@”替换为随机的字母数字值。例如,“@@@@@@@”可以更改为“hk9edc”,然后将替换查询字符串(string.format)中的“%s”并执行。
处理写入
我们的insert语句需要值。同样,sysbench在每次迭代中从event调用函数execute_inserts。在在execute_inserts中,我们使用上面描述的内置函数生成一些假字符串数据。
然后将这些字符串格式化为SQL并执行。
function create_random_email()
localusername=sysbench.rand.string(string.rep("@",sysbench.rand.uniform(5,10)))
localdomain=sysbench.rand.string(string.rep("@",sysbench.rand.uniform(5,10)))
return username.."@"..domain..".com"
end
function execute_inserts()
-- generate fake email/info
localemail=create_random_email()
localfirstname=sysbench.rand.string("first-"..string.rep("@",sysbench.rand.special(2,15)))
locallastname=sysbench.rand.string("last-"..string.rep("@",sysbench.rand.special(2,15)))
-- INSERT for new imdb.user
con:query(string.format(inserts[1],email,firstname,lastname))
-- INSERT for imdb.page_view
localpage=page_types[math.random(#page_types)]
con:query(string.format(inserts[2],page,sysbench.rand.special(2,500000),sysbench.rand.special(2,500000)))
end
运行示例
$sysbenchimdb_workload.lua\
--mysql-user=imdb --mysql-password=imdb\
--mysql-db=imdb --report-interval=1\
--events=0 --time=0 run
WARNING:Both event and time limit sare disabled,running an endless test
sysbench1.0.17(usingsystemLuaJIT2.0.4)
Running the test with following options:
Number of threads:1
Report intermediate results every 1 second(s)
Initializing random number generator from current time
Initializing workerthreads...
Threads started!
[1s]thds:1tps:15.96qps:177.54(r/w/o:112.71/31.92/32.91)lat(ms,95%):158.63err/s:0.00reconn/s:0.00
[2s]thds:1tps:15.01qps:169.09(r/w/o:109.06/30.02/30.02)lat(ms,95%):137.35err/s:0.00reconn/s:0.00
[3s]thds:1tps:26.00qps:285.00(r/w/o:181.00/52.00/52.00)lat(ms,95%):108.68err/s:0.00reconn/s:0.00
[4s]thds:1tps:15.00qps:170.00(r/w/o:108.00/32.00/30.00)lat(ms,95%):164.45err/s:0.00reconn/s:0.00
至此,我们完成了基于应用程序和数据集的自定义查询。大多数SysBench参数都是不言而喻的,但是让我来谈谈–report-interval=1,它每1秒显示一次统计信息。通常,sysbench在运行结束之前不会输出统计信息,但是示例执行将永远运行(–events=0 –time=0),因此我们需要统计信息来显示所有时间。您可以根据自己的喜好调整参数。例如,如果您只想运行一个测试5分钟,请设置–events=0 –run-time=300。
结论
SysBench是一个设计非常好的应用程序,它允许您使用预先定义的和自定义的查询来加载测试您的MySQL实例。使用Lua脚本语言,您可以创建几乎任何场景来满足您的需求。