需求:统计父文件夹包含子文件夹的文件个数。
最早是用Java代码实现的递归查询,本地测试没注意性能,正式上线后执行查询竟然用了40s,一口老血喷出来……
需要对查询做性能优化,于是想到了mysql的递归。
具体实现
DELIMITER //
CREATE FUNCTION getChildFileIds(orgid int, comid int) RETURNS varchar(10000) CHARSET utf8
Begin
DECLARE oTemp varchar(10000);
DECLARE oTempChild varchar(4000);
set oTemp = '';
set oTempChild = CAST(orgid AS CHAR);
While oTempChild is not null
DO set oTemp = CONCAT(oTemp, ',', oTempChild);
select GROUP_CONCAT(id) into oTempChild from file_info
where company_id = comid and FIND_IN_SET(pId, oTempChild) > 0 and status = 0;
End while;
return oTemp;
END //
DELIMITER ;
解释说明
1、DELIMITER //:定义结束符。MySQL默认的结束符是分号,但是函数体中可能用到分号。在命令行中创建自定义函数,为了避免冲突,需要使用DELIMITER //,也可以使用$$替代//。
2、CREATE FUNCTION:创建函数getChildFileIds,函数的参数是orgid(要查询的父节点id)和comid(公司id),返回值是varchar(10000)。
3、函数体放在 BEGIN 与 END 之间。
4、DECLARE:声明变量。
5、CONCAT:使用逗号将oTemp和oTempChild拼接。
6、GROUP_CONCAT:返回带有来自一个组的连接的非NULL值的字符串结果,缺省为一个逗号,默认以逗号拼接。
7、FIND_IN_SET(pId, oTempChild):pId为要查询的字段,oTempChild则以“,”分隔,如(1,2,3,4),表示在oTempChild中查找包含pId的结果,返回结果null或记录。
8、RETURN:返回拼接后的字符串oTemp。
查询结果
select getChildrenFileIds(2438, 2389) from file_info where id = 2438;
select id, pId, file_name, file_type from file_info
where FIND_IN_SET(id, getChildrenFileIds(2033, 2389));
优化结果
经测试,本地7s左右压缩到670ms左右,重新上线后,由于客户上传的文件实在太多,优化后仍然需要5s左右,但相比早先的40s快上很多,在可以接受的范围。