MySQL的经典用法(三)----海量数据统计处理,模拟物化视图

http://liuxinglanyue.iteye.com/blog/852048

一 物化视图 
    物化视图,它是用于预先计算并保存表连接或聚集等耗时较多的操作的结果,这样,在执行查询时,就可以避免进行这些耗时的操作,而从快速的得到结果。 
    只有大型数据库oracle10g,db2才支持这个功能,而MySQL5.1暂时还没有这个功能。本人通过事件调度和存储过程模拟了物化视图。下面大家一起来讨论吧。^-^ 

二 准备知识 
    1)存储过程:玩过数据库的人,都知道他是啥~,~ 
    2)事件调度:在MySQL5.1开始才有的新功能。说白了就是个定时器。跟java里的timer差不多。

Sql代码    收藏代码
  1. show processlist; --这个命令能是查看线程,如果启动了时间调度器,则会多个event_scheduler  
  2. set global event_scheduler = on--启动时间调度器,关闭就不用我说了吧,off就可以了  
  3. show processlist\G;--查看线程,是不是多了个 User: event_scheduler  
  4.   
  5. --如果想启动单个事件,则执行下面命令  
  6. ALTER EVENT `myEvent`   
  7. ON COMPLETION PRESERVE   
  8. ENABLE;  
  9. --关闭  
  10. ALTER EVENT `myEvent`   
  11. ON COMPLETION PRESERVE   
  12. DISABLE;  

mysql默认不会启动event,所以需要修改你的my.ini或my.cnf[mysqld]的下面加入如下行

event_scheduler=1

三 模拟物化视图 
    1)先建个基表吧。

Sql代码    收藏代码
  1. CREATE TABLE `user` (  
  2.   `Id` int(11) NOT NULL AUTO_INCREMENT,  
  3.   `namevarchar(255) DEFAULT NULL,  
  4.   `age` int(11) DEFAULT NULL,  
  5.   PRIMARY KEY (`Id`)  
  6. );  



    2)设计视图 
我想查询所有18岁员工的数量。 
很简单,select count(*) from user where age=18; 
如果是传统概念的视图,在MySQL中,每次访问视图的时候,他都会创建个临时表,然后执行一次。在海量数据的情况下,这样的效率是非常低的。而物化视图,则他会定时去刷新这个临时表,而不是你在用的时候才会去刷新。并且物化视图的"临时表"是一直存在的。所以效率高出非常多。拿空间换时间^-^ 

    3)创建"物化视图"的表

Sql代码    收藏代码
  1. CREATE TABLE `user_view` (  
  2.   `Id` int(11) NOT NULL AUTO_INCREMENT,  
  3.   `c` int(11) DEFAULT NULL,  
  4.   PRIMARY KEY (`Id`)  
  5. );  


    4)设计存储过程

Sql代码    收藏代码
  1. CREATE PROCEDURE demoSp()  
  2. BEGIN  
  3.     DECLARE z INT;  
  4. SELECT COUNT(*) INTO z FROM user;  
  5. delete from user_view;  
  6. insert into user_view(c) values(z);  
  7. END;  



    5)设计调度并执行,为了使实验明显,我就把调度设置成5秒一次吧。周期可以自己调节。

Sql代码    收藏代码
  1. CREATE EVENT `myEvent`   
  2. ON SCHEDULE EVERY 5 SECOND   
  3. ON COMPLETION PRESERVE   
  4. DO call demoSp();  



四 总结 
    上面的实现,可能不太明显,但在海量数据处理的时候进行统计,性能有明显的提升。大家做实验的时候,可以增加一个insert语句,方便观察。在更新数据的时候,如果数据量大,则需要按下面步骤来处理 
1)delete 1条记录 
2)insert 1条记录 
3)提交 
    如果一次性把数据全部删除,在查询的时候,有可能会出现空表的现象。而且会影响统计使用。 
    通过利用这个事件调度,定时备份的事情也同时解决了.

    建议大家配合表分区,索引同时使用,这样可以提高性能.

未完成:在更新表的时候,需要采用某种算法来执行,这样才能提高性能,而不是单纯的删除再插入.



http://www.iteye.com/topic/727676


你可能感兴趣的:(sql,数据库,mysql,user,insert,oracle10g)