pankuo1

PLSQL性能优化建议

了解PLSQL程序性能

影响性能常见原因

1.尽量使用存储过程，避免使用PL/SQL匿名块

存储过程创建后，oracle会对其进行语法句法分析，以编译的形式存储在数据库中，当客户端调用时，只需要发送一条调用指令，避免了匿名块在网上传送大量源代码，降低了网络通信的负担，同时因为仅在创建时编译一次，因此提升了程序运行的性能.

2.编写共享SQL语句

oracle在执行SQL语句时，在第一次解析后，会将SQL语句放在位于系统全局区SGA中的共享池中,这块内存区域可以被所有的数据库用户共享，因此在执行一个SQL语句时，比如在PL/SQL语句中的游标执行SQL语句,如果oracle检测到它和以前已运行过的语句相同,就会使用已经被解析的语句,使用最优的执行路径.

oracle在执行一条SQL语句时，总是会先从共享内存区中查找相同的sql语句，但是由于oracle只对简单表进行缓存，因此对于多表连接查询并不适用.

SELECT * FROM EMP;

SELECT * from EMP;

Select * from Emp;

SELECT * FROM EMP;

为了避免这类SQL语句，在编写SQL语句时，必须注意采用大小写一致的约定，关键字，保留字大写，用户声明的标识符小写，通过设计自己的编写约定并遵守这些约定，使要处理的语句与共享池中的相一致，有助于运行性能的提高.

3.使用BINARY_INTEGER 和 PLS_INTEGER声明整型

在PLSQL编程中要声明变量类型时，应该总是使用BINARY_INTEGER 和 PLS_INTEGER，避免过多地依赖于number类型，因为前者提供了较快的性能.

4.在过程中传递大数据参数时使用NOCOPY编译提示

当创建过程或函数时，IN模式总是传递指针，而OUT和IN OUT传递的则是值的副本,也称为传值传递。当涉及较大容量的参数传递时，会严重降低性能，此时应该考虑使用NOCOPY编译提示来按引用传递参数，参数的大小越大，效果就越明显.

例如，假定有过程具有一个IN OUT类型的参数，默认情况下会按值进行传递，下面的例子演示对这个过程进行多次调用，并传递一个较大的索引表参数，如果不使用NOCOPY，则会严重降低性能。

使用NOCOPY提升性能

declare

type test_tb1 is table of pls_integer index by pls_integer; --定义索引表类型

test_tb1 test_tb1_type; --定义索引表类型的变量

--定义内嵌子程序，在IN OUT 参数中使用NOCOPY提示来按引用传递

procedure test (arg_cnt in pls_integer，arg_tb1 in out nocopy test_tb1_type)

begin

for cnt_test in test_tb1.first .. arg_tb1.last --依循环索引表

loop

arg_tb1 (cnt_test):=arg_tb1 (cnt_test) + arg_cnt;

end loop; --为形式参数表赋值

end;

begin

for cnt in 0 .. 10000

loop

test_tb1 (cnt) := cnt;

end loop;

for cnt in 0 .. 10000

loop

test (cnt,test_tb1);

end loop;

end;

5.使用returning获取返回值

在使用DML语句处理对象行的数据时，如果要获取行的返回值，应该总是使用returning子句，以便减少对SQL的执行次数，提高执行的效率:

insert into .. value (..) returning col1 into :col1;

update .. set .. returning col1 into :col1;

delete .. returning col1 into :col1;

使用returning 不仅可以返回多列数据,也可以返回数据保存到数组等数据类型中:

returning col1，col2 into :col1，:col2;

returning col1 into :col1_array;

6.避免使用动态SQL语句

动态sql语句虽然提供了编程上的便利性，但是过多的使用动态sql语句会严重的降低PLSQL应用程序的性能，因此如无必要，应该总是考虑使用静态的sql语句。如果不得不使用动态sql语句，则应该总是选择使用本地动态sql语句，即execute immediate 或open for 而不要使用dbms_sql，因为dbms_sql不光编写代码较复杂，而且性能不如本地动态sql语句。

7.尽量使用bulk批处理

如果操作涉及大量的数据，则可以通过把大量的数据进行一次性处理来提升性能，比如可以将数据放到索引表，嵌套表和变长数组中，通过forall或bulk collect into 等批处理语句，一次性处理大的数据量，提升性能。

使用bulk collect into语句将emp表中所有的数据一次性插入到索引表变量中，当数据量特别大时，能显著的提高性能

使用批处理一次性获取所有数据

declare

type emp_tb1 is table of emp%ROWTYPE index by pls_integer; --定义索引表类型

emp_tb1 emp_tb1_type;

cursor emp_cur

select * from emp;

begin

open emp_cur;

fetch emp_cur

bulk collect into emp_tb1;

close emp_cur;

end;

通过使用bulk collect into子句，一次性将所有的游标数据提取到索引表变量中，提升了程序的执行性能，也节省了代码的编写量。因此只要有可能，应尽量使用批处理来完成数据的处理工作。

使用DBMS_PROFILER包

1.安装DBMS_PROFILER包

在使用DBMS_PROFILER之前，必须要以管理员身份进入数据库系统进行安装。

conn system/manager as sysdba;

desc dbms_profiler;

如果desc命令提示dbms_profiler包不存在，则需要使用如下命令进行安装:

sql>@?/rdbms/admin/profload.sql

再次运行desc dbms_profiler，可以看到这个包中包含的子程序的信息，使用的函数主要有两个:

start_profiler 启动profiler

stop_profiler 停止profiler

2.配置profiler方案

创建一个用来存放跟踪信息的用户，以及profiler相关的表的同义词:

create user profiler indentified by 123456;

grant connect，resource to profiler;

create public synonym plsql_profiler_runs for profiler.plsql_profiler_runs;

create public synonym plsql_profiler_units for profiler.plsql_profiler_units;

create public synonym plsql_profiler_data for profiler.plsql_profiler_data;

create public synonym plsql_profiler_runnumber for profiler.plsql_profiler_runnumber;

3.配置profiler表

conn profiler/123456

@?/rdbms/admin/proftab.sql

grant select on plsql_profile_runnumber to public;

grant select，insert，update，delete on plsql_profiler_data to public;

grant select，insert，update，delete on plsql_profiler_units to public;

grant select，insert，update，delete on plsql_profiler_runs to public;

plsql_profile_runnumber 保存了profiler的运行信息

plsql_profiler_data 保存每个单元的profiler信息

plsql_profiler_units 保存了每个单元的详细数据

plsql_profiler_runs 用来生成profiler唯一运行编号的序列

4.执行profiler获取配置信息

在创建了过程之后，就可以使用profiler来检测程序代码。

创建要被测试的过程

create table pro_tst_table (a int);

create or replace procedure sp_test

begin

for i in 1 .. 10000

loop

insert into pro_tst_table values(i);

end loop;

commit;

end;

使用dbms_profiler来测试包

declare

v_run_number integer;

v_temp1 integer;

begin

--启动profiler

sys.DBMS_PROFILER.start_profiler(run_number => v_run_number);

--显示当前跟踪的运行序号(后面查询要用)

dbms_output.put_line('run_number:'||v_run_number);

--运行要跟踪的PLSQL

sp_test;

--停止profiler

sys.DBMS_PROFILER.stop_profiler;

end;

5.查询profiler获取结果

要使用sql语句查询本次执行的信息，可以先查询plsql_profiler_runs获取本次执行的基本信息:

select runid，run_owner，run_date,run_total_time from plsql_profiler_runs;

笔者运行了两次代码，因此具有两个runid的记录，ID值是通过序列号生成的，最大ID值表示最近一次的执行.

RUN_TOTAL_TIME表示执行的时间，可以看到两次执行的时间具有明显的不同.

通过查询plsql_profiler_units表可以得到本次profile时的单元信息。

通过查询plsql_profiler_data表，可以根据行号和单元号获得执行的存储过程的每一行的统计信息。

使用DBMS_TRACE包

比如看到子程序的执行顺序，则可以使用DBMS_TRACE包，该包的使用过程与使用DBMS_PROFILER类似，一个主要区别在于dbms_trace可以设定需要跟踪的事件:调用，异常，SQL甚至每一个PLSQL代码的可运行。有了这些信息的辅助，可以非常迅速地定位后台程序流程的异常.

包中有如下两个函数:

set_plsql_trace:开启跟踪统计数据的收集。

clear_plsql_trace:停止跟踪统计数据的收集

1.配置与使用DBMS_TRACE

在使用之前，需要先配置一下dbms_trace所使用的数据表，并使得所有的用户都能够向这些表中写入数据，

conn system/manager as sysdba

@？/rdbms/admin/tracetab.sql

脚本创建了两个表和一个序列

plsql_trace_runs表:用来记录每一次的跟踪信息。

plsql_trace_events表:用来记录所有跟踪的详细数据

plsql_trace_runnumber序列:用于生成唯一运行号的序列.

2.在成功地创建了所需要的表之后，接下来需要为相应的表创建同义词，并为之分配可访问的权限，以便于public角色的用户能够对相应的表进行操作。

create or replace public synonym plsql_trace_runs for sys.plsql_trace_runs;

create or replace public synonym plsql_trace_events for sys.plsql_trace_events;

create or replace public synonym plsql_trace_runnumber for sys.plsql_trace_runnumber;

grant select,insert,update,delete on plsql_trace_events to public;

grant select,insert,update,delete on plsql_trace_runs to public;

grant select on plsql_trace_runnumber to public;

创建dbms_trace测试程序

create or replace procedure do_something (p_times in number)

1_dummy number;

begin

for i in 1 .. p_times

loop

select 1_dummy + 1 into 1_dummy from dual;

end loop;

end;

使用dbms_trace跟踪程序

declare

1_result binary_integer;

begin

--跟踪所有的调用

dbms_trace.set_plsql_trace(dbms_trace.trace_all_calls);

do_something(100);

--停止PLSQL跟踪

dbms_trace.clear_plsql_trace;

--跟踪所有的sql语句

dbms_trace.set_plsql_trace(dbms_trace.trace_all_sql);

do_something(100);

--停止跟踪

dbms_trace.clear_plsql_trace;

--跟踪所有行数据

dbms_trace.set_plsql_trace(dbms_trace.trace_all_lines);

do_something(100);

dbms_trace.clear_plsql_trace;

end;

对于每一次调用，都首先使用set_plsql_trace开始跟踪的过程，该过程的参数DBMS_TRACE_trace_all_calls是指定用来跟踪调用或返回值的常量。

在DBMS_TRACE包的包规范中包含了set_plsql_trace可供使用的常量的列表及详细的解释。

通过查询plsql_trace_runs表，来获取每一次跟踪的信息。

PLSQL性能优化技巧

oracle数据库在执行sql语句时，oracle的优化器会根据一定的规则确定sql语句的执行路径，以确保sql语句能以最优性能执行.在oracle数据库系统中为了执行sql语句，oracle可能需要实现多个步骤，这些步骤中的每一步可能是从数据库中物理检索数据行，或者用某种方法准备数据行，让编写sql语句的用户使用，oracle用来执行语句的这些步骤的组合被称为执行计划。

当执行一个sql语句时oracle经过了4个步骤:

解析sql语句:主要在共享池中查询相同的sql语句，检查安全性和sql语法与语义。

创建执行计划及执行:包括创建sql语句的执行计划及对表数据的实际获取。

显示结果集:对字段数据执行所有必要的排序，转换和重新格式化。

转换字段数据:对已通过内置函数进行转换的字段进行重新格式化处理和转换.

查看sql语句的执行计划，比如一些第三方工具需要先执行utlxplan.sql脚本创建explain_plan表。

@？/rdbms/admin/utlxplan.sql

set autotrace on explain:执行sql，且仅显示执行计划

set autotrace on statistics:执行sql 且仅显示执行统计信息

set autotrace on :执行sql，且显示执行计划与统计信息，无执行结果

set autotrace traceonly:仅显示执行计划与统计信息，无执行结果

set autotrace off:关闭跟踪显示计划与统计

set autotrace on explain

col ename format a20;

select empno，ename from emp where empno=7369;

理解执行计划

1.全表扫描:这种方式会读取表中的每一条记录，顺序地读取每一个数据块直到结尾标志，对于一个大的数据表来说，使用全表扫描会降低性能，但有些时候，比如查询的结果占全表的数据量的比例比较高时，全表扫描相对于索引选择又是一种较好的办法。

2.通过ROWID值获取：行的rowid指出了该行所在的数据文件，数据块及行在该块中的位置，所以通过rowid来存取数据可以快速定位到目标数据上，是oracle存取单行数据的最快方法。

3.索引扫描：先通过索引找到对象的rowid值，然后通过rowid值直接从表中找到具体的数据，能大大提高查找的效率。

连接查询的表顺序

默认情况下，优化器会使用all_rows优化方式，也就是基于成本的优化器CBO生成执行计划，CBO方式会根据统计信息来产生执行计划.

统计信息给出表的大小，多少行，每行的长度等信息，这些统计信息起初在库内是没有的，是做analyee后才发现的，很多时候过期统计信息会令优化器做出一个错误的执行计划，因此应及时更新这些信息。

在CBO模式下，当对多个表进行连接查询时，oracle分析器会按照从右到左的顺序处理from子句中的表名。例如：

select a.empno，a.ename，c.deptno，c.dname，a.log_action from emp_log a,emp b,dept c

在执行时，oracle会先查询dept表，根据dept表查询的行作为数据源串行连接emp表继续执行，因此dept表又称为基础表或驱动表。由于连接的顺序对于查询的效率有非常大的影响。因此在处理多表连接时，必须选择记录条数较少的表作为基础表，oracle会使用排序与合并的方式进行连接。比如先扫描dept表，然后对dept表进行排序，再扫描emp表，最后将所有检索出来的记录与第一个表中的记录进行合并。

如果有3个以上的表连接查询，就需要选择交叉表作为基础表。交叉表是指那个被其他表所引用的表，由于emp_log是dept与emp表中的交叉表，既包含dept的内容又包含emp的内容。

select a.empno，a.ename，c.deptno，c.dname，a.log_action from emp b,dept c,emp_log a;

指定where条件顺序

在查询表时，where子句中条件的顺序往往影响了执行的性能。默认情况下，oracle采用自下而上的顺序解析where子句，因此在处理多表查询时，表之间的连接必须写在其他的where条件之前，但是过滤数据记录的条件则必须写在where子句的尾部，以便在过滤了数据之后再进行连接处理，这样可以提升sql语句的性能。

避免使用*符号

使用decode函数

比如统计emp表中部门编号为20和部门编号为30的员工的人数和薪资汇总，如果不使用decode那么就必须用两条sql语句

select count(*)，SUM(sal) from emp where deptno=20;

union

select count(*)，SUM(sal) from emp where deptno=30;

上面进行了两次全表扫描

通过decode语句，可以再一个sql查询中获取到相同的结果，并且将两行结果显示为单行。

select count (decode (deptno，20，'X'，NULL)) dept20_count，

count (decode (deptno，30，'X'，NULL)) dept30_count，

SUM (decode (deptno，20，sal，NULL)) dept20_sal，

sum (decode (deptno，30，sal，NULL)) dept30_sal from emp;

上面只进行了一次全表扫描

通过灵活的运用decode函数，可以得到很多意想不到的结果，比如在group by 或order by子句中使用decode函数，或者在decode块中嵌套另一个decode块。

使用where而非having

where子句和having子句都可以过滤数据，但是where子句不能使用聚集函数，如count max min avg sum等函数。

例子：

select empno,deptno，sum(sal) from emp group by empno，deptno

having sum(sal) > 1000 and deptno in (20，30);

在having子句中，过滤出部门编号为20或30的记录，实际上这将导致查询取出所有部门的员工记录，在进行分组计算，最后才根据分组的结果过滤出部门 20和30的记录。这非常低效，好的算法是先使用where子句取出部门编号为20和30的记录，再进行过滤。

select empno，deptno，sum(sal) from emp where deptno in （20,30）

group by empno，deptno having sum (sal) > 1000;

使用UNION而非OR

如果要进行OR运算的两个列都是索引列，可以考虑使用union来提升性能。

例子：比如emp表中，empno和ename都创建了索引列，当需要在empno和ename之间进行OR操作查询时，可以考虑将这两个查询更改为union来提升性能。

select empno，ename，job，sal from emp where empno > 7500 OR ename LIKE 'S%';

使用UNION

select empno，ename，job，sal from emp where empno > 7500

UNION

select empno，ename，job，sal from emp where ename LIKE 'S%';

但这种方式要确保两个列都是索引列。

如果坚持使用OR语句，需要记住尽量将返回记录最少的索引列写在最前面，这样能获得较好的性能，例如empno > 7500 返回的记录要少于对ename的查询，因此在OR语句中将其放到前面能获得较好的性能。另外一个建议是在要对单个字段值进行OR计算的时候，可以考虑使用IN来代替

例如下面的

select empno，ename，job，sal from emp where deptno=20 OR deptno=30;

使用exists而非IN

比如查询位于芝加哥的所有员工列表可以考虑使用IN

select * from emp where deptno IN (

select deptno from dept where loc='CHICAGO');

替换成

select * from emp where exists (

select deptno from dept where loc='CHICAGO');

同样的替换页发生在not in 和not exists之间，not in 子句将执行一个内部的排序和合并，实际上它对子查询中的表执行了一次全表扫描，因此效率低，在需要使用NOT IN的场合，英爱总是考虑把它更改成外连接或NOT EXISTS

select * from emp where deptno NOT IN (

select deptno from dept where loc='CHICAGO');

为了提高较好的性能，可以使用连接查询

select a.* from emp a，dept b where a.deptno=b.deptno and b.loc <> 'CHICAGO';

最有效率的

select a.* from emp a where NOT EXISTS (

select 1 from dept b where a.deptno =b.deptno and loc='CHICAGO');

避免低效的PL/SQL流程控制语句

PLSQL在处理逻辑表达式值的时候，使用的是短路径的计算方式。

declare

v_sal number:=&sal;

v_job varchar2(20):=&job;

begin

if (v_sal > 5000 ) OR (v_job = '销售')

then

dbms_output.put_line('符合匹配的OR条件');

end if;

end;

首先对第一个条件进行判断，如果v_sal大于5000，就不会再对v_job条件进行判断，灵活的运用这种短路计算方式可以提升性能。应该总是将开销较低的判断语句放在前面，这样当前面的判断失败时，就不会再执行后面的具有较高开销的语句，能提升PL/SQL应用程序的性能.

举个例子，对于and逻辑运算符来说，只有左右两边的运算为真，结果才为真。如果前面的结果第一个运算时false值，就不会进行第二个运算、

declare

v_sal number:=&sal;

v_job varchar2(20):=&job;

begin

if (check_sal(v_sal) > 5000) AND (v_job = '销售') --判断执行条件

then

dbms_output.put_line('符合匹配的and条件');

end if;

end;

这段代码有一个性能隐患，check_sal涉及一些业务逻辑的检查，如果让check_sal函数的调用放在前面，这个函数总是被调用，因此处于性能方面的考虑，应该总是将v_job的判断放到and语句的前面.

declare

v_sal number:=&sal;

v_job varchar2(20):=&job;

begin

if (v_job='销售') and (check_sal(v_sal) > 5000)

then

dbms_output.put_line('符合匹配的and条件');

end if;

end;

避免隐式类型转换

你可能感兴趣的:(oracle,数据库,源代码,sql语句)

Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
Redis 有哪些危险命令？如何防范？花小疯 redis 缓存数据库危险命令大数据
Redis有哪些危险命令？Redis的危险命令主要有以下几个：1.keys客户端可查询出所有存在的键。2.flushdb删除Redis中当前所在数据库中的所有记录，并且此命令从不会执行失败。3.flushall删除Redis中所有数据库中的所有记录，不止是当前所在数据库，并且此命令从不会执行失败。4.config客户端可修改Redis配置。怎么禁用和重命名危险命令？看下redis.conf默认配置
KVM虚拟机源代码分析【转】 xidianjiapei001 #虚拟化技术
1.KVM结构及工作原理1.1KVM结构KVM基本结构有两部分组成。一个是KVMDriver，已经成为Linux内核的一个模块。负责虚拟机的创建，虚拟内存的分配，虚拟CPU寄存器的读写以及虚拟CPU的运行等。另外一个是稍微修改过的Qemu，用于模拟PC硬件的用户空间组件，提供I/O设备模型以及访问外设的途径。KVM基本结构如图1所示。其中KVM加入到标准的Linux内核中，被组织成Linux中标准
【Golang】 Golang 的 GORM 库中的 Rows 函数不爱洗脚的小滕 golang 开发语言后端
文章目录前言一、Rows函数解释二、代码实现三、总结前言在使用Go语言进行数据库操作时，GORM（GoObject-RelationalMapping）库是一个常用的工具。它提供了一种简洁和强大的方式来处理数据库操作。本文将介绍GORM库中的Rows函数，这是一个用于执行原生SQL查询并返回结果的函数。一、Rows函数解释在GORM库中，Rows函数用于执行原生SQL查询并返回*sql.Rows结
接口测试如何设计测试用例李蕴Ronnie
接口测试用例设计方式针对每个必填参数，都设计一条参数为空的测试用例必填参数不存在传的参数值在数据库中不存在添加数据接口，传入已有的数据重复添加编辑数据接口，各个字段分别编辑，合并编辑参数数据类型限制，针对每个参数设计一条参数值类型不符合的逆向用例参数自身取值范围，针对所有参数，设计一条每个参数值在取值范围内最大值的正向测试用例是否满足前提条件（token、headers），几个前提条件几条用例针对
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
Scanpy源码浅析之pp.normalize_total 何物昂
版本导入Scanpy,其版本为'1.9.1'，如果你看到的源码和下文有差异，其可能是由于版本差异。importscanpyasscsc.__version__#'1.9.1'例子函数pp.normalize_total用于Normalizecountspercell，其源代码在scanpy/preprocessing/_normalization.py我们通过一个简单例子来了解该函数主要功能:将一
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite