l1t

经济普查全国数据库备份方案的选择研究

　　在经济普查数据处理过程中，为了各专业调查组能顺利地对本专业的数据进行审核汇总等操作，确保数据处理系统数据库的安全，可靠，并在意外发生时能尽快恢复到最近可用的状态，必须做好经常性数据备份。同时，为了充分利用现有的设备能力，我们需要定时进行不同服务器之间数据迁移，然后执行不同的任务，这也要通过导出/导入的办法实现。

　　国家和省级经济普查机构数据处理采用的数据库平台是运行在HP－UX操作系统上的Oracle9i数据库，因此，数据库的备份方案围绕0racle数据库展开讨论。

ORACLE数据库有两类备份方法。

第一类为物理备份，该方法实现数据库的完整恢复，但数据库必须运行在归档模式下（业务数据库在非归档模式下运行），且需要大容量的外部存储设备，例如磁带库；

第二类备份方式为逻辑备份，业务数据库采用此种方式，此方法不需要数据库运行在归档模式下，不但备份简单，而且可以不需要外部存储设备。

ORACLE数据库的逻辑备份分为三种模式：表备份、用户备份和完全备份。

这里不准备深入讨论三种逻辑备份的区别，有关知识请参看参考资料1。

逻辑备份及恢复是通过ORACLE提供的命令行工具EXP和IMP结合使用实现的。

参考资料1在第8章有对于EXP和IMP工具的详尽介绍和分析，我这里提到的仅仅是最常用的几个用法。

可以说由EXP导出的dmp文件的唯一用途就是用IMP进行数据的导入，但这两个命令的运行时间是很不对称的。

备份和恢复是一个整体的过程，如果是防止系统故障时数据丢失的目的，当然是希望恢复的次数越少越好，哪怕所有的备份都派不上用场。这个时候安全是第一位的。

如果是数据迁移的目的，比如从A用户到B用户，C服务器到D服务器，而且这种迁移的频率还不低，那么时间因素就值得考虑。

根据以往的经验，导入、导出无非是两种情况，一种是内部格式交换，另一种是和外部文本文件交换。

第一种：EXP导出dmp文件，IMP导入。

第二种：自己编写脚本导出文本文件，用SQLLDR工具导入。

影响导出的因素，第一是数据量，第二是复杂程度。如果要求只导出符合某些条件的数据，一般比无条件导出要费时。

影响导入的因素，第一是数据量，第二是复杂程度。如果导入的数据库有各种约束，导入时必然要增加检查的时间，如果有索引需要更新，也要额外的时间和资源。

先介绍一下我面对的数据库的情况，每个Oracle账号(用户名)下有一致的模式，分别是53个记录比较多的基本表和若干由基本表计算得出的尺寸较小的汇总表，由于汇总表的数据依赖于基本表，随之而变，所以基本表是备份的重点，

MAIN_TABLE是主表，其他表通过UUID等关键字和MAIN_TABLE及其他另外的表进行关联，带行代码的表有一个由UUID、CATE_ITEM_CODE和CYC_CODE组合而成的主键约束，

其他不带行代码的表有一个由UUID和CYC_CODE组合而成的主键约束，MAIN_TABLE除了UUID的主键约束外还具有5个索引。

一组典型的基本表记录列表如下,其中，表名中带_SUB的是带行代码的二维表。

"MAIN_TABLE" 7171639 行 772 M

"J601" 5167505 行 1.737 GB

"J602" 2003971 行 567.4M

"JB603" 275534 行 20.86M

"JB603_JB603_SUB3" 536592 行 45.57M

"JB606_JB606_SUB1" 5301882 行 342 M

"JE621_JE621_SUB4" 7664234 行 382.1M

"JE622" 52343 行 9.813M

"JG627" 1795368 行 216.8M

总计 7.3 GB

从列表中可以看出，基层表的数据量确实较大，如何快速备份及恢复（导出及导入）是需要认真研究的。

基于应用程序导入性能的要求，数据库运行在非归档模式，而且在一个阶段中（经常超过10天）不可停止数据库进行维护操作，因此物理备份不能采用。

一、Exp/imp命令组合

因为在数据整理阶段，基本表需要进行经常的改错工作，所以需要每日备份。为了能够尽快将数据恢复到某一时间点，我们采用每日执行一次特定用户的53个基本表的完全备份。

exp tom/tom file=tom.dmp log=tom.log parfile=tables.par direct=y indexes=n

从上述命令行可以看出，我们既指定了用户，又指定了表，参数文件tables.par中列出了所有需要备份的基本表表名。

direct=y参数使Oracle采用直接路径，它能有效地改善导出速度，所用时间从21分缩短到17分。对于7G字节的数据量来说，这样的导出时间已经是令人非常满意的了。

导入，我们尝试过4种命令参数

方法A1

因为原始库分别在2个用户的基本表中。

因此需要分别导入，一次导入一个用户，串行执行。

导入所用时间:20:39-10:50=9小时49分

方法A2

人工并行处理，为了利用4个CPU的能力，修改参数文件将53个基本表划分为4组，用unix的&命令移到后台并行执行。

exp I0809/I0809@118 file=I0809-p1.dmp log=I0809-p1.log parfile=tables-p1.par direct=y indexes=n &

…

exp I0809/I0809@118 file=I0809-p4.dmp log=I0809-p4.log parfile=tables-p4.par direct=y indexes=n &

如果要关闭telnet客户端，需要把上述命令保存到批处理文件a.bat ，用 nohup sh a.bat &执行。

imp I0809/I0809 file=I08091202-p1.dmp parfile=tables-p1.par ignore=y log=impI08091202-p1.log &

…

imp I0809/I0809 file=I08091202-p4.dmp parfile=tables-p4.par ignore=y log=impI08091202-p4.log &

如果要关闭telnet客户端，需要把上述命令保存到批处理文件b.bat ，用 nohup sh b.bat &执行

导入所用时间=次日10:09-16:50=17小时19分。

方法A3

根据传统的经验，如果导入数据不及时提交将会占用较大的回滚段，降低速度，所以应该用commit=y参数。可是，对于这个数据库，即使把buffer设为4096000的大值，commit=y参数也大大增加了所用时间。这里I0809用户已经建好了模式，分别是53个基本表和若干计算表，并且基本表的主键约束和索引也已创建。

imp userid=I0809/I0809 file=I080908111900.dmp parfile=tables.par log=I0809.log ignore=y commit=y buffer=4096000

所用时间=第3日01:08-20:22=28小时46分。

方法A4

为了进行比较，新建了一个用户BEE，不包含任何表。

imp userid=BEE/BEE file=I080908111900.dmp parfile=tables.par log=I0809.log ignore=y

导入所用时间=13:34 -09:58=3小时36分。

创建索引的语句我们通过下面方法得到。

首先执行表结构及约束、索引的导出，但不导出数据记录。

exp userid=I0809/I0809 file=I0809st.dmp parfile=tables.par rows=n direct=y log=expI0809st.log

然后

imp userid=BEE/BEE file=I0809st08112003.dmp parfile=tables.par log=impI0809st.log indexfile=I0809stindex.sql

我们在I0809stindex.sql可以看到I0809st08112003.dmp中包含的表结构及约束、索引。

例如：

REM CREATE TABLE "JB603" ("UUID" VARCHAR2(32) NOT NULL ENABLE,

REM "CYC_CODE" VARCHAR2(2) NOT NULL ENABLE, "B03_01" NUMBER(9, 0),

REM "B03_02" NUMBER(9, 0), "B03_03" NUMBER(9, 0), "B03_04" VARCHAR2(1),

REM "B03_INFO1" VARCHAR2(10), "B03_INFO2" VARCHAR2(10), "B03_INFO3"

REM VARCHAR2(10), "B03_INFO4" NUMBER(1, 0), "B03_INFO5" NUMBER(2, 0),

REM "B03_INFO6" NUMBER(2, 0)) PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS

REM 255 STORAGE(INITIAL 65536 FREELISTS 1 FREELIST GROUPS 1) TABLESPACE

REM "EPRAS" LOGGING NOCOMPRESS ;

CREATE UNIQUE INDEX "PKJB603" ON "JB603" ("UUID" , "CYC_CODE" )

PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE(INITIAL 65536 FREELISTS 1

FREELIST GROUPS 1) TABLESPACE "EPRAS" LOGGING ;

然后我们可以删除一些"REM"（表示注释行），整理出一个创建约束、索引的脚本makeindex.sql

CREATE UNIQUE INDEX "PKJB603" ON "JB603" ("UUID" , "CYC_CODE" )

PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE(INITIAL 65536 FREELISTS 1

FREELIST GROUPS 1) TABLESPACE "EPRAS" LOGGING ;

ALTER TABLE "JB603" ADD CONSTRAINT "PKJB603" PRIMARY KEY

("UUID", "CYC_CODE") USING INDEX PCTFREE 10 INITRANS 2 MAXTRANS 255

STORAGE(INITIAL 65536 FREELISTS 1 FREELIST GROUPS 1) TABLESPACE

"EPRAS" LOGGING ENABLE ;

而创建表语句，如CREATE TABLE "JB603"是不必要的，因为导入dmp时会自动创建，如果写了，oracle将抛出一个错误信息，但不影响其余语句的执行，因此保留也无妨。

@makeindex.sql

重建所有基本表索引总共用时=02:28:06-02:21:24=6分42。

方法A5

exp导出不包含约束和索引的数据

exp bee/bee file=beec.dmp log=bee.log parfile=tables.par direct=y indexes=n CONSTRAINTS=n

导出所用时间=19:17-19:02=17分

在一个用应用程序产生的用户下删除tables.par中包含的53张表

imp userid=bee4/bee4 file=beec.dmp parfile=tables.par log=beecimp.log ignore=y

date

导入所用时间=14:53-13:15=1小时38分

@makeindex.sql

date

重建所有基本表索引和约束总共用时=11:05:51-10:28:26=37:25（索引建好以后，改为主键约束基本不用时间）

这样，我们通过采用Direct=y参数加快了导出，通过在导出时不导出约束和索引，并删除目标表导入，然后重建索引的办法加快了导入。

在Oracle 10g中新增加了expdp和impdp命令，这二个命令用到了新的数据泵(Pump)技术，支持并行操作，特别是导入速度有极大的提高。

方法B1

expdp bee/bee dumpfile=bee-%U.dmp directory=dmpdir logfile=bee..log parallel=5 parfile=tables.par EXCLUDE=INDEX,CONSTRAINT,TABLE_STATISTICS

06:49:40 - 06:32:33 =17分07 虽然expdp不再有direct=y参数，但它默认自动采用直接路径，当无法采用直接路径时改用常规路径。尽管有一些时间用于分析，仍然与exp的速度相当。

impdp bee2/bee2 dumpfile=bee-%U.dmp directory=dmpdir logfile=beei.log parallel=5 parfile=tables.par TABLE_EXISTS_ACTION=REPLACE REMAP_SCHEMA=bee:bee2

导入所用时间=07:05:11 - 06:49:40=15分31与exp的速度相当，和imp的速度不是一个数量级的，当然这里没有导入约束和索引，但即使导入约束，仍然比imp快了许多，参看下面方法B2。

导入后建立约束和索引的时间，08:55:42-08:24:38 =31分04

总时间=17:07+15:31+31:04=63分38

方法B2

导出时包含索引和约束，但目标表不存在

expdp bee/bee dumpfile=beei-%U.dmp directory=dmpdir logfile=bee.log parallel=5 parfile=tables.par

17:04-16:48-09:36=0:16

impdp bee3/bee3 dumpfile=beei-%U.dmp directory=dmpdir logfile=beeimp.log parallel=5 parfile=tables.par TABLE_EXISTS_ACTION=REPLACE REMAP_SCHEMA=bee:bee3

导入所用时间=17:57:13-17:04:36=52分37

总时间=16+52:37=69分

方法B1和B2两者速度持平，但方法B2步骤简单了许多，更适合一般用户使用。

Exp/imp命令组合小结：

有条件的话，首选Oracle 10g平台，采用expdp导出包含约束和索引的数据，然后impdp命令导入,一气呵成。虽然只能将dmp文件存在服务器端，但考虑到即使用exp也是telnet到服务器后执行的（为了充分利用服务器的高速I/O和大容量存储，并减少网络流量），两者没有本质的区别。而且expdp/impdp还具有很多可管理的特性，可以在导出/导入过程中挂起、恢复、终止任务。

另一处要注意的是dmpdir目录需要预先建立，

conn / as sysdba

create directory dmpdir as '/oradata/dmp';

grant read,write ON DIRECTORY dmpdir to tom;

而且给导出和导入用户都授权读写，可以用一个脚本完成，不费事。

GRANT READ ON DIRECTORY "SYS"."DMPDIR" TO "BEE3";

GRANT WRITE ON DIRECTORY "SYS"."DMPDIR" TO "BEE3";

GRANT "CONNECT" TO "BEE3";

GRANT "DBA" TO "BEE3";

GRANT "RESOURCE" TO "BEE3";

如果要在经济普查数据库这样的Oracle 9i平台导出和导入，采用exp导出不包含约束和索引的数据，再删除目标用户基本表的约束和索引（如果存在），然后imp命令导入，再用脚本建立约束和索引，commit=y参数不必使用。

上述各方法的参数以及运行时间的比较见附表：

(方法A:Oracle9i exp+imp,方法B:10g expdp+impdp)

方法	编号	提交	并行	导出约束	导出索引	导入前删目标表索引和约束	导出时间	导入时间	建立索引时间	总时间	首选
A	1	N	N	N	N	N	17分	9小时49分	0	10小时06分	否
A	2	N	Ｙ	N	N	N	17分	17小时19分	0	17小时36分	否
A	3	Ｙ	N	N	N	N	17分	28小时46分	0	29小时03分	否
A	4	N	N	Ｙ	N	Ｙ	17分	3小时36分	7分	4小时	否
A	5	N	N	N	N	Ｙ	18分	1小时38分	38分	2小时34分	是
B	1	N	Ｙ	N	N	Ｙ	17分	16分	31分	1小时04分	是
B	2	N	Ｙ	Ｙ	Ｙ	Ｙ	16分	53分	0	1小时09分	是

从上表可以看出:

1 手工模拟并行方法效果不佳。

2 一个教训：约束往往和一个唯一索引/主键相关联，所以仅仅利用indexes=n 选项是不够的，必须添加CONSTRAINTS=n，才能真正避免导入时的检查。

这里我们之所以能采用Drop指定表（表上的约束和索引自动被删除），然后导入数据，然后建立约束和索引的方法，原因有下面几方面。

1 数据来源比较干净，原来的数据库有严格的约束，垃圾数据不存在。

2 目标数据库没有记录，不会发生新旧数据的冲突。

3 数据库结构比较简单，没有外键、触发器等，导入时不必严格限定先后次序，也不用索引查找键值。

参考资料1中提到exp，sqlldr都有direct=y选项，绕过sql引擎，直接读写数据块。而imp没有此选项，只能用生成INSERT语句的办法，这一点可以通过导入进行时，用oem企业管理器观察系统用户进程得到。

二、文本导出和SQLLDR命令装载

以上讨论的是EXP和IMP结合使用的数据备份方法，下面讨论输出文本文件和SQLLDR装载的方法。

文本文件是各种数据库管理系统都支持的外部数据输入格式，SQLLDR是Oracle提供的高效的文本装入工具。SQLLDR利用一个称为控制文件的文本文件中的描述确定外部文本和数据库表字段的格式对应关系，它支持并行处理和直接路径装载。

一个典型的控制文件load.ctl如下所示

LOAD DATA

INTO TABLE DEPT

REPLACE

FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'

(DEPTNO,

DNAME,

LOC

)

它对应的文本文件data.txt

10,Sales,"""USA"""

20,Accounting,"Virginia,USA"

30,Consulting,Virginia

40,Finance,Virginia

50,"Finance","",Virginia

60,"Finance",,Virginia

通过命令行sqlldr userid=tkyte/tkyte control=load.ctl data=data.txt即可将data.txt中的记录装载到DEPT表。

SQLLDR提供了两种方法装载数据——常规路径装载与直接路径装载。常规路径装载是SQLLDR的默认装载方法。为了能够进行直接路径装载，在激活SQLLDR时，必须将DIRECT = TRUE添加到命令行参数中。常规路径装载具有直接路径装载不需要的一些额外步骤。这些额外步骤增加了系统处理的额外开销，使得常规路径装载的速度慢于直接路径装载。格式化SQL INSERT语句以及搜索SGA内存高速缓冲区的额外步骤与其他同时并发运行在数据库上的进程产生竞争。虽然出于速度原因，我们倾向于使用直接路径装载，但是在一些限制情形下，还是应使用常规路径装载。

下面是一些情形与案例，要求最好或必须使用常规路径装载方法，而不能使用直接路径装载：

■ 如果被装载的表是被索引的并且被并发访问的，或者如果要对表进行插入或删除，必须使用常规路径装载。

■ 当在控制文件中使用SQL函数时，必须使用常规路径装载。当使用直接路径装载时，SQL函数将不适用。

■ 当装载的表是一个簇表时。

■ 当装载少量记录到一个大型索引表，或当表具有引用完整性或检查约束时。这种情形下使用常规路径装载要好一些。

装载少量的记录到一个带有索引和/或引用及检查约束的大型表不是使用直接路径装载的一个限制因素，但是使用常规路径装载更为有效。在存在索引的情况下，或许常规路径装载在装载数据时更新索引要快一些，而且不需要进行一个大的排序/组合来创建新的索引。对于引用和检查约束，直接路径装载要求在装载前禁止这些约束。在全部数据装载后，重新允许检查约束，整个数据表都将根据这些约束进行检查，而不仅仅是被装载的数据。

虽然多种文档中提到，SQLLDR是Oracle最快的装载数据办法，但是对于本例这个特殊的数据库，它不是最有效的，理由有下面几点：

1 基本表的数量众多，书写控制文件工作繁重；

2 基本表的数量众多，书写导出文本文件脚本工作繁重；脚本通常采用spool命令和select语句配合的办法，利用sqlplus -silent 用户 @脚本名的办法可最大限度地减少由于在终端回显的时间。（参考资料1第9章提供了一个PL/SQL过程unloader实现从一个SQL查询语句自动产生导出的文本文件和相应的控制文件。参考资料3 提供了利用OCI Array Fetch实现的UNLOAD程序，执行速度比单行Fetch的PL/SQL过程快几倍）

3 需要产生大量的文件，操作比较繁琐，一般用户不易掌握；

4 如果能使用Oracle 10g版本，expdp+impdp的效率完全可以与SQLLDR并行处理相当。

5 导出文本文件的时间远长于exp命令的时间。(exp J601 表用时3分钟，unloader J601表20分钟也没有完成,spool脚本的运行时间和unloader相比，约为后者的3/4)

如果需要从其他数据库导入数据，文本文件和SQLLDR装载是较好的一种办法，事实上，经济普查数据处理程序采用了这种方法实现从Windows版MySQL数据库向Unix的Oracle导入数据。

三、结论

从上述两种方法的测试中，我们可以看出。大量数据迁移时，将数据先迁移再重建索引的原则都是不变的。如果明显是从一个符合约束的来源表导出数据到一个空表，那么约束也可以延迟建立。直接路径是Oracle特有的可提高导入/导出效率的选项，它的应用受到了某些限制，比如exp的query参数和direct参数便不兼容。

参考资料 1清华大学出版社《Oracle专家高级编程》（〈Expert one-on-one Oracle 〉Thomas Kyte著）

2机械工业出版社《Oracle 8_8i 开发使用手册》

3 OCI实现的UNLOAD程序楼方鑫, http://www.anysql.net

你可能感兴趣的:(oracle,数据库,table,constraints,logging,parallel)

UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
vue3中el-table中点击图片放大时，被表格覆盖叫我小鹏呀 vue.js javascript 前端
问题：vue3中el-table中点击图片放大时，被表格覆盖。解决方法：el-image添加preview-teleported
vue项目element-ui的table表格单元格合并酋长哈哈 vue.js elementui javascript 前端
一、合并效果二全部代码exportdefault{name:'CellMerge',data(){return{tableData:[{id:'1',name:'王小虎',amount1:'165',amount2:'3.2',amount3:10},{id:'1',name:'王小虎',amount1:'162',amount2:'4.43',amount3:12},{id:'1',name:'
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Vue中table合并单元格用法 weixin_30613343 javascript ViewUI
地名结果人名性别{{item.name}}已完成未完成{{item.groups[0].name}}{{item.groups[0].sex}}{{item.groups[son].name}}{{item.groups[son].sex}}exportdefault{data(){return{list:[{name:'地名1',result:'1',groups:[{name:'张三',sex
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
2023最详细的Python安装教程（Windows版本）程序员林哥 Python python windows 开发语言
python安装是学习pyhon第一步，很多刚入门小白不清楚如何安装python，今天我来带大家完成python安装与配置，跟着我一步步来，很简单，你肯定能完成。第一部分：python安装（一）准备工作1、下载和安装python(认准官方网站)当然你不想去下载的话也可以分享给你，还有入门学习教程，点击下方卡片跳转进群领取（二）开始安装对于Windows操作系统，可以下载“executableins
C++八股 Petrichorzncu 八股总结 c++开发语言
这里写目录标题C++内存管理C++的构造函数，复制构造函数，和析构函数深复制与浅复制：构造函数和析构函数哪个能写成虚函数，为什么？C++数据结构内存排列结构体和类占用的内存：==虚函数和虚表的原理==虚函数虚表（Vtable）虚函数和虚表的实现细节==内存泄漏==指针的工作原理函数的传值和传址new和delete与malloc和freeC++内存区域划分C++11新特性C++常见新特性==智能指针
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
Table列表复现框实现【勾选-搜索-再勾选】～四时春～ java 开发语言 elementui vue
Table列表复现框实现【勾选-搜索-再勾选】概要整体架构流程代码实现技术细节注意参考文献概要最近在开发时遇到一个问题，在进行表单渲染时，正常选中没有问题，单如果需要搜索选中时，一个是已选中的不会回填，二是在搜索的结果中进行选中，没有实现，经过排查，查找资料后实现。例如：整体架构流程具体的实现效果如下：代码实现{{scope.row.userName}}已选区{{userItem.userName
vue+el-table 可输入表格使用上下键进行input框切换以对_ vue学习记录 vue.js javascript 前端
使用上下键进行完工数量这一列的切换-->//键盘触发事件show(ev,index){letnewIndex;letinputAll=document.querySelectorAll('.table_inputinput');//向上=38if(ev.keyCode==38){if(index==0){//如果是第一行,回到最后一个newIndex=inputAll.length-1}elsei
vue + Element UI table动态合并单元格我家媳妇儿萌哒哒 element UI vue.js 前端 javascript
一、功能需求1、根据名称相同的合并工作阶段和主要任务合并这两列，但主要任务内容一样，但要考虑主要任务一样，但工作阶段不一样的情况。（枞向合并）2、落实情况里的定量内容和定性内容值一样则合并。（横向合并）二、功能实现exportdefault{data(){return{tableData:[{name:'a',address:'1',age:'1',six:'2'},{name:'a',addre
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
【Java】已解决：java.util.concurrent.CompletionException 屿小夏 java 开发语言
文章目录一、分析问题背景出现问题的场景代码片段二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：java.util.concurrent.CompletionException一、分析问题背景在Java并发编程中，java.util.concurrent.CompletionException是一种常见的运行时异常，通常在使用CompletableFuture进行异步计算时出现
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户