测试人员必须知道的数据库

1、MongoDB（一）NoSQL起源

随着互联网的发展，当我们把一台服务器一台服务器变成两台服务器，当我们开始建立数据备份，当我们需要加一个缓冲层，来调整所有的查询，投入更多的硬件。

最后，需要将数据切分多个集群上，并重构大量的应用逻辑以适应这种切分。不久之后，你就会发现被自己数月前的设计数据结构限制住了。

随着web2.0的兴起，关系型数据库本身无法克服的缺陷越来越明显，主要表现为如下几点。

1、对数据高并发读写的需求

2、对海量数据的高效率存储和访问的需求。

3、对数据库的高可扩展性和高可用性的需求。

4、数据库事务一致性需求。

5、数据库写实性和读写时性需求。

6、对复杂SQL的查询，特别是对关联查询的需求。

NoSQL是Notonly SQL的缩写，NoSQL不使用SQL作为查询语言。其数据存储可以不需要固定的表格模式，也经常避免使用SQL的join操作，一般有水平可扩展性的特征。

基本用法：

（1）查询name中包含 mongo的数据db.userInfo.find({name: /mongo/});

（2）查询name中以mongo开头的db.userInfo.find({name: /^mongo/});

（3）根据手机号修改serviceAccount里面的身份证认证次数

db.serviceAccount.update({"phone":"13310872023"},{$set:{"nameCheck.time":"0"}});

（4）查询某一时间段的数据

db.user.find({"createTime" : {$gt:ISODate("2015-06-01T11:36:53.249Z"),$lt:ISODate("2015-06-03T11:36:53.249Z")}}).pretty();

mongodb条件操作符，"$lt", "$lte", "$gt", "$gte", "$ne"就是全部的比较操作符，对应于"<", "<=", ">", ">=","!="。

2、Oracle：中文译作甲骨文，这是一家传奇的公司，有一个传奇的大老板Larry Ellision。 Ellision 32岁还一事无成，读了三个大学，没得到一个学位文凭，换了十几家公司，老婆也离他而去。开始创业时只有1200美元，却使得Oracle公司连续12年销售额每年翻一番。Oracle成立于1977年，早期的理论基础，反而来自于一篇IBM的论文《A Relational Model of Data for Large Shared Data Banks》【1】。作者CODD选取了关系代数的五种运算，并基于运算，架构了一种新型的数据存储模型。基于这种模型，Oracle成为了一个非常典型的关系数据库。因此也变的严谨、安全、高速、稳定，并且变的越来越庞大。Oracle的应用，主要在传统行业的数据化业务中，比如：银行、金融这样的对可用性、健壮性、安全性、实时性要求极高的业务；零售、物流这样对海量数据存储分析要求很高的业务。此外，高新制造业如芯片厂也基本都离不开Oracle；电商也有很多使用者，如京东（正在投奔Oracle）、阿里巴巴（计划去Oracle化）。而且由于Oracle对复杂计算、统计分析的强大支持，在互联网数据分析、数据挖掘方面的应用也越来越多。

下面介绍一下，连接Orcle的第三方工具，基本命令就不介绍了，和sql语句很像

PLSQL Developer是Oracle数据库开发工具，很牛也很好用，PLSQL Developer功能很强大，可以做为集成调试器，有SQL窗口，命令窗口，对象浏览器和性能优化等功能

3、DB2

DB2 超大型，与ORACLE类似，数据仓库和数据挖掘相当的不错，特别是集群技术可以使DB2的可扩性能达到极致。

全称为IBM DB2。是美国IBM公司开发的一套关系型数据库管理系统，它主要的运行环境为UNIX（包括IBM自家的AIX）、Linux、IBM i（旧称OS/400）、z/OS，以及Windows服务器版本。

DB2主要应用于大型应用系统，具有较好的可伸缩性，可支持从大型机到单用户环境，应用于所有常见的服务器操作系统平台下。

DB2提供了高层次的数据利用性、完整性、安全性、可恢复性，以及小规模到大规模应用程序的执行能力，具有与平台无关的基本功能和SQL命令。

DB2采用了数据分级技术，能够使大型机数据很方便地下载到LAN数据库服务器，使得客户机/服务器用户和基于LAN的应用程序可以访问大型机数据，并使数据库本地化及远程连接透明化。

DB2以拥有一个非常完备的查询优化器而著称，其外部连接改善了查询性能，并支持多任务并行查询。

DB2具有很好的网络支持能力，每个子系统可以连接十几万个分布式用户，可同时激活上千个活动线程，对大型分布式应用系统尤为适用。

4、SQL Server基本简介

1.1，概述

SQL Server 是Microsoft 公司推出的关系型数据库管理系统。具有使用方便可伸缩性好与相关软件集成程度高等优点，可跨越从运行Microsoft Windows 98 的膝上型电脑到运行Microsoft Windows 2012 的大型多处理器的服务器等多种平台使用。

Microsoft SQL Server 是一个全面的数据库平台，使用集成的商业智能 (BI)工具提供了企业级的数据管理。Microsoft SQL Server 数据库引擎为关系型数据和结构化数据提供了更安全可靠的存储功能，使您可以构建和管理用于业务的高可用和高性能的数据应用程序。

1.2，应用范围

SQL Server的应用范围，和其具体的版本有一定的关系，基本上是：企业版（Enterprise Edition）

（大中型企业商用）；标准版（Standard Edition）（小型企业商用）；开发版（Developer Edition）

（开发公司、开发人员使用）；个人版（Personal Edition）（开发人员使用）；MSDE 2000（Microsoft SQL

Server 2000 Desktop Engine）（简单的单机数据库、开发人员开发测试使用）

其中几个重要的概念

1.视图

(1).什么是视图？

视图(View)作为一种数据库对象，为用户提供了一个可以检索数据表中的数据方式。用户通过视图来浏览数据表中感兴趣的部分或全部数据，而数据的物理存储位置仍然在表中。

视图是一个虚拟表，并不代表任何物理数据，只是用来查看数据的窗口而已。视图并不是以一组数据的形式存储在数据库中，数据库中只存储视图的定义，而不存储视图对应的数据，这些数据仍存储在导出视图的基本表中。当基本表中的数据发生变化时，从视图中查询出来的数据也随之改变。

视图中的数据行和列都是来自于基本表，是在视图被引用时动态生成的。使用视图可以集中、简化和制定用户的数据库显示，用户可以通过视图来访问数据，而不必直接去访问该视图的基本表。

视图由视图名和视图定义两个部分组成。视图是从一个或多个表导出来的表，它实际上是一个查询结果，视图的名字和视图对应的查询存储在数据字典中。

(2).视图的优缺点？

<1>.视图的优点

A.数据安全性。

对不同的用户定义不同的视图，使用户只能看到与自己有关的数据。数据库授权命令可以使每个用户对数据库的检索限制到特定的数据库对象上，但不能授权到数据库特定行和特定的列上。通过视图，用户可以被限制在数据的不同子集上。

B.查询简单化。

为复杂的查询建立一个视图，用户不必输入复杂的查询语句，只需针对此视图做简单的查询即可。那些被经常使用的查询可以被定义为视图，从而使用户不必为以后的操作每次都指定全部的条件。

C.逻辑数据独立性。

视图可以使应用程序和数据库表在一定程度上独立。如果没有视图，应用一定是建立在表上的。有了视图之后，程序可以建立在视图之上，从而程序与数据库表被视图分割开来。

对于视图的操作，例如，查询只依赖于视图的定义，当构成视图的基本表需要修改时，只需要修改视图定义中的子查询部分，而基于视图的查询不用改变。

<2>.视图的缺点

A.性能。

SQL Server必须把视图的查询转化成对基本表的查询，如果这个视图是由一个复杂的多表查询所定义，那么，即使是视图的一个简单查询，SQL Server也把它变成一个复杂的结合体，需要花费一定的时间。

2.索引

(1).什么是索引？

索引是以表列为基础的数据库对象，它保存着表中排序的索引列，并且记录了索引列在数据表中的物理存储位置，实现了表中数据的逻辑排序，其主要目的是提高SQL Server系统的性能，加快数据的查询速度和减少系统的响应时间。索引通过记录表中的关键值指向表中的记录，这样数据库引擎就不用扫描整个表而定位到相关的记录。相反，如果没有索引，则会导致SQL Server搜索表中的所有记录，以获取匹配结果。

索引除了可以提高查询表内数据的速度以外，还可以使表和表之间的连接速度加快。例如，在实现数据参照完整性时，可以将表的外键制作为索引，这样将加速表与表之间的连接。

(2).索引的分类

有3种索引类型：聚集索引、非聚集索引和唯一索引。如果表中存在聚集索引，则非聚集索引使用聚集索引来加快数据查询。

<1>.聚集索引

聚集索引会对表和视图进行物理排序，所以这种索引对查询非常有效，在表和视图中只能有一个聚集索引。当建立主键约束时，如果表中没有聚集索引，SQL Server会用主键列作为聚集索引键。可以在表的任何列或列的组合上建立索引，实际应用中一般定义成主键约束的列建立聚集索引。

<2>.非聚集索引

非聚集索引不会对表和视图进行物理排序。如果表中不存在聚集索引，则表示未排序的。在表或视图中，最多可以建立250个非聚集索引，或者249个非聚集索引和1个聚集索引。

<3>.唯一索引

唯一索引不允许两行具有相同的索引值。只要列中数据是唯一的，就可在同一个表上创建一个唯一的聚集索引。如果必须实施唯一性以确保数据的完整性，则应在列上创建UNIQUE或PRIMARY KEY约束，而不要创建唯一索引。

(3).使用索引的代价

虽然索引有很多优点，但索引的存在也让系统付出了一定的代价。创建索引和维护索引都会消耗时间，当对表中的数据进行增加、删除和修改操作时，索引就要进行维护，否则索引的作用就会下降；另外，每个索引都会占用一定的物理空间，如果占用的物理空间过多，就会影响到整个SQL Server系统的性能。

(4).建立索引的原则

创建索引虽然可以提高查询速度，但是它是牺牲一定的系统性能。因此，在创建时，哪些列适合创建索引，哪些列不适合创建索引，需要进行判断，具体以下原则:

<1>.有主键的数据列要建立索引。因为主键可以加速定位到表中的某一行。

<2>.有外键的数据列要建立索引。外键列通常用于表与表之间的连接，在其上创建索引可以加快表间的连接。

<3>.对于经常查询的数据列最好建立索引。

A.对于需要在指定范围内快速或频繁查询的数据列，因为索引已经排序，其指定的范围是连续的，查询可以利用索引的排序，加快查询的时间。

B.经常用在WHERE子句中的数据列，将索引建立在WHERE子句的集合过程中，对于需要加速或频繁检索的数据列，可以让这些经常参与查询的数据列按照索引的排序进行查询，加快查询的时间。

<4>.对于那些查询中很少涉及的列、重复值比较多的列不要建立索引。

例如，在查询中很少使用的列，有无索引并不能提高查询的速度，相反增加了系统维护时间和消耗了系统空间。

3.存储过程

(1).什么是存储过程？

当开发一个应用程序时，为了易于修改和扩充，经常会将负责不同功能的语句集中起来而且按照用途分别放置，以便能够反复调用，而这些独立放置且拥有不同功能的语言，即是“过程”(Procedure)。

存储过程(Stored Producedures)是一组为完整特定功能的SQL语句集，经编译后存储在数据库中。用户通过指定存储过程的名字给出参数(如果该存储过程带有参数)来执行它。

它能够包含执行各种数据库操作的语句，并且可以调用其他的存储过程；能够接受输入参数，并以输出参数的形式将多个数据值返回给调用程序(Calling Procedure)或批处理(Batch)；向调用程序或批处理返回一个状态值，以表明成功或失败(以及失败的原因)。

(2).存储过程的优点

<1>.存储过程优点

A.执行速度快。

存储过程只在创造时进行编译，已经通过语法检查和性能优化，以后每次执行存储过程都不需再重新编译，而我们通常使用的SQL语句每执行一次就编译一次,所以使用存储过程可提高数据库执行速度。

B.允许组件式编程。

经常会遇到复杂的业务逻辑和对数据库的操作，这个时候就会用SP来封装数据库操作。当对数据库进行复杂操作时(如对多个表进行Update,Insert,Query,Delete时)，可将此复杂操作用存储过程封装起来与数据库提供的事务处理结合一起使用。只需创建存储过程一次并将其存储在数据库中，以后即可在程序中调用该过程任意次。在代码上看，SQL语句和程序代码语句的分离，可以提高程序代码的可读性。

存储过程可以设置参数，可以根据传入参数的不同重复使用同一个存储过程，从而高效的提高代码的优化率和可读性。

C.减少网络流量。

一个需要数百行Transact-SQL代码的操作由一条执行过程代码的单独语句就可实现，而不需要在网络中发送数百行代码。

对于同一个针对数据库对象的操作，如果这一操作所涉及到的T-SQL语句被组织成一存储过程，那么当在客户机上调用该存储过程时，网络中传递的只是该调用语句，否则将会是多条SQL语句。从而减轻了网络流量，降低了网络负载。

D.提高系统安全性。

可将存储过程作为用户存取数据的管道。可以限制用户对数据表的存取权限，建立特定的存储过程供用户使用，避免非授权用户对数据的访问，保证数据的安全。

<2>.存储过程缺点：

A.移植性差。依赖于数据库厂商,难以移植(当一个小系统发展到大系统时,对数据库的要求也会发生改变)；

B.难以调试、维护。业务逻辑大的时候,封装性不够,难调试难以维护；

C.服务器不能负载均衡。复杂的应用用存储过程来实现，就把业务处理的负担压在数据库服务器上了。没有办法通过中间层来灵活分担负载和压力.均衡负载等。

5、MySql

MySQL基本是生于互联网，长于互联网。其应用实例也大都集中于互联网方向，MySQL的高并发存取能力并不比大型数据库差，同时价格便宜，安装使用简便快捷，深受广大互联网公司的喜爱。并且由于MySQL的开源特性，针对一些对数据库有特别要求的应用，可以通过修改代码来实现定向优化

一般用的第三方连接工具

说明：几个简单的基本的sql语句

选择：select * from table1 where 条件

插入：insert into table1(field1,field2) values(value1,value2)

删除：delete from table1 where 条件

更新：update table1set field1=value1 where 条件

查找：select * from table1 where field1like’%value1%’---like的语法很精妙，查资料!

排序：select * from table1 order by field1,field2 [desc]

总数：select count as totalcount from table1

求和：select sum(field1) as sumvalue from table1

平均：select avg(field1) as avgvalue fromtable1

最大：select max(field1) as maxvalue from table1

最小：select min(field1) as minvalue from table1

平常我用的最多的一个函数

substring(expression,start,length) 取子串，字符串的下标是从“1”，start为起始位置，length为字符串长度，实际应用中以len(expression)取得其长度

工作实例：

MySql中查询OTP中动态验证码

select OtpCode from OTP where substring(createTime,1,15)='2015-07-22 21:1';

查询可用额度

db.user.find({"primaryPhone":"16810872049"}).pretty();

select AvailableFunds as 可用额度 from KyPayAccounts where UserGuid="2d834f79-44b0-47a5-afa6-be12b97d82d3";

查询18831199224号码在STG环境中的交易码

select * from OTP where UserGuid="805a494d-c6cf-4338-9e66-5feeae4355dd" order by CreateTime \G;

update IndexUser set Authenticate=1 where UserId="75bb9d0b-1e4d-45ce-8cec-6acb51d26721";

追加授信修改

update IndexBankAccount set VerifyResult=3,PendingConfirm=3 where UserId="0854a2dd-a80e-471a-920a-fee9ea41ced1" \G;

根据担保条件查询所有FullName

select FullName from IndexUserAccount,IndexUser where ((AccountManualStatus=2 or AccountManualStatus=5) and CreditStatus=2 and (AccountStatus=2 or AccountStatus=5)) and IndexUserAccount.UserId=IndexUser.Id;

6、Access是一种桌面数据库，只适合数据量少的应用，在处理少量数据和单机访问的数据库时是很好的，效率也很高。但是它的同时访问客户端不能多于4个。access数据库有一定的极限，如果数据达到100M左右，很容易造成服务器iis假死，或者消耗掉服务器的内存导致服务器崩溃。

软件测试交流群

测试人员必须知道的数据库

你可能感兴趣的:(测试人员必须知道的数据库)