黑马程序员_数据库基础

---------------------- Windows Phone 7手机开发、.Net培训、期待与您交流! ----------------------

1.      数据库概述

a)      用自定义文件格式保存数据的劣势

b)      DBMS(DataBase Management System,数据库管理系统)和数据库。平时谈到“数据库”可能有两种含义:MSSQLServer、Oracle等某种DBMS;存放一堆数据表的一个分类( Catalog )。

c)      不同品牌的DBMS有自己的不同的特点:MYSQL、 MSSQLServer、DB2、Oracle、Access、Sybase等。对 于开发人员来讲,大同小异

d)      SQL<>SQLServer<>MSSQLServer。最常见的错误。

e)      除了Access、SQLServerCE等文件型数据库之外,大部分数据库都需要数据库服务器才能运行。

学习、开发时是连接本机的数据库,

上线运行时是数据库运行在单独的服务器。

2.    数据库中的概念

2.1    Catalog(分类)(又叫数据库DataBase、表空间TableSpace),不同类的数据应该放到不同的数据库中

        a)      便于对各个Catalog进行个性化管理

        b)      避免命名冲突

        c)      安全性更高

2.2    Table(表):书都放到书架上,碗都放到橱柜中,不同类型的资料放到不同的“ 格子”中,将这种区域叫做“表”(Table)。不同的表根据放的数据不同进行空间 的优化,找起来也方便。

2.3    列(Column)、字段(Field)

3.    主键(PrimaryKey

主键就是数据行的唯一标识。不会重复的列才能当主键。一个表可以 没有主键,但是会非常难以处理,因此没有特殊理由表都要设定主键

主键有两种选用策略:业务主键逻辑主键

业务主键是使用有业务意义的字段做主键,比如身份证号、银行账号等;

逻辑主键是使用没有任何业务意义的字段做主键,完全给程序看的,业务人员不会看的数据。因为很难保证业务主键不会重复(身份证号重复)、不会变化(帐号升位),因此推荐用逻辑主键。


4.    SQLServer的管理

a)      需要安装SQLServer2005或者SQLServer2008,若要使用SQLServer管理工具进行开发还要安装SQL ServerManagement Studio,还可以使用VisualStudio进行管理

b)      使用免费的SQLServerExpress版本,Express版本的服务器名称. \SQLEXPRESS,对于开发人员来讲和其他版本没有区别。

c)      SQLServer的两种验证方式:用户名验证Windows验证,开发时用 Windows验证就行。

d)      开发人员关注点在开发上,而不是配置、备份等之上,那是DBA做的事情。

e)      创建数据库,创建表,设置主键

f)       SQLServer2008ManagementStudio中:编辑200行。05中:打开表。

g)      常用字段类型:bit(可选值0、1)、datetime、int、varchar、nvarchar(可能含有中文用nvarchar)

h)      Nvarchar(50)、Nvarchar(MAX)

i)       varchar、nvarchar和char(n)的区别: char(n)不足长度n的部分用空格填充。Var:Variable,可变的。

5.    SQL语句入门

a)      SQL语句是和DBMS“交谈”专用的语句,不同DBMS都认SQL语法。

b)      SQL语句中字符串用 单引号

c)      SQL语句是大小写不敏感的,不敏感指的是SQL关键字,字符串值还是大小写敏感的

d)      创建表、删除表不仅可以手工完成,还可以执行SQL语句完成,在自动化部署、数据导入中用的很多,CREATETABLE T_Person(Idint NOT NULL,Name nvarchar(50),Age int NULL)、Drop table T_Person1

e)      简单的Insert语句。INSERT INTOT_Person(Id,Name,Age)VALUES(1,'Jim',20)

f)       (*) SQL主要分DDL(数据定义语言)和DML(数据操作语言)两类。

Create Table、Drop Table、Alter Table等属于DDL

Select、Insert、Update、Delete等属于DML

6.    主键选择

a) SQLServer中两种常用的主键数据类型:

int(或bigint)+标识列(又称自动增长字段);

unique identifier(唯一标识符)(又称Guid全局统一标识符(=GloballyUnique Identifier)、UUID通用唯一识别码 (UniversallyUnique Identifier))

b)      用标识列实现字段自增可以避免并发等问题,不要开发人员控制自增。用标识列的字段在Insert的时候不用指定主键的值。将字段的“是标识列”设置为“是”,一个表只能有一个标识列

c)      Guid算法是一种可以产生唯一标识的高效算法,它使用网卡MAC、地址、纳秒级时间、芯片ID码等算出来的,这样保证每次生成的GUID永远不会重复,无论是同一个计算机上还是不同的计算机。在公元3400年以前产生的GUID与任何其他产生过的GUID都不相同。

SQLServer中生成 GUID的函数newid(),

.Net中生成Guid的方法:Guid.NewGuid(),返回是Guid类型。

d)      (*)Int自增字段的优点:占用空间小、无需开发人员干预、易读;缺点:效率低;数据导入导出的时候很痛苦。

e)      (*)Guid的优点:效率高、数据导入导出方便;缺点占用空间大、不易读。

业界主流倾向于使用Guid。

7.    数据插入

Insert语句可以省略表名后的列名,但是不推荐。

如果插入的行中有些字段的值不确定,那么Insert的时候不指定那些列即可。

给可以给字段默认值,如果Guid类型主键的默认值设定为newid()就会自动生成,很少这么干。

主键:insertinto Person3(Name,Age)values('lily',38);insertintoPerson4(Id,Name,Age)values(newid(),'tom',30);

8.    数据更新

更新一个列:UPDATET_Person Set Age=30

更新多个列:UPDATE T_Person Set Age=30,Name=‘tom’

更新一部分数据:UPDATE T_Person Set Age=30 where Name=‘tom’,用where语句表示只更新Name是’tom’的行,注意SQL中等于用单个=,而不是==。

Where中还可以使用复杂的逻辑判断UPDATE T_Person Set Age=30 where Name=‘tom’ or  Age<25,

or相当于C#中的||(或者)

update Person1 set NickName=N'二十岁'

where (Age>20 and Age<30) or(Age=80)

Where中可以使用的其他逻辑运算符:or、and、not、<、 >、>=、<=、!=(或<>)等

9.    数据删除

删除表中全部数据:DELETE FROMT_Person。

Delete只是删除数据,表还在,和Drop Table不同。

Delete也可以带where子句来删除一部分数据:DELETE FROM T_Person WHERE FAge > 20

10.  数据检索


简单的数据检索:SELECT* FROM T_Employee 员工

只检索需要的列:SELECTFNumber FROM T_Employee、SELECTFName,FAge FROM T_Employee

列别名:SELECTFNumber AS编号,FNameAS姓名,FAge AS Age111 FROM T_Employee

使用where检索符合条件的数据:SELECT FName FROM T_EmployeeWHERE FSalary<5000。

还可以检索不与任何表关联的数据:select1+1;select newid();select getdate();

11.  数据汇总

SQL聚合函数:MAX(最大值)、MIN(最小值)、AVG(平均值)、SUM(和)、COUNT(数量)

maximum minimum average

大于25岁的员工的最高工资:SELECT MAX(FSalary) FROMT_Employee WHERE FAge>25

最低工资和最高工资:SELECTMIN(FSalary),MAX(FSalary) FROM T_Employee

12.  数据排序

ORDER BY子句位于SELECT语句的末尾,它允许指定按照一个列或者多个列进行排序,还可以指定排序方式是升序(从小到大排列,ASC)还是降序(从大到小排列, DESC)。

按照年龄升序排序所有员工信息的列表:SELECT* FROM T_Employee ORDER BY FAge ASC

按照年龄从大到小排序,如果年龄相同则按照工资从大到小排序:SELECT* FROM T_Employee ORDER BY FAge DESC,FSalary DESC

ORDERBY子句要放到WHERE子句之后:SELECT * FROM T_Employee WHEREFAge>23 ORDER BY FAgeDESC,FSalary DESC

13.  通配符过滤

通配符过滤使用LIKE。

单字符匹配的通配符为半角下划线“_”,它匹配单个出现的字符。以任意字符开头,剩余部分为“erry”:SELECT * FROM T_Employee WHEREFName LIKE '_erry'

多字符匹配的通配符为半角百分号“%”,它匹配任意次数(零或多个)出现的任意字符。 “k%”匹配以“k”开头、任意长度的字符串。检索姓名中包含字母"n”的员工信息:SELECT * FROM T_EmployeeWHERE FName LIKE '%n%'

14.  空值处理

数据库中,一个列如果没有指定值,那么值就为null,这个null和C#中的null不同,数据库中的null表示“不知道”,而不是表示没有。因此selectnull+1结果是null,因为“不知道”加1的结果还是“不知道”。

SELECT * FROM T_Employee WHERE FNAME=null;

SELECT * FROM T_Employee WHERE FNAME!=null;都没有任何返回结果,因为数据库也“不知道”。

SQL中使用is nullis not null来进行空值判断

SELECT * FROM T_Employee WHERE FNAME is null;

SELECT * FROM T_Employee WHERE FNAME is not null;

15.  多值匹配

SELECT FAge,FNumber,FName FROM T_Employee WHEREFAge IN (23,25,28)

范围值:

SELECT * FROM T_Employee WHERE FAGE>=23 AND FAGE <=27;

SELECT * FROM T_Employee WHERE FAGE BETWEEN 23 AND 27

16.  数据分组

按照年龄进行分组统计各个年龄段的人数:

SELECT FAge,Count(*) FROM T_Employee GROUP BY Fage

GROUP BY子句必须放到WHERE语句的之后

没有出现在GROUPBY子句中的列是不能放到SELECT语句后的列名列表中的(聚合函数中除外).

错误:SELECTFAge,FSalary FROM T_Employee GROUP BY FAge

正确:SELECTFAge,AVG(FSalary) FROM T_Employee GROUP BY FAge

17.  Having语句

Where中不能使用聚合函数,必须使用 Having,Having要位于Group By之后, SELECT FAge,COUNT(*) AS人数 FROM T_Employee

GROUP BYFAge

HAVINGCOUNT(*)>1

注意Having中不能使用未参与分组的列, Having不能替代where。作用不一样,Having是对组进行过滤。

18.  限制结果集行数

a)      select top 5 * from T_Employee order by FSalary Desc

b)      (*)检索按照工资从高到低排序检索从第六名开始一共三个人的信息 :分页

SELECT top 3 *FROM T_Employee WHERE FNumber NOT IN(SELECT TOP 5 FNumber FROM T_Employee ORDER BY FSalary DESC) ORDER BY FSalaryDESC

c)      SQLServer2005后增加了Row_Number函数简化实现,后面会讲。

19.  去掉数据重复

a)      执行备注中的SQL语句,Alter和Insert单独执行。

b)      SELECTFDepartment FROM T_Employee

→ SELECT DISTINCT FDepartment FROM T_Employee

c)      DISTINCT(不同的明显的)是对整个结果集进行数据重复处理的,而不是针对每一个列,因此下面的语句并不会只保留Fdepartment进行重复值处理:

SELECT DISTINCT FDepartment,FSubCompany FROMT_Employee

20.  常见问题

1、SQLServer2008Management Studio中点击【执行】按钮,而不是绿色箭头的调试按钮。

2、如果机器上安装了VisualStudio2010或者 SQLServer2008,需要安装SQLServer2005 Management Studio

3、SQLServer2008 Management Studio中是“修改前200条”

4、Alter增加字段之后要关闭窗口重新打开才能看到新增加的列。

21.  联合结果集

a)      执行备注中的代码

b)      简单的结果集联合:

SELECT FNumber,FName,FAge FROM T_Employee

UNION     

SELECT FIdCardNumber,FName,FAge FROM T_TempEmployee   temp:临时雇员

c)      基本的原则:每个结果集必须有相同的列数; 每个结果集的列必须类型相容

d)      SELECTFNumber,FName,FAge,FDepartment FROM T_Employee     

UNION     

SELECTFIdCardNumber,FName,FAge, ’临时工,无部门’FROM T_TempEmployee

22.  Union all

SELECT FName FROM T_Employee UNION SELECT FNameFROM T_TempEmployee。UNION合并两个查询结果集,并且将其中完全重复的数据行合并为一条

SELECT FName FROM T_Employee

UNION ALL

SELECT FName FROM T_TempEmployee

Union因为要进行重复值扫描,所以效率低,因此如果不是确定要合并重复行,那么就用UNION ALL

23.  案例1

 要求查询员工的最低年龄和最高年龄,临时工和正式员工,要分别查询

SELECT '正式员工最高年龄',MAX(FAge) FROM T_Employee

UNION ALL

SELECT '正式员工最低年龄',MIN(FAge) FROM T_Employee

UNION ALL

SELECT '临时工最高年龄',MAX(FAge) FROM T_TempEmployee

UNION ALL

SELECT '临时工最低年龄',MIN(FAge) FROM T_TempEmployee

24.  案例2

查询每位正式员工的信息,包括工号、工资,并且在最后一行加上所有员工工资额合计。

SELECT FNumber,FSalary FROM T_Employee

UNION ALL

SELECT '工资合计',SUM(FSalary) FROM T_Employee

25.  数字函数(*

a)      执行备注中的代码

b)      ABS() :求绝对值。

c)      CEILING():舍入到最大整数 。3.33将被舍入为4、2.89将被舍入为3、-3.61将被舍入为-3。

Ceiling→天花板 最高限度

d)      FLOOR():舍入到最小整数。3.33将被舍入为3、2.89将被舍入为2、-3.61将被舍入为-4。

Floor→地板 最低限度

e)      ROUND():四舍五入。舍入到“离我半径最近的 数” 。Round→“半径”。Round(3.1425,2)。

26.  字符串函数(*

LEN() :计算字符串长度

LOWER() 、UPPER () :转小写、大写

LTRIM():字符串左侧的空格去掉                  trim:整齐,消减

RTRIM () :字符串右侧的空格去掉

LTRIM(RTRIM(' bb   '))

SUBSTRING(string, start_position, length)

参数string为主字符串,start_position为子字符串在主字符串中的起始位置,length为子字符串的最大长度。SELECT SUBSTRING('abcdef111',2,3)from T_Employee

NULL直接显示

27.  日期函数

a)      GETDATE():取得当前日期时间

b)      DATEADD(datepart , number, date ),计算增加以后的日期。参数date为待计算的日期;参数number为增量;参数datepart为计量单位。DATEADD(DAY, 3,date)为计算日期date的3天后的日期,而DATEADD(MONTH ,-8,date)为计算日期date的8个月之前的日期

datepart取值:

取值           别名           说明

quarter       qq,q           季度

month        mm,m        月份

dayofyear   dy,y   当年的第几天

day             dd,d                   日

week          wk,ww       星期几

hour           hh               小时

minute       mi,n           分

second       ss,s             秒

millisecond         ms              毫秒

c)      DATEDIFF( datepart , startdate , enddate ) :计算两个日期之间的差额

datepart 为计量单位,可取值参考 DateAdd。

d)      统计不同工龄的员工的个数: select DateDiff(year,FInDate, getdate()),count(*) from T_Employee group byDateDiff(year,FInDate,getdate())

f)       DATEPART(datepart,date):返回一个日期的特定部分

g)      统计员工的入职年份个数:select DatePart(year,FInDate),count(*)from T_Employee group by DatePart(year,FInDate)

28.  类型转换函数

1       CAST ( expression AS data_type)   转换成data_type

2       CONVERT ( data_type, expression)

Select cast (‘123’ as int), cast (‘2008-08-08’ asdatetime),

Convert (datetime, ‘2009-09-09’), convert (varchar(50),123)


         SELECTFIdNumber,

         RIGHT(FIdNumber,3)as 后三位,

         CAST(RIGHT(FIdNumber,3)AS INTEGER) as 后三位的 整数形式,

         CAST(RIGHT(FIdNumber,3)AS INTEGER)+1 as 后三位 加1,

         CONVERT(INTEGER,RIGHT(FIdNumber,3))/2as 后三位 除以2

         FROMT_Person

29.  空值处理函数

ISNULL(expression, value) :如果 expression不为空则返回expression,否则返回value。

SELECT ISNULL(FName,'佚名') as 姓名 FROM T_Employee

30.  CASE函数用法1

       单值判断,相当于switch case

       CASEexpression

       WHENvalue1 THENreturnvalue1

       WHENvalue2 THENreturnvalue2

       WHENvalue3 THENreturnvalue3

       ELSEdefaultreturnvalue

       END

       例子:

       SELECT FName,                                                          selectFName,

       (CASE FLevel                                           (case

WHEN1 THEN 'VIP客户'                        when FSalary<2000then ‘低收入’

       WHEN 2 THEN '高级客户'                      whenFSalary>=2000 and FSalary<=5000 then ‘中等收入’

       WHEN 3 THEN '普通客户'                      else‘高收入’

       ELSE '客户类型错误'                               end

       END) as FLevelName(客户类型)            )as 收入水平

       FROM T_Customer                                  from T_Employee

31.  CASE函数用法

CASE

WHEN condition1 THEN returnvalue1

WHEN condition 2 THEN returnvalue2

WHEN condition 3 THEN returnvalue3

ELSE defaultreturnvalue

END 相当于if…else…else….例子:SELECT

FName, FWeight, (CASE

WHEN FWeight<40 THEN ‘瘦瘦'

WHEN FWeight>50 THEN ‘肥肥'

ELSE 'ok'

END) as isnormal

FROM T_Person

32.  练习1

表中有AB C三列,用SQL语句实现:当A列大于B列时选择A列否则选择B列,当B列大于C列时选择B列否则选择C列。

select (case when a>b then a else b end),(casewhen b>c then b else c end ) from t

33.  练习2

单号 金额

Rk1  10

Rk2  20

Rk3  -30

Rk4  -10

将上面的表输出为如下的格式:

单号 收入 支出

Rk1   10    0

Rk2   20   0

Rk3 0   30

Rk4   0   10

Select

FNumber, (case when Amount>0 then FAmount else 0end) as 收入,(case when FAmount<0 then ABS(FAmount) else 0 end) as 支出

from T_Test1

34.  练习3

 有一张表T_Scores,记录比赛成绩

 Date        Name         Score

 2008-8-8 拜仁        胜

 2008-8-9 奇才          胜

 2008-8-9 湖人          胜

 2008-8-10 拜仁        负

 2008-8-8 拜仁          负

 2008-8-12 奇才        胜

 要求输出下面的格式:

 Name 胜 负

 拜仁 1    2

 湖人 1     0

 奇才 2    0

  

 注意:在中文字符串前加N,比如N’胜’

select Name,(case Score when N’胜’ then 1 else 0 end) as 胜, (case Score when N’负’ then 1 else 0 end) as 负 from T_Scores

select Name, Sum(case Score when N’胜’ then 1 else 0 end) as 胜, Sum(case Score when N’负’ then 1 else 0 end) as 负

from T_Scores group by Name

 

35.  练习

        创建一张表,记录电话呼叫员的工作流水,记录呼叫员编号、对方号码、通话开始时间、通话结束时间。建表、插数据等最后都自己写SQL语句。


         要求:

•     输出所有数据中通话时间最长的 5条记录。Order by datediff

提示:select DateDiff(second, StartDateTime, EndDateTime) from T_CallRecords

select top 5 * fromT_CallRecords1 order by DateDiff(second,StartDateTime, EndDateTime) Desc

•     输出所有数据中拨打长途号码(对方号码以0开头)的总时长。like、sum

提示:select * from T_CallRecords1 where TelNum like ‘0%’

select sum(datediff(second, StartDateTime, EndDateTime)) fromT_CallRecords1 where TelNum like ‘0%’

•     输出本月通话总时长最多的前三个呼叫员的编号。datediff(month....),sum, order by

提示:select datediff(month, convert(datetime, ‘2010-06-01’), convert(datetime, ‘2010-07-02’)),

                   datediff(month,convert(datetime, ‘2010-06-15’), convert(datetime, ‘2010-07-02’)),

         只差一个月

         selectCallerNumber, TelNum, datediff(month, StartDateTime, getdate()) fromT_CallRecords1

         select  * from T_CallRecords1 where datediff(month,StartDateTime, getdate()) = 0   (本月)

解答:select top 3 CallerNumber from T_CallRecords1 where datediff(month,StartDateTime, getdate()) =0

         group by CallerNumber orderby Sum(datediff(second, StartDateTime, EndDateTime)) Desc

 

•     输出本月拨打电话次数最多的前三个呼叫员的编号 .group by,count(*)

select  top 3 CallerNumber, count (*) from T_CallRecords1 wheredatediff(month, StartDateTime, getdate())=0

group byCallerNumber order bycount(*) Desc

•     输出所有数据的拨号流水,并且在最后一行添加 总呼叫时长

         • 呼叫员编号、对方号码、通话时长

         •.......

         • 汇总  [市内号码总时长][长途号码总时长]

select CallerNumber, TelNum, datediff(second,StartDateTime, EndDateTime) from T_CallRecords1

union all

select ‘汇总’,

convert (

varchar (50), sum ((case whenTelNum not like ‘0%’ then datediff(second,StartDateTime, EndDateTime) else 0 end))

) as 市内通话,  

sum((case when TelNum like ‘0%’ then datediff(second, StartDateTime, EndDateTime) else 0 end)) as 长途通话 from T_CallRecords1

 

36.  索引Index

1       全表扫描:对数据进行检索(select)效率最差的是全表扫描,就是一条条的找。

2       如果没有目录,查汉语字典就要一页页的翻,而有了目录只要查询目录即可。为了提高检索的速度,可以为经常进行检索的列添加索引,相当于创建目录。

3       创建索引的方式,在表设计器中点击右键,选择“索引/键”→添加→在列中选择索引包含的列。

4       使用索引能提高查询效率,但是索引也是占据空间的,而且添加、更新、删除数据的时候也需要同步更新索引,因此会降低Insert、Update、Delete的速度。只在经常检索的字段上(Where)创建索引

5       (*)即使创建了索引,仍然有可能全表扫描,比如like、函数、 类型转换等。

37.  表连接Join

1       有客户表(T_Customers)和订单表(T_Orders)两个表,客户表字段为:Id、Name、Age,订单表字段为:Id、BillNo、 CustomerId,订单表通过CustomerId关联客户表。

         select o.BillNo, c.Name, c.Age

         from T_Orders as o               别名o

         joinT_Customers as c

ono.CustomerId=c.Id

2       join是和哪个表连接,on后是连接的关系是什么。

3       要求显示所有年龄大于15岁的顾客购买的订单号、客户姓名、客户年龄。

         加上:where c.Age >15

4       要求显示年龄大于平均年龄的顾客购买的订单

         加上: where c.Age > (select avg(Age)from T_Customers)

5       (*)Inner Join、Left Join、Right Join

38.  子查询

1       将一个查询语句做为一个结果集供其他SQL语句使用,就像使用普通的表一样,被当作结果集的查询语句被称为子查询。所有可以使用表的地方几乎都可以使用子查询来代替。

SELECT * FROM(SELECT * FROM T2 where FAge<30)

2       单值做为子查询:SELECT 1 AS f1, 2, (SELECTMIN(FYearPublished) FROM T_Book),(SELECT MAX(FYearPublished)         FROM T_Book) AS f4


3       只有返回且仅返回一行、一列数据的子查询才能当成单值子查询。下面的是错误的:

SELECT 1 AS f1, 2,(SELECT FYearPublishedFROM T_Book)

SELECT * FROM T_ReaderFavorite WHERE FCategoryId=(SELECT FId FROM T_CategoryWHERE FName='Story')

4       如果子查询是多行单列的子查询,这样的子查询的结果集其实是一个集合

SELECT * FROM T_Reader

WHERE FYearOfJoinIN (select FYearPublished FROM T_Book)

5       限制结果集。返回第3行到第5行的数据( ROW_NUMBER 不能用在where子句中,所以将带行号的执行结果作为子查询,就可以将结果当成表一样用了):

SELECT * FROM (SELECT ROW_NUMBER()OVER(ORDER BY FSalaryDESC) AS rownum,FNumber,FName,FSalary,FAge FROM T_Employee) AS a

WHERE a.rownum>=3AND a.rownum<=5

取个别名,就OK

---------------------- Windows Phone 7手机开发、 .Net培训、期待与您交流! ----------------------

你可能感兴趣的:(黑马程序员_数据库基础)