浪浪余心lp

数据库系统概论总结

第一章、数据库系统概论
-----数据库的四个基本概念
1.数据（Data），描述事务的符号记录称为数据。数据的含义称为语义，数据与其语义是不可分的。
2.数据库（DataBase，DB）
长期存储在计算机内，有组织的，可共享的大量数据的集合。
数据库数据特点：1.永久存储 2.有组织 3.可共享
3.数据库管理系统（DataBase Management System,DBMS）
位于用户与操作系统之间的一层数据管理软件。数据库管理系统和操作系统一样是计算机的基础软件。
4.数据库系统（DataBase System,DBS）
数据库系统由数据库（DB），数据库管理系统(DBMS)，应用程序和数据库管理员(DBA)组成的存储、管理、处理和维护数据的系统。
------数据管理技术的三个阶段：
1.人工管理阶段
特点：数据不保存，应用程序管理数据，数据不共享，不具有独立性，应用程序管理数据。
2.文件系统阶段
特点：数据可以长期保存，由文件系统管理数据，但是数据共享性差，冗余度大，独立性差。
3.数据库系统阶段
特点：数据结构化，数据的共享性高，冗余度低且易扩充，数据独立性高（包括物理独立性和逻辑独立性），数据由数据库管理系统统一管理和控制。
-----数据模型是对现实世界数据特征的抽象，数据模型是数据库系统的核心和基础。
数据模型通常由数据结构，数据操作，数据的完整性约束三部分组成。
一个数据模型通常由这三个方面进行完整描述。
1.数据结构描述数据库的组成对象（实体）以及对象之间的联系。
2.数据操作是指对数据库中各种对象（型）的实例（值）允许执行的操作集合，包括操作和有关的操作规则。数据库主要有插删改查四大操作，数据模型必须确切定义这些操作的确切含义、操作符号、操作规则以及操作的实现语言。
根据模型应用的不同目的，数据模型可以分为三大类，分别属于三个不同层次。
3.数据的完整性约束：是一组数据的完整性规则。数据的完整性规则是数据、数据语义和数据联系所具有的制约和依存规则。包括数据结构的完整性规则和数据操作的完整性规则，用以限定符合数据模型的数据库状态以及状态的变化。
-----概念模型（信息模型），强调语义表达功能。
也称信息模型，主要用于数据库设计。
概念模型实际上是现实世界到机器世界的一个中间层次。
概念模型用于信息世界的建模。
现实世界是由一组称作实体的基本对象以及这些对象间的联系构成。
-----信息世界的基本概念
1.实体：现实世界中客观存在并可相互区别的事物。
2.属性：实体所具有的某一特征。
3.码：唯一标识实体的属性集。
4实体型：用实体名及其属性名集合来抽象和刻画同类实体，称为实体型。
5.实体集：同一类型实体的集合。
6.联系：实体内部联系指组成实体的各属性间的联系，实体间的联系可分为一对一，一对多，多对多三种。
概念模型的表示方法，**E-R模型（联系-实体模型）最常用的为实体-联系方法(Entity-Relationship approach），该方法用E-R图来描述概念模型。**E-R方法也成为E-R模型。
-----逻辑模型（逻辑数据模型）
逻辑层用于描述数据库数据的整体逻辑结构。该层的数据抽象称为逻辑数据模型（简称为逻辑模型）。主要用于数据库管理系统的实现。
层次模型、网状模型、关系模型等。
-----物理模型（物理数据模型）
**物理模型是对数据最底层的抽象，用来描述数据的物理存储结构和存取方法。例如，数据的物理记录格式是定长的还是变长的；数据压缩还是非压缩的；索引结构是B+树还是hash结构等。
1.层次模型
概念：有且只有一个结点没有双亲结点，称为根节点。根结点以外的其他结点有且只有一个双亲结点。
2.网状模型
概念：允许一个以上的结点无双亲，一个结点可以有多于一个双亲。
2.网状数据库的数据定义语言（DDL）和数据操作语言（DML）比较复杂，要求用户掌握数据库结构和存取路径，不容易使用。
3.关系模型
关系模型是最重要的一种数据模型.
概念：关系模型由关系数据结构，关系操作集合，关系完整性约束三部分组成。
-----关系模型中数据的逻辑结构是一张二维表，它由行和列组成。**关系模型就是由一组关系组成。
关系模型中的一些术语：
1.关系：一个关系对应通常说的一张表。
2.属性：表中的一列即为一个属性。
3.域：属性的取值范围。
4.元组：表中的一行即为一个元组。
5.码：也称码键。表中的某个属性组，它可以唯一标识一个元组。
6.分量：元组中的一个属性值。
7.关系模式：对关系的描述，一般表示为关系名（属性1，属性2，…，属性n），相当于二维表的表头部分（表格描述部分）。
关系模型要求关系必须是规范化的，关系的每一个分量必须是一个不可分的数据项。
关系模型的数据操纵主要包括查询、插入、删除和更新数据。
-----从现实世界到概念模型的转换（建模）是由数据库设计人员来完成的；从概念模型到逻辑模型的转换由数据库设计人员完成；逻辑模型到物理模型的转换由DBMS实现。

-----模式：数据库中全体数据的逻辑结构和特征的描述。
实例：模式的一个具体值。
模式是相对稳定的，实例是相对变动的。
-----数据库的三级模式结构是指数据库是由外模式，模式，内模式三级构成。
外模式：也称子模式或者用户模式，是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述。外模式是模式的子集，一个数据库可以有多个外模式，对应不同的用户需求。
模式：也称逻辑模式，数据库中全体数据的逻辑结构和特征的描述。
内模式：也称存储模式，一个数据库只有一个内模式，它是数据物理结构和存储方式的描述，是数据在数据库内部的组织方式。
-----数据库的两层映像，保证了数据库管理系统中的数据具有较高的逻辑独立性和物理独立性。
外模式/模式映像：模式描述的是数据的全局逻辑结构，外模式描述的是数据的局部逻辑结构。一个模式可以有多个外模式。对于每一个外模式，数据库管理系统都有一个模式/外模式映像，定义了该外模式和模式之间的关系，该映像定义在外模式的描述中。保证数据与程序的逻辑独立性。
模式/内模式映像：数据库中只有一个模式，也只有一个内模式，所以模式/内模式映像是唯一的。定义了数据的全局逻辑结构和物理存储之间的对应关系。该映像定义在模式的描述中。保证数据的物理独立性。
数据的独立性：**数据独立是指数据的使用（即应用程序）与数据的说明（即数据的组织结构和存储方式）分离，使应用程序只考虑如何使用数据，而无须关心他们的构造和存储。**数据的独立性用来描述应用程序和数据结构之间的依赖程度，包括数据的物理独立性和数据的逻辑独立性，依赖程度越低则独立性越高。
物理独立性：用户的应用程序和与数据库中数据的物理结构是相互独立的。数据库中的数据在磁盘上如何存储和组织的由数据库管理系统负责，应用程序只关心数据的逻辑结构，当数据的物理存储结构改变时，不用修改应用程序。
**逻辑独立性：用户的应用程序与数据库中的数据的逻辑结构是相互独立的。**数据库中的数据的全局逻辑结构由数据库管理系统负责，应用程序只关心数据的局部逻辑结构。数据的全局逻辑结构改变了，应用程序也不用修改。
----数据库系统的组成：
1.数据库
2.数据库管理系统和应用系统
3.人员（数据库管理员、系统分析员、数据库设计人员、应用程序猿、最终用户）

第二章、关系模型和关系代数
-----关系数据库系统：是支持关系模型的数据库系统。
关系模型的数据结构非常简单，只包含单一的数据结构——关系。
在用户看来，关系模型中数据的逻辑结构是一张二维表。
-----关系数据结构的形式化定义
1.域：一组具有相同数据类型的值的集合。
2.笛卡尔积：给定一组域D1,D2,D3,D4…,Dn，它们之间可以有相同的域。则D1,D2,D3,D4…,Dn的笛卡尔积为：D1XD2XD3XD4…XDn={(d1,d2,d3,…,dn)}对于集合中的每一个元素(d1,d2,d3,…,dn)成为一个n元组，简称元组；元素中的每一个值di称为一个分量。笛卡尔积的基数就是元组的数目。
3.关系：D1×D2×…×Dn的子集叫做所在域D1，D2，…,Dn上的关系，表示为R(D1，D2，…Dn)，relation。
这里R表示关系的名字，n是关系的目或度。
关系中的每个元素是关系的元组，通常用t表示。
n=1时，该关系为单元关系，或一元关系。
n=2时，为二元关系。
3.对于关系数据库，表头对应于关系模式，关系模式是型的概念，定义了元组集合的结构；表体对应于关系，关系是元组的集合，关系是值的概念。关系的描述即是关系模式，一般表示：
R(属性名1，属性名2，… ，属性名n)。
4.码：唯一标识一个元组的属性集。码=超码=码键
5.超码：唯一的标识一个元组的属性集。一个超码的任何超集都是超码。
6.如果属性集A是关系r的超码且属性集A的任意真子集都不能成为关系r的超码，则称属性集A为候选码。候选码就是最小的超码。
7.候选码：可以唯一标识一个元组的最少的属性集合。
8.主码：某个能够唯一标识一个元组的最小属性集合。
候选码的诸属性称为主属性，不包括在任何候选码中的属性称为非主属性，或非码属性。
无论是超码、候选码、主码，都具有唯一标识一个元组的特性，码包括超码、候选码和主码。
主码=主键，外码=外键。
在最简单的情况下，候选码只包含一个属性。在最极端的情况下，关系模式的所有属性都是这个关系的候选码，称为全码。

-----关系数据库模式
1.在关系模式中，实体和实体之间的联系都是通过关系来表示的。
2.所有的实体以及实体之间的联系所对应的关系的集合就构成了一个关系数据库。关系数据库也有值和型之分，关系数据库的型就是关系数据库模式，关系数据库模式就是它所包含的所有关系模式的集合，是对关系数据库的描述；关系数据库的值就是这些关系模式在某一时刻所对应的关系的集合，通常叫关系数据库实例。
-----关系完整性约束
关系模式中有3类数据完整性约束，实体完整性、参照完整性和用户自定义完整性。实体完整性和参照完整性是关系模式必须满足的数据完整性约束，被称作关系的两个不变性，由关系数据库管理系统自动支持。用户自定义完整性是应用领域需要遵循的数据完整性约束。
1.实体完整性：若属性集A是关系r的主码，则A一定不能取空值。由于现实中的实体都是可区分的，即它们具有某种唯一性标识，如果主码取空，那么存在不可标识的实体，这是不允许的。关系模式中以主码作为唯一性标识。
2.参照完整性：现实世界中的实体之间存在各种联系，而在关系模型中实体以及实体间的联系都是用关系来描述。因此，实体间的联系也就对应关系和关系之间的联系。参照完整性规则，若关系r外码参照关系s的主码，则对应的关系r中的每一个元组在属性F上的取值，要么是空值NULL，要么等于关系s中的某个元组的主码值。
3.数据库模式导航图
4.任何关系数据库管理系统都应该支持实体完整性和参照完整性，这是关系模式所要求的。不同的关系数据库根据不同的业务语义，通常还需要满足一些特殊的约束条件。
-----关系操作
-----关系可以有三种类型：基本关系（通常又称为基本表或基表）、查询表和视图表（关系就是表）
基本表是实际存在的表，查询表是查询结果对应的表，视图表是由基本表和其他视图表导出的表，是虚表。
-----关系模型的关系操作
1.关系中的关系操作有查询操作和更新操作（插、删、改、除）。查询操作是关系模型操作的最主要部分。查询操作的五个基本关系操作，选择、投影、集合并、集合差和笛卡尔积。其他操作可以通过基本操作来定义导出。关系操作的特点是集合操作方式，即操作的对象和结果都是集合。
2.查询语言可以分为过程化语言和非过程化语言。在过程化语言中，用户指导系统对数据库执行一系列操作以计算所需结果。在非过程化语言中，用户只需描述所需信息，而不用给出获取该信息的具体过程。关系查询语言有关系代数、关系演算和SQL语言。关系代数是用代数方式表达的关系查询语言，关系演算是用逻辑方式表达的关系查询语言，它们都是非结构化的查询语言。
3.结构化查询语言SQL，不仅有丰富的查询功能，而且数据定义、数据操作数据控制功能，集DDL、DML、DCL于一体，是关系数据库的标准语言。
-----关系代数查询语言
1.关系代数就是通过关系代数运算****来构建查询表达式。
2.查询又可以分为选择、投影、连接、除、并、差、交、笛卡尔积等、其中选择、投影、并、差、笛卡尔积是5 种基本的操作。交可以用差表示。
3.选择操作：在关系r中找到满足给定的谓词（选择条件）的所有元组,P表示谓词（选择条件）。例：σP®。
4.投影操作：关系是一个二维表，对它的操作从水平角度是选择操作，从纵向角度进行，即投影操作。例：ΠA®，关系r上的投影从关系r中选择若干属性组成新的关系，A为关系r的属性集合。无论是选择还是投影操作，最终结果都是关系，即可以用表达式来替代操作中的关系r。
5.笛卡尔积（重点理解怎么将两个关系进行合并，实际上就是关系r中的元组进行扩展，每个元组都扩展关系s中元组数，并添加到后面，且属性数是两个关系属性数目之和）
6.连接：连接也称为θ连接，关系R与关系S的连接运算是从两个关系的笛卡尔积中选取属性间满足一定条件（谓词θ）的所有元组。
等值连接：等值比较谓词的连接运算。
自然连接：是一种特殊的等值连接，两个关系中具有相同的属性组，并在这个公共属性集中等值连接，在结果中把重复的属性列去掉，最后只保留属性组中分量相同的元组。
左连接：在自然连接的基础上加上左边表上不包含自然连接中所含元组（行）的元组。
右连接：在自然连接的基础上加上右边表上不包含自然连接中所含元组（行）的元组。
外连接：左连接+右连接。
笛卡尔积对两个关系 R 和 S 进行操作，产生的关系中元组个数为两个关系中元组个数之积。等值联接则是在笛卡尔积的结果上再进行选择操作，挑选关系第 i 个分量与第(r+j) 个分量值相等的元组；自然连接则是在等值联接(以公共属性值相等为条件)的基础上再行投影操作，去掉 S 中的公共属性列，当两个关系没有公共属性时，自然连接就转化成笛卡尔积。
1、自然连接一定是等值连接，但等值连接不一定是自然连接。
2、等值连接要求相等的分量，不一定是公共属性；而自然连接要求相等的分量必须是公共属性。
3、等值连接不把重复的属性除去；而自然连接要把重复的属性除去。
4、等值去掉重复的属性就是自然连接。

第三章SQL查询语言
SQL语言由四部分组成，数据定义语言DDL、数据操作语言DML、数据控制语言DCL和其他。
数据定义语言：定义数据的逻辑结构，包括数据库、基本表、视图和索引等。还支持存储过程、函数、对象、触发器等的定义。
数据操作语言：数据库的数据进行检索和更新。更新操作包括增（插）、删、改。SQL数据操作语言=SQL数据检索寓言+SQL数据更新语言。
数据控制语言：对数据库对象进行授权、用户维护、完整性规则定义和事务定义等。
-----SQL结构化查询语言
1.高度非过程化，只需提出做什么，不用指明怎么做。
2.面向集合的操作方式，操作对象、查找结果和插入删除对象也可以是元组的集合。
3.SQL语言是独立的语言，也是嵌入式语言，可以插入到高级程序设计语言中去。
-----SQL语言支持关系数据库管理系统的三级模式结构，其中外模式对应视图和部分基本表，模式对应基本表，内模式对应存储文件。
1.数据库中的独立存在的表称为基本表。SQL中一个关系对应一个基本表，一个或者多个基本表对应一个存储文件；一个表可以带若干索引，索引也存放在存储文件中。
2.视图：一个或者几个基本表中导出的表，只存放视图的定义，不存放对应的数据。
-----SQL语句执行顺序
1.FROM子句
2.WHERE子句
3.GROUP子句
4.聚集函数进行计算
5.HAVING函数子句进行筛选分组
6.计算所有表达式
7.GROUP BY对结果进行排序
------SQL语句查询实例
https://blog.csdn.net/CJJ_jingjie/article/details/79845950
https://blog.csdn.net/znyyjk/article/details/52717336
https://blog.csdn.net/hundan_520520/article/details/54881208
https://blog.csdn.net/Hectorhua/article/details/13767361
https://blog.csdn.net/kasama1953/article/details/52226128

第四章数据库建模
数据库设计：通过将现实世界中的数据进行合理组织，并利用已有的数据库管理系统来建立数据库系统的过程。
-----数据库建模就是数据库概念设计。
它的任务就是分析数据库中必须存储的信息以及这些信息之间的关系，并通过一种数据模型表示。E-R模型是一种数据建模工具，它通过将现实世界中的事物以及关系建模为实体、实体的属性和实体之间的联系，并通过E-R图进行描述，具有很强的表达能力。
-----数据库设计分6个阶段：
需求分析、概念结构设计、逻辑结构设计、物理结构设计、数据库实施、数据库运行和维护。
①需求分析：准确了解与分析系统需要提供的功能和用户需求（包括数据与处理）；这是最困难、最耗费时间的一步。
这一阶段的分析结果是形成用户的需求规格说明书。
②概念结构设计（E-R模型的数据库概念设计）：通过对用户需求进行综合、归纳与抽象，形成一个独立于具体DBMS的概念模型。这是整个数据库设计的关键。
③逻辑结构设计：将概念结构转换为某个DBMS所支持的数据模型，即数据库模式。将E-R模式转换为关系数据库模式。
④物理结构设计：为逻辑数据模型选取一个最适合应用环境的物理结构（包括存储结构和存取方法）
⑤数据库实施：运用DBMS提供的数据库语言（如SQL）及宿主语言，根据逻辑设计和物理设计的结果：a. 建立数据库；b. 编制与调试应用程序；c. 组织数据入库；d. 进行试运行
⑥数据库运行和维护阶段：数据库应用系统经过试运行后即可投入正式运行；在数据库系统运行过程中必须不断地对其进行评价、调整与修改。
需求分析和概念设计独立于任何数据库管理系统。
逻辑设计和物理设计与选用的DBMS密切相关。
-----E-R模型的基本概念及表示
实体与实体集：
实体是客观世界中可区别其他事物的“事物”或“对象”。实体集是指具有相同类型和相同属性的实体集合。
属性：
简单属性和复合属性：可以和不可以划分为更小部分的属性。家庭地址多值属性。
单值属性和多值属性：一个特定实体在任何时候有一个或者多个值。
派生属性，通过其他相关属性派生出来。
E-R图中，实体集用矩形表示，属性用椭圆表示，多值属性用双椭圆表示，派生属性用虚线椭圆表示，属性与实体之间用连线表示。主码-下划线，外码-斜体字。
-----联系与联系集
**联系是多个实体间的相互关联，联系集是同类联系的集合。联系集是n（n>=2）个实体集上的数学关系，这些实体集不必互异。一般用菱形表示实体集。**例：选课联系集表示学生与课程之间的选课联系。可以为选课联系集定义一个属性成绩，一般图中都是省略实体集的属性，不再标明。
**数据字典：数据字典的作用是给数据流图上每个成分加以定义和说明。换句话说，数据流图上所有的成分的定义和解释的文字集合就是数据字典。**数据字典内容包括：
1.数据库中所有模式对象的信息，如表、视图、簇、及索引等。
2.分配多少空间，当前使用了多少空间等。
3.列的缺省值。
4.约束信息的完整性。
5.用户的名字。
6.用户及角色被授予的权限。
7.用户访问或使用的审计信息。
8.其它产生的数据库信息。
多联系：给定的各实体之间可以有多种不同的联系，即多个不同的联系集可以定义在一些相同的实体集上，称为实体之间的多联系。
联系集的度：参与联系集的实体集的数目称为联系集的度。二元联系集、三元联系集，数据库系统中大多数联系集都是二元的。

第五章关系数据理论和模式求精
-----必须掌握的基本概念
1.码：唯一标识一个元组的属性集。码=超码。
2.超码：唯一的标识一个元组的属性集。一个超码的任何超集都是超码。
3.如果属性集A是关系r的超码且属性集A的任意真子集都不能成为关系r的超码，则称属性集A为候选码。候选码就是最小的超码。
4.候选码：可以唯一标识一个元组的最少的属性集合。
5.主码：某个能够唯一标识一个元组的最小属性集合。
6.主属性（码属性）包含在任何一个候选码码中的属性称为为主属性，不包括在任何候选码中的属性称为非主属性（非码属性）。
7.无论是超码、候选码、主码，都具有唯一标识一个元组的特性，码包括超码、候选码和主码。
主码=主键，外码=外键。
在最简单的情况下，候选码只包含一个属性。在最极端的情况下，关系模式的所有属性都是这个关系的候选码，称为全码。
导读：一个好的关系模式应该是数据冗余尽可能少，且不会发生插入异常、删除异常和更新异常问题。为得到一个好的关系模式，一般需要进行模式分解。但模式分解还要考虑分解后的模式是否具有无损连接、保持依赖等特性。关系数据理论就是来指导设计出一个好的关系模式以及对已有的模式进行求精。
问题提出：数据冗余导致的问题和模式分解导致的问题。
-----数据冗余导致的问题（同一信息在数据库中存储了多个副本）
1.冗余存储：信息重复存储。例：在选课模式中，学生姓名和课程名都被重复存储多次。
2.更新异常：当重复信息的一个副本被修改时，所有的副本都要进行修改，当更新数据时，系统需要付出很大代价维护数据库的完整性，否则面临数据一致性的危险。例：当修改某学生的姓名或课程名时，可能只修改部分副本的信息，而其他副本未被修改到。
3.插入异常：只有当一些信息事先已经存放在数据库中时，另外一些信息才能存入数据库。如果某学生没选课或者某门课程没有学生选，则该学生或课程信息不能存入数据库。
4.删除异常：删除某些信息可能丢失其他信息。学生的所有选修课程信息被删除时，则该学生的信息被丢失。
解决问题：关系模式应该满足条件，即范式要求。
-----模式分解导致的问题
模式分解：为减少冗余和各种异常，将关系模式分解为较小的关系模式集来解决就是模式分解。
有损分解和无损分解：如果能够通过连接分解以后所得到的较小关系完全还原被分解关系的所有实例，称为无损分解。该分解具有无损连接的特性。
保持依赖：被分解的关系模式上的所有依赖关系都应该在分解得到的关系模式中保留。
-----函数依赖定义
若在一张表中，在属性（或属性组）X的值确定的情况下，必定能确定属性Y的值，那么就可以说Y函数依赖于X，写作 X → Y。也就是说，在数据表中，不存在任意两条记录，它们在X属性（或属性组）上的值相同，而在Y属性上的值不同。这也就是“函数依赖”名字的由来，类似于函数关系 y = f(x)，在x的值确定的情况下，y的值一定是确定的。
函数X确定Y函数=Y函数确定X= X → Y。
系名 → 系主任学号 → 系主任（学号，课名） → 分数
但下函数依赖关系则不成立：
学号 → 课名学号 → 分数课名 → 系主任（学号，课名） → 姓名
完全函数依赖（所有的X函数的属性确定Y）
在一张表中，若 X → Y，且对于 X 的任何一个真子集（假如属性组 X 包含超过一个属性的话），X ’ → Y 不成立，那么我们称 Y 对于 X 完全函数依赖，记作 X F→ Y。（那个F应该写在箭头的正上方，没办法打出来……，正确的写法如图1）

例如：
学号 F→ 姓名（学号，课名） F→ 分数（注：因为同一个的学号对应的分数不确定，同一个课名对应的分数也不确定）
部分函数依赖(部分函数X的属性确定Y）
假如 Y 函数依赖于 X，但同时 Y 并不完全函数依赖于 X，那么我们就称 Y 部分函数依赖于 X，记作 X P→ Y，如图2。

例如：（学号，课名） P→ 姓名
非平凡函数依赖：A->B函数依赖图

平凡函数依赖：A->A；AB->A(AB是属性集合，即相并)

传递函数依赖：前提，两两非平凡函数依赖

主属性（在任一候选码的属性）、非主属性、码（此处指候选码）
-----四个范式（重点）
1.第一范式1NF，如果关系模式r®的每个属性都是不可分的，则称r®属于第一范式，r®∈1NF。
2.第二范式2NF，如果关系模式r®∈1NF，且所有非主属性都完全函数依赖于r®的候选码（不存在非主属性部分依赖于候选码），则称r®属于第二式，r®∈2NF。目标；将只部分依赖候选码的非主属性分解到其他关系模式中去。
3.第三范式3NF，如果关系模式r®∈2NF，且所有非主属性都直接函数依赖于r®的候选码（不存在非主属性传递依赖于候选码，允许存在主属性对候选码的传递和部分函数依赖）。
4.BCNF范式，如果关系模式r®∈3NF，函数依赖集合中的所有依赖X->Y左部都包含R中的任一候选码（即BCNF范式中左部必须含有候选码）消除主属性对于码的部分与传递函数依赖。
5.一个满足BCNF范式的关系模式必然满足下列结论：
（1）所有非主属性都完全直接函数依赖于每个候选码。
（2）所有主属性都完全函数依赖于每个不包含它的候选码。
（3）没有任何属性完全函数依赖于非候选码的任何一组属性。即左部如果不包含候选码，那么就不存在。
例：3NF放松之处在于允许主属性对候选码的传递依赖和部分依赖。在满足3NF的如下关系模式中，存在主属性a部分函数依赖于候选码B，存在主属性b部分函数依赖于候选码C，存在主属性a传递依赖于主属性c。
**BCNF范式可以出现主属性传递依赖于某一候选码，但此时还需直接依赖另外一个候选码。**关系模式r®,R是属性集合，R(A,B,C,D),函数依赖集F={X1->X2 X2->X1 X1->X3 X1->X4}。仍然满足BCNF范式。
6.解题技巧：先标出主属性、非主属性、候选码，然后再标出关系。
-----函数依赖理论
逻辑蕴涵：若给定函数依赖集F，可以证明其他函数依赖也成立，则称这些函数依赖被逻辑蕴涵（p->q）。
函数依赖集闭包：F为函数依赖集，F逻辑蕴涵的所有函数依赖组成的集合称为F的闭包，记F+，F->F+当且仅当其永真。
计算函数依赖集的闭包：**Armstrong公理，**几个推论直接用于闭包计算。如下：
合并律：若X→Y，X→Z同时在R上成立，则X→YZ在R上也成立。
分解律：若X→YZ在R上成立,则X→Y,X→Z在R上也成立。
伪传递律：若X→Y在R上成立，且WY→Z，则XW→Z。
属性集闭包：r®为关系模式，F为函数依赖集，A为包含于R的属性集，则称在函数依赖集F下由A函数确定的所有属性的集合为F在属性集A的闭包，A+。
属性依赖集闭包的作用：
求关系模式R的候选码和最小函数依赖集F：
L类:一定存在某候选码当中。
R类：不属于候选码
N类：一定存在任意候选码当中
LR类：与L和N候选码中的属性逐个结合，求属性集闭包，若等于U，则为候选码。
模式分解算法:BCNF分解算法和3NF分解算法。

第六章数据库安全性保护和完整性约束
-----数据库安全性
导读：由于数据库中的数据是共享数据，必须在数据库管理系统中建立一套完整的使用规则进行数据库保护，以防止不合法的使用所造成的数据泄露、更改和破坏。
数据库安全保护的目标是确保只有授权用户才能访问数据库，所有未被授权的人员则无法接近数据。安全措施是指计算机系统中用户直接或通过应用程序访问数据库所要经过的安全认证过程。
数据库安全保护：
1.身份认证。
2.存取控制。：决定用户可以对数据库中的哪些对象进行操作、进行何种操作。
（1）**定义用户权限.**并将用户权限登记到数据字典中去。
（2）**合法权限检查。**每当用户发出存取数据库的操作请求后，DBMS查找数据字典，根据安全规则进行合法权限检查，若用户的操作请求超出了定义的权限，系统将拒绝执行此操作。
3.视图：可以通过对不同的用户定义不同的视图，达到限制用户访问范围的目的。因此，视图机制能隐藏用户无法获取的数据。视图的主要功能是提供数据库的逻辑独立性。
4.审计：审计是一种监视措施，用来跟踪和记录有关数据的访问活动。审计追踪把用户对数据库的所有操作自动记录下来，存放在审计日志中。审计日志的一般内容包括操作系统用户名、数据库用户名、数据库操作、操作对象名、操作时间等。审计往往很耗费时间和空间，DBMS一般都是将其作为可选特征，允许DBA根据应用需求打开或者关闭审计功能。审计是DBMS达到C2以上安全级别必不可少的一项安全指标。

第七章事务管理与恢复
-----事务的概念和4个特征
事务是用户定义的一个数据库操作系列，这些操作要么全做要么全不做，是一个不可分割的工作单位。
事务具有4个特性：原子性、一致性、隔离性和持续性，这4个特性也简称为ACID特性。
原子性：故障原子性。事务是数据库的逻辑工作单位。事务的所有操作要么都做要么都不做。通过DBMS撤销未完成事务对数据库的影响来实现的。
一致性：并发原子性。事务执行的结果必须是使数据库从一个一致性状态另外一个一致性状态。它是多个事务并发执行正确性的基础。通过代码或者DBMS提供的数据库完整性约束（如触发器）的自动检查功能来保证。事务的一致性包括显示一致性和隐式一致性。显示一致性是显示定义的完整性约束，如主码、外码、用户自定义约束等。隐式一致性是业务规则隐含的完整性要求。
隔离性：执行原子性。一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对其他并发事务是隔离的，并发执行的各个事务之间不能互相干扰。通过DBMS的并发控制模板保证。
持久性：恢复原子性。指一个事务一旦提交，它对数据库中的数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其执行结果有任何影响。通过记录在磁盘中的恢复信息（如日志、备份等）来实现丢失数据（因中断而丢失的存放在主存中还未保存到磁盘数据库中的数据）的恢复。
在操作系统中，进程是竞争系统资源和进行处理机调度的基本单元。在数据库管理系统中，事务是数据库管理系统中竞争资源、并发控制和恢复的基本单元。它由SQL语言和高级编程语言提供的事务开始语句和事务结束语句以及由它们包含的全部数据库操作语句组成。有两种类型的事务结束语句。
事务提交（commit）：将成功完成事务的执行结果永久化，并释放事务占有的全部资源。
事务回滚（rollback）：中止当前事务、撤销其对数据库的更新，释放所占全部资源。事务异常终止。回滚之前事务的所有更新操作，事务滚回到开始时的状态。
-----如何定义事务
显示定义事务：
BEGIN TRANSACTION
SQL语句1
SQL语句2
…
COMMIT/ROLLBACK
隐式定义事务：是指事务提交或回滚之后，自动开始新的事务。
-----事务的并发执行与调度
**并发执行和并行执行：**并发执行是单CPU的处理方式，即“宏观上并行，微观上串行”。并行执行就是在多CPU环境下，才能实现的多个任务同时进行。两者区别在于是否同时。
事务并发执行的优点：
增加系统吞吐量。吞吐量就是单位时间内系统完成事务的数量。当一事务需要等待I/O时，CPU可以去处理其他正在等待CPU的事务。
减少平均响应时间。事务响应时间是指事务从提交给系统到最后完成所需要的时间。
事务一致性状态：数据库中只包含成功事务提交的结果。
事务不一致性状态：数据库中包含失败事务提交的结果。
事务并发执行导致的不一致问题：
1.读脏数据。如果事务T1读取数据但没有提交这个数据，T1由于某种原因中止而撤销，这时T2读取这个未提交的数据，就读取了不一致（失败事务的结果）的数据。数据库中将这种读取未提交且被回滚撤销（先读取再撤销）的数据为读脏数据。
2.不可重复读。指事务Ti两次从数据库中读取的结果不同。如果事务1在事务2更新之前读取一次数据，在更新之后又读取这笔数据，两次读取时不同的。为保证不可重复读，隔离级别下，一个事务可以读另外一个事务未被提交的结果（前提是这个事务不回滚）
**3.丢失更新。**两个或多个事务都读取了同一数据值并修改，最后提交的事务的执行结果覆盖了前面事务提交的执行结果，从而导致前面事务的更新丢失。解决丢失更新的操作就是多读一次。
-----事务调度
事务并发执行的顺序是随机的，可以将多个事务操作组成的随机执行序列称为一个调度。对于一个调度序列来说，应该满足；
该调度应包含该组事务的全部操作。
属于同一个事务的操作应保持在原事务中的执行顺序。
串行调度：属于同一事务的操作都是相邻的。
事务的串行调度可保证数据库的一致性，如果能判断一个并发调度的执行结果等价于一个串行调度的结果，就称该并发调度可保证数据库的一致性（并发执行结果是正确的）。
**冲突操作：**如果Oi和Oj是不同事务在相同数据对象上的操作，并且其中至少有一个写操作，则称Oi和Oj是冲突操作，否则为非冲突操作（都是读操作）。
**冲突等价：**如果调度S可以经过交换一系列的非冲突操作（读操作之间的交换）得到一个新的调度S’,则称S和S’是冲突等价的。
冲突可串行化：如果调度S和一串行调度是冲突等价的（经过一系列读操作之间变换得到一个串行调度），则称S是冲突可串行化的。
冲突可串行化调度执行结果一定是正确的，但是正确的调度不一定是冲突可串行化的。存在不能冲突可串行化的调度结果正确，且等于串行调度结果的值。
题：判断一个给定调度是否可以冲突可串行化？
设并发调度事务集T={t1：R1(X)W1(X),t2：R2(X)R2(Y)W2(X),t3：R3(Y)W3(Y)},两个并发调度为：
HT=R1(X)R2(X)W1(X)R2(Y)W2(X)R3(Y)W3(Y)
HT’=R2(X)R3(Y)R2(Y)W2(X)R1(X)W3(Y)W1(X)
判断是否为冲突可串行化调度。
优先图：G=,其中V是顶点集，E是边集，顶点集由所有参加的调度的事务组成，边集由满足下列三个条件的之一的Ti->Tj组成。
1.Wi(Q)->Rj(Q)
2.Ri(Q)->Wj(Q)
3.Wi(Q)->Wj(Q)
基于优先图的冲突可串行化判别标准：如果优先图中无环，则冲突可串行化；如果有环，则非冲突可串行化。
根据并发调度从第一个操作开始直到最后一个操作结束，画出优先图。如果重复的指向，则保留一个箭头。先找操作对象，然后看事务顺序。
-----四大隔离级别：
当多个事务同时进行时,通过设置隔离级别来处理脏读、不可重复读、幻读事件。
read uncommitted | 0 未提交读
将查询的隔离级别指定为 0。
可以读脏数据
读脏数据:一事务对数据进行了增删改,但未提交,有可能回滚,另一事务却读取了未提交的数据
read committed | 1 已提交读
将查询的隔离级别指定为 1。
避免脏读,但可以出现不可重复读和幻读
**不可重复读:**一事务对数据进行了更新或删除操作,另一事务两次查询的数据不一致
幻（虚）读:一事务对数据进行了新增操作,另一事务两次查询的数据不一致。
repeatable read | 2 可重复读
将查询的事务隔离级别指定为 2。
避免脏读,避免不可重复读,允许幻像读
serializable | 3 可序列化
将查询的隔离级别指定为 3。
串行化读，事务只能一个一个执行，避免了脏读、避免不可重复读、避免幻读。
-----并发控制
当数据库中多个事务并发执行时，事务的隔离性不总是得以保证，DBMS必须采取一定的措施对并发执行事务之间的相互影响加以控制，这种措施就是并发控制机制。分为悲观的和乐观的。
悲观的事务并发控制方法认为数据的一致性经常会受到破坏（出现脏读、不可重复读和幻读），因此在事务访问数据对象前须采取一定措施加以控制，只有得到访问许可时，才能访问数据对象，如基于封锁的并发控制方法。乐观的事务并发控制方法认为数据的一致性通常不会受到破坏，故事务执行时可直接访问数据对象，只有事务结束时才验证数据库的一致性是否会被破坏。如基于有效性验证方法。
基于封锁的并发控制方法的基本思想：当事务T需访问数据对象Q时，先申请对Q的锁。如批准获得，则T继续执行,此后不允许其他事务修改Q，直到事务T释放Q上的锁。
基本锁类型：
1.共享锁（share lock，S锁），如果事务T获得数据对象Q的共享锁，则Q可读Q但不能写Q。
2.排他锁（X锁），如果事务T获得数据对象Q的排他锁，则Q可读Q也可写Q。
3.读操作申请S锁，写操作或读写操作申请X锁，事务管理器收到封锁请求后，按封锁相容性原则判断是否满足该事务的加锁请求。
**4.锁相容：**如果事务Ti持有数据对象Q的某类型锁后，事务Tj也申请对Q的封锁，如果允许Tj获得对Q的锁，则称Ti申请锁与Tj持有锁相容，否则不相容。共享锁与共享锁相容其他都不相容。
-----两阶段封锁协议（封锁就是加锁，也可以说是申请锁、加锁和释放锁的一系列操作）
两阶段封锁协议要求每个事务分两个阶段提出申请锁和解锁。
1.增长阶段：事务可以获得锁，不能释放锁。
2.缩减阶段：事务可以释放锁，不能再申请锁。
3.两阶段封锁协议能保证冲突可串行化。（非冲突操作交换得到一个串行调度）对于任何事务，调度中该事务获得其最后加锁时刻（增长阶段结束点）称为事务的封锁点。这样多个事务可以根据它们的封锁点进行排序，而这个顺序就是并发事务的一个冲突可串行化顺序。
**4.保证事务可串行化的最常用协议是两阶段封锁协议。**一开始，事务处于增长阶段，事务根据需要获得锁。一旦该事务释放了锁，它就进入缩减阶段，不能再发出加锁请求。两阶段封锁协议实现了事务集的串行化调度，但同时，一个事务的失败可能会引起一连串事务的回滚。为避免这种情况的发生，我们需要进一步加强对两阶段封锁协议的控制。
5.严格两阶段封锁协议（避免级联回滚）和强两阶段封锁协议。严格两阶段封锁协议除了要求封锁是两阶段之外，还要求事务持有的所有排它锁必须在事务提交之后方可释放。这个要求保证未提交事务所写的任何数据，在该事务提交之前均以排它锁封锁，防止其他事务读取这些数据。强两阶段封锁协议，**要求事务提交之前不得释放任何锁。**使用锁机制的数据库系统，要么使用严格两阶段封锁协议，要么使用强两阶段封锁协议。两阶段封锁协议并不保证不会发生死锁，数据库系统必须采取其他的措施，预防和解决死锁问题。
-----恢复与备份
导读：DBMS在运行过程中，可能出现各种各样的故障，如软件故障、电源故障、磁盘故障、自然灾害甚至人为的恶意破坏。由于这些故障的发生可能导致数据丢失或者损坏。当这些故障发生后，DBMS应该采取一系列措施保证能够将数据库恢复到故障发生前的某个一致性状态。 如果数据库中只包含所有成功事务的结果，则称该数据库处于一致性状态。如果由于故障导致有些事务尚未完成就被迫中断，如果这些未完成的事务对数据库所做的修改有一部分写入物理数据库中，数据库就处于一种不正确状态（不一致状态），需要DBMS根据故障类型采取相应措施，将数据库恢复到某个一致的状态。
数据库的故障可用事务的故障来表示，主要分类：
（1）事务故障。事务在运行过程中由于种种原因，如输入数据的错误、运算溢出、违反了某些完整性限制、某些应用程序的错误，以及并发事务发生死锁等，使事务未运行至正常终止点就被撤销，这种情况称为“事务故障”。该类故障特征就是系统的软件和硬件都能正常运行，内存和磁盘上的数据都没有丢失和破坏。数据库可能已经将夭折事务操作完成的部分修改的数据写到磁盘中。此时，DBMS强行回滚夭折事务，清除其对数据库的所有修改，使得事务好像没由操作过一样。这类恢复叫撤销。
（2）系统故障。系统故障是指系统在运行过程中，由于某种原因（如操作系统或数据库管理系统代码错误、操作员操作失误、特定类型的硬件错误（如 CPU 故障）、突然停电等造成系统停止运行），致使事务在执行过程中以非正常方式终止，这时内存中的信息丢失，但存储在外存储设备上的数据不会受影响。发生系统故障时，一些尚未完成的事务的结果可能已写入物理数据库中，为了保证数据一致性，需要清除这些事务对数据库的修改。还有一些已完成事务所提交结果留在内存缓冲区中，尚未写到磁盘物理数据库中，使得这些事务对数据库的修改丢失，这也使数据库处于一种不一致状态，因此应将这些已提交事务的更新结果重新写入数据库。系统启动时，恢复程序需要撤销所有未完成事务，还需要重做所有已提交事务，以便将数据库真正恢复到某个一致性状态。
（3）介质故障。系统在运行过程中，由于某种硬件故障，如磁盘损坏、磁头碰撞或由于操作系统的某种潜在的错误、瞬时强磁场干扰，使存储在外存上的数据部分损失或全部损失，称为“介质故障”。这类故障比前两类故障的可能性虽然小得多，但破坏性却最大。
（4）计算机病毒。计算机病毒是一种人为破坏计算机正常工作的特殊程序。在数据库系统中，恢复的基本含义就是恢复数据库本身。也就是说，在发生某种故障使数据库当前的状态已经不再正确时，把数据库恢复到已知为正确的某一状态。目前数据库系统中最常用的恢复方法是转储和登记日志文件，可根据故障的不同类型，采用不同的恢复策略。

你可能感兴趣的:(S1:计算机知识总结)

人工智能真的能编程吗？研究勾勒出自主软件工程的障碍 WSSWWWSSW 人工智能软件工程
想象一下这样一个未来：人工智能悄然承担起软件开发的繁重工作：重构杂乱无章的代码、迁移遗留系统以及排查竞态条件，这样人类工程师就可以专注于架构、设计以及那些机器仍然无法解决的真正新颖的问题。最近的进展似乎让这个未来近在咫尺，但麻省理工学院计算机科学与人工智能实验室（CSAIL）以及其他几家合作机构的研究人员发表的一篇新论文指出，要实现这个潜在的未来，需要认真审视当前面临的挑战。这篇题为《面向软件工程
计算机网络哪里不会点哪里. 网络计算机网络服务器网络
目录一、OSI与TCP/IP各层的结构与功能二、三次握手和四次挥手1.三次握手2.为什么要三次握手3.第二次握手回传了ACK，为什么还要回传SYN4.四次挥手三、TCP协议如何保证可靠传输四、状态码五、Cookie和Session六、HTTP1.0和HTTP1.1七、URI和URL八、HTTP和HTTPS一、OSI与TCP/IP各层的结构与功能应用层应用层(application-layer）的任
计算机网络学习----Https协议典孝赢麻崩乐急计算机网络学习 https
在互联网通信中，数据安全始终是核心需求。当用户在浏览器中输入https://访问网站时，背后隐藏着一套复杂的安全机制——HTTPS（HypertextTransferProtocolSecure）。它通过TLS/SSL协议对HTTP通信加密，而支撑这一加密体系的核心正是证书体系。本文将详细解析HTTPS的证书体系、加密通信流程、核心作用、优缺点，并结合代码示例说明其实现逻辑。HTTPS是什么？HT
初识opencv
文章目录1.什么opencv，它的优势点2.opencv安装和环境配置3.了解数字图像的基本概念：像素、彩色图像、灰度图像、二值图像、图像算数操作4.练习numpy中array的基本操作5.练习图像的加载、保存、以及算术操作参考文献1.什么opencv，它的优势点OpenCV是Intel®开源计算机视觉库。它由一系列C函数和少量C++类构成，实现了图像处理和计算机视觉方面的很多通用算法。OpenC
深入理解Socket套接字原理 Princesk web应用测试学习 websocket tcp/ip python
Socket套接字原理1、什么是Socket在计算机领域，套接字Socket作为计算机之间进行通信的固定的约定方式之一存在。这种太抽象了，我举个例子，我们要是用笔记本电脑前需要先对电脑供电，那供电就有两种方式电线插座供电和电池供电，电网有电就用插座供电，电网没电就用笔记本的自带的电池供电。那么这个供电的工具（电池或者电线插座）就是套接字Socket。Socket起源于Linux系统，我们都知道Li
C语言第一章--C语言简介
C语言第一章--C语言简介一、指令、程序和软件1.什么是指令？2.什么是程序？3.什么是软件？二、计算机语言1.什么是计算机语言？2.计算机语言有哪些？三、高级语言的发展1.什么是非结构化语言？2.什么是结构化语言？3.什么是面向对象语言？四、C语言简介五、语言特点1.语法简洁2.具有结构化的控制语句3.丰富的数据类型4.丰富的运算符5.可对物理地址进行直接操作6.具有良好的移植性7.可生成高质量
Roslyn 的兴起 AI云栈
原文地址：https://msdn.microsoft.com/magazine/732ddd02-d67b-447e-a400-ec8c1e94b58c过去数年来，各类计算机专业人员、思想领导者和专家倡导将域特定语言(DSL)的概念作为研究软件问题解决方案的一种方法。如果“临时用户”可以使用DSL语法在系统中调整和修改业务规则，这种方法似乎尤其适用。这对许多开发人员来说是软件的“圣杯”—构建在业
HCIP第一天课程笔记整理搞IT的马哥 IP 网络网络协议 tcp/ip 服务器
HCIP----huawei认证高级工程师抽象语言先转化成编码编码一定要转化成二进制（为什么一定要转化成二进制？）二进制信号转化成电信号处理电信号（协议等同于标准，目的就是提升服务）（1876年电话诞生，1946年第一台电子计算机诞生）OSI参考模型---OSI/RM---ISO（国际标准化组织）---1979年颁布开放式系统互联参考模型（应表会传网数物）应用层---提供各种应用服务，将抽象语言转
C语言程序设计--第一章 C语言概述 ✎ ぅTrip、° c语言
计算机语言计算机语言种类有很多，根据其发展的过程和面向的对象，可分为三类：机器语言、汇编语言、高级语言。机器语言（第一代语言）由二进制代码0和1构成的指令序列，面向计算机CPU系统，是计算机可以直接识别并执行的计算机语言。例：加法指令10000000、减法指令10010000优点：机器语言能被计算机CPU直接理解和执行，不需要另外的翻译软件，占用空间少，执行速度快。缺点：机器语言缺点主要表现在难理
【C语言编写随机数生成器】-经典C语言程序100例之十二 DevRevolt c语言算法开发语言编程
【C语言编写随机数生成器】-经典C语言程序100例之十二随机数在计算机编程中是非常重要的一种技术，因为它可以用于创建随机序列、密码学、统计分析等多个领域。本文介绍了使用C语言编写随机数生成器的方法。C语言提供了rand()和srand()函数来生成伪随机数。其中，srand()函数用于初始化随机数发生器，而rand()函数则返回0到RAND_MAX（通常为32767）之间的随机整数。这两个函数的使
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
ARM指令集--简介小蘑菇二号 arm 指令集
目录1ARM指令集特点2ARM指令集分类3指令格式ARM指令集是专为ARM架构处理器设计的一系列机器指令集合。ARM（AdvancedRISCMachines）以其精简指令集计算机（RISC）设计理念为基础，提供了高效、低功耗的指令系统。ARM指令集历经多个版本迭代，目前最新的主流版本包括ARMv8-A（支持AArch64和AArch32两种执行状态）。1ARM指令集特点-**精简指令集**：指令
socket网络通信TCP与UDP原理及代码实现（c++、python）
目录Socket原理通信协议原理TCPUDP代码实现TCPC++pythonUDPC++pythonSocket原理Socket（套接字）是计算机网络中用于实现进程间通信的一种机制，特别是在不同主机之间通过网络进行数据传输时。它是网络编程的核心概念之一，为应用程序提供了统一的接口，使得开发者可以通过网络发送和接收数据。可以将Socket类比为电话系统中的“电话机”。两台设备通过Socket建立连接
IPv6的创新与演进：从IP地址耗尽到下一代网络协议
IPv6的创新与演进：从IP地址耗尽到下一代网络协议背景简介随着计算机网络技术的飞速发展，互联网连接的设备数量呈指数级增长。在1984年，主机数量首次突破1000台大关，此时使用的IPv4协议凭借32位地址空间，还能应对网络的需求。然而，随着互联网的普及，越来越多的设备接入网络，IP地址耗尽成为了一个迫在眉睫的问题。为了解决这一危机，业界开始寻求新的解决方案，最终促成了IPv6（下一代互联网协议）
两月速通大模型开发，你需要做什么？32岁程序员转行大模型，大龄程序员如何转行大模型？
别再犹豫转不转行，只看理论不行动了！作为一位30+北漂男程序员，2个月零基础转行大模型，成功拿下月薪2w+的offer！今天我来分享一下我的亲身经历，希望能给还在迷茫中的你一些启发！转行前的“悲惨”生活我，一个30+男单身青年，因为家里在一个小城市，大学时一心想报到大城市来，想尝试一下新的生活方式，所以选择了一个普通的二本学院在北京开启了我的大学生活。因为选择的计算机专业，每天都很忙，也比较难，听
格灵深瞳视觉算法面试30问全景精解机＿长算法面试职场和发展
格灵深瞳视觉算法面试30问全景精解——AI感知×智能安防×场景创新：格灵深瞳视觉算法面试核心考点全览前言格灵深瞳（GREATVISION）作为国内领先的人工智能与计算机视觉企业，专注于智慧安防、智能交通、智慧零售等领域，推动视觉算法在大规模城市级场景的落地。格灵深瞳视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在复杂场景下的创新能力与工程实践。本文精选30个高质量面试问题，涵盖基
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
考科目三最笨的方法小淑文
认识我的人都知道我比较笨。比如考职称用的计算机五个模块，别人一天可以全部考完，而我却用了五年一个模块一个模块地考,有两科还得补考。然而，像我这么笨的人，最近补考好不容易给过了科目三。在此，有些心得想与大家分享。不过以下方法只适用于比较笨的人，聪明人可以到此为止。首先关于灯光我第一次考，因为太紧张，就是在灯光那里莫名其妙地挂了。至于为什么挂，目前我都还不知道错在哪。后来补考练车，教练让我们看看别人怎
最新Java学习路线总结，搬砖工逆袭Java架构师 2401_84266286 程序员 java 学习开发语言
|一文读懂JVM类加载机制过程及原理||跟同事杠上了，ApacheBeanutils为什么被禁止使用？||Java中常见的编码集问题||为什么人们宁可用Lombok，也不把成员设为public？|2、java集合【Java集合1】Java集合基础知识总结（绝对经典）【Java集合2】List遍历删除元素remove()")【Java集合3】List＜T＞和List＜?＞的区别【Java集合4】Ja
数据结构入门：像整理收纳一样简单！今天你睡了嘛数据结构数据结构
在我们生活中，经常会面对这样的问题：“我要怎么整理我的衣柜？”“电脑里照片太多了，怎么归类才方便查找？”其实，程序员也有类似的烦恼。他们不整理衣柜，而是“整理数据”。而这门关于如何“收纳”和“使用”数据的学问，就叫做数据结构。一、数据结构的基本概念1、数据数据是信息的载体，是数字、字符以及所有能输入到计算机中并被计算机程序识别和处理的符号的集合。数据是计算机程序加工的原料。2、数据元素数据元素是数
量子计算机的操作系统：开源生态与核心架构全景图 109702008 量子计算量子计算人工智能
副标题：从日本OQTOPUS到中国启科，开源如何重塑量子计算未来一、量子操作系统：重新定义“资源管理”传统操作系统管理CPU与内存，量子操作系统（QOS）的核心使命是操控“量子态”：硬件控制层：通过精密脉冲（微波/激光）操纵量子比特，实时校准误差（类似设备驱动层）资源管理层：调度量子比特、编译优化电路、协调量子-经典混合计算（核心“内核”功能）应用接口层：提供Qiskit/Cirq等编程框架（用户
经典与量子结合：微算法科技（MLGO）混合经典量子算法优化多查询问题 MicroTech2025 科技量子计算
在当今快速发展的技术领域，量子计算被视为解决复杂问题的下一个前沿。尽管量子计算机的潜力巨大，但它们在实际应用中仍面临诸多挑战，尤其是在错误率和量子比特数量方面。为了克服这些限制，微算法科技（NASDAQ:MLGO）开发了一种创新的混合算法，结合了经典计算和量子计算的优势，以优化多查询问题（MQO）。量子计算是一种利用量子力学原理进行信息处理的技术。与传统的经典计算机相比，量子计算机在处理某些特定类
量子计算时代的突破：微算法科技开发出多目标进化算法推动量子电路创新
量子计算正处于技术发展的前沿，但其实际应用与潜力的实现仍然面临巨大挑战。量子计算机的基本单位是量子比特（qubit），与经典计算机的比特不同，量子比特可以同时处于多个状态（叠加），并通过纠缠现象相互作用。理论上，量子计算机能够以比经典计算机快得多的速度解决某些问题，特别是在处理涉及大量变量和复杂数据集的问题时。尽管量子硬件的进步令人瞩目，尤其是近期一些公司推出了量子处理器，但量子算法（即量子计算机
突破量子仿真瓶颈：微算法科技MLGO量子算法的算术化与核操作迭代模型
近年来，量子计算机的迅速发展和潜在的强大计算能力吸引了全球科研机构和企业的广泛关注。量子计算机利用量子力学的特性来处理复杂的计算任务，具有在某些方面远超经典计算机的潜力。然而，真正实用的量子计算机尚未大规模普及，因此在经典平台上模拟量子算法成为当前的研究热点之一。微算法科技（NASDAQ:MLGO）近日开发的一种创新型高精度、高吞吐量的可重构仿真技术，旨在为量子算法的研究和应用提供有效的解决方案。
网络爬虫再深入——对抗指纹检测、分布式架构与智能解析实战 rooney2024 爬虫
目录一、深入反爬：浏览器指纹检测与对抗（配图1）1.高级指纹检测原理2.对抗方案与实战二、分布式爬虫架构深度设计（配图2）1.容错与弹性设计2.智能限流算法三、智能解析：LLM与计算机视觉的融合（配图3）1.LLM解析非结构化文本2.视觉辅助定位元素四、法律与伦理：爬虫工程师的自我修养1.关键法律边界2.道德实践框架五、未来战场：Web3.0时代的爬虫技术演进1.去中心化网络挑战2.AI驱动的自适
大学的第一次考试像我这么聪明的小公举只有一个
快过年啦，也快迎来了寒假，我的大学上半年就这么过去啦，感觉时间过得很快，马上就到了考试周，可是我们却还没有做好准备，大家都是一头雾水。习惯了高中的考试模式，也没体验过大学的考试是什么样子的，所以心里还有些慌张，而第一门课就是让文科生难以理解的计算机。到了考试周，同学们都抓紧了复习，教学楼，图书馆，自习室这些地方早就挤满了人，有的人都要早起去占位置。作为文科生，专业的社会学和心理学，有往届的学姐学长
vue中实现验证码输入结城 vue 验证码 vue输入框
vue验证码input输入解决焦点切换有点晚了就不吐槽了，咱还是把代码上了，赶紧洗澡，养好精神明天努力上班！！！想学node,想学react,想精进webpack,想vue学的更好一点，了解底层代码，学算法，学计算机原理，想写自己的博客网站…这是一条学无止境的路，没办法要恰饭效果html部分js部分exportdefault{props:{inputNums:{type:Number,defaul
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc