gongyuandaye

CMU15-445-Spring-2023-Project #1 - 前置知识（lec01-06）

Lecture #01_ Relational Model & Relational Algebra

Databases

数据库是相互关联的数据的有组织集合，对现实世界的某些方面进行建模。区别于DBMS（MySQL、Oracle）。

Flat File Strawman

数据库以CSV文件的形式存储，并由DBMS管理。

Database Management System

DBMS是允许应用程序在数据库中存储和分析信息的软件。
数据模型（data model）是描述数据库中数据的概念集合。e.g. relational、NoSQL、vectors。
模式（schema）是对基于数据模型的特定数据集合的描述。

Relational Model

关系模型定义了一种基于关系的数据库抽象，以避免维护开销。

relation是一组无序集合，允许重复元素出现，等价于table。
tuple（domain）代表relation中的一组属性，带有n条属性的relation叫做n-ary relation。
relation中primary key唯一标识一个元组。
foreign key指定一个关系中的属性必须映射到另一个关系中的元组。

Data Manipulation Languages (DMLs)

Relational Algebra

关系代数是一组基本操作，用于检索和操作关系中的元组。

Select
Projection
Union
Intersection
Difference
Product
Join：根据共有的属性中的相同值进行连接，并去除重复列。

Lecture #02_ Modern SQL

Relational Languages

关系代数基于集合set（无序、无重复）。SQL基于包bag（无序，允许重复）。

SQL History

Joins

合并一个或多个表中的列，生成一个新表。用于表达涉及跨多个表的数据的查询。

Aggregates

aggregation function
DISTINCT keyword
GROUP BY
HAVING

String Operations

SQL标准规定字符串区分大小写，且只允许单引号。
LIKE keyword：“%”匹配任意字串，包含空；“_”匹配任意单个字符。
“||”：将两个或多个字符串连接成一个字符串。

Date and Time

操作DATE和TIME属性。

Output Redirection

列数和type需要一致，列名不需要。

Output Control

ORDER BY
LIMIT

Nested Queries

Window Functions

ROW_NUMBER()：当前行的编号。在窗口函数排序前计算。
RANK()：当前行的顺序位置。在窗口函数排序后计算。
OVER clause：指定计算窗口函数时如何将tuple分组。使用 PARTITION BY 指定分组。使用 GROUP BY 排序。

Common Table Expressions

临时表，其作用域仅限于单个查询。

在 WITH 后添加 RECURSIVE 关键字，可以让 CTE 引用自身。

Lecture #03_ Database Storage (Part I)

Storage

关注面向磁盘的DMS，即数据库存储在非易失磁盘上。
DBMS需要关注如何将在非易失磁盘与易失memory之间移动数据。由于从磁盘获取数据的速度非常慢，DBMS将重点关注隐藏磁盘的延迟，而不是对寄存器和高速缓存进行优化。

Disk-Oriented DBMS Overview

数据库全部在磁盘上，数据库文件中的数据按页组织，第一页是目录页。
要对数据进行操作，DBMS需要将数据带入内存。为此，数据库管理系统需要一个**缓冲池（buffer pool）**来管理数据在磁盘和内存之间的移动。DBMS还有一个执行引擎来执行查询。执行引擎会向缓冲池请求一个特定页面，缓冲池会负责将该页面带入内存，并向执行引擎提供一个指向内存中该页面的指针。缓冲池管理器将确保在执行引擎对内存中的该部分进行操作时，页面仍然存在。

DBMS vs. OS

实现虚拟内存的一种方法是使用 mmap （memory mapping）将文件内容映射到进程的地址空间，这样操作系统就可以负责在磁盘和内存之间来回移动页面。但是如果 mmap 遇到页面错误，进程就会被阻塞。

File Storage

DBMS 的最基本形式是将数据库存储为磁盘上的文件。操作系统对这些文件的内容一无所知。只有 DBMS 知道如何破译它们的内容，因为这些内容是以 DBMS 特有的方式编码的。 DBMS 的存储管理器负责管理数据库的文件。它将文件表示为页面集合。它还会跟踪哪些数据已被读取和写入页面，以及这些页面中还有多少可用空间。

Database Pages

DBMS 在一个或多个文件中以固定大小的数据块（称为页）组织数据库。页面可以包含不同类型的数据（tuple、index等）。大多数系统不会在页面中混合这些类型的数据。
每个页面都有一个唯一的标识符。如果数据库是一个单独的文件，那么页面 ID 可以只是文件偏移量。大多数数据库管理系统都有一个间接层，将页面 ID 映射到文件路径和偏移量。
大多数 DBMS 使用固定大小的页面，以避免支持可变大小页面所需的工程开销。
存储设备保证以原子方式写入硬件页的大小。如果硬件页面为 4 KB，而系统尝试向磁盘写入 4 KB，那么要么 4 KB 全部写入，要么全部不写入。

Database Heap

堆文件是一个无序的页面集合，其中的tuples以随机顺序存储。可以在磁盘上找到 DBMS 需要的页面位置。
DBMS 在给定页面 ID 的情况下找到磁盘上的页面的方法：

Linked List：页眉页持有指向空闲页列表和数据页列表的指针。但是，如果 DBMS 要查找特定页面，则必须对数据页列表进行顺序扫描，直到找到要查找的页面。
Page Directionary：DBMS 维护特殊页面，跟踪数据页面的位置以及每个页面上的可用空间。

Page Layout

Tuple Layout

非规范化元组数据（Denormalized Tuple Data）：如果两个表有关联，DBMS就可以 "预连接 "它们，这样这两个表就会出现在同一个页面上。这使得读取更快，因为数据库管理系统只需加载一个页面，而不是两个独立的页面。不过，由于数据库管理系统需要为每个元组提供更多空间，因此更新成本会更高。

Lecture #04_ Database Storage (Part II)

Log-Structured Storage

page layout如果是slotted page的话，会有一些问题：tuple的删除；读取一个tuple需要读取整个block；tuple的更新可能需要花费大量时间切换block。
log structure DBMS不存储tuple，只存储log。

log包含元组的唯一标识符、操作类型（PUT/DELETE）以及元组的内容；
倒序扫描读取记录，同时可以使用索引跳转到日志中的特定位置；
由于写入是顺序的，所以速度很快；
可以定期压缩日志，方法是在多个页面中只记录每个元组的最新变化；
压缩后，由于每个元组只有一个，不再需要排序，因此DBMS可以按 id 排序，以加快查找速度。这些表称为排序字符串表（Sorted String Tables，SSTables）；
缺点是压缩成本较高，还会导致写入放大（重复写入相同的数据）；

Data Representation

有五种高级数据类型可以存储在元组中：

Integers
- Examples: INTEGER, BIGINT, SMALLINT, TINYINT.
Variable Precision Numbers
- Examples: FLOAT, REAL.
Fixed-Point Precision Numbers
- Examples: NUMERIC, DECIMAL.
Variable-Length Data
- Examples: VARCHAR, VARBINARY, TEXT, BLOB.
Dates and Times
- Examples: TIME, DATE, TIMESTAMP.

System Catalogs

为了让 DBMS 能够破译元组的内容，它需要维护一个内部目录，告诉它有关数据库的元数据：

表和列，以及这些表上的任何索引；
数据库用户及其权限；
有关表格及其包含内容的统计信息（如属性的最大值）；

Lecture #05_ Storage Models & Compression

Database Workloads

OLTP: Online Transaction Processing
- 特点是快速、短时间操作和查询，一次只对单个实体进行操作。写入次数通常多于读取次数。
OLAP: Online Analytical Processing
- 对数据库的大部分数据进行长时间运行的复杂查询和读取。数据库系统通常要从 OLTP 侧收集的现有数据中分析和提取新数据。
HTAP: Hybrid Transaction + Analytical Processing
- 同时出现在一个实例。

Storage Models

N-Ary Storage Model (NSM)——行存储，OLTP
- 将单个tuple的所有属性连续存储在一个页面中；
- 优点是修改操作快，缺点是在扫描表的大部分内容时效率较低；
Decomposition Storage Model (DSM) ——列存储，OLAP
- 在数据块中连续存储所有元组的单个属性（列）；
- 适合有许多只读查询的 OLAP，这些查询会对表的一个属性子集执行大量扫描，减少了I/O浪费；
- 点查询、插入、更新和删除速度较慢；
- 将tuple重新组合
  - 最常用的方法是固定长度偏移。在这种情况下，给定列中的值将与处于相同偏移量的另一列中的值属于同一个元组。因此，列中的每个值都必须具有相同的长度。
  - 使用tuple id。DBMS会为列中的每个属性存储一个元组 id（例如主键）。然后，系统还会存储一个映射，告诉它如何跳转到具有该 id 的每个属性。这种方法的存储开销很大，因为它需要为每个属性条目存储一个元组 id。

Database Compression

磁盘I/O一般是主要的限制因素，通过数据压缩，DBMS能够获取更多的tuple，但是也会在压缩和解压缩上消耗时间。
现实世界中的数据一般具有以下特点：

某个属性是偏态分布的；
单个tuple属性之间强相关；

基于此，数据库压缩需要达成以下目标：

产生定长数据，除了存储在不同数据池中的可变长度数据；
late materialization：允许 DBMS 在查询执行过程中尽可能推迟解压缩；
无损压缩，任何类型的有损压缩都必须在应用层面进行；

压缩粒度：

Naive Compression

通常会选择压缩率较低的算法，以换取更快的压缩/解压缩速度。
MySQL InnoDB 就是一个使用Naive Compression的例子。DBMS 会压缩磁盘页面，将其填充为 2KB 的幂次，然后将其存储到缓冲池中。但是，每次 DBMS 尝试读取/修改数据时，缓冲池中的压缩数据都必须首先解压缩。

为了避免每次都要将整张表压缩和解压缩，MySQL 会把表分解成更小的块。
没有考虑数据的高层含义或语义。算法既不考虑数据结构，也不考虑query如何访问数据，从而无法利用延迟实体化（late materialization），因为 DBMS 无法判断何时可以延迟数据的解压缩。

Columnar Compression

Run-Length Encoding (RLE)
- 将单列中相同值数据压缩为：value、offset、length；
- 应事先对列进行排序，这样可以对重复属性进行聚类，从而提高压缩率。请注意，RLE 的有效性在很大程度上取决于基础数据特征（如每种数据中属性的数量和频率）；
Bit-Packing Encoding
- 当一个属性的所有值都小于该值声明的最大size时，就用较少的位来存储它们；
- 类似位域；
Mostly Encoding
- Bit-Packing Encoding变体，用offset-value表保存超出声明的最大size的值；
Bitmap Encoding
- 位图通常被分割成块，以避免分配大块的连续内存；
- 只有在值的基数或者说种类较低时有效；
Delta Encoding
- 记录同一列中相邻值之间的差值。基准值可以在线存储，也可以存储在单独的查找表中；
- 还可以对存储的差值使用 RLE，以获得更好的压缩率；
Incremental Encoding
- 通过这种方式记录常用前缀或后缀、长度，从而避免重复。这种编码方式最适用于有序数据；
Dictionary Compression（most common）
- 用较小的code替换频繁的value。然后，数据库管理系统只存储这些代码和将这些代码映射到其原始值的数据结构（即字典）。字典压缩方案需要支持快速编码/解码以及范围查询；

Lecture #06_ Buffer Pools

Introduction

DBMS 负责管理内存和从磁盘来回移动数据。由于大部分数据不能直接在磁盘上操作，因此任何数据库都必须能够高效地将以文件形式存在的数据从磁盘移动到内存中，以便使用。从执行引擎的角度来看，理想的情况是所有数据都 "看起来 "在内存中。它不必担心数据是如何获取到内存中的。
分为空间控制（让经常一起使用的page在物理位置上也靠近）和时间控制（目的是最大限度地减少从磁盘读取数据的停顿次数）

Locks vs. Latches

Locks是用于保护数据库内容（例如元组、表或数据库本身）不受其他事务影响的高级别逻辑原语。事务将在其整个持续时间内持有锁。数据库系统可以向用户展示正在运行查询时持有的锁。锁需要能够回滚更改。
Latches是用于数据库管理系统（DBMS）内部数据结构的临界区的低级别保护原语（例如哈希表或内存区域）。latch仅在执行特定操作的持续时间内被持有，并且不需要具备回滚更改的能力。它们更精细地用于内部，由DBMS使用以确保对其自身结构的安全并发访问。

Buffer Pool

缓冲池是从磁盘读取页面的内存缓存。
缓冲池的内存区域是由固定大小的页面组成的数组。当DBMS请求一个页面时，该页面就会从磁盘复制到缓冲池的一个frame中。请求页面时，数据库系统可以先搜索缓冲池。只有在找不到页面时，系统才会从磁盘获取页面副本。脏页面会被缓冲，不会立即写回。（对应UnpinPage脏标记置true不立即写回磁盘）

页表（page table）是一个内存哈希表，用于跟踪当前内存中的页面。它将page id 映射到缓冲池中的frame位置。由于缓冲池中页面的顺序并不一定反映磁盘上的顺序，因此这个额外的间接层可以识别缓冲池中的页面位置。
每当线程修改页面时，都会设置 dirty-flag。这表明存储管理器必须将页面写回磁盘。
引用计数器（pincount）跟踪当前访问该页面（读取或修改）的线程数。线程必须在访问页面前递增计数器。如果页面的引用计数大于零，则存储管理程序不允许从内存中删除该页面。钉住不会阻止其他事务同时访问页面。
数据库中的内存根据两种策略分配给缓冲池：

全局策略。DBMS 为使正在执行的整个工作负载受益而应做出决策。它考虑所有活动事务，以找到分配内存的最佳决策；
局部策略。它所做的决策会使单个查询或事务运行得更快，即使这对整个工作负载不利。本地策略为特定事务分配frame，而不考虑并发事务的行为。

Buffer Pool Optimizations

Multiple Buffer Pools
- 维护多个缓冲池（即每个数据库缓冲池、每个页面类型缓冲池）。然后，每个缓冲池可采用为其内部存储的数据量身定制的本地策略。这种方法有助于减少锁存争用，并提高本地性；
- page选择缓冲池的方法：
  - object ids：映射的方式；
  - hashing：DBMS 对页面 ID 进行散列，以选择访问哪个缓冲池；
Pre-fetching
- DBMS 还可以根据query计划预先抓取页面来进行优化。然后，在处理第一组页面的同时，将第二组页面预先抓取到缓冲池中。缓冲池管理器也可以预取树形索引数据结构中的叶子page。
Scan Sharing (Synchronized Scans)
- 允许多个查询附加到扫描表的单个游标上。如果一个查询开始扫描，而已有一个查询正在进行扫描，那么 DBMS 就会将第二个查询的游标附加到已有的游标上。DBMS 会跟踪第二个查询与第一个查询的连接位置，以便在到达数据结构末尾时完成扫描。
Buffer Pool Bypass
- 顺序扫描操作不会将获取的页面存储在缓冲池中，以避免开销。如果操作需要读取磁盘上连续的大量页面序列，这种方法非常有效。缓冲池旁路还可用于临时数据（排序、连接）。

OS Page Cache

大多数磁盘操作都是通过OS API进行的。OS一般会维护自己的文件系统缓存。
大多数 DBMS 使用直接 I/O 来绕过OS的缓存，以避免冗余的页面副本和管理不同的驱逐策略。
Postgres 是一个使用OS页面缓存的数据库系统实例。

Buffer Replacement Policies

当 DBMS 需要释放一个frame，为新页面腾出空间时，它必须决定从缓冲池中驱逐某个页面。

Least Recently Used (LRU)
- 最近最少使用替换策略；
- 使用队列，以便进行排序，并通过减少驱逐时的排序时间来提高效率；
CLOCK
- 每个页面都有一个ref bit。当一个页面被访问时，将其设置为 1；

缺点：由于顺序扫描会快速读取许多页面，缓冲池会被填满，其他查询的页面会被驱逐，因为它们的时间戳会更早。在这种情况下，最新的时间戳并不能准确反映我们实际要驱逐的页面。
solution：

LRU-K
按查询进行本地化。DBMS 根据每个事务/查询选择要驱逐的页面。这样可以最大限度地减少每次查询对缓冲池的污染。
优先级提示。允许事务在查询执行过程中根据每个页面的上下文告诉缓冲池页面是否重要。

对于脏页面，最快的方法是丢弃缓冲池中任何不脏的页面；较慢的方法是将脏页面写回磁盘，以确保其更改被持久化。
一种方法是通过后台写入，数据库管理系统可以定期浏览页表，并将脏页写入磁盘。当一个脏页面被安全写入后，数据库管理系统可以驱逐该页面，或者直接取消脏标记。

Other Memory Pools

除了tuple和index还需要其他memory：

MySQL中处理JSON数据小村学长毕业设计 mysql json 数据库
MySQL中处理JSON数据已成为大数据分析领域的一个新方向，这一功能自MySQL5.7版本引入以来，为数据库管理系统在处理非结构化数据方面提供了强大的支持。以下是对MySQL中处理JSON数据的详细探讨，包括其引入的背景、特性、函数与操作符、性能优化以及在大数据分析中的应用等方面。一、JSON数据类型引入的背景随着大数据技术的迅猛发展和普及，数据量的爆炸性增长对数据处理能力提出了前所未有的挑战。
SQLServer : DDL,DML,DQL,DCL的区别 SJ15630070060 Sql Server sqlserver 数据库
01、DDL（DataDefinitionLanguages）语句：即数据库定义语句，用来创建数据库中的表、索引、视图、存储过程、触发器等对象。SQLServerDLL语法是指SQLServer数据库定义域发的语法规则集合，主要包括创建、修改和删除数据库对象的语句。常用的语句关键字有：【createtable创建表】、【altertable修改表】、【droptable删除表】、【truncate
MySQL数据库中DDL 、DML 、DQL 、DCL 分别是什么超爱西西鸭 MySQL数据库数据库 mysql sql 运维
目录：一、DDL语句二、DML语句三、DQL语句四、DCL语句在MySQL数据库中，DDL、DML、DQL、DCL分别代表不同的语言类别，用于执行不同的数据库操作。一、DDL语句DDL（DataDefinitionLanguage）语句：数据定义语言，主要是进行定义/改变表的结构、数据类型、表之间的链接等操作。如创建、修改或删除表、视图、索引等。常用的语句关键字CREATE、DROP、ALTER、
数据库开发必备：深入理解DDL、DML、DQL和DCL 平凡程序猿~ 数据库数据库开发 oracle 数据库
文章目录一、数据库操作分类概述1.DDL（数据定义语言）2.DML（数据操作语言）3.DQL（数据查询语言）4.DCL（数据控制语言）二、DDL：数据定义语言1.DDL-数据库操作2.DDL-表操作三、DML：数据操作语言1.DML-添加数据2.DML-修改数据3.DML-删除数据四、DQL：数据查询语言1.DQL-基本查询2.DQL-条件查询3.DQL-聚合函数4.DQL-分组查询5.DQL-排
MySQL 奇幻之旅：从基础探秘到高级应用魔法进阶的华夫饼进大厂 mysql 数据库
MySQL奇幻之旅：从基础探秘到高级应用魔法在数据库的神秘世界里，MySQL宛如一座蕴藏无尽宝藏的城堡，我怀揣着探索的热情与求知的渴望，踏上了这趟扣人心弦的学习征程。一、MySQL基础：城堡基石的雕琢（一）数据库与表的操作：构建数据的栖息之所数据库创建与管理：绘制数据城堡的蓝图：犹如精心绘制城堡的设计图，我熟练掌握了使用CREATEDATABASE语句创建数据库的魔法咒语，像CREATEDATAB
Linux_C编程—信号处理函数的返回 Aspirant-GQ Linux Linux 信号处理函数信号处理返回
文章目录信号处理函数执行完怎么办setjmp()/longjmp()sigsetjmp()/siglongjmp()信号处理函数执行完怎么办一般来讲，信号处理函数执行完毕都会正常返回，也可以调用其他函数返回到程序的主函数中。这里总结一下信号处理函数执行完毕后跳转到主函数中指定的位置的操作（有点类似goto语句，但goto不支持函数间的跳转，只能在一个函数中跳转），主要是通过俩对函数来实现的：set
基于Redis geo地理位置的物流路线规划系统实现方案 xiyubaby.17 缓存 redis
物流路线规划系统实现方案一、系统架构图数据存储层数据处理层业务服务层客户端RedisGEOPostgreSQL图数据库地理编码服务实时交通处理路线优化引擎距离计算服务路径规划服务订单管理服务物流管理系统司机APP客户门户客户端API网关业务服务层数据处理层数据存储层二、核心模块实现1.地理模型定义publicclassLocation{privateStringid;privateStringad
Linux：信号处理原理与实现「已注销」 linux 运维服务器
什么是信号信号本质上是在软件层次上对中断机制的一种模拟，其主要有以下几种来源：程序错误：除零，非法内存访问等。外部信号：终端Ctrl-C产生SGINT信号，定时器到期产生SIGALRM等。显式请求：kill函数允许进程发送任何信号给其他进程或进程组。目前Linux支持64种信号。信号分为非实时信号(不可靠信号)和实时信号(可靠信号)两种类型，对应于Linux的信号值为1-31和34-64。信号是异
服务器上部署springboot项目学习笔记 Warren98 服务器 spring boot 学习后端阿里云 java
Java相关命令运行jar包:在linux中,进入到jar包所在目录后,直接tab补全名称即可java-jarjar包名称查看jar包是否在运行：ps-ef|grepjava终止运行的jar包:kill#是jar包的id根据jar包名称查看运行状态psaux|grepMyBlog-0.0.1-SNAPSHOT.jar设置jar包一直运行每次启动jar包时,都需要打开SSH远程连接工具,比如fina
Linux信号处理：从“死亡快递“到系统级心跳的奇幻漂流 Loving_enjoy 实用技巧 linux
当Ctrl+C变成"死亡按钮"2017年，某倒霉程序员在深夜误触Ctrl+C，导致价值千万的比特币矿机集群集体"自杀"，这场事故揭示了信号处理的本质——它既是系统的紧急逃生通道，也是定时炸弹的遥控器。本文将带你走进Linux信号的奇幻世界，看这些1到64号的"数字幽灵"如何游走于进程之间。---##一、信号基础：操作系统的摩尔斯电码###1.1信号的诞生：Unix世界的暴力美学-**31个传统信号
linux驱动(三):gpiolib 菜_小_白 linux c语言驱动开发
本文主要探讨使用210的gpiolib库编写led驱动。gpio.h#defineS5PV210_GPIO_A0_NR(8)......#defineS5PV210_GPIO_ETC4_NR (6)定义端口的GPIO数目#defineS5PV210_GPIO_NEXT(__gpio)\ ((__gpio##_START)+(__gpio##_NR)+CONFIG_S3C_GPIO_SPAC
前端简单数据存储：跳过后端数据库的一种高效策略，应对一些不需要后端访问数据库的简单操作：静态 Markdown 文件存储【D＇accumulation】前端数据库学习 vscode html5 vue.js
问题提出：在一些应用场景中，有些数据并不重要，也不需要频繁地进行动态增删改查，比如品牌历史、产品介绍等说明性内容。为此，我选择在前端直接存储这些静态数据，跳过后端数据库调用。本文将分享如何利用Vue工程中直接存放Markdown文件与内嵌数据，将数据管理与业务逻辑解耦，从而实现快速开发、便于维护和灵活更新的目的。静态Markdown文件存储方法案例：原理：将Markdown文件（如brandHis
chromadb向量数据库使用（2） ZHOU_CAMP RAG chat_Chain 数据库 chromadb
目录代码代码解释**1.导入chatGLM嵌入函数****2.创建ChromaDB客户端和集合****3.查询集合中的数据数量****4.添加数据到集合****5.获取已存储的文档****6.更新文档****7.再次获取数据，验证更新结果****8.删除某个文档****9.获取已删除的文档****总结**代码importchromadb.utils.embedding_functionsasemb
SAP-ABAP:SAP事务码SE14深度解析：数据库表管理核心工具爱喝水的鱼丶 SAP-ABAP开发基础详解 ABAP开发之必须知道的 VIP详情查看专栏 SAP ABAP 开发运维运维数据库
SAP事务码SE14深度解析：数据库表管理核心工具SE14是SAP中用于激活并调整透明表的数据库结构的工具，主要用于字段修改、主键变更或数据类型调整后同步数据库表结构，支持数据迁移及重建索引SE14核心功能
领域驱动新实践：COLA框架全解析——架构设计与实战案例解析 Java进阶八股文后端
1.引言：为什么选择COLA实现DDD？——从“代码泥潭”到“领域清晰”的架构跃迁传统分层架构的痛点：当代码沦为“数据库操作说明书”在典型的MVC或三层架构中，业务逻辑常常被“撕碎”成零散的片段，散落在Service层的各个角落。以电商系统的订单管理为例，开发者可能会遇到这样的场景：java代码解读复制代码//传统Service层：贫血模型的典型代码publicclassOrderService{
Windows操作系统部署Tomcat详细讲解 web15085415935 面试学习路线阿里巴巴 windows tomcat java
Tomcat是一个开源的JavaServlet容器，用于处理JavaWeb应用程序的请求和响应。以下是关于Tomcat的用法大全：一、安装Tomcat下载访问ApacheTomcat官方网站（https://tomcat.apache.org/），根据你的操作系统（如Windows、Linux、macOS）和需求选择合适的版本进行下载。例如，对于开发环境，通常选择较新的稳定版本。安装（以Windo
Linux第零节：Linux命令速查图表（按功能分类）熊峰峰 5.Linux linux php
Linux命令速查图表（按功能分类）思维导图示意Linux命令文件操作权限管理系统管理网络操作文本处理压缩归档ls/cd/pwdmkdir/rm/cpcat/less/findchmodchownps/top/killshutdown/unamecurl/netstatnc/tcpdumpgrep/awk/sedtar/zip/unzip一、文件与目录操作命令功能描述常用选项示例ls列出目录内容-
腾讯面经，有点难度~ 后端go
今天分享组织内的朋友在腾讯安全的实习面经。内容涵盖了QPS测试方法、SQL聚合查询、Linux进程管理、Redis数据结构与持久化、NAT原理、Docker隔离机制、Go语言GMP调度模型、协程控制、系统调用流程、变量逃逸分析及map操作等等知识点。下面是我整理的面经详解：面经详解一个表，里面有数据列，id，name,class，查学生最喜欢的前10个课程，sql语句实现SELECTclass,C
Spring 事务管理全解析：原理、源码与实战工一木子 SpringFramework 笔记 spring 数据库 java
Spring事务管理全解析：原理、源码与实战事务（Transaction）是保证数据一致性的重要机制，Spring通过声明式事务和编程式事务提供强大的事务管理能力。本篇文章将深入剖析Spring事务的底层原理、传播机制、源码解析，并通过代码实战讲解如何正确使用Spring事务。1.什么是事务？（What）事务是数据库操作的最小执行单元，必须具备ACID（原子性、一致性、隔离性、持久性）特性。Spr
SQL中体会多对多 PlumCarefree sql 数据库
我们可以根据学生与课程多对多关系的数据库模型，给出实际的表数据以及对应的查询结果示例，会用到JOIN``LEFTJOIN两种连接1.学生表（students）student_idstudent_name1张三2李四3王五2.课程表（courses）course_idcourse_name1数学2英语3物理3.选课表（student_courses）idstudent_idcourse_id1112
云智慧发布对象关系型数据库CloudPanguDB，打破传统技术壁垒
近日，云智慧推出关系型数据库CloudPanguDB（中文名称：盘古数据库），旨在通过高兼容性能和创新技术架构，降低企业项目整体运营成本。无论是处理海量复杂数据，还是构建清晰有序的数据结构关系，CloudPanguDB都具有强大的应用价值。随着各产业数字化转型的迅速发展，企业对国产化数据库需求与日俱增。CloudPanguDB以云智慧自身产品技术为基础，统一优化技术架构，功能覆盖关系型数据库、全文
python本地连接minio 伶星37 python 网络服务器
在你浏览器能成功访问到你的minio网页，并且成功登录之后。接下来如果你想用python连接数据库，并且想用python连接minio，就可以用这个blog。连接代码client=Minio("localhost:9000",#9000是默认端口号access_key="admin",#你的账户secret_key="password",#你的密码secure=False,#这点我会详细说明)为什
文件的基本的基本属性伶星37 linux 服务器
为什么要有基本属性Linux系统是一种典型的多用户系统，不同的用户处于不同的地位，拥有不同的权限。为了保护系统的安全性，Linux系统对不同的用户访问同一文件（包括目录文件）的权限做了不同的规定。例子你可以把Linux比作成一个学校，里面的人学生老师校长里面的资料课本学校档案老师个人备案资料学生只能看课本，其他的都不能看，而老师，可以看老师备案资料和课本。校长上面都可以看。在Linux中我们通常使
mongodb与爬虫的关系 getapi mongodb 爬虫数据库
MongoDB与爬虫之间的关系主要体现在数据存储和管理的层面。爬虫（WebCrawler或Spider）是一种自动化工具，用于从互联网上抓取网页内容或特定数据。而MongoDB是一个NoSQL数据库，常被用来存储和管理爬虫抓取到的数据。以下是它们之间关系的具体分析：1.爬虫的数据存储需求爬虫在运行过程中会抓取大量的非结构化或半结构化数据（例如HTML页面、JSON数据、图片链接等）。这些数据通常具
【MongoDB】分片部署和应用实践全过程 gaoyi1234560 mongodb 数据库运维开发
基本概念Router(mongos)：数据库集群请求的入口ConfigServers(replicaset)存储数据库的元数据，如路由，分片的配置Share:数据库拆分分片具体操作配置主机名：vi/etc/hosts192.168.0.222m1192.168.0.111m2192.168.0.113m3安装目录为：/opt/mongodb/cluster创建目录和日志目录：mkdir-p/opt
ERROR: Failed building wheel for pyaudioFailed to build pyaudioERROR: ERROR: Failed to build insta 小李飞刀李寻欢 python audio pyaudio 安装库 python
ERROR:FailedbuildingwheelforpyaudioFailedtobuildpyaudioERROR:ERROR:Failedtobuildinstallablewheelsforsomepyproject.tomlbasedprojects(pyaudio)这个错误表明在编译pyaudio时缺少PortAudio开发库。以下是完整解决方案：Linux系统解决方案#1.安装系统
服务器负载均衡冬冬小圆帽服务器负载均衡 vim
1.安装EPEL仓库EPEL（ExtraPackagesforEnterpriseLinux）仓库提供了额外的软件包，安装HAProxy前需要先启用EPEL仓库。sudoyuminstallepel-release-y2.安装HAProxy通过EPEL仓库安装HAProxy。sudoyuminstallhaproxy-y注意：如果服务器上已安装Docker，可能会干扰HAProxy的安装。建议先关
SQL Server 2022常见问题软件研究员数据库 sql server
根据本人多年使用数据库的经验，总结SQLServer2022数据库常见问题包含安装、链接、性能等问题，下面简单说下。一、安装失败问题主要是以下问题：1、硬件配置问题sqlServer2022运行的最低硬件配置要求：根据官网公布要求最低1G内存，最低6G可用磁盘空间，处理器速度1.4GHz，x64处理器；显示器Super-VGA(800x600)。注意：在这里我说的是最低配置。2、软件插件问题缺少.
Elasticsearch 搜索引擎原理与实践 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Elasticsearch是开源分布式搜索引擎，提供搜素、分析、数据可视化等功能。它是一个基于Lucene的全文搜索服务器，能够把结构化或非结构化的数据经过索引生成一个索引库，使其可以被搜索到。在现代Web应用中，搜索功能已经成为不可或缺的一项功能。但是传统上，传统搜索方式需要依赖于数据库查询或者其他复杂的查询接口。而Elasticsearch提供了一种高效、稳
Centos Redis安装与配置指南程序~阿呆 linux 开发工具 redis 中间件
1.环境说明centos7.9redis6.2.6安装方式：外网服务器可以使用wget来下载安装，内网服务器只能windows下载后上传到linux服务器上2.新建下载目录将下载的Redis放在本文件夹中mkdir/tools3.Redis下载服务器执行wget命令：wgethttp://download.redis.io/releases/redis-6.2.6.tar.gz4.解压和编译依次执
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本