高阳很捷迅

一款OLAP数据库ClickHouse

本篇主题：基于3W1H原则，讲解ClickHouse，以便于后续开发实践。

中文文档：如何使用 ClickHouse 测试您的硬件 | ClickHouse Docs

1 clickhouse是什么？

ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库（DBMS），使用C++语言编写，主要用于在线分析处理查询（OLAP），能够使用SQL查询实时生成分析数据报告。

tips:

OLTP（on-line transaction processing）翻译为联机事务处理， OLAP（On-Line Analytical Processing）翻译为联机分析处理，从字面上来看OLTP是做事务处理，OLAP是做分析处理。从对数据库操作来看，OLTP主要是对数据的增删改，OLAP是对数据的查询。

1.1 Why we choose it

1.1.1 经典架构及分析

架构分析

数据的实效性，中间过程经过Kafka、ETL、调度处理，报表的实效性不理想
即席分析性能，Hive存储是hdfs文件系统，查询效率不高，不适合即席查询
涉及Hadoop组件多
数据链路长，数据链路处理流程长，繁琐容错也不好

1.1.2 为啥选择ClickHouse

ClickHouse独立于hadoop生态之外，开源的OLAP数据库
支持海量数据，实时导入，适合在线查询，多维聚合分析
真正的面向列的DBMS，SQL语法支持
简单、开箱即用
主主架构，支持线性扩展
其他原因，请看下方特性

1.2 clickhouse特点

1、完备的DBMS功能

ClickHouse拥有完备的管理功能，所以它称得上是一个DBMS（Database Management System，数据库管理系统），而不仅是一个数据库。作为一个DBMS，它具备了一些基本功能，如下所示。

DDL（数据定义语言）：可以动态地创建、修改或删除数据库、表和视图，而无须重启服务。
DML（数据操作语言）：可以动态查询、插入、修改或删除数据。
权限控制：可以按照用户粒度设置数据库或者表的操作权限，保障数据的安全性。
数据备份与恢复：提供了数据备份导出与导入恢复机制，满足生产环境的要求。
分布式管理：提供集群模式，能够自动管理多个数据库节点。

这里只列举了一些最具代表性的功能，但已然足以表明为什么Click House称得上是DBMS了。

2、列式存储与数据压缩

列式存储和数据压缩，对于一款高性能数据库来说是必不可少的特性。一个非常流行的观点认为，如果你想让查询变得更快，最简单且有效的方法是减少数据扫描范围和数据传输时的大小，而列式存储和数据压缩就可以帮助我们实现上述两点。列式存储和数据压缩通常是伴生的，因为一般来说列式存储是数据压缩的前提。

列式存储相比于行式存储，列式存储在分析场景下有着许多优良的特性。

分析场景中往往需要读大量行但是少数几个列。

在行存模式下，数据按行连续存储，所有列的数据都存储在一个block中，不参与计算的列在IO时也要全部读出，读取操作被严重放大。

列存模式下，只需要读取参与计算的列即可，极大的减低了IO cost，加速了查询。

同一列中的数据属于同一类型，压缩效果显著，压缩比高。

列存往往有着高达十倍甚至更高的压缩比，节省了大量的存储空间，降低了存储成本。

更高的压缩比意味着更小的data size，从磁盘中读取相应数据耗时更短。

自由的压缩算法选择。clickhouse默认使用LZ4算法压缩，数据总体的压缩比可以达到8:1。
不同列的数据具有不同的数据类型，适用的压缩算法也就不尽相同。可以针对不同列类型，选择最合适的压缩算法。
高压缩比，意味着同等大小的内存能够存放更多数据，系统cache效果更好。

官方显示，通过列存储，在某些分析场景下，能获得100倍甚至更高的加速效果。

3、向量化执行引擎

clickhouse不仅将数据按列存储，而且按列进行计算。传统的OLTP数据库通常采用按行计算，原因是事务处理中以点查为主，SQL计算量小，实现这些技术的收益不够明显，单个SQL所涉及计算量可能极大，将每行作为一个基本单元进行处理会带来严重的性能损耗：

1）对每一行数据都要调用相应的函数，函数调用开销占比高；

2）存储层按列存储数据，在内存中按列组织，但是计算层按行处理，无法充分利用CPU Cache的预读能力，造成CPU Cache miss严重；

3）按行处理，无法利用高效的SIMD指令

ClickHouse实现了向量化执行引擎（Vectorized execution engine），对内存中的列式数据，一个batch调用一次SIMD指令（而非每一行调用一次），不仅减少函数调用次数，降低Cache miss，而且可以充分发挥SIMD指令的并行能力，大幅度缩短了计算耗时。向量执行引擎，通常能够带来数倍的性能提升。

SIMD全称Sigle Instuction Multiple Data，单指令多数据流，能够赋值多个操作数，并把它们打包在大型寄存器的一组指令集。以同步方式，在同一时刻执行同一条指令。

4、关系模型与SQL查询

相比HBase和Redis这类NoSQL数据库，ClickHouse使用关系模型描述数据并提供了传统数据库的概念（数据库、表、视图和函数等）。

与此同时，ClickHouse完全使用SQL作为查询语言（支持GROUP BY、ORDER BY、JOIN、IN等大部分标准SQL）。

5、多样化的表引擎

ClickHouse和MySQL类似，把表级的存储引擎插件化，根据表的不同需求可以设定不同的存储引擎。目前包括合并树、日志、接口和其他四大类20多种引擎。

不同的引擎决定了表数据的存储特点和表数据的操作行为：

1）决定表存储在哪里以及以何种方式存储

2）支持哪些查询以及如何支持

3）并发数据访问

4）索引的使用

5）是否可以执行多线程请求

6）数据复制参数

表引擎决定了数据在文件系统的存储方式，常用的也是官方推荐的MergeTree系列，如果需要数据副本的话可以使用ReplicateMergeTree系列，相当于MergeTree的副本版本。读取集群数据需要使用分布式表引擎Distribute。

6、多线程与分布式

如果说向量化执行是通过数据级并行的方式提升了性能，那么多线程处理就是通过线程级并行的方式实现了性能的提升。相比基于底层硬件实现的向量化执行SIMD，线程级并行通常由更高层次的软件层面控制。由于SIMD不适合用于带有较多分支判断的场景，ClickHouse也大量使用了多线程技术以实现提速，以此和向量化执行形成互补。

ClickHouse使用分布式分而治之的思想，利用多台服务的资源协同处理。在数据层面预先将数据分布到各太服务器，在计算层面，将数据的计算查询直接下推到数据所在服务器。在数据存取方面，既支持分区（纵向扩展，利用多线程原理），也支持分片（横向扩展，利用分布式原理），可以说是将多线程和分布式的技术应用到了极致。

7、多主架构

HDFS、Spark、HBase和Elasticsearch这类分布式系统，都采用了Master-Slave主从架构，由一个管控节点作为Leader统筹全局。而ClickHouse则采用Multi-Master多主架构，集群中的每个节点角色对等，客户端访问任意一个节点都能得到相同的效果。这种多主的架构有许多优势，例如对等的角色使系统架构变得更加简单，不用再区分主控节点、数据节点和计算节点，集群中的所有节点功能相同。所以它天然规避了单点故障的问题，非常适合用于多数据中心、异地多活的场景。

8、数据分片与分布式查询

数据分片是将数据进行横向切分，这是一种在面对海量数据的场景下，解决存储和查询瓶颈的有效手段，是一种分治思想的体现。

ClickHouse支持分片，而分片则依赖集群。每个集群由1到多个分片组成，而每个分片则对应了ClickHouse的1个服务节点。分片的数量上限取决于节点数量（1个分片只能对应1个服务节点）。

ClickHouse并不像其他分布式系统那样，拥有高度自动化的分片功能。ClickHouse提供了本地表（Local Table）与分布式表（Distributed Table）的概念。一张本地表等同于一份数据的分片。而分布式表本身不存储任何数据，它是本地表的访问代理，其作用类似分库中间件。借助分布式表，能够代理访问多个数据分片，从而实现分布式查询。

这种设计类似数据库的分库和分表，十分灵活。例如在业务系统上线的初期，数据体量并不高，此时数据表并不需要多个分片。所以使用单个节点的本地表（单个数据分片）即可满足业务需求，待到业务增长、数据量增大的时候，再通过新增数据分片的方式分流数据，并通过分布式表实现分布式查询。

1.3 clickhouse性能测试

官网提供的测试：ClickBench — a Benchmark For Analytical DBMS

专家测试：http://www.clickhouse.com.cn/topic/5c453371389ad55f127768ea

1.4 clickhouse适用和不适用场景

官网文档：OLAP使用场景

总结：

数据只是添加到数据库，没有必要修改
读取数据时，会从数据库中提取出大量的行，但只用到一小部分列
大宽表，读大量行但是少量列，结果集较小，列的值是比较小的数值和短字符串
数据需要以大批次（大于1000行）进行更新，而不是单行更新；或者根本没有更新操作
无需事务，数据一致性要求低
每次查询中只会查询一个大表。除了一个大表，其余都是小表
查询结果显著小于数据源。即数据有过滤或聚合。返回结果不超过单个服务器内存大小

2 clickhouse的使用

官网在线测试链接：https://play.clickhouse.tech/?file=welcome

2.1 数据类型

基础类型只有数值、字符串和时间三种类型，没有 Boolean 类型，但可以使用整型的 0 或 1 替代。

ClickHouse 的数据类型和常见的其他存储系统的数据类型对比：

MySQL	Hive	CLickHouse（区分大小写）
byte	TINYINT	Int8
short	SMALLINT	Int16
int	INT	Int32
long	BIGINT	Int64
varchar	STRING	String
timestamp	TIMESTAMP	DateTime
float	FLOAT	Float32
double	DOUBLE	Float64
boolean	BOOLEAN	无

看官网：数据类型 | ClickHouse Docs

说明：Clickhouse的字段默认是不允许为NULL的，如果数据有可能为NULL，需要将字段定义为类似Nullable(Int64)的类型。

2.2 存储引擎

ClickHouse 提供了大约 28 种表引擎，各有各的用途，比如有 Log 系列用来做小表数据分析，MergeTree 系列用来做大数据量分析，而 Integration 系列则多用于外表数据集成。再考虑复制表Replicated 系列，分布式表 Distributed 等，纷繁复杂，新用户上手选择时常常感到迷惑。

ClickHouse表引擎一共分为四个系列，分别是Log、MergeTree、Integration、Special。其中包含了两种特殊的表引擎Replicated、Distributed，功能上与其他表引擎正交，根据场景组合使用。

最强大的表引擎当属 MergeTree （合并树）引擎及该系列（*MergeTree）中的其他引擎。对于大多数正式的任务，推荐使用MergeTree 族中的引擎。因为只有合并树系列的表引擎才支持主键索引、数据分区、数据副本和数据采样这些特性，同时也只有此系列的表引擎支持ALTER相关操作。

Log、Special、Integration 主要用于特殊用途，场景相对有限。MergeTree 系列才是官方主推的存储引擎，支持几乎所有 ClickHouse 核心功能。

存储引擎，去查阅官方文档

2.2.1 表引擎概览

一共分为四个系列，分别是Log、MergeTree、Integration、Special。其中包含了两种特殊的表引擎Replicated、Distributed，功能上与其他表引擎正交。表引擎（即表的类型）决定了：

（1）数据的存储方式和位置，写到哪里以及从哪里读取数据
（2）支持哪些查询以及如何支持。
（3）并发数据访问。
（4）索引的使用（如果存在）。
（5）是否可以执行多线程请求。
（6）数据复制参数。

2.2.2 翻牌子存储引擎如何选

1、Log系列

Log系列表引擎功能相对简单，主要用于快速写入小表（1百万行左右的表），然后全部读出的场景。

几种Log表引擎的共性是：

数据被顺序append写到磁盘上；
不支持delete、update；
不支持index；
不支持原子性写；
insert会阻塞select操作。

它们彼此之间的区别是：

TinyLog：不支持并发读取数据文件，查询性能较差；格式简单，适合用来暂存中间数据；
StripLog：支持并发读取数据文件，查询性能比TinyLog好；将所有列存储在同一个大文件中，减少了文件个数；
Log：支持并发读取数据文件，查询性能比TinyLog好；每个列会单独存储在一个独立文件中。

2、Integration系列

该系统表引擎主要用于将外部数据导入到ClickHouse中，或者在ClickHouse中直接操作外部数据源。

Kafka：将Kafka Topic中的数据直接导入到ClickHouse；
MySQL：将Mysql作为存储引擎，直接在ClickHouse中对MySQL表进行select等操作；
JDBC/ODBC：通过指定jdbc、odbc连接串读取数据源；
HDFS：直接读取HDFS上的特定格式的数据文件；

3、Special系列

Special系列的表引擎，大多是为了特定场景而定制的。这里也挑选几个简单介绍，不做详述。

Memory：将数据存储在内存中，重启后会导致数据丢失。查询性能极好，适合于对于数据持久性没有要求的1亿一下的小表。在ClickHouse中，通常用来做临时表。
Buffer：为目标表设置一个内存buffer，当buffer达到了一定条件之后会flush到磁盘。
File：直接将本地文件作为数据存储；
Null：写入数据被丢弃、读取数据为空；

4、MergeTree系列

Log、Special、Integration主要用于特殊用途，场景相对有限。MergeTree系列才是官方主推的存储引擎，支持几乎所有ClickHouse核心功能。

1、一般情况下使用MergeTree引擎即可。

2、子类引擎使用

特殊功能：发生在分区合并时

ReplacingMergeTree：解决数据去重问题，有相同主键无法去重的问题，主要基于order by后的字段进行去重。

CollapsingMergeTree：数据删除问题，以增代删。缺陷：多线程情况下，乱序写入，无法删除。

VersionedCollapsingMergeTree：数据删除问题，以增代删。解决CollapsingMergeTree缺陷

SummingMergeTree：特定数据合并问题，主要基于order by后的字段进行sum聚合。

AggregatingMergeTree：特定数据合并问题，主要基于order by后的字段进行AggregateFunction 类型的聚合

5、Distributed 分布式引擎

Distributed 分布式引擎本身不存储数据, 但可以在多个服务器上进行分布式查询。

2.3 clickhouse的SQL特性

参见知识库其他文档：clickhouse的语法特性 vs maxcomputer

2.4 ClickHouse的函数

ClickHouse中至少存在两种类型的函数

常规函数：每一行执行一次函数计算一样（对于每一行，函数的结果不依赖于其他行）
聚合函数。合函数则从各行累积一组值
arrayJoin函数与表函数均属于第三种类型的函数

官网资料：Functions | ClickHouse Docs

自定义函数实现，知识库《ClickHouse源码：函数&自定义函数》

3 实践与应用

3.1 基于ClickHouse数仓分层

ck适合的数据模型

ck数仓数据模型采用星型模型搭建，星型架构是一种非正规化的结构，多维数据集的每一个维度都直接与事实表相连，不存在渐变维度，所以数据有一定冗余。因为有冗余，所以很多统计不需要做外部的关联查询，因此一般情况下效率比雪花模型高。

说明：使用星型模型搭建即最大限度的允许数据冗余，减少必要的外表连接，提高sql效率

3.2 电信用户画像案例分析

基于clickHouse数据架构

1、数据流程处理

2、任务调度

3、数据导出实现

定义引擎类别MySQL，直接进行操作。

clear_dx_user_group_001 数据源是mysql；export_dx_user_group_001数据源是clickhouse。

4、bitmap函数在用户画像中实现

核心表：

CREATE TABLE IF NOT EXISTS ctuserbasecoredb.app_dx_portrait_tag_umap_1d
(
    dw_gmt_create DateTime COMMENT '日期',
    ds FixedString(8) COMMENT '数据分区 yyyymmdd',
    tag_id         String   COMMENT '标签id',
    tag_value     String   COMMENT '标签值',
    us AggregateFunction(groupBitmap,UInt64) COMMENT '用户uid集合形成bitmapping'
)engine=AggregatingMergeTree()
partition by  ds
order by (tag_id,tag_value)
-- 指定数据生命周期为7天,数据备份，到指定卷或者磁盘
TTL dw_gmt_create  + INTERVAL 7 DAY
-- 索引粒度，默认8192
SETTINGS index_granularity = 8192
COMMENT '标签-标签聚合用户表-全量表(tag->uidbitmap)';

聚集：

INSERT INTO TABLE ctuserbasecoredb.app_dx_portrait_tag_umap_1d
select
    now() AS dw_gmt_create
     ,'${before_date_str}' AS ds
     ,t.tag_id
     ,t.tag_value
     ,groupBitmapState(t.bit_map_id) AS us
from (
     select
         s1.tag_id
          ,s1.out_user_id
          ,s1.tag_value
          ,s2.bit_map_id
     from(
         SELECT
             tag_id
              ,out_user_id
              ,tag_value
         FROM ctuserbasecoredb.dwb_dx_portrait_user_lni_act_1d
         where ds = '${before_date_str}'

         UNION ALL
         select
             tag_id
              ,out_user_id
              ,tag_value
         FROM ctuserbasecoredb.dwb_dx_portrait_user_attr_1d
         where ds = '${before_date_str}'
    )s1
    join (
    select out_user_id,bit_map_id
     from ctuserbasecoredb.dim_dx_user_bitmap_id_df
     where ds = '${before_date_str}'
    )s2
    on s1.out_user_id = s2.out_user_id
)t
group by t.tag_id,t.tag_value;

关键SQL:

  insert into app_dx_portrait_group_tag_aggregation_1d
  select now() as dw_gmt_create
  ,'{self.ds_partition}' as ds
  ,'{group_id}' as group_id
  ,s2.out_user_id as out_user_id
  ,s2.tag_detail
  ,now() as base_time
  from ( select arrayJoin(bitmapToArray(t.us)) as id from ({group_tag_conditions_sql})t) s1
  join (
    select out_user_id,bit_map_id,tag_detail
    from dim_dx_user_bitmap_id_df
    where ds = '20211013'
  )s2
  on s1.id = s2.bit_map_id

group_tag_conditions_sql：

select arrayJoin(bitmapToArray(t.us)) as id 
from (
  select groupBitmapOrState(us) as us from (
    select groupBitmapAndState(us) as us from (
      select us from app_dx_portrait_tag_umap_1d where ds='20211013' and tag_id='DX_01_AB_0001' and tag_value = 'true'
      UNION ALL  
      select us from app_dx_portrait_tag_umap_1d where ds='20211013' and tag_id='DX_01_AA_0001' and tag_value = 'true'
      UNION ALL  
      select us from app_dx_portrait_tag_umap_1d where ds='20211013' and tag_id='DX_01_AA_0002' and tag_value = '电信' 
      UNION ALL  
      select groupBitmapOrState(us) as us from app_dx_portrait_tag_umap_1d where ds='20211013' and tag_id='DX_01_AA_0003' and tag_value in ('未知', '浙江', '上海', '北京', '湖北')
    )
 )
)

3.3 ClickHouse监控

知识库文档：ClickHouse 监控平台

监控 | ClickHouse Docs

这是官网给出的方案：基于prometheus + grafana生态。

测试环境：http://172.31.28.31:3000/d/10Bw94W7z/clickhousece-shi-huan-jing?orgId=1

4 clickhouse优化

4.1 Clickhouse SQL常规优化

单表查询：

Prewhere替代where
列裁剪与分区裁剪，代替使用select *
orderby 结合where、limit
避免构建虚拟列（as xx）,不要在结果集上构建虚拟列，虚拟列非常消耗资源浪费性能，可以考虑在前
uniqCombined替代distinct ，uniqCombined底层采用类似HyperLogLog算法实现，能接收2%左右的数据误差，可直接使用这种去重方式提升查询性能。

多表查询：

用IN 代替JOIN

insert into hits_v2
select a.* from hits_v1 a where a. CounterID in (select CounterID from
visits _v1

大小表JOIN ，小表在右

insert into table hits_v2
select a.* from hits_v1 a left join visits_v 2 b on a. CounterID=b.
CounterID;

注意谓词下推（版本差异）,每个子查询提前完成过滤操作
分布式表使用GLOBAL
使用字典表，字典表会常驻内存，在需要进行关联分析的业务中使用

4.2 clickhouse explain

基本语法：

EXPLAIN [AST | SYNTAX | PLAN | PIPELINE] [setting = value, ...]
SELECT ... [FORMAT ...]

➢ PLAN：用于查看执行计划，默认值。

header 打印计划中各个步骤的head 说明，默认关闭，默认值0;
description 打印计划中各个步骤的描述，默认开启，默认值1；
actions 打印计划中各个步骤的详细信息，默认关闭，默认值0。

➢ AST ：用于查看语法树;

➢ SYNTAX：用于优化语法;

➢ PIPELINE：用于查看PIPELINE 计划。

header 打印计划中各个步骤的head 说明，默认关闭;
graph 用DOT图形语言描述管道图，默认关闭，需要查看相关的图形需要配合graphviz查看；
actions 如果开启了graph，紧凑打印打，默认开启。

注：PLAN 和PIPELINE 还可以进行额外的显示设置，如上参数所示。

-- 先做一次查询
SELECT number = 1 ? 'hello' : (number = 2 ? 'world' : 'hello') FROM numbers(10);

-- 查看语法优化
EXPLAIN SYNTAX SELECT number = 1 ? 'hello' : (number = 2 ? 'world' : 'hello') FROM numbers(10);

-- 开启三元运算符优化
SET optimize_if_chain_to_multiif = 1;

-- 再次查看语法优化
EXPLAIN SYNTAX SELECT number = 1 ? 'hello' : (number = 2 ? 'world' : 'hello') FROM numbers(10);

-- 返回优化后的语句
SELECT if(number = 1, 'hello', if(number = 2, 'world', 'hello')) FROM numbers(10);

你可能感兴趣的:(数据分析,数据库,clickhouse,hive)

如何寻找好用的GPTs模型？小宝哥Code ChatGPT与AIGC 人工智能
要有效地寻找和使用好用的GPT模型，可以按照以下步骤来选择和应用最合适的模型，尤其是在科研或工作中需要完成特定任务时：1.明确需求和任务在寻找适合的GPT模型之前，首先需要明确你要解决的任务或需求。不同的GPT模型在处理各种任务时表现不一样。常见的任务包括：文本生成：创作文章、生成报告、写作论文等。问答系统：快速解答科研问题、技术问题等。翻译和润色：翻译论文、改进文章语言质量等。数据分析和图表生成
Django ORM解决Oracle表多主键的问题 zZeal django python 后端 oracle
现状以Django3.2为例DjangoORM设计为默认使用单一主键（通常是自增的id字段），这一选择主要基于以下核心原因：简化ORM设计与操作统一访问方式外键关联简化避免歧义冲突主键语义明确防止隐式依赖性能与数据库兼容索引效率优化跨数据库兼容替代方案成熟unique_together约束Oracle现状原始业务表，很多都使用多主键。使用Django映射现有Oracle数据库无法处理多主键问题。O
java访问数据库视图_java 访问数据库视图金小夕 java访问数据库视图
工作多年调用视图到多次,自己写代码使用视图还是头一回,也觉得新鲜,那就开始呗,数据库系统是Oracle1我用的数据库连接客户端是Navicat,首先创建视图,其实视图就是调用表的操作,提取自己需要的数据放到视图下面,相对于java来说,可以把视图看成是特殊的表对待,这里说的特殊指的是通过hql语句调用访问数据库的时候涉及到关联表的问题.创建视图如下:然后通过myeclipse的hiberanger
MySQL优化系列9-MySQL控制查询优化器Hints 只是甲 MySQL从小工到专家之路 #MySQL优化 mysql hints MySQL调整执行计划
备注:测试数据库版本为MySQL8.0文章目录一.控制查询计划评估二.可切换的优化三.优化器的Hints3.1优化器Hints概述3.2优化器Hints语法3.3连接顺序优化器Hints3.4表级别的优化器Hints3.5索引级别优化器Hints3.6子查询相关优化器的Hints3.7语句执行时间优化器Hints3.8可变设定Hints语法3.9资源组Hint语法3.10命名查询块的优化器Hint
实验三数据库完整性技术计算机小白的笔记数据库 database
实验三数据库完整性技术【实验目的】1、掌握完整性的概念；2、熟悉MySQL的完整性技术。3、了解MySQL的违反完整性处理措施。【实验性质】验证性实验【实验学时】2H【实验内容】写出完整、详尽的SQL语句，根据实验记录结果并总结。(空位不够请自行续页)一、定义完整性。(5分)/*创建表s、p、j、spj*/定义s表；sno主码，sname非空、city缺省值定义p表；pno主码，pname非空、c
实验三数据库完整性 (头歌) 霸敛笔记数据库 sql oracle
实验三数据库完整性(头歌)制作不易！点个关注！给大家创造更多的价值！目录实验三数据库完整性(头歌)`制作不易！点个关注！给大家创造更多的价值！`第一关：定义s表完整性相关知识MySQL约束概述主键约束非空约束默认值约束查看表中的约束编程要求第二关：定义p表完整性相关知识MySQL检查约束（CHECK）编程要求代码如下：第3关：定义j表完整性编程要求代码如下：第4关：定义spj表完整性相关知识MyS
Python Django ORM qq_15654157 Python python
一、ORM介绍1.什么是ORM?ORM全拼Object-RelationMapping.中文意为对象-关系映射.在MVC/MVT设计模式中的Model模块中都包括ORM2.ORM优势（1）只需要面向对象编程,不需要面向数据库编写代码.对数据库的操作都转化成对类属性和方法的操作.不用编写各种数据库的sql语句.（2）实现了数据模型与数据库的解耦,屏蔽了不同数据库操作上的差异.不在关注用的是mysql
计算机毕业设计JAVA房屋租赁系统mybatis 煦洋cxsj985 mybatis java 开发语言
计算机毕业设计JAVA房屋租赁系统mybatis计算机毕业设计JAVA房屋租赁系统mybatis+源码+调试部署+系统+数据库+lw本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5.7/8.0源码地址：https://pan
大数据分析案例-基于逻辑回归算法构建抑郁非抑郁推文识别模型艾派森大数据分析案例合集机器学习人工智能 python 数据挖掘回归
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+喜欢大数据分析项目的小伙伴，希望可以多多支持该系列的其他文章大数据分析案例合集
多线程与高并发（6）——CAS详解（包含ABA问题）李王家的翠花 java 多线程 java 开发语言
一、乐观锁和悲观锁乐观锁和悲观锁都是用于解决并发场景下的数据竞争问题，不局限于某种编程语言或数据库。1、乐观锁：就是很乐观，每次去拿数据的时候都认为别人不会修改，所以不会上锁，但是在更新的时候会判断一下在此期间别人有没有去更新这个数据。乐观锁的实现方式：主要有两种，一种是CAS机制，一种是版本号机制。（1）版本号机制：在数据中增加一个version字段用来表示该数据的版本号，每当数据被修改版本号就
Django ORM查询示例：获取主键为1的记录标题 Leon_Jinhai_Sun django 数据库 oracle
>>>Entry.objects.values_list('headline',flat=True).get(pk=1)'Firstentry'这段代码是使用Django框架的ORM（Object-RelationalMapping，对象关系映射）系统来查询数据库中的一条记录。下面是代码的详细解释：Entry.objects.values_list('headline',flat=True).ge
数据库用户管理比特知识工坊 MySQL专栏数据库 adb android
数据库用户管理1.创建用户MySQL在安装是，会默认创建一个名位root的用户，该用户拥有超级权限，可以控制整个MySQL服务器。在对MySQL的日常管理和操作中，通常创建一些具有适当权限的用户，尽可能的不用或少用root登录系统，以此来确保数据的安全访问。可以使用createuse语句创建用户，并设置相应密码：createuser用户[indentifiedby[password]'passwo
第七章 C - D 开头的术语 yaoxin521123 IRIS相关术语 oracle 数据库
文章目录第七章C-D开头的术语当前设备(currentdevice)当前目录(currentdirectory)基于游标的SQL(cursor-basedSQL)游标(cursor)自定义存储(customstorage)以D开头的术语数据库(database)数据库缓存(databasecache)数据库加密(databaseencryption)数据库加密密钥(database-encrypt
实验九视图的使用无尽罚坐的人生数据库 oracle java
实验九视图的使用一、实验目的1．熟悉视图的操作。二、实验内容及要求用SQL语句完成下列功能。使用数据库为SCHOOL数据库。1．建立一视图View_CSTeacher，列出计算机系各个老师的资料(姓名、性别、职称)。createviewView_CSTeacher(姓名,性别,职称)asselectteac_id,teac_sex,techpostfromteachert,deparmentdwh
SQLite 附加数据库 zhang.fang 数据库 sqlite oracle
假设这样一种情况，当在同一时间有多个数据库可用，您想使用其中的任何一个。SQLite的ATTACHDATABASE语句是用来选择一个特定的数据库，使用该命令后，所有的SQLite语句将在附加的数据库下执行。语法SQLite的ATTACHDATABASE语句的基本语法如下：ATTACHDATABASEfile_nameASdatabase_name;如果数据库尚未被创建，上面的命令将创建一个数据库，
Python使用FastApi开发接口冉成未来 python fastapi 开发语言
文章目录python开发web框架简介FastApi安装安装依赖包代码编写创建数据库连接模块database.py创建数据库实体模块model.py创建实体类模型模块schemas.py创建操作数据库模块curd.py创建接收请求模块main.py创建运行模块run.py项目运行编写完以上代码，通过以下命令进行项目启动查看项目接口pyinstalle打包FastApi项目项目通过uvicorn运行
【手写数据库内核组件】0301 缓存模型介绍，缓存分层架构与缓存映射算法，以及缓存淘汰替换算法，同步一致的策略韩楚风 C语言实战-手写数据库内核组件数据库缓存架构 c语言数据结构
0301缓存介绍专栏内容：postgresql使用入门基础手写数据库toadb并发编程个人主页：我的主页管理社区：开源数据库座右铭：天行健，君子以自强不息；地势坤，君子以厚德载物.文章目录0301缓存介绍一、概述二、多样的数据造就各异的缓存三、缓存的架构四、缓存算法4.1缓存组织算法4.2缓存映射算法4.3缓存替换算法4.4缓存同步算法五、总结结尾
数据库查询优化：提升性能的关键实践 qcidyu 文章归档 DBA最佳实践性能调优查询执行计划索引 SQL 数据库性能查询优化
title:数据库查询优化：提升性能的关键实践date:2025/1/30updated:2025/1/30author:cmdragonexcerpt:在当今数据驱动的商业环境中，数据库的性能直接影响着应用程序的响应速度和用户体验。查询优化是性能调优的重要组成部分，通过对SQL查询的分析与改进，减少查询执行时间和资源消耗，从而提升整体系统效率。categories:前端开发tags:查询优化数据
数据库物理备份：保障数据完整性和业务连续性的关键策略 qcidyu 数据库
title:数据库物理备份：保障数据完整性和业务连续性的关键策略date:2025/1/29updated:2025/1/29author:cmdragonexcerpt:在现代企业中，数据被视为最重要的资产之一。因此，确保数据的安全性、完整性和可用性是每个数据库管理员（DBA）的首要任务。在数据管理的过程中，备份与恢复是必不可少的策略，尤其是物理备份。物理备份通过直接复制数据库的物理文件，从而实
《告别监控焦虑！Kylin系统Zabbix保姆级安装手册》入眼皆含月 kylin zabbix 大数据
一、概况Zabbix是一个广泛使用的企业级开源监控解决方案，能够监控网络、服务器、虚拟机和云服务等IT基础设施。它通过灵活的通知机制，使用户能够为几乎所有事件配置基于电子邮件的警报，从而快速响应服务器问题。二、Zabbix的主要功能（1）全面的监控能力：能够监控几乎所有类型的IT组件，包括操作系统性能、网络设备、数据库、应用程序等。（2）灵活的数据收集方式：支持多种数据收集方法，如SNMP、IPM
对 oracle 19.9 数据库安装 19.13 补丁步骤 whn1977
前提检查df-h磁盘空间要充足crsctlstatres集群状态要正常，最好重启主机再检查一遍（时钟不同步可能起不来，权限、密码可能导致不正常）selectname,database_role,open_modefromgv$database;数据库角色是primary，open_mode=readwrite上传介质到/ora_softRU19.13介质:p33248471_190000_Linu
oracle两列数列找差异,ORACLE中比较两个数据库的差异沙雕网友已上线 oracle两列数列找差异
方法一、用PL/SQLDEVELOPER来比较1.登陆数据库A.2.打开TOOLS菜单下的CompareUserObjects3.点TargetSession，登陆数据库B4.执行Compare5.返回的是所有不同的对象以及更新语句[@more@]方法二、1、对需要比较的表进行分析(可全表可抽样，自选),否则统计信息不准；2、通过dba_tab_col_statistics表的column_nam
PostgreSQL的一主一从集群搭建部署 (同步) keep__go PostgreSQL postgresql 数据库
一、实验环境虚拟机名IP身份简称keep-postgres12-node1192.168.122.87主节点node1keep-postgres12-node2192.168.122.89备节点node2二、安装数据库源码包方式（主）1、创建用户[root@keep-postgres12-node1~]#groupaddpostgres[root@keep-postgres12-node1~]#u
Oracle 统计信息笔记----一、表的统计信息 w.ang.jie oracle 随记统计信息 oracle 数据库统计信息
sosi.txt脚本：SHOWOptimizerStatisticsInformation；显示表级别、分区级别、子分区级别的统计信息。Oracle数据库的统计信息存储在数据字典里1.对表test收集统计信息avg_row_len：表示目标表的平均行长度。（不算行头）数字100在Oracle数据块的行里占2字节，加上描述其长度的1字节，一共3字节同理，'CUIHUA’一共占6+1=7字节。两个字段
SQLAlchemy ORM在Python Web开发中的核心作用探究不一样的信息安全网络杂烩 sql
摘要在PythonWeb开发领域，SQLAlchemyORM扮演着至关重要的角色。作为一种对象关系映射工具，它能够将Python类与数据库表相映射，实现数据行与Python对象之间的转换。开发者可以使用面向对象的方法操作数据库，无需直接编写SQL语句，从而大幅提升开发效率并降低出错概率。SQLAlchemyORM提供了一套强大而灵活的数据库操作方法，助力开发者快速构建和维护复杂的数据模型。关键词S
Python从0到100（二十二）：用Python读写CSV文件是Dream呀 python 数据库开发语言
一、CSV文件概述CSV，即逗号分隔值（CommaSeparatedValues），是一种以纯文本形式存储表格数据的通用格式。它因其简洁和易于使用而广泛应用于数据交换，如在数据库、电子表格等应用程序中导入和导出数据。CSV文件的纯文本特性使其与操作系统和编程语言无关，大多数编程语言都提供了处理CSV文件的功能，使其在数据处理和科学领域中极为流行。CSV文件的主要特点包括：纯文本格式：使用特定字符集
第25天：web攻防-通用漏洞&sql读写注入&MYSQL&MSSQL 不灭锦鲤 sql mysql sqlserver
#知识点：1、sql注入-mysql数据库2、sql注入-mssql数据库3、sql注入-postgreSQL数据库#详细点：Access无高权限注入点-只能猜解，还是暴力猜解MYSQL，PostgreSQL，MSSQL高权限注入，可升级为读写执行。演示案例MYSQL读取文件内容，记把my.ini改成utf-8的格式使用load_file读取网站关键性内容，在sql注入中，我试了读取不道，明明在数
MySQL知识点总结（九） a_j58 mysql 数据库
请说明FILE,PROCESS,RELOAD这三个系统权限的作用？FILE：允许运行SQL语句在服务器主机文件系统中读写文件。PROCESS；允许使用SHOWPROCESSLIST语句查看客户端正在执行的所有语句。RELOAD:允许执行FLUSH语句以重新加载日志和权限表。请说明授权表的内容和它的作用MySQL服务器在启动时将授权表从mysql数据库读取到内存中，所有的访问控制决策都以这些表为依据
MySQL中的读锁与写锁：概念与作用深度剖析恩爸编程 mysql mysql 数据库 mysql读锁 mysql写锁 mysql中的读锁啥意思 mysql中的写锁啥意思 mysql锁机制
MySQL中的读锁与写锁：概念与作用深度剖析在MySQL数据库的并发控制机制中，读锁和写锁起着至关重要的作用。它们是确保数据在多用户环境下能够正确、安全地被访问和修改的关键工具。一、读锁（共享锁）概念读锁，也称为共享锁（SharedLock），在MySQL中使用LOCKINSHAREMODE语句来实现。当一个事务对某一数据对象施加读锁时，允许其他事务同时对该数据对象进行读取操作，但不允许其他事务对
MMOFPS架构方案你一身傲骨怎能输游戏框架架构
设计一个大规模多人在线第一人称射击游戏（MMOFPS）的架构是一个复杂且具有挑战性的任务。这个架构需要考虑到高并发、低延迟、数据一致性、安全性和可扩展性等多个方面。以下是一个详细的MMOFPS架构方案，涵盖了客户端、服务器、数据库和网络通信等方面。架构概述客户端:负责渲染、用户输入、动画和本地物理计算。服务器:负责游戏逻辑、状态同步、玩家匹配和数据存储。数据库:存储玩家数据、游戏状态和日志。网络通
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&