liushangzaibeijing

InnoDB学习笔记一引擎架构及特性

文章目录

- 一、InnoDB引擎架构
- - 1.1 InnoDB架构图
  - 1.2 InnoDB的一个多线程模型
  - 1.2.1 Master Thread - 核心线程
  - - 1.0.x版本之前的Master Thread
    - - 主loop线程
      - backgroud线程
      - flush loop线程
      - suspend loop线程
    - 1.2.x版本之前Master Thread
    - 1.2.x版本的Master Thread
  - 1.2.2 IO Thread
  - 1.2.3 Purge Thread
  - 1.2.4 Page Cleaner Thread
  - 1.3 基础知识补充
- 二、InnoDB的特性
- - 2.1 Insert Buffer - 插入缓冲
  - - 为啥非唯一约束
    - 插入缓冲占用内存过多
    - 插入缓存的内部实现
  - 2.2 Double Write - 两次写
  - - double write空间构成
    - 崩溃恢复
  - 2.3 自适应哈希索引
  - - 建立要求
    - 限制
  - 2.4 AIO - 异步IO
  - 2.5 刷新临近页
  - 2.6 预读 read ahad
  - - 数据库读操作流程
    - 预读机制

数据库是数据的集合，数据库管理系统（DBMS）是操作和管理数据库的应用程序。数据库应用主要有两类：OLAP（联机分析处理）和OLTP（联机事务处理）。

OLAP的主要特点是:

实时性要求不高
数据量大
并发量小

OLTP的主要特点是:

实时性要求高
数据量小
高并发
要求满足ACID

mysql是一种OLTP类型的DBMS或者说OLTP是传统的关系型数据库的主要应用，其体系架构如下图所示：

mysql中集成的是插件式的存储引擎，InnoDB引擎是其中之一。存储引擎基于表而不是数据库：同一个数据库中根据不同表的访问操作需求可以选择不同的存储引擎。

一、InnoDB引擎架构

InnoDB引擎主要面对OLTP类应用。

InnoDB引擎在mysql中处于文件和文件系统的上层，管理着对InnoDB引擎表的访问和更新。

1.1 InnoDB架构图

InnoDB完整架构图

图片来源与官网：

https://dev.mysql.com/doc/refman/5.7/en/innodb-architecture.html

1.2 InnoDB的一个多线程模型

1.2.1 Master Thread - 核心线程

Master Thread是InnoDB存储引擎非常核心的一个后台线程，主要负责将缓冲池中的数据异步刷新到磁盘，保证数据的一致性，包括脏页的刷新、合并插入缓冲、UNDO页的回收等。

1.0.x版本之前的Master Thread

Master Thread具有最高的线程优先级别。内部由多个循环组成：主循环（loop）、后台循环（backgroup loop）、刷新循环（flush loop）、暂停循环（suspend loop）。Master Thread会根据数据库运行的状态在loop、backgroup loop、flush loop和suspend loop中进行切换。

主loop线程

loop是主循环，大多数的操作都在这个循环中，主要有两大部分的操作——每秒钟的操作和每10秒钟的操作。伪代码如下：

void master_thread()
{
    loop:
    for(int i = 0; i < 10; ++i){
        do thing once per second;
        sleep 1 second if necessary;
    }
    do things once per ten seconds;
    goto loop;
}

每秒一次的操作包括：

日志缓冲刷新到磁盘，即使这个事务还没有提交（总是）；

即使某个事务还没有提交，InnoDB存储引擎仍然每秒会将reDo日志缓冲中的内容刷新到重做日志文件。这也解释了为什么再大的事务提交的时间也是很短的。
合并插入缓冲（可能）；

合并插入缓冲并不是每秒都会发生的。InnoDB存储引擎会判断当前一秒内发生的IO次数是否小于5次，如果小于5次，InnoDB存储引擎认为当前的IO压力很小，可以执行合并插入缓冲的操作；

什么叫做合并插入缓冲：对于非聚集索引每次插入会随机访问页，写入性能低，这里可以采取将多个插入操作合并到一个io中，增加写的性能
至多刷新100个InnoDB的缓冲池中的脏页到磁盘（可能）；
刷新100个脏页也不是每秒都会发生的，InnoDB存储引擎通过判断当前缓冲池中脏页的比例(buf_get_modified_ratio_pct)是否超过了配置文件中
innodb_max_dirty_pages_pct这个参数（默认是75，代表75%），如果超过了这个值，InnoDB存储引擎则认为需要做磁盘同步的操作，将100个脏页写入磁盘中。
如果当前没有用户活动，则切换到background loop(可能)；

每10秒的操作主要是下面几个方面：

刷新100个脏页到磁盘（可能）
InnoDB存储引擎会先判断过去10秒之内磁盘的IO操作是否小于200次，如果是，InnoDB存储引擎认为当前有足够的磁盘IO能力，因此将100个脏页刷新到磁盘。
合并至多5个插入缓冲（总是）
将日志缓冲刷新到磁盘（总是）
删除无用的Undo页（总是）
刷新100个或者10个脏页到磁盘（总是）
InnoDB存储引擎会执行full purge操作，即删除无用的Undo页。对表进行update，delete这类的操作时，原先的行被标记为删除，但是因为一致性读的关系，需要保留这些行版本的信息。但是在full purge过程中，InnoDB存储引擎会判断当前事务系统中已被删除的行是否可以删除，比如有时候可能还有查询操作需要读取之前版本的undo信息，如果可以删除，InnoDB存储引擎会立即将其删除。从源代码中可以看出，InnoDB存储引擎在执行full purge 操作时，每次最多尝试回收20个undo页。

然后，InnoDB存储引擎会判断缓冲池中脏页的比例（buf_get_modified_ratio_pct）,如果有超过70%的脏页，则刷新100个脏页到磁盘，如果脏页的比例小于70%,则只需刷新10%的脏页到磁盘。

backgroud线程

如果当前没有用户活动（数据库空闲）或者数据库关系，就会切换到backgroud loop这个循环。
backgroud loop会执行以下操作：

删除无用的Undo页（总是）
合并20个插入缓冲（总是）
跳回到主循环（总是）
不断刷新100个页直到符合条件（可能，需要跳转到flush loop中完成）

flush loop线程

刷新脏页到磁盘(总是)
如果缓冲池中的脏页比例大于innodb_max_dirty_pages_pct的值（默认75%）继续刷新脏页

否则跳转到suspend loop中。

suspend loop线程

Master Thread挂起，等待事件的发生。

若用户启用了InnoDB存储引擎，却没有使用任何InnoDB存储引擎的表，那么Master Thread总是处于挂起的状态。

最后，Master Thread完整的伪代码如下：

void master_thread()
{
    loop:
    //每一秒的操作
    for(int i = 0; i < 10; ++i){
        thread_sleep(1);
        //刷新日志到磁盘
        do log buffer flush to disk;
        //合并插入缓冲
        if(last_one_second_ios < 5)
            do merge at most 5 insert buffer;
        //至多刷新100个InnoDB的缓冲池中的脏页到磁盘（可能） 
        if(buf_get_modified_ratio_pct > innodb_max_dirty_pages_pct)
            do buffer pool flush 100 dirty page;
        //无用户活动 跳转到backgroup 循环中    
        if(no user activity)
            goto backgroud loop;
    }
    //每10秒的操作
    //如果上一次10秒内 io次数小于200 
    //则刷新100个脏页到磁盘
    if(last_ten_second_ios < 200)
        do buffer pool flush 100 dirty page;
    //并至多5个插入缓冲
    do merge at most 5 insert buffer;
    //将日志缓冲刷新到磁盘
    do log buffer flush to disk;
    //删除无用的Undo页
    do full purge;
    //缓冲池中的脏页如果超过70% 则刷新100个脏页到磁盘
    if(buf_get_modified_ratio_pct > 70%)
        do buffer pool flush 100 dirty page;
    else
    //否则刷新10个脏页到磁盘
        buffer pool flush 10 dirty page;
        
    // 后台循环   
    backgroud loop：
    // 删除无用的undo页
    do full purge	
    //合并插入缓冲是innodb_io_capacity的5%（10）（总是）
    do merge 20 insert buffer;	
    // 如果不空闲，就跳回主循环，如果空闲就跳入flush loop
    if not idle					
        goto loop:		
    else
        goto flush loop

	// 刷新循环
    flush loop:				
    do buffer pool flush 100 dirty page;
    if(buf_get_modified_ratio_pct > innodb_max_dirty_pages_pct)	
    	// 如果缓冲池中的脏页比例大于innodb_max_dirty_pages_pct的值（默认75%）
    	// 跳到刷新循环，不断刷新脏页，直到符合条件
        goto flush loop;		
    // 完成刷新脏页的任务后，跳入suspend loop
    goto suspend loop;		

    suspend loop:
    //master线程挂起，等待事件发生
    suspend_thread();		
    waiting event;
    goto loop;
}

1.2.x版本之前Master Thread

使用innodb_io_capacity来动态调整InnoDB引擎的刷新脏页数量和合并插入缓存数量

（1）在合并插入缓冲时，合并插入缓冲的数量为innodb_io_capacity值的5%;

（2）在从缓冲区刷新脏页时，刷新脏页的数量为innodb_io_capacity;

mysql> show variables like 'innodb_io_capacity';
+--------------------+-------+
| Variable_name      | Value |
+--------------------+-------+
| innodb_io_capacity | 200   |
+--------------------+-------+
1 row in set (0.00 sec)

如果用户使用的是SSD类的磁盘，可以将innodb_io_capacity的值调高，直到符合磁盘IO的吞吐量为止；

innodb_max_dirty_pages_pct的默认值由原来的90改为了75。这样既可以加快刷新脏页的频率，又能够保证磁盘IO的负载。

mysql> show variables like 'innodb_max_dirty_pages_pct';
+----------------------------+-------+
| Variable_name              | Value |
+----------------------------+-------+
| innodb_max_dirty_pages_pct | 75    |
+----------------------------+-------+
1 row in set (0.00 sec)

新增一个参数innodb_adaptive_flushing(自适应地刷新)，该值影响每秒刷新脏页的数量。

原来写死参数，现在由buf_flush_get_desired_flush_rate函数通过判断产生重做日志的速率来决定最合适的刷新脏页数量。
innodb_purge_batch_size,该参数可以控制每次full purge回收的Undo页的数量。

该参数的默认值为20，并可以动态地对其进行修改。

mysql> show variables like 'innodb_purge_batch_size';
+-------------------------+-------+
| Variable_name           | Value |
+-------------------------+-------+
| innodb_purge_batch_size | 20    |
+-------------------------+-------+
1 row in set (0.00 sec)

查看innodb引擎的线程状态

mysql> show engine innodb status\G
*************************** 1. row ***************************
  Type: InnoDB
  Name: 
Status: 
=====================================
170312 20:14:04 INNODB MONITOR OUTPUT
=====================================
Per second averages calculated from the last 38 seconds
-----------------
BACKGROUND THREAD
-----------------
srv_master_thread loops: 1 1_second, 1 sleeps, 0 10_second, 1 background, 1 flush
srv_master_thread log flush and writes: 1

1.2.x版本的Master Thread

1.2.x版本中再次对Master Thread进行了优化。
Master Thread的伪代码如下：

if InnoDB is idle
    srv_master_do_idle_tasks();
else
    srv_master_do_active_tasks();

srv_master_do_idle_tasks()就是之前版本中每10秒的操作，srv_master_do_active_tasks()处理的是之前每秒中的操作。
对于刷新脏页的操作，从Master Thread线程分离到一个单独的Page Cleaner Thread，从而减轻了Master Thread的工作，同时进一步提高了系统的并发性。

1.2.2 IO Thread

InnoDB中大量使用AIO (Async IO) 来处理IO请求。

IO Thread的作用，是负责这些 IO 请求的回调（call back）

可使用 show engine innodb status看到以下类型

insert buffer thread
log thread
read thread（4个）
write thread（4个）

1.2.3 Purge Thread

作用

事务被提交后，其所使用的undo log可能不在需要。因此，需要purge thread来回收已经使用并分配的undo页。

来历

以前Master Thread来完成释放undo log，InnoDB1.1独立出来，分担主线程压力

查看purge thread的数量

mysql> show variables like 'innodb_purge_threads';
+----------------------+-------+
| Variable_name        | Value |
+----------------------+-------+
| innodb_purge_threads | 4     |
+----------------------+-------+
1 row in set (0.02 sec)

1.2.4 Page Cleaner Thread

** 作用**

脏页刷新到磁盘

来历

以前Master Thread来刷新脏页，InnoDB1.2独立出来，分担主线程压力

1.3 基础知识补充

redo log: redo log叫做重做日志，记录InnoDB的更改后的值,用来恢复数据。
undo log：undo log（撤销日志）记录了数据修改之前的历史值，通过 undo log 回溯到可见的历史版本，用于事务回滚。
bin log：binlog，记录InnoDB、MYISAM等所有存储引擎的修改记录。在事务之前提交，用于从库三方同步数据使用。存储为具体的数据内容或者完整的sql。
脏页:innodb为了读写的高效性，读写操作先从其服务的缓存区或缓存池读写数据，写操作导致在内存中数据和磁盘上的数据不一致，则内存上的修改数据的页被称为脏页。

二、InnoDB的特性

2.1 Insert Buffer - 插入缓冲

插入缓冲是为了提高插入数据效率的，往非聚簇索引中插入数据时，首先会看缓冲池中，是否有要插入的非聚簇索引页。如果有则直接插入，那个页变成脏页。如果没有，就把多次插入的数据先缓冲到插入缓冲中，然后合并多次操作，即把非聚集索引在一起的数据合并为一次IO（减少IO），再以一定的频率刷新到磁盘(将Insert Buffer和辅助索引页字节点进行merge操作)，但是插入缓冲只是针对非聚集索引且没有唯一约束的索引的插入有效。

为啥非唯一约束

如果该非聚集索引有唯一约束，那么为了保证唯一性，必须每次插入前都去查询是否存在相同的数据，这时就必须到磁盘到处找是否存在该值（也称为离散读），这就导致插入缓冲失效了。

插入缓冲是为了解决非聚集索引随机写导致的效率低的问题，但是对于有唯一约束的非聚集索引也无能为力。

插入缓冲占用内存过多

在写密集的情况下，插入缓冲会占用过多的缓冲池内存，默认最大可以占用1/2的缓冲池内存，修正这个问题可以修改默认值对插入缓冲的大小进行控制。

插入缓存的内部实现

insert buffer内部是一颗B+树,mysql4.1之前是每张表有一颗insert buffer B+树，而现在的版本是全局只有一颗B+树，负责对所有的表的辅助索引进行insert buffer, 这颗B+树存放在共享表空间中即ibdata1中。

2.2 Double Write - 两次写

当innodb存储引擎正在写入某个页到表中，而这个页只写了一部分就发生了宕机，称为部分写失效，会导致数据丢失，可以通过重做日志恢复，可是重做日志中记录的是对页的物理操作，如偏移量80，写‘ddd’操作。如果这个页本身已经损坏，则重做也没意义，因此，可以在应用重做之前，用户需要一个页的副本，当发生写失效时，通过副本还原该页，再进行重做，这就是doublewrite。

两次写带给innodb存储引擎的是数据页的可靠性。

Double write 要解决数据库 flush 脏页的时候，系统可能宕机，这个时候数据库的一个脏页可能只刷了一部分。
而 InnoDB 的 redo log 没有记录整个 page 的内容。因为如果每次修改都记录整个 page，那日志就太大了。
也就是说， old_page + redo_log => new_page，如果 old_page 的内容被写坏了，数据就没法恢复了。
Double write 的做法就是先将 old_page + redo_log 得到的 new_page 先持久化到磁盘上的“另一个地方”。然后再进行 inplace update，如果中途发生宕机，可以从“另一个地方”恢复这个 page 的数据。

double write空间构成

1. 内存的doublewrite buffer，大小为2MB(128页)

2. 磁盘上共享空间doublewrite buffer，大小2MB(128页)，其中120个用于批量刷脏数据，另外8个用于Single Page Flush。

当一系列机制触发数据缓冲池中的脏页刷新时，并不直接写入磁盘数据文件中，而是先拷贝至内存中的doublewrite buffer中；
接着从内存 doublewrite buffer分两次写入磁盘共享表空间的doublewrite buffer中(连续存储，顺序写，性能很高)，每次写1MB；
待第二步完成后，再将磁盘中doublewrite buffer中的脏页数据写入实际的各个表空间文件(离散写)；(脏页数据固化后，即进行标记对应doublewrite数据可覆盖)。

崩溃恢复

如果操作系统在将页写入磁盘的过程中发生崩溃，在恢复过程中，innodb存储引擎可以从共享表空间的doublewrite中找到该页的一个最近的副本，将其复制到表空间文件，再应用redo log，就完成了恢复过程。

2.3 自适应哈希索引

自适应哈希索引(Adaptive Hash Index )** :innodb存储引擎会监控对表上的各索引页的查询，如果观察到建立哈希索引可以带来速度提升，则建立哈希索引，称之为自适应哈希索引（Adaptive hash index,AHI）.AHI是通过缓冲池的B+树构造而来，因此建立速度很快，innodb会自动根据访问的频率和模式自动的为某些热点页建立哈希索引。

建立要求

对于这个页的连续访问模式必须是一样的，即指查询条件一样(对于多列索引来说，where a =1 和 where a = 1 and b =2时不同的访问模式)
以该模式访问了100次
页通过该模式访问了N次，其中N=页中记录*1/16

限制

哈希索引只能用来搜索等值的查询，如select * from table where index_col=“xxx”;而对于其他查找类型，如范围查找不能使用哈希索引，通过参数innodb_adptive_hash_index来禁止或者开启此特性，默认AHI为开启状态。

2.4 AIO - 异步IO

目的

为了提高磁盘操作性能，使用异步io(asynchronous io,AIO)的方式来处理磁盘操作。

用户可以在发出一个IO请求后立即再发出另一个IO请求，当全部IO请求发送完毕后，等待所有的io操作完成，称为AIO，AIO还可以进行io merge操作，也就是将多个io合并为一个io.这样可以提高IPOS性能。

例如，用户查询的页为

（3,5）（3,6）（3,7）

每个页的大小为16KB，那么，Sync IO需要三次IO 操作。而AIO会判断这三个页是连续的，（通过space，offset就可以看出来）因此，AIO会发出一个IO请求，从(3,5)开始，读取48KB的页

应用场景

预读（read ahead）
脏页的刷新

2.5 刷新临近页

工作原理

当刷新一个脏页时，innodb会检测该页所在区的所有页，如果是脏页，那么一起刷新。

好处

通过AIO，将多个IO写入操作合并到一个IO操作中，对于机械硬盘来说，性能提升很明显。固态硬盘建议关闭。

参数控制

参数innodb_flush_neighbors来开启或关闭该特性，为0则关闭。

2.6 预读 read ahad

数据库读操作流程

数据库请求数据的时候，会将读请求交给文件系统，放入请求队列中；相关进程从请求队列中将读请求取出，根据需求到相关数据区(内存、磁盘)读取数据；取出的数据，放入响应队列中，最后数据库就会从响应队列中将数据取走，完成一次数据读操作过程。

预读机制

InnoDB在I/O优化上提供了预读机制，预读机制是发起一个IO请求，异步的从磁盘预先读取多个页数据（不仅仅只读取IO请求对应的页数据）

InnoDB使用两种预读算法来提高I/O性能：线性预读（linear read-ahead）和随机预读（randomread-ahead）

**1.线性预读方式： **通过innodb_read_ahead_threshold控制是否将下一个区(extent)的数据预先读取到缓冲池(buffer pool)中。

**2.随机预读方式：**表示当同一个区段(extent)中的一些页(page)在缓冲池(buffer pool)中发现时，Innodb会将该区段中的剩余页一并读到缓冲池中。

软件工程概论试题四 minaMoonGirl 软件工程
一、单选1.瀑布模型的关键不足在于()。A.不能适应需求的动态变更B.过于灵活C.各个阶段需要进行评审D.过于简单正答：A2.具有风险分析的软件生存周期模型是()。A.瀑布模型B.喷泉模型C.螺旋模型D.增量模型正答：C3.下面的图描述的是哪种软件过程模型()A.瀑布模型B.敏捷开发C.原型开发D.集成与配置正答：D二、多选4.软件工程的三要素是什么?A.工具B.过程!C.结构化D.方法E.数据流
AI：180-如何利用Python进行图像处理和计算机视觉任务一键难忘精通AI实战千例专栏合集 python 图像处理计算机视觉
本文收录于专栏：精通AI实战千例专栏合集https://blog.csdn.net/weixin_52908342/category_11863492.html从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践都有参考学习意义。每一个案例都附带关键代码，详细讲解供大家学习，希望可以帮到大家。正在不断更新中~一.探索Python在图像处理和计算机视觉任务中的应用随着人
Mongo数据库（一） wangmy3028 Mongon
一、cappedcollectionsCappedcollections就是固定大小的collection。它有很高的性能以及队列过期的特性(过期按照插入的顺序).有点和"RRD"概念类似。Cappedcollections是高性能自动的维护对象的插入顺序。它非常适合类似记录日志的功能和标准的collection不同，你必须要显式的创建一个cappedcollection，指定一个collecti
Python中的lambda函数彬彬侠 Python基础 lambda 匿名函数 Python
Python中的lambda函数lambda函数是Python中的一种匿名函数，它使用关键字lambda定义。lambda函数通常用于需要短小函数的场景，尤其是在需要函数作为参数的时候。1.lambda函数的基本语法lambdaarguments:expression参数说明：arguments：函数的参数（可以有多个）。expression：一个表达式，该表达式的值将作为lambda函数的返回值
一文解锁 NVM：Node版本随意切换不再发愁一个小白的小白人前端 nvm node.js 前端 node.js
前言搞前端开发的朋友肯定都对Node.js不陌生，它在咱们的工作里，就像得力助手，没了它，很多工作都没法顺利开展。但Node.js更新得那叫一个快，新特性、新优化不断冒出来。这就好比你本来开着一辆顺手的车，开得正稳呢，突然厂家说出了新款，性能更强，功能更多，你心里肯定痒痒，想试试新的。可实际情况是，每个项目就像不同的乘客，需求不一样。我之前做一个老项目维护，它就像个念旧的乘客，只认Node.js的
探索未来开发的新起点：NetCore-Boilerplate 侯深业Dorian
探索未来开发的新起点：NetCore-Boilerplatenetcore-boilerplateBoilerplateofAPIin.NET7项目地址:https://gitcode.com/gh_mirrors/ne/netcore-boilerplate是一个强大的、基于.NETCore的现代Web应用模板，它提供了全面的基础架构和最佳实践，为开发者快速启动新的Web项目提供了便利。该项目旨
Tesla Autopilot技术架构整理(引用自EatElephant) Aikun7777777 自动驾驶架构人工智能
1.FSDOverview通过8台相机(36HZ)采集数据(960*1280的RGB图像)在自研的2颗*FSDchip(72TOPS(int8))上进行超过1000种不同任务的感知预测包括但不限于下面的超过50种MainTask:MovingObjects:StaticsObjects:EnviromentTags:每个MainTask下面还有若干Subtasks,例如车辆检测还包括车辆的静止,朝
OAuth1和OAuth2授权协议 yaoshengting #jira 安全
OAuth1授权协议1.概述OAuth1是OAuth标准的第一个正式版本，它通过签名和令牌的方式，实现用户授权第三方访问其资源的功能。在OAuth1中，安全性依赖于签名机制，无需传递用户密码。2.核心特性使用签名（Signature）来验证请求，提供高安全性。每次请求需要签名，因此客户端和服务器必须具备一致的签名计算能力。授权流程较复杂，尤其是在客户端上实现。3.授权流程OAuth1的流程包括以下
AI在虚拟试衣中的应用：革新在线购物体验 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
AI在虚拟试衣中的应用：革新在线购物体验关键词：虚拟试衣,增强现实,在线购物,深度学习,图像识别,人工智能,用户交互1.背景介绍1.1问题由来随着电子商务的迅猛发展，在线购物已经成为人们日常生活的一部分。然而，由于无法亲身试穿，在线购物体验在满足用户个性化需求方面仍存在诸多不足。传统的网页图片展示和文字描述难以真实传达衣物的质地、颜色和尺寸。因此，虚拟试衣技术应运而生，成为电商平台上提升用户体验的
AI在虚拟客户服务中的应用：提供24_7支持 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
AI在虚拟客户服务中的应用：提供24/7支持关键词：虚拟客服,自然语言处理(NLP),聊天机器人,对话系统,深度学习,用户支持,自动化1.背景介绍随着互联网和移动互联网的迅速发展，客户服务成为各大企业提升竞争力的重要环节。但传统的客服模式存在诸多痛点：人力成本高、响应时间慢、工作时间有限等。在企业面临全时用户需求和竞争压力日益加剧的当下，如何以更低的成本、更快的速度、更高效的资源利用率，持续提供优
柳暗花明又一村：Seq2Seq编码器解码器架构 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
Seq2Seq,编码器-解码器,自然语言处理,机器翻译,文本生成,循环神经网络,长短期记忆网络1.背景介绍在人工智能领域，自然语言处理(NLP)始终是研究的热点之一。从机器翻译到文本摘要，从对话系统到问答机器人，Seq2Seq编码器-解码器架构在众多NLP任务中展现出强大的能力。传统的机器翻译方法通常依赖于统计模型和规则引擎，难以捕捉语言的复杂性和语义关系。随着深度学习的兴起，Seq2Seq架构为
sqoop导出orc数据至mysql,将Sqoop导入为OrC文件终有尽头
IsthereanyoptioninsqooptoimportdatafromRDMSandstoreitasORCfileformatinHDFS?Alternativestried:importedastextformatandusedatemptabletoreadinputastextfileandwritetohdfsasorcinhive解决方案AtleastinSqoop1.4.5t
MVC 文件夹：架构之美与实际应用 lsx202406 开发语言
MVC文件夹：架构之美与实际应用引言MVC（Model-View-Controller）是一种设计模式，它将应用程序分为三个核心组件：模型（Model）、视图（View）和控制器（Controller）。这种架构模式不仅提高了代码的可维护性和可扩展性，而且使得开发流程更加清晰。本文将深入探讨MVC文件夹的组成、作用以及在实际项目中的应用。MVC文件夹组成MVC文件夹通常包含以下三个子文件夹：1.M
solidity：智能合约结构介绍 FAFU_kyp #solidity智能合约区块链
合约结构介绍1.SPDX版权声明bytecodemetadata介绍2.pragmasolidity版本限制3.contract关键字4.import导入声明5.interface:接口6.library:库合约合约结构介绍1.SPDX版权声明第1行//SPDX-License-Identifier:MIT就是合约的版权声明。其中SPDX-License-Identifier(SPDX许可标示)是
.NET使用C#设置Excel单元格数值格式 .netc#excel数字表格
设置Excel单元格的数字格式是创建、修改和格式化Excel文档的关键步骤之一，它不仅确保了数据的正确表示，还能够增强数据的可读性和专业性。正确的数字格式可以帮助用户更直观地理解数值的意义，减少误解，并且对于自动化报告生成、财务计算等应用场景来说，精确的格式控制也是保证数据准确性和一致性的重要保障。在.NET平台上，我们可以使用C#轻松完成Excel单元格的数字格式设置，实现自动化处理。本文将介绍
《C++ 赋能 K-Means 聚类算法：开启智能数据分类之旅》 c++c#
在当今数字化浪潮汹涌澎湃的时代，人工智能无疑是引领科技变革的核心驱动力之一。而在人工智能的广袤天地中，数据分类与聚类作为挖掘数据内在价值、揭示数据潜在规律的关键技术手段，正发挥着前所未有的重要作用。K-Means聚类算法，作为数据聚类领域的经典之作，以其简洁高效的特性而备受瞩目。当我们将目光聚焦于C++这一强大而高效的编程语言时，会发现它与K-Means聚类算法的结合犹如天作之合，能够为数据处理与
《解锁AI黑科技：数据分类聚类与可视化》程序猿阿伟人工智能科技分类
在当今数字化时代，数据如潮水般涌来，如何从海量数据中提取有价值的信息，成为了众多领域面临的关键挑战。人工智能（AI）技术的崛起，为解决这一难题提供了强大的工具。其中，能够实现数据分类与聚类，并以可视化形式展现的AI技术，正逐渐成为各行业数据分析和决策的核心力量。数据分类与聚类：AI的核心技能数据分类是将数据划分到预先定义好的类别中，就像把图书馆里的书籍按照不同学科分类摆放，方便读者查找。比如在垃圾
性能测试网络风险诊断有哪些？ Feng.Lee 漫谈测试开发语言
目录一、网络定位分析手段二、sar命令三、netstat命令以下是几种常见的网络风险诊断方法网络连通性检查带宽与延迟测量丢包率分析网络拓扑结构审查安全设备影响评估协议层面上的优化负载均衡器效能检验云化服务架构下的特殊考量系统应用之间的交换，尤其是跨机器之间，都是要基于网络的，因此网络宽带，响应时间，网络延迟，阻塞等都是影响系统性能的因素。如果应用在不稳定，不安全的网络下，则会导致应用程序的超时，丢
第05章 17 Contour 过滤器介绍与例子捕鲸叉 VTK编程学习信息可视化 VTK
vtkContourFilter是VTK（VisualizationToolkit）中的一个关键类，用于从输入数据生成等值线或等值面。它是基于阈值的过滤器，可以从标量字段中提取等值线或等值面。vtkContourFilter的核心功能是根据用户指定的值生成等值线或等值面，并将其表示为多边形网格。vtkContourFilter的主要功能等值线/等值面生成：根据用户指定的等值（通常是标量值）生成等值
微调特定于域的搜索的文本嵌入：附Python代码详解人工智能
微调特定于域的搜索的文本嵌入：附Python代码详解阅读时长：20分钟发布时间：2025-02-02近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】嵌入模型将文本表示为具有语义意义的向量。尽管它们可以很容易地用于无数的用例（例如检索、分类），但通用嵌入模型在特定领域的任务上可能表现不佳。
LSTM 网络在强化学习中的应用 AI天才研究院 LLM大模型落地实战指南 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LSTM网络在强化学习中的应用关键词：LSTM、强化学习、时序依赖、长期记忆、深度Q网络、策略梯度、Actor-Critic摘要：本文深入探讨了长短期记忆（LSTM）网络在强化学习领域的应用。我们将详细介绍LSTM的核心概念、结构和工作原理，以及它如何解决传统循环神经网络面临的长期依赖问题。文章重点分析了LSTM在强化学习中的多种应用场景，包括深度Q网络、策略梯度方法和Actor-Critic架构
Redis基础命令之set、zset 泪染的青空 redis 数据库缓存
1.SetRedis的Set是String类型的无序集合。集合成员是唯一的，这就意味着集合中不能出现重复的数据。1.1SADD--添加一个或多个成员这里添加三个成员到set集合中127.0.0.1:6379>SADDsetmysqljavac++(integer)31.2SMEMBERS--查看成员127.0.0.1:6379>SMEMBERSset1)"c++"2)"java"3)"mysql"
零信任安全架构烁月_o9 安全网络 web安全运维微信
零信任安全架构是一种创新的网络安全理念和模型，它颠覆了传统的基于边界的安全思维。一、基本理念零信任架构基于“永不信任，始终验证”的原则。这意味着无论访问请求是来自组织内部网络还是外部网络，都不能默认其是安全的，必须对每个访问请求进行严格的身份验证和授权。传统的安全架构主要聚焦于保护网络边界，一旦攻击者突破边界，就可以相对容易地在内部网络中移动并访问各种资源。而零信任架构则认为，威胁可能来自任何地方
AI大模型基于LLM的Agent架构图解 AI产品经理人工智能深度学习语言模型学习
Agent定义Agent是什么？Agent是一种能够自主决策、采取行动以达到某种目标的实体。AIAgent的确定义：基于人工智能（尤其是大模型）技术，能够感知和理解环境，并采取行动以完成目标的智能实体。Agent能干什么？AIAgent主要依托LLM模型和具体的业务场景来调用相应的工具来完成任务目标，智能化程度和行业贴合度会更明显。典型案例有什么？智能核保应用，如果解决方案搭载AIAgent能力，
linux为什么不是实时操作系统 lingllllove linux 大数据运维
Linux操作系统以其强大的功能和广泛的应用被广泛使用，但它并不是一个实时操作系统（RTOS）。本文将详细解释为什么Linux不是实时操作系统，并探讨实时操作系统的关键特性和需求。一、实时操作系统的定义和特性1.1实时操作系统定义实时操作系统是一种在规定时间内对外部事件做出响应的操作系统。RTOS通常用于需要高精度时间控制和高可靠性的数据处理场景，如工业控制、航空航天、汽车电子和电信设备等。1.2
好用的跨语言搜索引擎推荐 2401_89759569 搜索引擎
互联网时代的到来使得获取信息变得前所未有的便捷。然而，语言障碍一直是全球信息交流的一个显著障碍。跨语言搜索引擎应运而生，帮助用户跨越语言的障碍，获取更多元的知识。今天，我将介绍一些好用的跨语言搜索引擎，并详细解读其中的一个——大同搜索。1.大同搜索：中英文内容的桥梁大同搜索（https://datong.info）是一款支持跨语言搜索的智能搜索引擎，能够同时搜索中英文内容，并提供高质量的搜索结果。
你怎么比较MongoDB、CouchDB及CouchBase?思维导图代码示例（java 架构) 用心去追梦 mongodb java 架构
MongoDB、CouchDB和Couchbase是三种流行的NoSQL数据库，它们各自有着独特的设计哲学和技术特点。以下是它们之间的比较，涵盖了架构、数据模型、查询语言、复制机制、扩展性以及其他关键特性。MongoDB、CouchDB及Couchbase比较-思维导图概要您可以创建一个以“MongoDBvs.CouchDBvs.Couchbase”为核心节点的思维导图，并根据以下分类展开：概述简
加热台一键控制：基于ATMEGA8进行控制卓晴科学-技术-探究单片机 mongodb
简介：本文记录了对于加热台的一键控制模块的制作。给出了相应的设计文件的主要记载。便于将来的维修。关键词：加热台，控制，MEGA8加热台控制目录Contents电路设计控制程序总结利用光耦充当按钮开关AD\Test\2025\January\ThemoplatecontrolMEGA8.SchDocD:\zhuoqing\window\Atmel\test\2025\January\Thermopl
python pandas 统计列中关键字一共出现的次数 yangshuo1281 pytion
#姓名性别年龄#0张三男11#1李四女16#2赵五男12#3张三男11#4赵五男12#5赵五男12importpandasaspddf=pd.read_excel('./test.xlsx')print(df)print("-----------"
Spring的设计理念之【事务管理】冰糖心158 java
Spring框架的事务管理是其核心设计理念之一，旨在简化复杂的事务处理逻辑，提供统一的编程模型，同时支持灵活的事务策略配置。以下是Spring事务管理的关键设计理念和实现机制：一、设计目标解耦业务逻辑与事务管理将事务管理代码从业务逻辑中剥离，开发者只需关注业务逻辑，事务的开启、提交、回滚等由框架统一处理。统一事务抽象提供PlatformTransactionManager接口，抽象不同事务实现（如
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS