Wengy.Xu

Mysql数据库分库分表实践

目前应用系统的最大瓶颈出现在数据库，主要是基于数据库的逻辑存储结构，和磁盘的物理特性决定了随机读取效率低下，无法靠简单磁盘阵列的扩展或者分布式文件系统，来提升性能。

数据库的瓶颈

不管是IO瓶颈，还是CPU瓶颈，最终都会导致数据库的活跃连接数增加，进而逼近甚至达到数据库可承载活跃连接数的阈值。在业务Service来看就是，可用数据库连接少甚至无连接可用。接下来就可以想象了吧（并发量、吞吐量、崩溃）。

IO瓶颈
- 由于关系型数据库的存储结构，不适用于分布式文件系统，往往会出现磁盘读IO瓶颈，热点数据太多，数据库缓存放不下，每次查询时会产生大量的IO，降低查询速度 ==> 分库和垂直分表。
- 网络IO瓶颈，请求的数据太多，网络带宽不够 ==> 分库。
CPU瓶颈
- SQL问题，如SQL中包含join，group by，order by，非索引字段条件查询等，增加CPU运算的操作 ==> SQL优化，建立合适的索引，在业务Service层进行业务计算。
- 单表数据量太大，查询时扫描的行太多，SQL效率低，CPU率先出现瓶颈 ==> 水平分表。

分库分表

水平分片

概念：

以字段为依据，按照一定策略（hash、range等），将数据拆分到多个分片中。分片多了，io和cpu的压力自然可以成倍缓解。

场景：

水平分表

系统绝对并发量并没有上来，变更不频繁，只是单表的数据量太多，存在冷热数据，影响了SQL效率，加重了CPU负担，以至于成为瓶颈。
水平分库

系统绝对并发量上来了，分表难以根本上解决问题，并且还没有明显的业务归属来垂直分库。

垂直分片

概念：

以表为依据，按照业务归属不同，将数据拆分到不同的分片中。

场景：

垂直分表
- 系统绝对并发量并没有上来，表的记录并不多，但是字段多，并且热点数据和非热点数据在一起，单行数据所需的存储空间较大。以至于数据库缓存的数据行减少，查询时会去读磁盘数据产生大量的随机读IO，产生IO瓶颈。
- 可以用列表页和详情页来帮助理解。垂直分表的拆分原则是将热点数据（可能会冗余经常一起查询的数据）放在一起作为主表，非热点数据放在一起作为扩展表。这样更多的热点数据就能被缓存下来，进而减少了随机读IO。拆了之后，要想获得全部数据就需要关联两个表来取数据。但记住，千万别用join，因为join不仅会增加CPU负担并且会讲两个表耦合在一起（必须在一个数据库实例上）。关联数据，应该在业务Service层做文章，分别获取主表和扩展表数据然后用关联字段关联得到全部数据。
垂直分库
- 系统绝对并发量上来了，并且可以抽象出单独的业务模块。
- 到这一步，基本上就可以服务化了。例如，随着业务的发展一些公用的配置表、字典表等越来越多，这时可以将这些表拆到单独的库中，甚至可以服务化。再有，随着业务的发展孵化出了一套业务模式，这时可以将相关的表拆到单独的库中，甚至可以服务化。我们在微服务拆分的时候，其实已经完成了数据库的垂直拆分

3. 分库分表的基本原则

什么时候需要考虑分库分表

当MySQL单表的记录数达到1000W左右时，即要考虑分库分表，来满足业务增长

1000万以内的数据可以考虑索引分段的方法去优化

eg:

	1. 用户积分表-user_game_score, 百万级， 字段包含uid、game_id, score ,用户完成某个任务获得游戏积分后，显示实时排名。即计算某个用户当前的排名
	2. 大字段索引的优化,计算大字段的hash值，通过取模，新增分段索引

分片键的选择

分片键的选择，要结合业务来进行，一般在SQL占比最大的语句中，选择分片键。

首先根据需求分析，判断系统请求最大的业务类型，并提供生产环境相应的数据支撑。

如何在生产环境查询sql的执行次数？
```
use performance_schema;

SELECT DIGEST_TEXT,COUNT_STAR,FIRST_SEEN,LAST_SEEN FROM events_statements_summary_by_digest ORDER BY COUNT_STAR DESC
```
通过该语句可以查询哪类的SQL执行最多
冷热数据分离，大字段分离
将Mysql定位于事务性数据库（OLTP），专注于事务流水操作，发挥关系形数据库的特长
结合业务避免笛卡尔乘积，尽量以小表驱动大表，来进行分库关联
分库分表会大大提高系统设计的复杂度，需要平衡

4. 常见分片策略

基于范围分片
- 时间：按照年、月、日去切分。例如order_2020、order_202005、order_20200501
- 地域：按照省或市去切分。例如order_beijing、order_shanghai、order_chengdu
- 大小：从0到1000000一个表。例如1000001-2000000放一个表，每100万放一个表
优点：新的数据可以落在新的存储节点上，如果集群扩容，数据无需迁移。
缺点：数据热点分布不均，数据冷热不均匀，导致节点负荷不均。
Hash取模分片

整型的Key可直接对设备数量取模，其他类型的字段可以先计算Key的哈希值，然后再对设备数量取模。假设有n台设备，编号为0 ~ n-1，通过Hash(Key) % n就可以确定数据所在的设备编号。该模式也称为离散分片。

优点：实现简单，数据分配比较均匀，不容易出现冷热不均，负荷不均的情况。
缺点：扩容时会产生大量的数据迁移，比如从n台设备扩容到n+1，绝大部分数据需要重新分配和迁移。（有优化方案）
一致性Hash+虚拟节点

通过一致性Hash + 虚拟节点可以在保证数据冷热均匀的基础上，大大减少数据迁移的工作量

扩容后：
Jump Consistent Hash

参考1：https://opensource.actionsky.com/20200213-hash/

参考2：https://opensource.actionsky.com/20201223-dble/

参考3： https://arxiv.org/ftp/arxiv/papers/1406/1406.2294.pdf

参考4：https://opensource.actionsky.com/20190910-dble/
分组法

Hash分片是可以解决数据均匀的问题，范围法`可以解决数据迁移问题，那我们可以不可以两者相结合呢？利用这两者的特性呢？

考虑在hash分片的基础，加上一个Group的概念，组内遵循hash分片，组与组之间，采用范围法

设计方案如图：

因为组内采用了hash分片，这样落在每一个分片的数据是基本平均的，每一个数据库关联不同的分片，而且数据库也可以关联不同分组的分片，这样就可以保证每个数据库的流量平均，并且扩容只需要新增一个组就可以了。
- 数据结构设计：

可以将这个映射关系缓存起来，这样不会影响性能

5. 分库分表后带来的问题

非分区键查询，需要遍历多个库

场景一（一对一的场景）

用户表采用 user_id 哈希取模进行了水平分库，分散了单库的压力，但是这里可能会出现一些问题，一个是说，用户在登录的时候，可能不是根据userid登陆的，可能是根据用户名，手机号之类的来登录的，此时你又没有userid，怎么知道去哪个表里找这个用户的数据判断是否能登录呢？
- 解决方案：冗余双写映射法
  
  创建一张userId 和手机号的映射表（该映射表也可以通过手机号分片），在往用户表插入的时候，同时维护映射表，这样通过手机号和 userId 都可以快速定位到某个分片。这张映射表还可以考虑放在缓存中
  - 冗余会带来一致性问题，跨库双写事务如何处理
    
    详见分布式事务小节
场景二（一对多的场景）

用户表和订单表是一对多的情况，通过订单id查询订单详情流量占比为60%，通过userId查询订单列表的访问量占30%，这时候如果通过订单id分片，则查询用户的订单列表，就需要遍历所有的分片；如果通过userId 分片，在查询订单id的详情时，就需要遍历所有的分片
- 解决方案：基因法（ER分片）

场景三（多对多的场景）

典型的场景，用户之间的相互关注，需要查询我的关注和关注我的流量各占50%，一旦数据量爆炸以后，需要分片，如果采用 user_id 分片，则查询“关注我的人”就需要遍历多个分片；如果采用follower_id分片，则查询“我的关注”还是需要遍历多个分片
- 解决方案：异构表冗余
- 数据冗余势必会带来数据一致性的问题
  
  详见分布式事务小节
场景四：复合场景（多分片键组合）

销售中心订单表，包含用户ID(user_id), 订单ID(order_id), 商户ID( merchant_id) , 主要的访问方式有
1. 通过 user_id 查询我的订单 (30%)
2. 通过 order_id 查询订单详情（60%）
3. 通过 merchant_id 查询商户的订单量（10%）
那么在数据量很大的时候，单表无法支撑时，应该如何进行拆分呢？

碰到复杂的问题，可以把他拆解成已知的问题：
- user_id 和 order相当于是一对多的场景，可以采用基因法
- user_id和merchant_id相当于多对多的场景，可以采用异构表冗余法
可以通过两者结合的方法来处理

场景五
- 消息流水表（用户动态，app消息推送, 订单表）：记录数量随着时间的推移而不断增长，数据存在冷热，离当前时间越近的数据访问频度越高，流水表在原有分库的基础上，最好要再按时间分表，这样可以防止随着时间推移出现数据爆炸。
- 在流水表的访问流量中，经常会碰到查询最近1个月，最近1年的数据，如果单单只存储一个月的数据，那么在应用层就需要查询两次，为了减少一次查询，给应用层代理便利，可以适当的冗余。例如：
  1. 消息推送表，按月分表，可以在存储当月数据的同时，冗余上个月的数据，每张表存储2个月的数据，这样在查询最近一个月的数据时，就可以只查询一次，就返回从上个月的今天到现在的所有数据
  2. 订单表分片的策略，按照用户ID的基因分库，按照年分表，每张表存储2年的数据（存储今年的数据并冗余上去年的数据），这样在查询最近一年的数据时，就可以只查询一次。
场景六

有些时候，有一些工具表，比如数据字典，手机归属地表，省份表等，每一个分片都有可能会使用到
- 解决方案：全局表（变化少，并发低，可以考虑 XA 两阶段事务）
  
  像数据字典，省份表，厂商表这些变动不是非常频繁的表可以，考虑采用全局表，在多个库中都包含该表
复杂搜索场景

如在运营管理界面上，有一个用户管理模块，需要对用户按照性别，住址，年龄，职业等各种条件进行各种组合的复杂搜索

解决方案：对用户数据进行binlog监听，把需要搜索的所有字段同步到Elasticsearch中去，建立好搜索的索引
简单的OLAP场景

有些时候我们还会有一些简单报表统计的需求，如：需要统计销量前100的商品

解决方案：单独创建一个报表库，在其中创建中间表，通过订阅变更的消息，来实现增量同步

创建报表库，在报表库中维护一个商品销量表 rpt_sales_volume，当用户下单后，发布消息，报表服务通过消费该消息，更新商品的销量，当数据量很大时可以考虑分表（报表数据的查询一般提供给运营，并发不会特别大）

注意：应该将Mysql定位于事务性数据库（OLTP），专注于事务流水操作，发挥关系形数据库的特点，尽量通过离线或者流式计算的方式来处理OLAP，

分页查询问题

分页需要确认排序字段，在分库中查询出来以后，进行二次组装，需要在每一个分片上先查询出来pageSize*pageNum数量的记录，然后在应用层进行组装（效率比较低）
监听binlog, 将变更发送到消息队列，同步到Elasticsearch中，在ES中进行分页查询

分布式事务

分布式事物的技术方案很多，这里只介绍适合做数据冗余的分布式事务技术

**实时性的要求不是非常高：**通过最终一致性来保证分布式事务
- 方案一：binlog监听
  
  通过Canal监听binlog, 增量同步到Elasticsearch中，为了防止并发过大，以及每一条日志都可以正确同步，保证数据的最终一致性，在Canal和Elasticsearch之间加了一层MQ（一般使用kafka）。通过mq的ack机制保证每一条binlog日志的正常同步，同时给大并发提供缓冲
  - 注意： 在处理同一行数据时，需要保证MQ的有序消费
  数据对比
  
  为了给数据同步上一个保险，还可以利用有序队列，进行数据比对，我们可以利用有序队列的特性，让其第一条消息堆积十分钟，那么后续消息基本上也会堆积十分钟，然后就可以消费这个消息进行数据拉取，拿到最新的数据进行数据对比，如图所示：
  - 其他同步工具选型
    - logstash_jdbc（全量同步）
    - kafka_connector
- 方案二：本地消息表
  
  本地消息表这个方案最初是 ebay 架构师 Dan Pritchett 在 2008 年发表给 ACM 的文章。该方案中会有消息生产者与消费者两个角色，假设系统 A 是消息生产者，系统 B 是消息消费者，其大致流程如下：
  1. 当系统 A 被其他系统调用发生数据库表更操作，首先会更新数据库的业务表，其次会往相同数据库的消息表中插入一条数据，两个操作发生在同一个事务中
  2. 系统 A 的脚本定期轮询本地消息往 mq 中写入一条消息，如果消息发送失败会进行重试
  3. 系统 B 消费 mq 中的消息，并处理业务逻辑。如果本地事务处理失败，会在继续消费 mq 中的消息进行重试，如果超过重试次数，或者是业务上的失败，则需要记录错误记录，并通知系统A回滚（开发成本高）；或者实现最大努力通知，通过人工介入实现必须成功（开发成本较小，运维成本大）
    
    这里要注意一点，就是在事物开启后，到事务提交前，需要锁定相关的操作记录，阻止其他进程进行数据更新，并记录undolog,提供给其他进程进行查询，这样才能避免产生脏读
  本地消息表实现的条件：
  1. 消费者与生成者的接口都要支持幂等
  2. 生产者需要额外的创建消息表
  3. 事务开启时，对需要的资源进行预留和锁定（分布式锁）
  4. 需要建立错误监控体系，及时人工介入，错误记录要保留完整的数据，方便数据恢复
  容错机制：
  1. 步骤 1 失败时，事务直接回滚
  2. 步骤 2、3 写 mq 与消费 mq 失败会进行重试
  3. 超过失败重试的次数，记录错误记录和日志，人工介入（当错误记录超过100条时，所有事务全部回滚，防止产生大量需要人工处理的数据）
  此方案的核心是将需要分布式处理的任务通过消息日志的方式来异步执行。消息日志可以存储到本地文本、数据库或消息队列，再通过业务规则自动或人工发起重试。人工重试更多的是应用于支付场景，通过对账系统对事后问题的处理。
**实时性，和准确性要求高：**本地消息表+实时查询

在原数据库中插入完以后，先在相同的库添加一条映射记录，然后记录缓存，表示映射表有数据还没有同步，按异步方案进行同步，如果此时已经需要查询该映射记录，则先按映射表的分片表的记录查询出来，并加上缓存中记录的这条映射。
使用支持ACID的分布式数据库（Mysql Cluster）
- 实现原理
  
  分布式数据库实现分布式事务的主流方法还是2PC, 过多副本（Multi-Paxos）,解决了2PC单点，阻塞和数据不一致的问题
  
  如上图所示，当分布式事务提交时，会选择其中的一个数据分片作为协调者在所有数据分片上执行两阶段提交协议。由于所有数据分片都是通过 Paxos 复制日志实现多副本高可用的，当主副本发生宕机后，会由同一数据分片的备副本转换为新的主副本继续提供服务，所以可以认为参与者和协调者都是保证高可用不宕机的（多数派存活），绕开了协调者宕机的问题。
  
  在参与者高可用的实现前提下，可以对协调者进行了“无状态”的优化。在标准的两阶段提交中，协调者要通过记录日志的方法持久化自己的状态，否则如果协调者和参与者同时宕机，协调者恢复后可能会导致事务提交状态不一致。但是如果我们认为参与者不会宕机，那么协调者并不需要写日志记录自己的状态。
  
  所以在第一阶段所有参与者都回复prepare完成以后，即可以反馈事务提交成功，提升了2PC的效率
  由于存在多副本，只要保证在prepare阶段，验证事务执行没有错误，协调者发出commit指令后，就可以乐观的认为，事务执行成功并反馈给事务发起者。相信commit消息会被多数副本收到，多数副本收到消息以后，剩下的就交给他们自己同步
  
  在上图中（绿色部分表示写日志的动作），左侧为标准两阶段提交协议，用户感知到的提交时延是4次写日志耗时以及2次 RPC 的往返耗时；由于少了协调者的写日志耗时以及提前了应答客户端的时机，用户感知到的提交时延是1次写日志耗时以及1次 RPC 的往返耗时。

分片的扩容问题

成倍扩容法
1. 首先添加一个从库，实现和主库同步

同步完成后，修改数据源，成倍扩容

时间断+Hash分片

根据时间断来进行分片，（比如在2020-01-01前创建的用户id，取Hash值后，按100取模；2020-01-01至2020-12-31创建的用户id,取Hash值后，按1000取模；）好处：扩容不需要对数据迁移。

6. 最佳实践

可以通过用户手机的归属地进行分库，然后基于用户ID 的Hash值进行分表，其他和用户相关的表（比如订单和内容），打入归属地和用户ID 的基因，进行ER分片。

Sharding-Sphere实践

DBLE实践

Canal, XData + Elasticsearch 实践

MongoDB常见的运维工具总结介绍 yuanpan mongodb 运维数据库
MongoDB提供了一些强大的运维工具，帮助管理员进行数据库监控、备份、恢复、性能优化等操作。以下是一些常见的MongoDB运维工具及其功能介绍：1.MongoDBAtlas功能：MongoDBAtlas是MongoDB官方的云托管数据库服务，它提供了全托管的MongoDB实例和自动化运维功能，包括自动备份、自动扩展、高可用性、监控和安全性等。它使得运维团队可以专注于应用开发，而无需担心数据库的管
kettle常用的数据库连接示例星月情缘02 ETL技术 kettle sql连接
kettle是一款强大的数据抽取转换工具，在数据仓库，ETL任务处理中使用的非常频繁的开源工具。它也支持众多的数据库连接类型。下面是支持的数据库连接对比图。请参考学习。就介绍这么多。
数仓ETL测试星月情缘02 etl 数据仓库
提取，转换和加载有助于组织使数据在不同的数据系统中可访问，有意义且可用。ETL工具是用于提取，转换和加载数据的软件。在当今数据驱动的世界中，无论大小如何，都会从各种组织，机器和小工具中生成大量数据。在传统的编程方式中，ETL都提取并进行一些转换操作，然后将转换后的数据加载到目标数据库文件等。为此，需要用任何编程语言编写代码，如Java，C#，C++等。为了避免更多编码和使用库，将通过拖放组件来减少
ER图（Entity Relationship Diagram，实体关系图）太阳 oracle 数据库
以下是一些常见的绘制ER图的工具，涵盖了在线工具和桌面软件，你可以根据自身需求进行选择：在线工具boardmix功能特点：拥有大量包括ER图模板在内的模板库，能加速ER图的创建；支持多人在线协作，多名用户可同时编辑和查看ER图；用户可在图上添加评论、标签和批注，方便交流协商；ER图可轻松导出为图片或PDF文件，便于分享。适用场景：适合数据库设计团队协作创建和修改ER图；项目管理中，项目团队可用来了
01_什么是Redis？袁庭新 Redis 7企业级开发实战教程 redis 数据库缓存
1.什么是NoSQL？1.1NoSQL介绍NoSQL，全称为NotOnlySQL（不仅仅是SQL），指的是非关系型的数据库。它最早出现于1998年，由CarloStrozzi提出，旨在找到存储和检索数据的新高效途径，而不是在所有情况下都依赖关系型数据库。2009年，NoSQL的概念在亚特兰大举行的"no:sql(east)"讨论会上得到了进一步推广和发展，这次讨论会标志着NoSQL数据库发展史上的
数仓的数据加工过程-ETL 星月情缘02 ETL技术 etl
ETL代表ExtractTransform和Load。ETL将所有三个数据库功能组合到一个工具中，以从一个数据库获取数据并将其放入另一个数据库。提取：提取是从数据库中提取(读取)信息的过程。在此阶段，从多个或不同类型的来源收集数据。转换：转换是将提取的数据从之前的形式转换为所需形式的过程。数据可以放入另一个数据库。可以通过使用规则或查找表或将数据与其他数据组合来进行转换。加载：加载是将数据写入目标
基于Spark的实时计算服务的流程架构小小搬运工40 spark 大数据
基于Spark的实时计算服务的流程架构通常涉及多个组件和步骤，从数据采集到数据处理，再到结果输出和监控。以下是一个典型的基于Spark的实时计算服务的流程架构：1.数据源数据源是实时计算服务的起点，常见的数据源包括：消息队列：如Kafka、RabbitMQ、AmazonKinesis等。日志系统：如Flume、Logstash等。传感器数据：物联网设备产生的数据流。数据库变更数据捕获（CDC）：如
机器学习建模流程 day02 扫把星133 机器学习人工智能 python
机器学习建模流程通常可以分为以下几个主要步骤：问题定义与数据收集：确定问题的类型（分类、回归、聚类等可见上篇所讲内容）和目标。收集相关数据，可以是从数据库、API、文件或其他来源获取。注释：数据库是计算机里面的存储的数据的，当然可以对数据进行一些操作增删改查，通常用于存储大量结构化数据，并提供高效的数据操作和查询功能。API（ApplicationProgrammingInterface，应用程序
史上最强！Spring Boot 3.3 高效批量插入万级数据的多种方案 m0_74825074 面试学习路线阿里巴巴 spring boot 后端 java
SpringBoot3.3多种方式实现高效批量插入万级数据，史上最强！在大数据处理场景下，如何高效地将大量数据插入数据库是一个重要课题。本文基于SpringBoot3.3及MyBatis-Plus，介绍几种高效的批量插入数据的方法，包括：使用JDBC批处理使用自定义SQL批处理单条插入（for循环）拼接SQL语句插入MyBatis-Plus的saveBatch方法循环插入+开启批处理模式每种方式都
SQLServer中DBCC INPUTBUFFER显示从客户端发送到 SQL Server 实例的最后一个语句 zxrhhm sqlserver 数据库
SQLServer中DBCCINPUTBUFFER显示从客户端发送到SQLServer实例的最后一个语句1、本文内容语法参数结果集权限示例适用于：SQLServerAzureSQL数据库AzureSQL托管实例显示从客户端发送到SQLServer实例的最后一个语句。2、语法DBCCINPUTBUFFER(session_id[,request_id])[WITHNO_INFOMSGS]3、参数se
golang请求云数据库ClickHouse数据库报错:err code: 202, message: Too many simultaneous queries. Maximum: 100 zhoupenghui168 golang #golang基础数据库 golang 开发语言后端 sync
1.场景描述开发环境:语言:golang1.22数据库引擎:GORM数据库:ClickHouse场景:当使用sync.WaitGroup并发执行多个gorm相关的goroutine时,报错:errcode:202,message:Toomanysimultaneousqueries.Maximum:1002.错误原因从上面错误中可以看出:(1).这是因为当前正在进行的查询或插入操作超过了设置的最大
golang通过AutoMigrate方法自动创建table详解 zhoupenghui168 golang #golang基础数据库数据库 GORM AUTOMigrate
一.AutoMigrate介绍1.介绍在Go语言中，GORM支持Migration特性，支持根据GoStruct结构自动生成对应的表结构,使用GORMORM库的AutoMigrate方法可以自动创建数据库表，确保数据库结构与定义的模型结构一致。AutoMigrate方法非常方便，特别适合在开发阶段进行快速迭代注意：AutoMigrate会创建表、缺失的外键、约束、列和索引出于保护数据的目的，它不会
【编程小白必看】MySQL 时间类型操作秘籍一文全掌握 6个q mysql数据库 mysql adb 数据库
【编程小白必看】MySQL时间类型操作秘籍一文全掌握文章目录前言一、MySQL时间类型有哪些？二、时间类型详解1.DATE类型2.TIME类型3.DATETIME类型4.TIMESTAMP类型5.YEAR类型三、日期时间函数1.CURRENT_DATE()和CURRENT_TIME()2.NOW()和SYSDATE()3.DATE_ADD()和DATE_SUB()4.STR_TO_DATE()和D
JAVA开源免费项目基于Vue和SpringBoot的医院后台管理系统（附源码）胡晗靓 java vue.js spring boot 开源前端开发语言
本文项目编号T170，文末自助获取源码\color{red}{T170，文末自助获取源码}T170，文末自助获取源码目录一、系统介绍二、数据库设计三、配套教程3.1启动教程3.2讲解视频3.3二次开发教程四、功能截图五、文案资料5.1选题背景5.2国内外研究现状六、核心代码6.1查询数据6.2新增数据6.3删除数据一、系统介绍在管理员功能模块确定下来的基础上，对管理员各个功能进行设计，确定管理员功
MYSQL学习笔记(六)：聚合函数、sql语句执行原理简要分析羊小猪~~ MYSQL mysql sql 数据库考研后端 c++java
前言：学习和使用数据库可以说是程序员必须具备能力，这里将更新关于MYSQL的使用讲解，大概应该会更新30篇+，涵盖入门、进阶、高级(一些原理分析);这一篇是内容较少，主要讲解：聚合函数和简要介绍sql语句执行过程；虽然MYSQL命令很多，但是自己去多敲一点，到后面忘记了，查一下就可以回忆起来使用了；这一系列也是本人学习MYSQL做的笔记，也是为了方便后面忘记查询；参考资料：尚硅谷、黑马、csdn和
scrapy六 SSSCAESAR
目录设置代理ip设置随机的请求头(u-a)scrapy集成seleniumRedisNoSQL和SQL数据库的比较Redis特性设置代理ip代理的作用：突破自身的IP访问限制隐藏自身真实的ip如何获取ip：付费代理代理ip的匿名度：透明服务器知道这次使用了代理也知道真实的ip匿名服务器知道使用了代理不知道真实的ip高匿不知道使用了代理也不知道真实的ipclassIPProxyDownloaderM
【详解】CentOS6.5下搭建LAMP环境牛肉胡辣汤 php
CentOS6.5下搭建LAMP环境在Linux系统上搭建LAMP（Linux、Apache、MySQL、PHP）环境是许多Web开发者的基本技能之一。本文将详细介绍如何在CentOS6.5系统上搭建一个完整的LAMP环境。环境准备操作系统：CentOS6.5软件版本：Apache:2.2.xMySQL:5.1.xPHP:5.3.x确保你的CentOS6.5已经安装并可以正常访问互联网。安装Apa
【详解】MySQL重连，连接丢失：Thelastpacketsuccessfullyreceivedfromtheserve 牛肉胡辣汤 mysql adb 数据库
目录MySQL重连，连接丢失：Thelastpacketsuccessfullyreceivedfromtheserver1.连接丢失的原因1.1超时设置不当1.2网络问题1.3数据库服务器资源限制2.诊断方法2.1查看日志文件2.2使用SHOWPROCESSLIST命令2.3监控系统资源3.解决方案3.1调整超时参数3.2增强网络稳定性3.3优化数据库配置3.4应用层处理代码说明：注意事项：错误
MySQL中有哪几种锁？ chengxuyuan66666 mysql 数据库
MySQL中的锁机制是数据库并发控制的重要组成部分，这些锁可以根据不同的分类标准进行划分。以下是对MySQL中锁的详细分类和解释：一、按锁的性质分类乐观锁（OptimisticLocking）假设并发操作时不会发生冲突，只在提交事务时检查数据是否被其他事务修改过。适用于读多写少的场景。实现方式通常是通过记录版本号或时间戳来判断数据是否被修改。悲观锁（PessimisticLocking）假设并发操
neo4j desktop点击启动失败解决方案手板心里煎鱼吃数据库 neo4j
项目场景：neo4jdesktop点击start出现报错，即使重装后仍然显示感叹号。问题描述neo4jdesktop重装几次之后，数据库出现感叹号，而且出现了以前的数据库，且无法删除。解决方案：解决方案参考：链接:https://blog.csdn.net/qq_34045989/article/details/115458261
【热门主题】000045 分布式数据库：技术演进与应用探索宝码香车热门主题数据库
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录【热门主题】000045分布式数据库：技术演进与应用探索一、分布式数据库概述（一）定义与原理（二）发展历程二、数据一致性实现方法（一）传统方法与挑战（二）多种实现方案三、架构设计（一）MySQL常见架构1.搭建步骤2.复制原理3.优缺点（二）
【热门主题】000059 分布式数据库：技术演进与未来展望宝码香车热门主题数据库
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录【热门主题】000059分布式数据库：技术演进与未来展望一、分布式数据库概述二、发展历程（一）传统单机数据库的局限（二）互联网时代的挑战与探索（三）分布式数据库的崛起三、核心技术（一）数据复制（二）数据分区（三）分布式事务四、架构类型（一）分
正在更新丨豆瓣电影详细数据的采集与可视化分析（scrapy+mysql+matplotlib+flask） Want595 Python数据分析 scrapy mysql matplotlib
文章目录豆瓣电影详细数据的采集与可视化分析（scrapy+mysql+matplotlib+flask）写在前面数据采集0.注意事项1.创建Scrapy项目`douban2025`2.用`PyCharm`打开项目3.创建爬虫脚本`douban.py`4.修改`items.py`的代码5.修改`pipelines.py`代码6.修改`settings.py`代码7.启动`douban2025`项目8
基于JavaWeb的原色蛋糕商城的设计与实现 yh1340327157 计算机毕业设计实战案例 java-ee struts kafka tomcat hibernate intellij-idea spring
开发环境开发语言：Java框架：springbootJDK版本：JDK1.8服务器：tomcat7数据库：mysql5.7（一定要5.7版本）数据库工具：Navicat11开发软件：eclipse/myeclipse/ideaMaven包：Maven3.3.9浏览器：谷歌浏览器后台路径地址：localhost:8080/项目名称/admin/dist/index.html前台路径地址：localh
如何在AWS上部署一个Web应用？电脑高手-小林 aws 前端云计算
随着云计算的普及，越来越多的开发者选择将Web应用部署到AWS（AmazonWebServices）上。AWS提供了丰富的云服务，包括计算、存储、数据库等，适用于不同规模的项目。本文将详细介绍如何在AWS上部署一个简单的Web应用，并通过Chrome浏览器验证部署效果。部署前的准备工作在开始部署之前，请确保您已经完成以下准备工作：注册AWS账户访问AWS官方网站，完成账户注册。如果您是新用户，可以
python3连接mysql8.0 _l_r_k_ 数据库 python
最近在学习数据库，尝试用python连接mysql8.0，但是一直报错，最后才发现是密码设置错误，导致一直连接不上数据库。先在my.ini配置：[mysqld]default_authentication_plugin=mysql_native_password再在mysql下执行命令：ALTERUSER'root'@'localhost'IDENTIFIEDWITHmysql_native_pa
学习笔记（Maui 02 Sqlite） sleevefisher 笔记 .net
Maui学习笔记（2）MVVM+IService架构下的数据服务（对应P3-P6）MVVM+IService架构下程序结构与功能Model：数据（Models文件夹）View：显示数据（Views文件夹）ViewModel：准备显示数据（ViewModels文件夹）IService:数据库服务操作（Services文件夹）1键值存储：偏好存储1.1键值存储的接口Services文件夹内创建接口IS
智联未来——打造基于机器学习的MySQL智能运维助手，开启协作新时代墨夶数据库学习资料2 机器学习 mysql 运维
在当今快速发展的信息技术领域，数据库作为信息系统的核心组件，其稳定性和效率直接关系到业务的成功与否。面对日益增长的数据管理和处理需求，传统的运维方式已经难以满足现代企业对高效、稳定服务的要求。为此，越来越多的企业开始探索如何通过智能化手段提升数据库运维水平，特别是利用最新的AI技术和自动化工具来构建一个功能强大的智能运维助手。今天，我们将深入了解如何训练这样一个基于机器学习的MySQL智能运维助手
mysql 单表并发_mysql怎么支撑百万级并发-对于同一个表，MySQL支持多少个并发操作... weixin_39878991 mysql 单表并发
到服务器的SQL最大并发连接数为16384、mysql百万级数据查询。受服务器配置和网络环境的限制，实际服务器支持的并发连接数量会更小。MySQL流量大，并发问题高因为mysql是一个线程的连接，当并发性高的时候，每秒需要几百甚至是线程，在这里创建和销毁线程很容易说。需要大量的内存，线程缓存命中率的下降，以及创建破坏线程的性能的提高——这个问题并不是特别大，重点是底层的mysql来瞬间处理这几百个
linux下mysql将表导出_linux下mysql导出数据表命令大嘴福妮 linux下mysql将表导出
Linux下有时候只想要导出mysql的数据表要使用什么命令呢?下面由学习啦小编为大家整理了linux下mysql导出数据表命令的相关知识，希望对大家有帮助!linux的mysql导出数据表命令详解1、导出a、使用默认的路径使用命令select*from数据表名intooutfile'文本名.txt';b、指定存放的路径使用命令select*from数据表名intooutfile'd:\文本名.t
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end