贺佬湿

电商系统架构设计系列（九）：如何规划和设计分库分表？

上篇文章中，我给你留了一个思考题：分库分表该如何设计？

今天这篇文章，我们来聊一下如何规划和设计分库分表，以及要考虑哪些问题。

引言

当要解决海量数据的问题，就必须要用到分布式的存储集群了，因为 MySQL 本质上是一个单机数据库，所以很多场景下不是太适合存 TB 级别以上的数据。

但是，绝大部分的电商大厂，它的在线交易这部分的业务，比如说，订单、支付相关的系统，还是舍弃不了 MySQL，原因是，只有 MySQL 这类关系型数据库，才能提供金融级的事务保证。对于分布式事务，那些新的分布式数据库提供的所谓的分布式事务，多少都有点儿残血，目前还达不到这些交易类系统对数据一致性的要求。

那既然 MySQL 支持不了这么大的数据量，这么高的并发，还必须要用它，怎么解决这个问题呢？还是按照我们之前的文章跟你说的思想，分片，也就是拆分数据。1TB 的数据，一个库撑不住，我把它拆成 100 个库，每个库就只有 10GB 的数据了，这不就可以了么？这种拆分就是所谓的 MySQL 分库分表。

不过，思路是这样没错，分库分表实践起来是非常不容易的，有很多问题需要去思考和解决。

如何规划分库分表？

我们以订单表来举例子。首先需要思考的问题是，分库还是分表？分库呢，就是把数据拆分到不同的 MySQL 库中去，分表就是把数据拆分到同一个库的多张表里面。

在考虑到底是分库还是分表之前，我们需要先明确一个原则：

那就是能不拆就不拆，能少拆不多拆。

原因也很简单，你把数据拆分得越散，开发和维护起来就越麻烦，系统出问题的概率就越大。

基于这个原则我们想一下，什么情况下适合分表，什么情况下不得不分库？

那我们分库分表的目的是为了解决两个问题：

是数据量太大，查询慢的问题。这里面我们讲的“查询”其实主要是事务中的查询和更新操作，因为只读的查询可以通过缓存和主从分离来解决。解决查询慢，只要减少每次查询的数据总量就可以了，也就是说，分表就可以解决问题。
是为了应对高并发的问题。应对高并发的思想，一个数据库实例撑不住，就把并发请求分散到多个实例中去。所以，解决高并发的问题是需要分库的。

简单地说，数据量大，就分表；并发高，就分库。

一般情况下，我们的方案都需要同时做分库分表，这时候分多少个库，多少张表，分别用预估的并发量和数据量来计算就可以了，预估量建议为现有量的5-10倍。

另外，我个人不建议你在方案中考虑二次扩容的问题，也就是考虑未来的数据量，把这次分库分表设计的容量都填满了之后，数据如何再次分裂的问题。

现在技术和业务变化这么快，等真正到了那个时候，业务早就变了，可能新的技术也出来了，你之前设计的二次扩容方案大概率是用不上的，所以没必要为了这个而增加方案的复杂程度。

这里强调一下，越简单的设计可靠性越高。

如何选择 Sharding Key？

分库分表还有一个重要的问题是，选择一个合适的列或者说是属性，作为分表的依据，这个属性一般称为 Sharding Key。像我们上篇文章说到的归档历史订单的方法，它的 Sharding Key 就是订单完成时间。每次查询的时候，查询条件中必须带上这个时间，我们的程序就知道，三个月以前的数据查订单历史表，三个月内的数据查订单表，这就是一个简单的按照时间范围来分片的算法。

选择合适 Sharding Key 和分片算法非常重要，直接影响了分库分表的效果。我们首先来说如何选择 Sharding Key 的问题。

选择这个 Sharding Key 最重要的参考因素是，我们的业务是如何访问数据的。

比如我们把订单 ID 作为 Sharding Key 来拆分订单表，那拆分之后，如果我们按照订单 ID 来查订单，就需要先根据订单 ID 和分片算法计算出，我要查的这个订单它在哪个分片上，也就是哪个库哪张表中，然后再去那个分片执行查询就可以了。

但是，当我打开“我的订单”这个页面的时候，它的查询条件是用户 ID，这里没有订单 ID，那就没法知道我们要查的订单在哪个分片上，就没法查了。当然你要强行查的话，那就只能把所有分片都查一遍，再合并查询结果，这个就很麻烦，而且性能很差，还不能分页。

那要是把用户 ID 作为 Sharding Key 呢？也会面临同样的问题，使用订单 ID 作为查询条件来查订单的时候，就没办法找到订单在哪个分片了。这个问题的解决办法是，在生成订单 ID 的时候，把用户 ID 的后几位作为订单 ID 的一部分，比如说，可以规定，18 位订单号中，第 10-14 位是用户 ID 的后四位，这样按订单 ID 查询的时候，就可以根据订单 ID 中的用户 ID 找到分片。

那我们系统对订单的查询方式，肯定不只是按订单 ID 或者按用户 ID 这两种啊。比如说，商家希望看到的是自己店铺的订单，还有各种和订单相关的报表。对于这些查询需求，我们一旦对订单做了分库分表，就没法解决了。那怎么办呢？

一般的做法是，把订单数据同步到其他的存储系统中去，在其他的存储系统里面解决问题。比如说，我们可以再构建一个以店铺 ID 作为 Sharding Key 的只读订单库，专门供商家来使用。或者，把订单数据同步到 HDFS 中，然后用一些大数据技术来生成订单相关的报表。

所以你看，一旦做了分库分表，就会极大地限制数据库的查询能力，之前很简单的查询，分库分表之后，可能就没法实现了。

你要记得一句话：分库分表一定是，数据量和并发大到所有招数都不好使了（比如缓存），我们才拿出来的最后一招。

如何选择分片算法？

举个例子，我们能不能用订单完成时间作为 Sharding Key 呢？比如说，我分 12 个分片，每个月一个分片，这样对查询的兼容要好很多，毕竟查询条件中带上时间范围，让查询只落到某一个分片上，还是比较容易的，我在查询界面上强制用户必须指定时间范围就行了。

这种做法有个很大的问题，比如现在是 3 月份，那基本上所有的查询都集中在 3 月份这个分片上，其他 11 个分片都闲着，这样不仅浪费资源，很可能你 3 月那个分片根本抗不住几乎全部的并发请求。这个问题就是“热点问题”。

也就是说，我们希望并发请求和数据能均匀地分布到每一个分片上，尽量避免出现热点。这是选择分片算法时需要考虑的一个重要的因素。一般常用的分片算法就那么几种，刚刚讲到的按照时间范围分片的方法是其中的一种。

基于范围来分片容易产生热点问题，不适合作为订单的分片方法，但是这种分片方法的优点也很突出，那就是对查询非常友好，基本上只要加上一个时间范围的查询条件，原来该怎么查，分片之后还可以怎么查。范围分片特别适合那种数据量非常大，但并发访问量不大的 ToB 系统。比如说，电信运营商的监控系统，它可能要采集所有人手机的信号质量，然后做一些分析，这个数据量非常大，但是这个系统的使用者是运营商的工作人员，并发量很少。这种情况下就很适合范围分片。

一般来说，订单表都采用更均匀的哈希分片算法。比如说，我们要分 24 个分片，选定了 Sharding Key 是用户 ID，那我们决定某个用户的订单应该落到那个分片上的算法是，拿用户 ID 除以 24，得到的余数就是分片号。这是最简单的取模算法，一般就可以满足大部分要求了。当然也有一些更复杂的哈希算法，像一致性哈希之类的，特殊情况下也可以使用。

需要注意的一点是，哈希分片算法能够分得足够均匀的前提条件是，用户 ID 后几位数字必须是均匀分布的。比如说，你在生成用户 ID 的时候，自定义了一个用户 ID 的规则，最后一位 0 是男性，1 是女性，这样的用户 ID 哈希出来可能就没那么均匀，可能会出现热点。

还有一种分片的方法：查表法。查表法其实就是没有分片算法，决定某个 Sharding Key 落在哪个分片上，全靠人为来分配，分配的结果记录在一张表里面。每次执行查询的时候，先去表里查一下要找的数据在哪个分片中。

查表法的好处就是灵活，怎么分都可以，你用上面两种分片算法都没法分均匀的情况下，就可以用查表法，人为地来把数据分均匀了。查表法还有一个特好的地方是，它的分片是可以随时改变的。比如我发现某个分片已经是热点了，那我可以把这个分片再拆成几个分片，或者把这个分片的数据移到其他分片中去，然后修改一下分片映射表，就可以在线完成数据拆分了。

但你需要注意的是，分片映射表本身的数据不能太多，否则这个表反而成为热点和性能瓶颈了。查表法相对其他两种分片算法来说，缺点是需要二次查询，实现起来更复杂，性能上也稍微慢一些。但是，分片映射表可以通过缓存来加速查询，实际性能并不会慢很多。

总结

对 MySQL 这样的单机数据库来说，分库分表是应对海量数据和高并发的最后一招，分库分表之后，将会对数据查询有非常大的限制。

分多少个库需要用并发量来预估，分多少表需要用数据量来预估。选择 Sharding Key 的时候，一定要能兼容业务最常用的查询条件，让查询尽量落在一个分片中，分片之后无法兼容的查询，可以把数据同步到其他存储中去，来解决这个问题。

我们常用三种分片算法，范围分片容易产生热点问题，但对查询更友好，适合并发量不大的场景；哈希分片比较容易把数据和查询均匀地分布到所有分片中；查表法更灵活，但性能稍差。

对于订单表进行分库分表，一般按照用户 ID 作为 Sharding Key，采用哈希分片算法来均匀分布用户订单数据。为了能支持按订单号查询的需求，需要把用户 ID 的后几位放到订单号中去。

最后，还需要强调一下，我们所提到的这些分片相关的知识，不仅仅适用于 MySQL 的分库分表，你在使用其他分布式数据库的时候，一样会遇到如何分片、如何选择 Sharding Key 和分片算法的问题，它们的原理都是一样的，所以我们说的这些方法也都是通用的。

感谢阅读，如果你觉得这篇文章对你有一些启发，也欢迎把它分享给你的朋友。

思考题

怎么能避免写出慢SQL？

期待、欢迎你留言或在线联系，与我一起讨论交流，“一起学习，一起成长”。

上一篇文章

电商系统架构设计系列（八）：订单数据越来越多，数据库越来越慢该怎么办？

系列分享

Elasticsearch教程
微服务架构实战
架构思维成长系列
电商系统架构设计系列

------------------------------------------------------

我的CSDN主页

关于我（个人域名，更多我的信息）

我的开源项目集Github

期望和大家 一起学习，一起成长，共勉，O(∩_∩)O谢谢

如果你有任何建议，或想学习的知识，可与我一起讨论交流

欢迎交流问题，可加个人QQ 469580884，

或者，加我的群号 751925591，一起探讨交流问题

不讲虚的，只做实干家

Talk is cheap，show me the code

数据库如何应对保障大促活动 2401_86087710 数据库 oracle
当前，随着电商节日的增多（6.18、双十一、双十二）、平台拉新趋于频繁，大促活动也越来越普遍。作为一个电商平台，每年都会有一次，甚至几次的流量“大考”。数据库作为系统的重要节点，其稳定性和性能格外重要，数据库的全力保障是一个大的挑战。电商大促，这场没有硝烟的战争很多人已有体会，在此不再赘述。现在，我们直接切入主题–数据库如何积极应对，全力保障大促活动。这个题目分解为三个部分进行讲解：第一部分，准备
php进制代码,php如何利用32进制实现对id的加密解密（附代码）职景 php进制代码
这篇文章给大家介绍的内容是关于php如何利用32进制实现对id的加密解密(附代码)，有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。最近在项目中遇到一个问题，当前用户分享一个邀请码给好友，好友根据邀请码注册成为新用户之后，则成为当前用户的下级，特定条件下，可以得到下级用户的一系列返利。这里要实现的就是根据当前用户的id，生成一个加密串，并且可以反向解密。经过不断的测试调整，终于得到了
Go+gRPC-Gateway(V2) 微服务实战，小程序登录鉴权服务(四)：客户端强类型约束，自动生成 API TS 类型定义... 为为少 go python golang jwt 小程序
系列云原生API网关，gRPC-GatewayV2初探Go+gRPC-Gateway(V2)构建微服务实战系列，小程序登录鉴权服务：第一篇Go+gRPC-Gateway(V2)构建微服务实战系列，小程序登录鉴权服务：第二篇Go+gRPC-Gateway(V2)构建微服务实战系列，小程序登录鉴权服务(三)：RSA(RS512)签名JWT客户端强类型约束，自动生成APITS类型定义protobufjs
Elasticsearch集群架构：构建高效、可扩展的搜索平台 detayun Elasticsearch elasticsearch 架构大数据
在当今大数据和云计算的时代，高效、实时的数据检索能力成为了企业核心竞争力的重要组成部分。Elasticsearch，作为一款基于Lucene构建的开源搜索引擎，以其强大的全文搜索能力、灵活的扩展性和丰富的功能特性，成为了众多企业首选的数据搜索和分析平台。本文将深入探讨Elasticsearch集群的架构设计，帮助您更好地理解和构建高效、可扩展的搜索解决方案。一、Elasticsearch简介Ela
浅谈隐私计算 eso1983 python 安全
1.隐私计算概述隐私计算是指在保护数据本身不对外泄露的前提下，实现数据的计算和分析的一系列信息技术。随着数据成为重要的生产要素，数据的流通与融合需求日益增长，但数据隐私安全问题也愈发突出。隐私计算技术旨在平衡数据的价值挖掘与隐私保护，为数据的安全使用提供解决方案。隐私计算涉及到多个主要的关键技术：多方安全计算：基于密码学原理，允许多个参与方在不泄露各自私有数据的情况下，协同计算某个函数。各方将各自
DeepSeek在协同过滤和深度学习技术中的应用场景 python算法(魔法师版) 深度学习人工智能
DeepSeek作为一个集成多种先进技术的平台，利用协同过滤和深度学习技术在多个领域实现了创新应用。以下是一些具体的场景和示例，展示了这些技术如何被应用于实际问题中。一、推荐系统电子商务协同过滤：在电商平台中，协同过滤用于根据用户的历史行为（如购买记录、浏览历史等）推荐相关商品。基于用户的相似性或项目的相似性来生成个性化推荐。Python深色版本fromsurpriseimportDataset,
JAX-RS中请求与响应头的处理技巧 t0_54program python 开发语言个人开发
在JavaEE中，JAX-RS（JavaAPIforRESTfulWebServices）是一个用于构建RESTfulWeb服务的强大框架。它提供了多种方式来处理HTTP请求和响应头，这在开发RESTfulAPI时非常有用。本文将通过一系列实例，详细介绍如何在JAX-RS中访问请求头以及如何设置响应头。一、访问请求头（一）使用HttpHeadersHttpHeaders接口提供了对请求头的全面访问
自然语言生成（NLG）算法模型评估方案的硬件配置、系统架构设计、软件技术栈、实现流程和关键代码 weixin_30777913 人工智能算法系统架构自然语言处理
智能化对话中的自然语言生成（NLG）算法模型评估是一个复杂而多维的过程，它涉及多个评估指标和策略，以确保生成的文本质量、准确性和流畅性。智能化对话中的NLG算法模型评估是一个涉及多个评估指标和策略的过程。通过选择合适的评估指标和策略，可以全面、客观地评估模型的性能和表现，为模型的优化和改进提供有力支持。以下是对NLG算法模型评估的详细论述及举例说明：一、评估指标准确性：•关注模型生成的语言内容是否
NPDP第二章：组合管理钱包不紧张女士产品运营
什么是产品组合？权衡取舍一系列项目或产品新产品开发面临的挑战1.新产品开发与企业战略脱节；2.过的的项目同时开发；3.缺乏有效的业务优先级管理；4.资源配置没有动态调整。组合管理定义（过程）（组合管理就是做对的项目）组合管理是动态决策的过程、持续评估选择的项目、不确定性、合理分配资源完成正确的事组合管理价值：早期选择、快决策、提高回报率、降低风险组合管理的特点：1.在动态决策环境下运行；2.项目处
短视频推荐系统架构设计：从召回、排序到冷启动的全链路解析热爱分享的博士僧系统架构
短视频推荐系统的设计是一个复杂的过程，涉及到从内容召回、排序到解决冷启动问题的多个环节。下面将对这一过程进行全链路解析。1.召回阶段召回是推荐系统的第一个步骤，目的是从海量的内容库中快速筛选出可能感兴趣的候选集供用户查看。常见的召回策略包括：基于流行度的召回：根据视频的观看次数、点赞数、分享数等指标来选择热门内容。协同过滤召回：利用用户行为数据（如浏览历史、点赞、评论等），找到与当前用户兴趣相似的
Python零基础入门：从入门到实战的10个必学知识点小尤笔记 python 数据库服务器
Python零基础入门到实战，需要掌握一系列基础且关键的知识点。以下是10个必学的知识点及其代码演示：CSDN大礼包：《2024年最新全套学习资料包》免费分享1.变量与数据类型变量：用于存储数据，可以随时修改其存储的值。数据类型：Python有丰富的数据类型，包括整数（int）、浮点数（float）、字符串（str）、布尔型（bool）等。#变量赋值a=10#整数b=3.14#浮点数c="Hell
AI浪潮下程序员的职业转型与技术进阶之路 nbsaas-boot 人工智能
一、引言1.1研究背景与意义在科技飞速发展的当今时代，人工智能（AI）无疑是最为耀眼的技术领域之一。从早期简单的专家系统到如今复杂的深度学习模型，AI技术经历了从理论探索到广泛应用的巨大跨越，正以前所未有的速度改变着我们的生活和工作方式。近年来，AI技术取得了一系列突破性进展。以GPT系列为代表的大型语言模型，展现出强大的自然语言处理能力，能够实现文本生成、对话交互、代码编写等多种任务。根据《20
JavaScript系列（54）--性能优化技术详解 ᅟᅠ ‌‍‎‏ 一进制 JavaScript javascript 性能优化开发语言
JavaScript性能优化技术详解⚡今天，让我们继续深入研究JavaScript的性能优化技术。掌握这些技术对于构建高性能的JavaScript应用至关重要。性能优化基础概念小知识：JavaScript性能优化涉及多个方面，包括代码执行效率、内存使用、DOM操作、网络请求等。通过合理的优化策略，可以显著提升应用的响应速度和用户体验。性能分析工具实现//1.性能计时器classPerformanc
DeepSeek的出现对全球GPT产业产生的冲击不要em0啦机器学习 gpt
引言近年来，人工智能技术的迅猛发展推动了自然语言处理（NLP）领域的革命性进步。特别是以GPT（GenerativePre-trainedTransformer）系列模型为代表的大规模预训练语言模型，已经在全球范围内引发了广泛关注和应用。然而，随着技术的不断演进，新兴的GPT模型如DeepSeek的出现，正在对全球GPT产业产生深远的影响。本文将从技术、市场、应用场景和产业生态等多个维度，深入探讨
FPGA 之 SOPC 系列（七）NIOS II 高级技术 FPGA技术江湖 FPGA项目开发经验分享 FPGA学习系列 fpga sopc nios ii
FPGA之SOPC系列（七）NIOSII高级技术今天给大侠带来今天带来FPGA之SOPC系列第七篇，NIOSII高级技术，希望对各位大侠的学习有参考价值，话不多说，上货。本篇是有关SOPC的深入设计，帮助读者掌握如何定制用户指令。定制用户逻辑外设和定制用户指令是使用NiosII嵌入式软核处理器的SOPC系统的重要特性，用户还可以通过定制用户逻辑外设和定制用户指令来实现各种应用要求，同时介绍了Nio
出栈序列问题——卡特兰数 tanactor c++刷题 c++算法
大家新年快乐啊！！！（^_^）最近在刷题时遇见了这个题是一个关于出栈方案的简单递归问题后来Deepseek了一下才知道该题的背景故留存在此供自己以后查阅以下是关于卡特兰数的相关内容：什么是卡特兰数？卡特兰数（CatalanNumber）是一系列在组合数学中经常出现的自然数。卡特兰数的第n项（记作cn表示许多组合问题的解的数量。卡特兰数的前几项为：C0=1,C1=1,C2=2,C3=5,C4=14,
在Python中使用“判断字典键是否存在的方法“进行键的查找代码之旅创造者 python 开发语言 Python
在Python编程中，经常需要在字典中查找某个特定的键是否存在。字典是Python中常用的数据结构之一，它由一系列键-值对组成，每个键都是唯一的。为了判断一个键是否存在于字典中，我们可以使用in关键字或has_key()方法。下面将介绍如何使用in关键字和has_key()方法来判断键是否存在，并提供相应的源代码示例。使用in关键字判断键是否存在在Python中，使用in关键字可以判断一个键是否存
商品价格跟踪爬虫：监控多个电商网站的商品价格波动 Python爬虫项目 2025年爬虫实战项目爬虫 python 开发语言
1.引言在当前的电商环境中，商品价格变化快速且频繁。对于消费者而言，能够实时跟踪商品价格的波动是一项非常实用的功能。而对于商家来说，了解竞争对手的价格走势也是一种重要的商业策略。因此，开发一个商品价格跟踪爬虫，能够帮助我们及时掌握价格动态。本文将详细介绍如何使用Python实现一个高效的商品价格跟踪爬虫，并对多个电商网站进行价格监控。2.爬虫概述爬虫的作用是模拟浏览器向目标网站发送请求，获取商品页
Spark基础【RDD依赖关系--源码解析】 OneTenTwo76 Spark spark scala 大数据
文章目录一RDD依赖关系1RDD血缘关系2RDD依赖关系3RDD阶段划分4RDD任务划分一RDD依赖关系1RDD血缘关系相邻两个RDD之间的关系，称之为依赖关系，多个连续的依赖关系称之为血缘关系RDD只支持粗粒度转换，即在大量记录上执行的单个操作。将创建RDD的一系列Lineage（血统）记录下来，以便恢复丢失的分区。RDD的Lineage会记录RDD的元数据信息和转换行为，当该RDD的部分分区数
ROS发行版虎啸~嘤嘤嘤机器人自动驾驶人工智能
ROS是一个用于机器人软件开发的灵活框架，它支持多种编程语言，并且其不同的版本（称为“发行版”）提供了不同的特性和兼容性。foxy是ROS2的一个发行版名称。ROS2是ROS的一个新版本，它引入了新的通信机制（如DDS，DataDistributionService）、更好的系统架构和更多的现代编程语言支持（如C++11、Python3等）。foxy是在特定时间点上发布的ROS2的一个版本，它包含
Rust语言进阶之文件处理：BufReader用法实例(一百零三) Android系统攻城狮 rust 开发语言后端
简介：CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布：《Android系统多媒体进阶实战》优质专栏：Audio工程师进阶系列【原创干货持续更新中……】优质专栏：多媒体系统工程师系列【原创干货持续更新中……】优质视频课程：AAOS车载系统+AOSP14系统攻城狮入门视频实战课人生格言：人生从来没有捷径，只有行动才是治疗恐惧和懒惰的唯一良药.更多原创,欢迎关注：Android系
如何高效使用Excel的SUMIF函数：掌握条件求和的技巧
背景：在日常工作中，我们经常遇到这样的情况：需要根据特定条件对一系列数据进行求和。幸运的是，Excel提供了一个强大的工具来简化这一任务——SUMIF函数。本博客将带你深入了解如何使用SUMIF函数，包括一些实用的示例和高级技巧。SUMIF函数概述SUMIF函数是一个条件求和函数，它允许你在满足一个条件的情况下求和一列数字。它的基本语法如下：SUMIF(range,criteria,[sum_ra
第28节课：前端项目实战—从需求分析到开发流程的全方位指南学问小小谢 HTML学习笔记前端需求分析安全 web安全网络性能优化 html5
目录项目需求分析与设计项目背景与目标项目背景项目目标需求收集与分析用户需求业务需求项目设计技术栈选择系统架构设计数据库设计项目开发流程环境搭建安装Node.js和npm初始化项目编码实践组件化开发状态管理测试与调试单元测试集成测试部署与维护部署维护结语在前端开发领域，将理论知识应用于实际项目是提升技能的关键。本节课将通过一个完整的前端项目实战案例，详细介绍项目需求分析与设计，以及项目开发流程，帮助
ChatGPT-4o和ChatGPT-4o mini的差异点老六哥_AI助理指南人工智能 chatgpt
在人工智能领域，OpenAI再次引领创新潮流，近日正式发布了其最新模型——ChatGPT-4o及其经济实惠的小型版本ChatGPT-4oMini。这两款模型虽同属于ChatGPT系列，但在性能、应用场景及成本上展现出显著的差异。本文将通过图文并茂的方式，深入解析两者之间的不同点。一、性能差异ChatGPT-4o：全能型语言模型多模态处理能力：ChatGPT-4o不仅限于文本处理，更能够实时处理和生
揭秘 Fluss 架构组件大圣数据星球大数据 Flink 设计模式
这是Fluss系列的第四篇文章了，我们先回顾一下前面三篇文章主要说了哪些内容。Fluss部署，带领大家部署Fluss环境，体验一下Fluss的功能Fluss整合数据湖的操作，体验Fluss与数据湖的结合讲解了Fluss、Kafka、Paimon之间的区别和联系前面三篇文章可以让大家上手玩起来Fluss这个框架，并说明了它与Kafka、Paimon数据湖的关系，接下来的文章就深入Fluss细节来说一
深度学习盛行，还记得哪些传统机器学习方法和模型？硬件学长森哥人工智能深度学习机器学习人工智能
开头森哥说：假期前后在准备成像技术的总结，目前已完成两部分，争取在摸索出一些编辑和运营技巧后，完善成一个系列和大家见面；当然也有可能会通过一些更加贴合摄影实用的角度出一些更加浅显的内容。最终如何呈现还需要慢慢摸索。传统机器学习是指在深度学习盛行之前开发的机器学习和人工智能技术。这些传统方法通常依赖于手工设计的特征提取和模型结构。而深度学习是一种机器学习技术，它通过深层神经网络从原始数据中学习特征表
告别破解版！EDU邮箱可畅享Adobe全家桶，还有这5个冷门技巧等你解锁 shelby_loo adobe
还在为破解版Adobe软件的各种问题头疼吗？是时候和它们说再见了！现在，通过EDU教育邮箱，你就可以免费使用正版Adobe系列软件，告别破解版带来的烦恼。如何获取EDU邮箱？想要了解如何获取EDU邮箱，你可以参考我昨天的文章。掌握这5个冷门技巧，让你的Adobe软件技能更上一层楼Photoshop：快速抠图不求人还在用魔棒工具或者钢笔工具辛苦抠图？试试Photoshop的“选择并遮罩”功能吧！它能
基于“蘑菇书”的强化学习知识点（一）：奖励函数（Reward Function）和价值函数（Value Function）的区别墨绿色的摆渡人基于“蘑菇书”的强化学习知识点强化学习蘑菇书
奖励函数（RewardFunction）和价值函数（ValueFunction）的区别摘要1.定义与目标奖励函数（RewardFunction）价值函数（ValueFunction）2.核心区别3.具体示例场景：迷宫导航问题(1)奖励函数的设计(2)价值函数的计算对比结果4.关系与协同作用总结摘要本系列知识点讲解基于蘑菇书EasyRL中的内容进行详细的疑难点分析！具体内容请阅读蘑菇书EasyRL！
模式识别与机器学习（Python实现）：基于sklearn朴素贝叶斯模型实现男女分类 CV视界模式识别机器学习与图像处理机器学习 python 人工智能
模式识别与机器学习（Python实现）：基于sklearn朴素贝叶斯模型和pazen窗方法实现男女分类欢迎大家来到安静到无声的《模式识别与人工智能（程序与算法）》，如果对所写内容感兴趣请看模式识别与人工智能（程序与算法）系列讲解-总目录，同时这也可以作为大家学习的参考。欢迎订阅，优惠价只需9.9元，请多多支持！目录标题模式识别与机器学习（Python实现）：基于sklearn朴素贝叶斯模型和paz
博客建站7 - hexo博客独立服务器如何自动部署？ c++
1.本网站的系统架构2.安装git3.配置git用户3.1.为什么要创建git用户3.2.创建git用户3.3.设置git用户的密码3.4.创建公钥-私钥对3.5.服务器配置公钥4.hexo配置自动化部署4.1.配置Git仓库4.2.hexo站点配置1.本网站的系统架构网站示例：sunlogging.com服务器：阿里云ECS服务器系统：Ubuntu24.04LTS博客框架：Hexo网站主题：Vo
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。