大摩羯先生

「数据密集型系统搭建」开卷篇｜什么是数据密集型系统

在我们开发的诸多系统，基本都可以视为“数据密集型系统”，数据是一切物质的载体，我们依靠数据做存储记录，通过数据进行信息传递交换，最终还要数据来呈现和展示等，从一定视角而言，系统中最核心、最底层、最密集的是数据，时刻都在围绕数据构建服务运转并驱动业务。

1. 系统服务在承载哪些职责

我们先来思考几个比较本宗的问题 ——— 我们为何要开发一个系统？怎么体现一个系统的好坏？系统在为谁服务？

为何要开发一个系统？

在当前这个信息化、互联网的时代，软件系统已经根入到生活生产、衣食住行的每一个环节，无论是ToC或ToB业务，无论是天上飞的还是地上跑的，都有软件系统存在的身影。从最朴素的视角出发，我们是在用软件工程、技术手段来构造一个组合要件，完成功能满足需求，让它的形式看起来像一个整体，来服务一定范围的业务或者人群，并且会存在一定生命周期的持续性技术集合，在服役期间要尽最大能力达成业务诉求，要做到运转稳定、数据准确、体验良好等，最终收益是通过技术投入来助力业务运作的高效收益。

怎么体现一个系统的好坏？

随着承载业务的发展，系统也在随之变化，大部分时间是从0.0.1到0.0.2的逐层迭代，也会有1.x到2.x的改造升级甚至重构。小改动是量变，可以是功能优化，也可以是问题修复，投入可控，挑战不大，大改动是质变，非常考量团队及个人的能力水平，是对系统前期搭建可塑性、扩展性的考验和回溯，成功的质变带来的是无穷无尽的能量，它能紧跟业务的迭代进行适配推动其蓬勃发展，而糟糕的劣变会让系统埋下雷区，让团队成员疲惫不堪，从而与业务节奏脱节。

因此，一个大部分人眼里好的系统不应仅仅是让上游业务使用者感觉”厉害“，还要让参与系统开发、维护的参与者们感觉”舒适“，既要外表光鲜，也要自得其所。能够同时满足以上两点在诸多的项目实践过程中的确很难，但是如果能做到的确很棒，这就是一个”好系统“的标准。

系统在为谁服务？

角色	服务内容
系统使用者	提供系统功能，提高作业效率，完善作业流程，基于信息化实现最高收益
系统建设者	反哺式反馈，决定方案和实施细节，又时刻获取正负面系统构建效果

基于上述，我们可以从系统使用者、系统建设者两个方面进行划分：

对服务使用者「用户」 的功能交付，用户具有上帝视角，用户反馈是系统服务成败的关键一环甚至是最核心一环，一切都是为了使用者更好的体验
对服务建设者「研发」 的投入反馈，方案是研发做的，代码是研发敲的，合理不合理，是否可扩展可维护，可以看做是自己的因来种自己的果，抛开第一层用户交付，其他全是研发自身建设的驱动内循环，可维护可拓展较为丝滑的迭代体验来自于前期良好的设计与实践。

服务承诺：更高、更快、更强

SLA (Service Level Agreement)，即服务级别协议，是指提供服务的企业与客户之间就服务的品质、水准、性能等方面所达成的双方共同认可的协议或契约。

运动场上的健儿们追求的目标是奋力夺冠，技术角逐中研发小伙儿们的目标是打造"三高"。

『高并发』如何花最少的资源做最多的事情？如何让最少的投入获得最大的产出？这是一个非常考究的话题，高并发意味着高吞吐，在一定时间内可以处理更多的事情，在同样的资源投入下，有的系统可以同时处理上万请求，有的系统只能处理几百，这场景最熟悉的莫过于去银行办理业务了，如果一个银行只能开一个窗口，所有用户无论什么业务都只能one by one串行等候，这种体验让人一言难尽，如果这时银行开窍了，增开窗口，而且还把办理不同业务的人拆分开，加快办理速度，”并发“噌的一下就上来了，正如魔兽世界地精的那句开场白”时间就是金钱，我的朋友！“，高效率的系统能力必然带动业务的高增长，这才是真的”快“。
『高性能』性能永远是一个迷人的话题，迷人之处在于每一次小小的进阶都是一次极限的突破，而每一次小小的变化来自于强大的知识积累和实践新知的融合。图灵奖获得者尼古拉斯•威茨说到”程序=数据结构+算法“，当参与了诸多项目开发，经历过诸多性能优化的实践，尤其是碰壁过很多困难和陷入窘境的时候，这句话就非常具有指导意义，前面提到系统开发的三层概念，数据层、应用层是研发大展身手的地方，也是最能体现这句话深谙含义的地方。微观来说，各种数据结构决定了查询、更新数据的时间复杂度，选择合理的数据存储结合巧妙的算法特点可以使得数据处理事半功倍；宏观来说，熟练的组合和编排中间件充分发挥他们的优势和特点，让正确的东西做正确的事情，形成整体收益，这才是真的”高“。
『高可用』相信当你作为一个用户使用产品时，宁可反应慢一点、界面丑一些都能暂且忍受，就是不能接受系统直接”暴毙“不能用。高可用的要求是”三高“的底线，是最不能被突破的一环，当你设计的技术方案搭建出了可靠的系运转体系，经过业务极限的洗礼后屹然不倒，就像狂风呼啸过那山岭仍稳如磐石，这才是真的”强“。

内省心法：靠得住、看得懂、改得动

除了对外部交付负责，还要对内部自身负责，体现在负责服务的工程质量，其中包括方案合理性、编码标准化等多方面，这需要参与系统建设的每一位小伙伴的共同努力和守护。

『可靠性』如果你的系统动不动就崩了，那么连对外部交付的”高可用“这个底线都没守住，业务洪流直接让你决堤，这个系统此刻就是失败的，你所有功劳苦劳都是虚无的。经过诸多的项目实践会发现，正确的人做正确的事情才可以有正确的决策然后引导事情向着正确的方向发展，说了这么多”正确“就是想强调它很重要！首先，我们需要有一定业务经验和项目实践的工程师或者架构师来统筹全局，因为见过风雨得到过总结经验的人会带你避开那些坑做出团队内相对合理和较好的技术方案，在大方向确定的指导下进行技术实践完成编码和协作，在很大程度上能规避潜在风险，即使遇到未知问题也会有更多指导性建议进行校正，最终收获一个相对稳定、收益较高的结果，团队受益、每个人受益，最直接的就是整个团队及成员不必苦苦困在不合理的方案设计、扭曲的项目实践中，为那些不必要的奇葩问题和不稳定性擦屁股，因此，一个”靠得住“系统来源于专业团队，必须有专业领袖牵引，抱紧一群专业的伙伴参与实践，在系统迭代和建构过程中形成良性的内循环，好的设计结合好的实践，高效地适配业务节奏运转。
『可扩展性』每个工程师都或多或少学习过GoF的设计模式，设计模式的指导思想之一也在引导我们多多创造可扩展的顶层设计、编码实践，因为系统如何我们的血液和机体是变化的，迭代是常态，在顶层视角为未来变数预留空间是非常友好的操作，能让未来的变化接入的成本降低，让系统建构的可塑造性变强。比如你在做一家公司的支付系统，今天业务的发展可能只涉及微信支付、支付宝支付，在设计初期聪明的你一定会想到未来还会有更多其他支付方式的对接接入，于是你会设计相对标准化的接入方式为未来的变化做建构储备，一名优秀的工程师想必时常在实践中问自己：我的系统是否能让未来的自己或他人”改得动“？
『可维护性』提到可维护性，让我想起工业化时期的美国历史片段，当时机器化工厂遍地突起，每个资本家都有一套自己的制造流程和规范，于是出现了五花八门的机器组件，一个小小的螺丝在不同厂家都有不同的型号，如果某家工厂经营不善倒闭而恰巧这时候你在他家采买的机器零件出现问题都没有地方维修，因为其他家的零件根本不能适配，这大大阻碍了工业化的进展，于是开始有统一的行业标准规范，大家可以在功能上搞噱头和研究突破，但是零件上必须严格统一。这是一个比较深刻的例子，映射到软件工程中也是一样的，我们是一群拿着键盘操作0和1世界的编程工人或设计师，机器在运转的过程中问题总是不可避免会出现，而操作机器的人也不可能永远都是一个，因此我们的操作流程、机器规范也需要标准化来约束，能让别人”看得懂“你在用代码表达什么，你的设计方案在解决什么问题，而不是你一个人自己过家家想让它DDD就DDD，想让它有索引就有索引…系统构建是一个团队性任务，需要达成共识的约束和自驱，团队认知是一笔非常宝贵的软资产，那些错误的实践操作破坏性很大，应当及时制止。

2. 系统结构是什么样的

系统是层次化的

所谓系统，围绕业务展开，根据业务的复杂度可以非常庞大，也可以非常精简，可以是12306网站、京东商城这种量级的大家伙，也可以是一个班级人员查询、加减乘除计算这种基础功能。我们围绕复杂度适中的一般性系统构成来说明，从上到下大概可以分为用户层、应用层、数据层。

『用户层』包含WEB、APP等多端内容呈现，是软件使用者的交互层
『应用层』是研发发挥设计、Coding天赋的重要场所
『数据层』也可称为存储层，是对业务形态的映射存储，是各种数据结构集成后业务的承载体

系统的分层划分是为了保持职责单一，让每个模块功能更内聚。每一层都很重要，每一部分的参与合作组成了系统全貌。

底层结构决定上层建筑

作为一名前端研发的话，相信你的视角会聚焦在用户层交互体验，作为一名服务端研发的话，相信你的关注点会放在应用层逻辑开发和一部分数据层交互，如果你是一名DBA或者数据BP同学，相信你的工作范畴会全部在数据层上。如果每一位同学都能够在做好本位工作的基础上跳出自身层次象限来全局审视的话，相信会有更多的认知和思考，会拥有一种全局视角，能够帮助更好地理解层次交互和递进关系。

相信嗅觉灵敏的你能够看到系统整体建构也很契合”底层结构决定上层建筑“的建造规律，而我们的系统搭建又何尝不是在做一次”建筑“之旅？在陪家里小朋友搭建乐高积木的时候，小朋友总是想搭得高高，在小朋友的世界里，搭得越高就意味着他的”系统“越厉害，大人总会引导说一定要把最下面的搭稳牢固，不然晃晃悠悠的很容易倒塌。数据层的构建就好比”乐高“最需要稳固的，我们要选择那些适合的存储中间件，追求大容量的上Hive、Hbase这种大数据存储，需要保证数据完整性的上Oracle、MySQL这些保证事务的DBMS，对数据有聚合计算诉求的可以使用列式存储加快取数效率，需要条件筛选检索的搜索需要ES、MongoDB这些强大引擎支持，等等。这些数据组件就像形状各异的”积木“，平摊的桌面一定是用方形最牢固，拼接的缝隙根据缺口需要选择三角形、圆形等其他多边形组件来支持做到适配。

牢固基础非常重要

还是回到”程序=数据结构+算法“的话题上，数据层存储方式简单而言就是各种数据结构的具象化，从最简易的数据结构到从简易数据结构组合变化而来的复杂数据结构，都需要我们非常熟悉其特点，选择数据中间件其实就是在选择它背后包含和支持的数据结构，通过选择适合的要件才可以巧妙结合算法发挥出强大作用，比如你非要在一个朴素的单链表结构上进行顺序查找，它的平均时间复杂度永远定格在O(N)这是不会改变的，而你把数据存储在数组里，借助数组索引就能有O(1)时间复杂度的取数效率，反过来如果插入数据的话两种数据结构的效率又反之大相径庭。

底层的不牢靠，方案有问题，会直接影响应用层、展示层，而且上层建筑累死累活打补丁做优化也是治标不治本，这点对于服务端小伙伴来说特别重要，因为应用层、数据层设计都是从服务端发起并实现的，大部分同学刚刚入行时比较聚焦应用层语言、框架、设计模式的学习和积累，鲜有耐心埋头对数据层进行深入学习和分析，因为工作中大部分创造性工作在编码中进行，而且一些工作业绩产出息息相关，而数据层一般由DBA、数据BP进行维护和开发，所以技术实践过程中应用层方面设计做的相对较好，数据层中间件选择和库表设计相对比较初级，出现严重的”偏科“问题，木桶原理深刻的告诉我们一定要补足自己的短板，两个60分是都及格了，一个20分一个100分还需要参加补考。

3. 系统数据是怎么密集起来的

前面讲到了数据层基石的重要性，下面来看看下系统中数据层究竟存储着哪些数据？

我们常说，要站在业务视角，离开业务空谈技术就像花朵离开了土壤，失去了技术产值。业务它在做什么、做了什么、做得如何，全都离不开数据进行承载和流转。

我们可以将与业务息息相关的数据称之为“事实数据”，这部分数据是真实的业务要存储和使用的，比如我们做一个订单系统，必然要存储订单的单号、下单时间、下单人信息等；把一些辅助支撑作用或衍生的数据称之为“辅助数据”，比如订单作为数据会有创建时间、删除时间、更新时间，为了加快订单中某些字段的查询我们会做索引数据来帮助加快查询等，这些便是起辅助和支持性作用的数据，更多的是帮助系统构建使用到的，不被业务直接感知和使用。

事实数据

存在形式	举例	作用
业务字段	订单号、下单人、下单时间、单据状态…	交易记录、付款凭证

事实数据的规模是和其承载业务的复杂度、繁忙度是正相关的，两者的交织使得系统服务本身天生就是一个数据密集型的存在。

所谓复杂度就是把业务横切面来看，如果是一个UserInfo服务，涵盖的是查询、认证相关能力，支撑业务的模块版图就不大，所需要的存储结构相对就少，那么它的复杂度就是较低的，倘若换做成一个支付系统，复杂度就会提高非常多，订单、核销、履约、对账、渠道等等诸多环境和模块，那么底层所依赖的存储结构的子单元数量、关联关系都会增加。

所谓繁忙度就是把业务纵切面来看，代表业务的吞吐体量，一个县级别的农村合作社业务肯定比不过五大行，时间维度上数据的自然增长体量会有天壤之别。一个业务线上跑5年一张表存百万级数据和一个业务每小时存亿级数据的技术挑战、存储规格以及背后的数据检索、更新等捆绑要求是不可同日而语的。

辅助数据

存在形式	举例	作用
辅助字段	创建时间、更新时间…	辅助性、功能性记录
关系表	主外键映射关系表	解耦、关联
索引	MySQL二级索引、ES倒排索引	加快检索
日志	应用日志、操作日志…	便于追踪，排查问题

关于辅助数据的用途真的太多太多，它的呈现形式也是多种多样，即可以用来做技术优化，又可以用来做问题排查、辅助功能。

这里举一个例子，我们简单的写一个Query接口把它部署到运行环境中，一次简单请求串联和涉及了多少数据以及数据相关能力的支持呢？在微服务体系的架构中，首先要经过鉴权、链路、网格各类基础运维系统进行日志记录、链路追踪、染色路由等，当终于抵达目标业务系统时候必然要经过自身数据存储进行数据读取，这部分数据源还可能已经经过你的索引优化、数据层抽象关联等，还可能需要通过Http、RPC等协议再关联其他系统进行数据读取和关联，最终组装编排返回到上游呈现在顶层。

对比来看，如果事实数据的规模是1，那么辅助数据会是1*N，为了“更高、更快、更强”地支撑事实数据运转流通，需要诸多的辅助数据配合，这使得原本就足够数据密集的应用附带了更多的数据环绕进行加持，加剧了系统数据密集的规模和体量。

4. 数据使用场景有哪些

关于数据使用的场景一般而言，我们会分为OLAP和OLTP。

场景	侧重点
OLTP	偏向数据存储，强调事务性（ACID）、实时性
OLAP	偏向数据分析，强调计算、聚合、筛选、转换

OLTP

（On-Line Transaction Processing）联机事务处理

能够迅速、一致、交互地从各个方面观察信息，以达到深入理解数据的目的。它具有FASMI(Fast Analysis of Shared Multidimensional Information)，即共享多维信息的快速分析的特征。主要应用是传统关系型数据库。OLTP系统强调的是内存效率，实时性比较高。

OLAP

（On-Line Analytical Processing）联机分析处理

基本特征是前台接收的用户数据可以立即传送到计算中心进行处理，并在很短的时间内给出处理结果，是对用户操作快速响应的方式之一。应用在数据仓库，使用对象是决策者。OLAP系统强调的是数据分析，响应速度要求不高。

中医的治病的手段是“望、闻、问、切”，这是从事实出发、实践出真知的典范，技术方案的调研环节也应该有同等思维做储备和引导。OLAP和OLTP的划分，对于数据密集型下应用开发的方案判断选择是有很好指导意义的，能够让我们摒弃那些根本就不适合场景的蹩脚设计以及后续无穷无尽的“优化”，让我们选择正确的数据存储以及适合该场景的下技术方案进行演进，从“底层结构决定上层建筑”这一根本的开始就做好做对。

5. 数据组件的选择有哪些

核心存储：关系型数据库

一般来说，关系型数据库具备较为强大的对象结构与关系的描述能力，大部分时间我们选择使用MySQL、Oracle这些老牌产品进行核心业务的存储，它们是数据层存储的主力军，对于数据来说无非就是写入、查询两种操作，关系型数据组件的标配之一就是支持完整的事务性(ACID)，业务数据是核心，而完整记录和存储它是核心的核心，破坏数据的完整性其他功能将没有价值，因此数据存储都会抱紧关系型数据做数据层设计和展开。

加快查询：辅助索引

在项目实践中基本都有一个“读多写少”的共识，如何最快、多样化地检索到数据是每个系统搭建过程中的必经一课。搜索引擎一类数据组件提供的能力，而这些搜索引擎大部分加快查询的思路之一就是通过空间换时间提前存储目标数据以及结构加快特定查询诉求。

比如ES能够很好地弥补关系型数据库中条件筛选或模糊查询能力的不足，就是通过倒排索引的构建来完成的；还有我们在关系型数据库中也会使用到二级索引，增加特定字段的存储与关联，减少回表的检索路径，甚至进行覆盖索引以求达到最佳查询效率。

更快查询：内存

只要使用硬盘存储，都无法越过I/O读取这层屏障。更快的查询我们还可以选择使用应用内存、外部内存来加速我们的查询，从而获得更高的吞吐和性能。

Redis、Memcached可以让数据检索和更新从硬盘I/O级别读取能力提升到内存I/O级别，而应用级内存则比外部内存更进一步，抛开了协议通信和数据交换，更快一步。但是需要明确的是，好的东西都很稀缺，内存资源是成本相对宝贵的，只适合那些短小精悍的数据内容，需要我们把好钢用在刀刃上，而且我们需要不能光聚焦在SLA的提升还需要考虑ROI，比如你的数据就存储在硬盘上，服务查询响应时间是100ms，吞吐量也足够满足业务需求，即使提升到5ms对业务也没有任何增长作用，但是却需要投入资源开发改造，徒然提高成本，这便有些偏离初衷了。

数据通道：消息队列

消息队列是高并发、大数据环境下很好的产物，它给系统交互增加了一层Buffer，这层缓冲可以让不相关的系统实现交互的解耦，提供异步重试能力，能够有效限制流速等等，让服务在构建过程中更具有伸缩性、扩展性。出镜率较高的有应用层开发涉及的RocketMQ和数据层涉及的Kafka等。

聚合计算：列式存储

长久以来，数据存储的先入为主的都是以行式结构进行存储，因为通过主键或者辅助索引关联查询到后就可以拿到这一行数据记录，读取效率很高。随着大数据化，对数据分析的诉求日益增多已经成为常态，不光光是单纯的检索出原始数据行，而是要条件筛选然后进行聚合完成统计工作，这种场景下行式存储就显得有些笨拙，比如表里存了用户的年龄，现在要统计所有用户的平均年龄，那么需要把所有行数据都检索出来，而且不需要统计的行内其他字段也需要通过I/O读取出来定位到需要的年龄字段后一个个缓存下来，然后把所有的年龄字段计算好返回结果，这个过程中大量不必要的I/O读取非常浪费资源。

而列式存储就是为了适配这种统计场景应运而生的产物，在数据存储上得天独厚
的优势给这个系列的数据组件产品能够在较短响应时间内返回统计结果，代表性产品如Clickhouse。

6. 数据视角，拥抱业务

系统构建本身是冰冷的，而参与构建它的人是有温度的。如果系统可以规划为三层，那么系统建造者的自我演化也可以划分为三个阶段，分别是新生期、进阶期、高能期。

『新生期』当步入程序世界的第一步，大部分甚至所有人都是在接触某一种编程语言，然后开始学习和探究语言特性以及它生态所衍生的框架和周边，大部分工作在Coding，模仿学习和实践是提升自身技能的主要方式，能力和视角主要还是聚焦在功能开发，通过编码实现原始价值。
『进阶期』逐渐地，随着对业务工作使然的被动了解或自驱力主动的熟悉，加上频繁地实践中试错开始有一些中层设计能力，能够很好地履行功能集合模块化的交付和输出，甚至可以协作或帮助其他伙伴完成工作任务，技术上有一定积累经验，团队中有一定感染和带动能力，通过协作发挥团队价值。
『高能期』人的上限是不可估量的，暂且把这个阶段描述为高能期。这阶段的系统建造者会更聚焦业务，从系统细节的一砖一瓦而来，经过迭代风暴的洗礼，已经练就了完备的技术能力，开始回到系统开始的地方，关注业务动态，做与之适配的技术规划和导引，甚至可以通过技术驱动业务更上一个台阶。

如何成为高能期的系统建造者呢？请关注与你息息相关的业务，业务让技术有价值。

如何去关注业务呢？请你拥有数据视角，数据让业务有方向。

 以上便是本章的全部内容，如果觉得有所收获，欢迎 『点赞』、『收藏』、『关注』 一键三连支持喔~

你可能感兴趣的:(数据密集型系统搭建,数据库,系统架构,数据仓库,大数据)

为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
《分片终章的哈希裂痕：藏在数据拼接里的隐形逻辑》前端
在大文件分片传输里，有一个令人费解的现象：当所有分片的校验都显示正常，拼接后的整体文件却与源文件的哈希值不符，而问题往往精准地指向最后一片。这并非偶然的技术故障，而是数据传输链条中多重隐形逻辑交织的必然结果，如同钟表的齿轮在最后一圈突然出现难以察觉的错位。文件被切割成固定大小的分片时，最后一片往往是规则的例外。它如同拼图中形状特异的收尾piece，尺寸可能小于其他分片，却承担着衔接整体的关键作用。
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Cesium加载各类数据总结 zhu_zhu_xia cesium JavaScript javascript
接触到的加载数据类型：源地图、shp、Geojson、png、wms、地形底图一.Cesium加载各类底图#此类加载的本质在于newCesium.ImageryProvider()Apidefination：“Providesimagerytobedisplayedonthesurfaceofanellipsoid.Thistypedescribesaninterfaceandisnotinten
vue keep-alive标签的运用
keep-alive，想必大家都不会很陌生，在一些选项卡中会使用到。其实，它的作用大概就是把组件的数据给缓存起来。比如果我有一个选项卡，标签一，标签二，标签三。现在，我需要实现，当我在标签一的表单中输入内容后，点击标签二，再回到标签一，表单的内容依然存在。如果按以往的做法，不使用keep-alive，那是不能实现的。然而，我们只需要在选项卡的内容最外层包一个keep-alive标签即可。但这儿有一
Redis Sentinel（哨兵）和 Redis Cluster（集群） G丶AEOM 八股普通学习区 Redis redis 数据库缓存
哨兵机制和集群有什么区别Redis集群主要有两种，一种是RedisSentinel哨兵集群，一种是RedisCluster。主从集群，包括一个Master和多个Slave节点，Master负责数据的读写，Slave负责数据的读取，Master上收到的数据变更会同步到Slave节点上实现数据同步，但不提供容错和恢复，在Master宕机时不会选出新的Master，导致后续客户端所有写请求直接失败。所以
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Linux/Centos7离线安装并配置MySQL 5.7 有事开摆无事百杜同学 LInux/CentOS7 linux mysql 运维
Linux/Centos7离线安装并配置MySQL5.7超详细教程一、环境准备1.下载MySQL5.7离线包2.使用rpm工具卸载MariaDB（避免冲突）3.创建系统级别的MySQL专用用户二、安装与配置1.解压并重命名MySQL目录2.创建数据目录和配置文件3.设置目录权限4.初始化MySQL5.配置启动脚本6.配置环境变量三、启动与验证1.启动MySQL服务2.获取初始密码3.登录并修改密码
Linux操作系统磁盘管理 CZZDg linux 运维服务器
目录一.硬盘介绍1.硬盘的物理结构2.CHS编号3.磁盘存储划分4.开机流程5.要点6.磁盘存储数据的形式二.Linux文件系统1.根文件系统2.虚拟文件系统3.真文件系统4.伪文件系统三.磁盘分区与挂载1.磁盘分区方式2.分区命令3.查看与识别命令4.格式化命令5.挂载命令四.LVM逻辑卷1.概述2.管理命令五.磁盘配额1.概述usrquota:支持对用户的磁盘配额grpquota：支持对组的磁
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
玩转Docker | 使用Docker部署gopeed下载工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署gopeed下载工具前言一、gopeed介绍Gopeed简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署gopeed服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问gopeed应用五、测试与下载六、总结前言在当今信息爆炸的时代，高效地获取和管理网络资源变得尤为重要。无论是下载大型文件还是进行日常的数据传输，一个稳
UNIX域套接字
1、UNIX域套接字的定义UNIX域套接字是进程间通信（IPC）的一种方式，不涉及网络协议栈，因此在同一台主机上的通信中，它比基于TCP/IP协议的网络套接字更快速、更高效。2、UNIX域套接字的分类字节流套接字（SOCK_STREAM）：提供面向连接的、可靠的数据传输服务。数据报套接字（SOCK_DGRAM）：提供无连接的数据传输服务，数据以独立的数据报形式传输。3、UNIX套接字与TCP/IP
【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
“Datawhale AI夏令营”基于带货视频评论的用户洞察挑战赛 fzyz123 Datawhale AI夏令营人工智能 Datawhale 大模型技术 NLP 深度学习 AI夏令营
前言：本次是DatawhaleAI夏令营2025年第一期的内容，赛事是：基于带货视频评论的用户洞察挑战赛（科大讯飞AI大赛）一、赛事背景在直播电商爆发式增长浪潮中，短视频平台积累的海量带货视频及用户评论数据蕴含巨大商业价值。这些数据不仅是消费者体验的直接反馈，更是驱动品牌决策的关键资产。用户洞察的核心在于视频内容与评论数据的联合挖掘：通过智能识别推广商品分析评论中的情感表达与观点聚合精准捕捉消费者
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name