csdn大数据

如何学习分布式系统？一文全Get！

本文来自作者在GitChat（ID：GitChat_Club）上分享「如何学习分布式系统？」，CSDN独家合作发布。

分布式系统在互联网公司中的应用已经非常普遍，开源软件层出不穷。hadoop生态系统，从hdfs到hbase，从mapreduce到spark，从storm到spark streaming, heron, flink等等，如何在开源的汪洋中不会迷失自己？本文将从基本概念、架构并结合自己学习工作中的感悟，阐述如何学习分布式系统。由于分布式系统理论体系非常庞大，知识面非常广博，笔者能力有限，不足之处，欢迎讨论交流。

常见的分布式系统分为数据存储系统如hdfs，hbase；数据处理计算系统如storm、spark、flink；数据存储兼分析混合系统，这类系统在数据存储的基础上提供了复杂的数据搜索查询功能，如elastic search、druid。对于存储兼计算的系统，我们仍然可以分开分析，所以本文会从数据存储和计算两种系统来论述。

文章的大致结构：第一部分，分布式系统的基本概念；第二、三部分分别详细论述数据存储和数据计算系统；最后一部分总结。

概念

分布式系统：每个人都在提分布式系统，那么什么是分布式系统？其基本概念就是组件分布在网络计算机上，组件之间仅仅通过消息传递来通信并协调行动。

A distributed system is one in which components located at networked computers communicate and coordinate their actions only by passing messages. （摘自分布式系统概念和设计）

节点：节点可以理解为上述概念提到的组件，其实完成一组完整逻辑的程序个体，对应于server上的一个独立进程。一提到节点，就会考虑节点是有状态还是无状态的？判断标准很简单，该独立节点是否维护着本地存储的一些状态信息，或者节点是不是可以随时迁移到其他server上而保持节点的行为和以前一致，如果是的话，则该节点是无状态，否则是有状态的。

异常：异常处理可以说是分布式系统的核心问题，那么分布式异常处理相对于单机来说，有什么不同呢？在单机系统中，对于程序的处理结果是可以预知的，要么成功，要么失败，结果很明确。可在分布式环境中，处理结果除了明确返回成功或失败，还有另外一种状态：超时，那超时意味着处理结果完全不确定，有可能成功执行，也有可能执行失败，也有可能根本没执行，这给系统开发带来了很大的难度。其实各种各样的分布式协议就是保证系统在各种异常情形下仍能正常的工作，所以在学习分布式系统时，要着重看一下文档异常处理fault-tolerance章节。

CAP理论：学习分布式系统中需要重要理解的理论，同时在架构设计中也可以用到这个理论，例如在一些情形下我们可以通过降低一致性来提高系统的可用性，将数据的每次数据库更新操作变成批量操作就是典型的例子。

CAP理论，三个字母代表了系统中三个相互矛盾的属性：

C（Consistency）：强一致性，保证数据中的数据完全一致；
A（Available）：在系统异常时，仍然可以提供服务，注：这儿的可用性，一方面要求系统可以正常的运行返回结果，另一方面同样对响应速度有一定的保障；
P（Tolerance to the partition of network ）：既然是分布式系统，很多组件都是部署在不同的server中，通过网络通信协调工作，这就要求在某些节点服发生网络分区异常，系统仍然可以正常工作。

CAP 理论指出，无法设计一种分布式协议同时完全具备CAP属性。

从以上CAP的概念我们得出一个结论，在技术选型时，根据你的需求来判断是需要AP高可用性的系统（容忍返回不一致的数据）还是CP强一致性的系统，或者根据系统提供的参数在AC之间权衡。（可能会有读者会问，为什么一定需要P呢？既然是分布式系统，在网络分区异常情况下仍然正常提供服务是必须的。）

数据存储系统

当数据量太大以及已经超过单机所能处理的极限时，就需要使用到数据存储分布式系统。无论是选择开源系统还是自己设计，第一个要考虑的问题就是数据如何分布式化。

数据分布方式

哈希方式：哈希方式是最常见的数据分布方式。可以简单想象有一个大的hash表，其中每个桶对应的一台存储服务器，每条数据通过某种方式计算出其hash值分配到对应的桶中。 int serverId = data.hashcode % serverTotalNum 上面只是一个简单的计算公式示例，通过这种方式就可以将数据分配到不同的服务器上。

优点：不需要存储数据和server映射关系的meta信息，只需记录serverId和server ip映射关系即可。
缺点：可扩展性不高，当集群规模需要扩展时，集群中所有的数据需要迁移，即使在最优情况下——集群规模成倍扩展，仍然需要迁移集群一半的数据（这个问题有时间可以考虑一下，为啥只需要迁移一半？）；另一个问题：数据通过某种hash计算后都落在某台服务器上，造成数据倾斜（data skew）问题。
应用例子：ElasticSearch数据分布就是hash方式，根据routingId取模映射到对应到不同node上。

数据范围分布：将数据的某个特征值按照值域分为不同区间。比如按时间、区间分割，不同时间范围划分到不同server上。

优点：数据区间可以自由分割，当出现数据倾斜时，即某一个区间的数据量非常大，则可以将该区间split然后将数据进行重分配；集群方便扩展，当添加新的节点，只需将数据量多的节点数据迁移到新节点即可。
缺点：需要存储大量的元信息（数据区间和server的对应关系）。
应用例子：Hbase的数据分布则是利用data的rowkey进行区间划分到不同的region server，而且支持region的split。

数据量分布：按数据量分布，可以考虑一个简单例子：当使用log文件记录一些系统运行的日志信息时，当日志文件达到一定大小，就会生成新的文件开始记录后续的日志信息。这样的存储方式和数据的特征类型没有关系，可以理解成将一个大的文件分成固定大小的多个block。

优点：不会有数据倾斜的问题，而且数据迁移时速度非常快（因为一个文件由多个block组成，block在不同的server上，迁移一个文件可以多个server并行复制这些block）。
缺点：需要存储大量的meta信息（文件和block的对应关系，block和server的对应关系）。
应用例子：Hdfs的文件存储按数据量block分布。

一致性哈希：前文刚提到的哈希方式，当添加删除节点时候，所有节点都会参与到数据的迁移，整个集群都会受到影响。那么一致性哈希可以很好的解决这个问题。一致性哈希和哈希的数据分布方式大概一致，唯一不同的是一致性哈希hash的值域是个环。

优点：集群可扩展性好，当增加删除节点，只影响相邻的数据节点。
缺点：上面的优点同时也是缺点，当一个节点挂掉时，将压力全部转移到相邻节点，有可能将相邻节点压垮。
应用例子：Cassandra数据分布使用的是一致性hash，只不过使用的是一致性hash改良版：虚拟节点的一致性hash（有兴趣的可以研究下）。

讨论完数据分布问题，接下来该考虑如何解决当某个节点服务不可达的时候系统仍然可以正常工作（分布式系统CAP中网络分区异常问题）？这个问题的解决方案说起来很简单，就是将数据的存储增加多个副本，而且分布在不同的节点上，当某个节点挂掉的时候，可以从其他数据副本读取。

引入多个副本后，引来了一系列问题：多个副本之间，读取时以哪个副本的数据为准呢，更新时什么才算更新成功，是所有副本都更新成功还是部分副本更新成功即可认为更新成功？这些问题其实就是CAP理论中可用性和一致性的问题。其中primary-secondary副本控制模型则是解决这类问题行之有效的方法。

primary-secondary控制模型

主从（primary-secondary ）模型是一种常见的副本更新读取模型，这种模型相对来说简单，所有的副本相关控制都由中心节点控制，数据的并发修改同样都由主节点控制，这样问题就可以简化成单机问题，极大的简化系统复杂性。

注：常用的副本更新读取架构有两种：主从（primary-secondary）和去中心化（decentralized）结构，其中主从结构较为常见，而去中心化结构常采用paxos、raft、vector time等协议，这里由于本人能力有限，就不再这儿叙述了，有兴趣可以自己学习，欢迎补充。

其中涉及到主从副本操作有以下几种：

副本的更新

副本更新基本流程：数据更新操作发到primary节点，由primary将数据更新操作同步到其他secondary副本，根据其他副本的同步结果返回客户端响应。各类数据存储分布式系统的副本更新操作流程大体是一样的，唯一不同的是primary副本更新操作完成后响应客户端时机的不同，这与系统可用性和一致性要求密切相关。

以mysql的master slave简单说明下，通常情况下，mysql的更新只需要master更新成功即可响应客户端，slave可以通过binlog慢慢同步，这种情形读取slave会有一定的延迟，一致性相对较弱，但是系统的可用性有了保证；另一种slave更新策略，数据的更新操作不仅要求master更新成功，同时要求slave也要更新成功，primary和secondray数据保持同步，系统保证强一致性，但可用性相对较差，响应时间变长。

上述的例子只有两个副本，如果要求强一致性，所有副本都更新完成才认为更新成功，响应时间相对来说也可以接受，但是如果副本数更多，有没有什么方法在保证一定一致性同时满足一定的可用性呢？这时就需要考虑Quorum协议，其理论可以用一个简单的数学问题来说明：

有N个副本，其中在更新时有W个副本更新成功，那我们读取R个副本，W、R在满足什么条件下保证我们读取的R个副本一定有一个副本是最新数据（假设副本都有一个版本号，版本号大的即为最新数据）？

问题的答案是：W+R > N (有兴趣的可以思考下)

通过quorum协议，在保证一定的可用性同时又保证一定的一致性的情形下，设置副本更新成功数为总副本数的一半（即N/2+1）性价比最高。（看到这儿有没有想明白为什么zookeeper server数最好为基数个？）

副本的读取

副本的读取策略和一致性的选择有关，如果需要强一致性，我们可以只从primary副本读取，如果需要最终一致性，可以从secondary副本读取结果，如果需要读取最新数据，则按照quorum协议要求，读取相应的副本数。

副本的切换

当系统中某个副本不可用时，需要从剩余的副本之中选取一个作为primary副本来保证后续系统的正常执行。这儿涉及到两个问题：

副本状态的确定以及防止brain split问题：一般方法是利用zookeeper中的sesstion以及临时节点，其基本原理则是lease协议和定期heartbeat。Lease协议可以简单理解成参与双方达成一个承诺，针对zookeeper，这个承诺就是在session有效时间内，我认为你的节点状态是活的是可用的，如果发生session timeout，认为副本所在的服务已经不可用，无论误判还是服务真的宕掉了，通过这种机制可以防止脑裂的发生。但这样会引起另外一个问题：当在session timeout期间，primary 副本服务挂掉了，这样会造成一段时间内的服务不可用。
primary副本的确定：这个问题和副本读取最新数据其实是一个问题，可以利用quoram以及全局版本号确定primary副本。zookeeper在leader选举的过程中其实利用了quoram以及全局事务id——zxid确定primary副本。

存储架构模型

关于数据的分布和副本的模型这些细节问题已经详细叙述，那么从系统整体架构来看，数据存储的一般流程和主要模块都有哪些呢？从元数据存储以及节点之间的membership管理方面来看，主要分以下两类：

中心化的节点membership管理架构

这类系统主要分为三个模块：client模块，负责用户和系统内部模块的通信；master节点模块，负责元数据的存储以及节点健康状态的管理；data节点模块，用于数据的存储和数据查询返回。

数据的查询流程通常分两步：1. 向master节点查询数据对应的节点信息；2. 根据返回的节点信息连接对应节点，返回相应的数据。

分析一下目前常见的数据存储系统，从hdfs，hbase再到Elastic Search，通过与上述通用系统对比，发现：master节点模块具体对应hdfs的namenode、hbase的hMaster、Elastic Search的master节点；data节点对应hdfs的datanode、hbase的region server、Elastic Search的data node。

去中心化的节点membership管理架构

与上一模型比较，其最大的变化就是该架构中不存在任何master节点，系统中的每个节点可以做类似master的任务：存储系统元信息以及管理集群节点。

数据的查询方式也有所不同，client可以访问系统中的任意节点，而不再局限于master节点，具体查询流程如下：1. 查询系统中任意节点，如果该数据在此节点上则返回相应的数据，如果不在该节点，则返回对应数据的节点地址，执行第二步；2. 获得数据对应的地址后向相关请求数据。

节点之间共享状态信息是如何做到的呢？常用的方法是使用如gossip的协议以及在此基础之上开发的serf框架，感兴趣的话可以参考redis cluster 和 consul实现。

数据计算处理系统

常用的数据计算主要分为离线批量计算，可以是实时计算，也可以是准实时mini-batch计算，虽然开源的系统很多，且每个系统都有其侧重点，但有些问题却是共性相通的。

数据投递策略

在数据处理中首先要考虑一个问题，我们的数据记录在系统中会被处理几次（包括正常情形和异常情形）：

at most once：数据处理最多一次，这种语义在异常情况下会有数据丢失；
at least once：数据处理最少一次，这种语义会造成数据的重复；
exactly once：数据只处理一次，这种语义支持是最复杂的，要想完成这一目标需要在数据处理的各个环节做到保障。

如何做到exactly once，需要在数据处理各个阶段做些保证：

数据接收：由不同的数据源保证。
数据传输：数据传输可以保证exactly once。
数据输出：根据数据输出的类型确定，如果数据的输出操作对于同样的数据输入保证幂等性，这样就很简单（比如可以把kafka的offset作为输出mysql的id），如果不是，要提供额外的分布式事务机制如两阶段提交等等。

异常任务的处理

异常处理相对数据存储系统来说简单很多，因为数据计算的节点都是无状态的，只要启动任务副本即可。

注意：异常任务除了那些失败、超时的任务，还有一类特殊任务——straggler（拖后腿）任务，一个大的Job会分成多个小task并发执行，发现某一个任务比同类型的其他任务执行要慢很多（忽略数据倾斜导致执行速度慢的因素）。

其中任务恢复策略有以下几种：

简单暴力，重启任务重新计算相关数据，典型应用：storm，当某个数据执行超时或失败，则将该数据从源头开始在拓扑中重新计算。
根据checkpoint重试出错的任务，典型应用：mapreduce，一个完整的数据处理是分多个阶段完成的，每个阶段（map 或者reduce）的输出结果都会保存到相应的存储中，只要重启任务重新读取上一阶段的输出结果即可继续开始运行，不必从开始重新执行该任务。

背压——Backpressure

在数据处理中，经常会担心这样一个问题：数据处理的上游消费数据速度太快，会不会压垮下游数据输出端如mysql等。通常的解决方案：上线前期我们会做详细的测试，评估数据下游系统承受的最大压力，然后对数据上游进行限流的配置，比如限制每秒最多消费多少数据。其实这是一个常见的问题，现在各个实时数据处理系统都提供了背压的功能，包括spark streaming、storm等，当下游的数据处理速度过慢，系统会自动降低上游数据的消费速度。

对背压感兴趣朋友们，或者有想法自己实现一套数据处理系统，可以参考Reactive Stream，该项目对通用数据处理提供了一种规范，采用这种规范比较有名的是akka。

数据处理通用架构

数据处理的架构大抵是相似的，通常包含以下几个模块：

client：负责计算任务的提交。
scheduler ：计算任务的生成和计算资源的调度，同时还包含计算任务运行状况的监控和异常任务的重启。
worker：计算任务会分成很多小的task， worker负责这些小task的执行同时向scheduler汇报当前node可用资源及task的执行状况。

上图是通用的架构模型图，有些人会问这是hadoop v1版本的mapreduce计算框架图，现在都已经yarn模式的新的计算框架图，谁还用这种模式？哈哈，说的对，但是现在仍然有些处理框架就是这种模型————storm。

不妨把图上的一些概念和storm的概念映射起来：Job tracker 对应于 nimbus，task tracker 对应于 supervisor，每台supervisor 同样要配置worker slot，worker对应于storm中的worker。这样一对比，是不是就觉得一样了？

这种框架模型有它的问题，责任不明确，每个模块干着多样工作。例如Job tracker不仅要监控任务的执行状态，还要负责任务的调度。TaskTracker也同样，不仅要监控task的状态、执行，同样还要监控节点资源的使用。

针对以上问题，基于yarn模式的新的处理架构模型，将任务执行状态的监控和任务资源的调度分开。原来的Job tracker分为resource manger 负责资源的调度，任务执行的监控则交给每个appMaster来负责，原来的task tracker，变为了node manager，负责资源的监控和task的启动，而task的执行状态和异常处理则交给appMaster处理。

同样的，twitter 根据storm架构方面的一些问题，推出了新的处理框架heron，其解决的问题也是将任务的调度和任务的执行状态监控责任分离，引入了新的概念Topology Master，类似于这儿的appMaster。

总结

分布式系统涵盖的内容非常多，本篇文章主要从整体架构以及概念上介绍如何入门，学习过程有一些共性的问题，在这儿总结一下：

先分析该系统是数据存储还是计算系统。
如果是数据存储系统，从数据分布和副本策略开始入手；如果是数据处理问题，从数据投递策略入手。
读对应系统架构图，对应着常用的架构模型，每个组件和已有的系统进行类比，想一下这个组件类似于hdfs的namenode等等，最后在脑海里梳理下数据流的整个流程。
在了解了系统的大概，着重看下文档中fault tolerence章节，看系统如何容错，或者自己可以预先问些问题，比如如果一个节点挂了、一个任务挂了系统是如何处理这些异常的，带着问题看文档。
文档详细读了一遍，就可以按照官方文档写些hello world的例子了，详细查看下系统配置项，随着工作的深入就可以看些系统的细节和关键源码了。

这次分享的文章内容就这么多，中间难免有些纰漏，有任何问题欢迎随时指正交流，大家共同进步，谢谢大家。

作者：李峰，高级工程师，目前就职于LogicMonitor（提供SaaS服务监控平台，每天采集监控数据上百亿条），从事数据处理平台架构，专注于分布式存储流式计算。点击阅读原文查看交流实录。

你可能感兴趣的:(如何学习分布式系统？一文全Get！)

brew java 切换_Java jdk11 在Mac上的安装和配置以及JDK多个版本之间切换 weixin_39570838 brew java 切换
1、JDK11安装1)下载JDK11wgethttps://download.java.net/java/GA/jdk11/13/GPL/openjdk-11.0.1_osx-x64_bin.tar.gz2)解压安装包(系统中默认安装位置：/Library/Java/JavaVirtualMachines/)sudotar-zxfopenjdk-11.0.1_osx-x64_bin.tar.gz-
Mammoth.js 使用详解啃火龙果的兔子开发DEMO 前端 javascript
Mammoth.js使用详解Mammoth.js是一个用于将Word文档（.docx）转换为HTML或Markdown的JavaScript库，支持浏览器和Node.js环境。安装浏览器环境Node.js环境npminstallmammoth#或yarnaddmammoth基本使用1.将DOCX转换为HTML//浏览器中使用input[type=file]获取文件document.getEleme
Android开发中的函数式编程应用：什么是函数式编程
我们进行了多年的Android开发，但是面对越来越复杂的业务逻辑和越来越庞大的代码，传统命令式的编程方式已经渐渐无法解决我们的问题了。今天开始我们将探索一种非常强大的编程范式：函数式编程。1.传统编程范式的挑战1.1过程式编程的难题大家日常开发中一定遇到过这些问题：1.1.1返回值不确定//全局计数器变量varcounter=0//返回值依赖于外部状态，每次调用结果不同fungetNextId()
threejs的transformControls拖拽结束的异常
transformControls拖拽结束以后会以结束点的射线拾取重新选中新的模型，这里发现是监听事件的问题//创建TransformControlsconsttransformControls=newTransformControls(camera,renderer.domElement);consttransformControlsHelper=transformControls.getHel
小程序领域设计中的用户体验优化小程序开发2020 小程序 ux ai
小程序领域设计中的用户体验优化：从"用得上"到"用得爽"的进阶指南关键词：小程序设计、用户体验优化、交互流畅性、性能调优、用户行为分析摘要：本文以"用户体验优化"为核心，结合小程序的特性与用户真实使用场景，系统讲解从性能加速到交互设计的全链路优化方法。通过生活案例类比、技术原理拆解与实战代码演示，帮助开发者/设计师理解"用户体验"的底层逻辑，掌握可落地的优化技巧，最终实现小程序从"能用"到"好用"
一个实例用全创建型模式-优化（冗余消除）科学的发展-只不过是读大自然写的代码 #c++ubuntu开发 java 算法前端
1.关联链接上一篇：一个实例用全创建型模式-CSDN博客目录：《一个实例讲完23种设计模式》2.内容当前：单件+抽象工厂+创建者+工厂方法+优化需求：坦克大战创建两种坦克坦克类型射程速度b7070米时/70公里b5050米时/50公里设计说明1.抽象工厂承担了创建部件的任务2.创建者承担了将部件组装的任务3.工厂方法类相当于创建者模式的导演，但是他是并未给用户提供选择创建者的接口。而是通过自己的多
linux-权限管理
linux-权限管理一、权限的基本类型二、权限的表示方式1.字符形式（rwx）2.数字形式三、权限管理常用命令1.chmod2.chown3.chgrp四、隐藏权限1.lsattr2.chattr五、权限掩码六、特别权限位1.suid2.sgid3.StickyBit七、权限委托1.授权用户2.授权组里的用户3.使用命令别名授权八、ACL1.getfacl2.setfacl总结一、权限的基本类型读
展锐平台(Android15)WLAN热点名称修改不生效问题分析
前言在展锐AndroidV项目开发中，需要修改softAp/P2P热点名称时，发现集成GMS后直接修改framework层代码无效。具体表现为：修改packages/modules/Wifi/WifiApConfigStore中的getDefaultApConfiguration方法编译烧录后修改不生效问题根源在于：Wi-Fi模块在AndroidS(12)及以上版本已纳入Mainline模块Mai
第二十六：Fiddler抓包-抓取Android7.0以上的Https包(一)-root手机+低版本安卓7.0以下+targetSdkVersion设置为23+设置信任用户证书卢卡平头哥 Fiddler fiddler https android
一.简介1.假如设备是android7.0+的系统同时应用设targetSdkVersion>=24的话那么应用默认是不信任安装的Fiddler用户证书的所以你就没法抓到应用发起的https请求然后你在Fiddler就会看到一堆200HTTPTunneltoxxx.xxx.xxx:443的请求日志这些都是没有成功抓取的https请求
FastAPI依赖注入：构建高可维护API的核心理念与实战源滚滚AI编程 fastapi log4j
依赖注入（DependencyInjection,DI）作为FastAPI的核心设计模式，通过解耦组件依赖关系、提升代码复用性和可测试性，已成为现代API开发的基石。本文将深入解析其工作原理、高级特性及企业级应用场景。一、依赖注入的核心价值解耦与模块化将数据库连接、认证逻辑等基础设施与业务逻辑分离，避免代码冗余。示例：路由函数无需手动创建数据库连接，通过Depends(get_db)自动注入[ci
一文详解：使用HTTPS有哪些优势？ JoySSL303 https 网络协议 http ssl 网络
互联网发展到今天，HTTP协议的明文传输会让用户存在非常大的安全隐患。试想一下，假如你在一个HTTP协议的网站上面购物，你需要在页面上输入你的银行卡号和密码，然后你把数据提交到服务器实现购买。假如这个环节稍有不慎，你的传输数据被第三者给截获了，由于HTTP明文数据传输的原因，你的银行卡号和密码，将会被这个截获人所得到。现在你还敢在一个HTTP的网站上面购物吗？你还会在一个HTTP的网站上面留下你的
AI+区块链：代购系统如何破解碳足迹追踪“数据黑箱”？
绿色电商趋势：代购系统如何实现碳足迹追踪与可持续物流？在全球气候危机与可持续发展目标的双重驱动下，绿色电商正从概念走向实践。作为跨境电商的核心环节，代购系统如何通过技术创新实现碳足迹追踪与可持续物流，成为行业突破增长瓶颈、构建差异化竞争力的关键。本文结合技术架构、行业实践与未来趋势，解析代购系统在绿色转型中的路径选择。一、碳足迹追踪：从数据孤岛到全链路透明1.技术架构：区块链+IoT构建可信数据链
[晕事]今天做了件晕事83: pen test mzhan017 英语学习笔记晕事英语学习
这个缩写，就不能顾名思义了，而且pen是一个独立的单词，从读音上来说还容易和pain混淆，所以导致初接触者有些困扰。所以这个pentest的缩写，有些失败。全写是penetrationtest：渗透测试。https://en.wikipedia.org/wiki/Penetration_test修改建议是改成penetest，至少可以和pen在书写上区分，在读音是也可以区分，就读“排你test”。
探秘阿里云消息队列：解锁分布式系统的异步通信奥秘云资源服务商阿里云云计算中间件
阿里云消息队列：分布式架构的基石在当今数字化快速发展的时代，分布式系统已成为企业构建高可用、高性能应用的关键架构。而消息队列，作为分布式系统中的重要组件，犹如基石一般，支撑着整个架构的稳定运行。它能够有效地解决分布式系统中的异步通信、解耦、削峰填谷等问题，为系统的可靠性和扩展性提供了强大的保障。阿里云作为云计算领域的领军者，其推出的阿里云消息队列凭借着卓越的性能、高可靠性以及丰富的功能，成为了众多
一文搞懂 Cursor 内部工作原理~ zz_jesse
介绍了Cursor，一个结合了AI技术的代码编辑器，它通过深度学习和语义索引的方式，提升了开发者的工作效率。Cursor通过与VSCode相似的界面和功能，以及自己的AI特性，实现了代码的智能化编辑和错误检查。译文从这开始～～你可能已经看到新闻：OpenAI正以高达30亿美元的价格收购Windsurf！与此同时，Cursor的母公司Anysphere也正在以90亿美元估值融资9亿美元！这对于代码生
数字化时代练歌神器：卡拉OK点唱机应用全解析
本文还有配套的精品资源，点击获取简介：卡拉OK点唱机是一款专为音乐爱好者和练歌者设计的软件，提供网络点播、音轨分离、音调调整、评分系统、回放功能和歌词同步显示等辅助功能，帮助用户随时随地进行歌唱练习，提升演唱技巧。高级版本还提供专业音效处理功能，使得卡拉OK点唱机成为业余爱好者和专业歌手的理想训练工具。1.网络点播功能的实现与应用网络点播功能改变了我们获取媒体内容的方式，赋予了用户前所未有的主动性
MAXCC可编程中控集成音频处理器功能全解析 geffen1688 中控主机 3d web3 css3 avs3
格芬MAXCC可编程中控集成音频处理器功能全解析一、技术架构与核心功能格芬MAXCC可编程中控矩阵一体机（如GF-MIXCC系列）通过高度集成化设计，将中控系统、音频矩阵、视频矩阵及环境控制功能融为一体，其音频处理能力尤为突出：音频矩阵与混音功能8进8出音频矩阵：支持Dante网络音频传输，采样率达24bit/48KHz，配备高性能A/DD/A转换器和32-bit浮点DSP处理器，确保音频信号的高
kylin安装docker
1.前言本文详细介绍如何在kylinv10上安装docker。系统环境如下：dockder:20.10.7linuxos:kylinv10(GFB)linuxkernel:4.19.90-52.23.v2207.gfb01.ky10.aarch642.安装docker2.1.下载docker二进制包wgethttps://mirror.nju.edu.cn/docker-ce/linux/stat
win7查找计算机图片,win7系统全盘搜索图片的操作方法闫泽华 win7查找计算机图片
很多小伙伴都遇到过对win7系统全盘搜索图片进行设置的困惑吧，一些朋友看过网上对win7系统全盘搜索图片设置的零散处理方法，并没有完完全全明白win7系统全盘搜索图片是如何设置的，今天小编准备了简单的操作办法，只需要按照1.在win7系统中打开电脑，点击桌面上的【计算机】；2.打开计算机文件夹后，在右上角搜索计算机框中，会出现3种格式，类型、修改日期、大小，一般找图片都是选择类型，点击【类型】；的
鲲鹏麒麟离线安装Docker angushine docker
服务器信息[root@testinstall]#cat/etc/kylin-releaseKylinLinuxAdvancedServerreleaseV10(Tercel)下载安装包访问https://download.docker.com/linux/static/stable/aarch64/找到合适的版本，这里采用18.09.9这个版本访问如下链接下载安装包wgethttps://down
ClickHouse高频面试题野老杂谈数据库
ClickHouse高频面试题1、简单介绍一下ClickHouse2、ClickHouse具有哪些特点3、ClickHouse作为一款高性能OLAP数据库，存在哪些不足4、ClickHouse有哪些表引擎5、介绍下Log系列表引擎应用场景共性特点不支持6、简单介绍下MergeTree系列引擎7、简单介绍下外部集成表引擎ODBCJDBCMySQLHDFSKafkaRabbitMQ8、ClickHou
AJAX（一）版本兼容性、XHR请求、GET 还是 POST？async= True 或 False？
AJAX（一）版本兼容性、XHR请求、GET还是POST？async=True或False？文章目录AJAX（一）版本兼容性、XHR请求、GET还是POST？async=True或False？1.AJAX简介什么是AJAX？AJAX工作原理AJAX是基于现有的Internet标准2.创建XMLHttpRequest对象（兼容性）3.向服务器发送请求（XHR请求）GET还是POST？GET请求(UR
Qt导入ui文件的方法百口可乐__ Qt-qt ui 开发语言
1.首先对项目Test_0右键点击，添加现有文件。选择要添加的新的Design_5.ui文件。导入新的ui文件。2.打开Test_0.pro文件，会有以下形式的代码，确保其中有导入的ui文件Design_5.ui。FORMS+=a.ui\b.ui\...Design_5.ui确保Test_0.pro文件中有以下代码，用于生成"ui_xxx.h"文件。QT+=widgets3.点击构建，执行qmak
C语言—-数据的输入输出，printf，putchar，puts，scanf，getchar函数的使用及区别老虎0627 C语言 c语言开发语言
数据的输入C程序中实现输入的函数很多，下面逐个来进行介绍用printf函数输出数据printf函数的一般格式printf（“格式控制”，输出列表）；例如#includeintmain(){inta=1;printf("a=%d\n"
java使用iText导出pdf添加页眉，并设置图片
PdfWriterpdfWriter;Documentdocument;publicExportPDF(Filefile){document=newDocument();//建立一个Document对象document.setPageSize(PageSize.A4);//设置页面大小try{pdfWriter=PdfWriter.getInstance(document,newFileOutpu
python写实时同步卫星云图拉米医生
您好！为了获取卫星云图的实时同步信息，您可以使用Python调用公开的API来获取这些信息。首先，您需要找到一个提供卫星云图信息的API，例如NASA的公共API或者其他私有API。然后，您可以使用Python中的requests库来调用API并获取响应。具体来说，您可以使用requests.get()方法发送HTTPGET请求，并使用.json()方法将响应转换为JSON格式。然后，您就可以使用
全球波动环境下的跨境场外期权系统解决方案——机构风险管理与收益增强新基建 Ashlee_guweng22346 区块链金融架构人工智能自动化 java log4j
摘要在全球贸易摩擦升级与金融市场波动加剧的背景下，场外个股期权作为精细化风险管理工具的价值日益凸显。本报告深度解析跨境场外期权交易系统的核心架构与商业价值，系统支持香草期权、个股期权等非标准化合约的全生命周期管理，涵盖产品创建、智能询价、自主报价、对冲交易及跨境清算等关键模块。结合欧盟加速战略物资储备、中美关税政策调整、黄金避险需求激增等2025年7月国际金融动态，论证该系统如何助力机构客户在不确
AI时代下如何学习前端之第2篇：前端开发者的“AI焦虑“：被替代还是被赋能？指尖动听知识库 AI时代下如何学习前端人工智能前端
文/指尖动听知识库-胖胖文章为付费内容，商业行为，禁止私自转载及抄袭，违者必究！！！文章专栏：AI时代下如何学习前端“每当我看到AI生成完美代码时，都会想：我的工作还有价值吗？”——一位有5年经验的前端开发者如果你读了上一篇《ChatGPT问世后ÿ
H3初识——入门介绍之路由、路由元数据
简介H3提供了灵活且高性能的路由系统，支持多种HTTP方法、动态参数和中间件组合，适用于现代Web服务开发。基本用法import{H3,serve}from"h3";constapp=newH3();//定义GET路由app.get("/",(context)=>{return"HelloH3路由!";});//定义POST路由app.post("/submit",async(context)=>
告别重复订单！分布式ID生成核心方案全揭秘山海上的风分布式 java
《告别重复订单！分布式ID生成核心方案全揭秘》你可能用过UUID，却饱受索引性能折磨；你尝试过数据库自增ID，却在分库分表时束手无策；你研究过雪花算法，却被时钟回拨问题困扰……分布式订单ID生成究竟有没有完美方案？本文将为你一一拆解，并给出企业级最优解！一、为什么订单ID如此关键？（示意图：分布式订单系统）需求维度技术指标灾难案例全局唯一零冲突概率重复订单导致财务对账崩溃高性能10万+TPS秒杀活
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam