春秋战国程序猿

一致性哈希算法及其实现（Consistent Hashing）

一致性哈希算法及其实现（Consistent Hashing）

一，一致性哈希算法的原理

1，一致性哈希算法诞生的背景
    技术和业务是相互推动，共同前进的。一致性哈希算法的产生也源于业务的需求。随着业务的增长，一台单机
已经不能满足业务的需要，分布式架构应运而生。分布式环境下，多台机器需要协同作业，如果保证数据在分布式
环境下的一致性，就成为了亟待解决的问题。一致性哈希算法，就是为了解决多台机器，在动态增删的情况下，能够
最大限度地保证信息的一致性。
    一致性哈希算法是一种分布式哈希算法，设计目标是为了解决互联网中的热点(Hot spot)问题。一致性哈希算法
设计初衷和CARP十分类似。CARP，即Composition/Aggregation Principle，组合/聚合原则。CARP的目标之一，是为
了改善服务的可用性。在多台服务器环境下，进行故障转移，提高系统的可用性。一致性哈希修正了CARP使用的简单
哈希算法带来的问题，使得分布式哈希（DHT）可以在P2P环境中真正得到应用。

2，一致性哈希算法实现参考标准
    设计一致性hash算法，一般需要遵循以下几个标准：
2.1、平衡性(Balance)：平衡性不仅仅指的是平均分配，可以理解为一种加权的平均，根据每台服务器的能力，把任务
分配下去，充分利用每台机器的资源。
2.2、单调性(Monotonicity)：如何理解单调性？是一个难点。网上的说法基本上都是“拿来主义”，并没有把单调性的
概念说清楚。如果仅仅从概念上来说单调性，很难说清楚。我们可以换一个角度来解读“单调性”，从单调性要解决的
问题入手，解读“单调性”，或者说从单调性的功能入手，解读“单调性”。在动态变化的分布式环境中，增加服务器节点
和移除服务器节点是最常见的操作。如果我们采用简单的哈希算法，比如使用节点的IP的哈希值hash%节点数N，做为哈
希值，映射到节点上。那么，一旦节点数发生了变化，所以的哈希值都会失效。单调性就是为了解决这个问题的。
2.3、分散性(Spread)：在分布式环境中，节点A有可能看不到其他所有的N-1个节点，只看到其中的一部分节点。当节
点A将数据映射到其他节点时，由于不同节点所见的集群范围有可能不同，从而导致哈希的结果不一致，最终相同的
数据被不同的节点映射到不同的内存中。这种情况显然是应该避免的，因为它导致相同的数据被存储到不同的节点，降低
了系统存储的效率。分散性目前不是很理解，为什么相同的数据会映射到不同的节点呢？留着以后研究。
2.4、负载(Load)：负载的概念看了网上的说法，也不是很明白，留着以后研究。

二，一致性哈希算法的创新点

    一致性哈希算法的实现过程，其实就是为了解决上述问题的过程。我们这里不按照网上的方式进行枯燥的讲解，而是
通过对比，进行有针对性的讲解。一致性哈希算法，在不同的系统环境下，具有不同的实现方式。但是，实现的大致过程
还是一致的。

1，静态映射 --> 动态映射
    普通的哈希算法，比如上面提到的（hash % N），由于数据和节点是静态绑定的。也就是说，进行哈希运算后，数据
和节点之间的关系就确定了。一旦节点数发生变化，所有的哈希都失效了。一致性哈希算法，是如何解决这个问题的呢？
一致性哈希算法引入了环的概念，并且最关键的创新点是：将节点的分配和数据的分配，拆分成了2个独立的过程。数据
和节点的关联，不是通过哈希算法直接建立起来的。这样数据和节点就相对独立了，节点A的变化，并不会影响到整个分布
式系统，因为此时不需要对所有数据进行哈希运算。
    一致性哈希算法的进步之处在于，把数据和节点的关联，从“静态”变成了“动态”。

2，顺时针就近查找节点
    一致性哈希算法是怎么把数据和节点关联起来的呢？在节点和数据都哈希到圆环上以后，数据通过顺时针方向查找的
方式，与节点建立关联。数据把顺时针找到的第一个节点作为自己的存储位置，这样一来，数据和节点就完美的关联起来
了。

三，一致性哈希算法面对的问题

    一致性哈希算法解决了普通哈希算法不能解决的问题，但是一致性哈希算法也存在一定的缺陷。在节点A挂掉的情况下，
映射到节点A上的数据，会受到影响。因为之前映射到A节点的数据，现在按照顺时针查找，映射到了节点A的下一个节点。
同样的，在增加一个节点时，也会影响一部分数据。
    一致性哈希算法的另一个缺陷是，当集群中的节点数量很少时，会造成数据倾斜。数据倾斜的问题，可以通过虚拟节点
的方式来解决。在虚拟节点和实际节点之间再增加一次映射。

总之，相比于普通的哈希算法，一致性哈希算法对于节点的动态增删，具有一定的容错性和可扩展性。

    /** 
     *  MurMurHash算法，是非加密HASH算法，性能很高， 
     *  比传统的CRC32,MD5，SHA-1（这两个算法都是加密HASH算法，复杂度本身就很高，带来的性能上的损害也不可避免） 
     *  等HASH算法要快很多，而且据说这个算法的碰撞率很低. 
     *  http://murmurhash.googlepages.com/ 
     */  
    private Long hash(String key) {  
          
        ByteBuffer buf = ByteBuffer.wrap(key.getBytes());  
        int seed = 0x1234ABCD;  
          
        ByteOrder byteOrder = buf.order();  
        buf.order(ByteOrder.LITTLE_ENDIAN);  
  
        long m = 0xc6a4a7935bd1e995L;  
        int r = 47;  
  
        long h = seed ^ (buf.remaining() * m);  
  
        long k;  
        while (buf.remaining() >= 8) {  
            k = buf.getLong();  
  
            k *= m;  
            k ^= k >>> r;  
            k *= m;  
  
            h ^= k;  
            h *= m;  
        }  
  
        if (buf.remaining() > 0) {  
            ByteBuffer finish = ByteBuffer.allocate(8).order(  
                    ByteOrder.LITTLE_ENDIAN);  
            // for big-endian version, do this first:   
            // finish.position(8-buf.remaining());   
            finish.put(buf).rewind();  
            h ^= finish.getLong();  
            h *= m;  
        }  
  
        h ^= h >>> r;  
        h *= m;  
        h ^= h >>> r;  
  
        buf.order(byteOrder);  
        return h;  
    }

四，一致性哈希算法的java实现

package redis.cn;
import java.nio.charset.Charset;
import java.util.List;
import java.util.SortedMap;
import java.util.TreeMap;
import com.google.common.hash.HashFunction;
import com.google.common.hash.Hashing;
public class ConsistentHash {
	// ------------------ 一致性哈希算法的java实现 ------------------
    private SortedMap ketamaNodes = new TreeMap();
    private int numberOfReplicas = 1024;
    // 这里使用了谷歌的jar包 -- guava-18.0.jar
    private HashFunction hashFunction = Hashing.md5();
    private List nodes;
    private volatile boolean init = false; //标志是否初始化完成
    // 有参数构造函数
    public ConsistentHash(int numberOfReplicas,List nodes){
        this.numberOfReplicas = numberOfReplicas;
        this.nodes = nodes;
        init();
    }
    // 根据key的哈希值，找到最近的一个节点（服务器）
    public String getNodeByKey(String key){
        if(!init)
        	throw new RuntimeException("init uncomplete...");
        // 注意，这里是NIO包 java.nio.charset.Charset
        byte[] digest = hashFunction.hashString(key, Charset.forName("UTF-8")).asBytes();
        long hash = hash(digest,0);
        //如果找到这个节点，直接取节点，返回
        if(!ketamaNodes.containsKey(hash)){
            //得到大于当前key的那个子Map，然后从中取出第一个key，就是大于且离它最近的那个key
            SortedMap tailMap = ketamaNodes.tailMap(hash);
            if(tailMap.isEmpty()){
                hash = ketamaNodes.firstKey();
            }else{
                hash = tailMap.firstKey();
            }

        }
        return ketamaNodes.get(hash);
    }
    // 新增节点
    public synchronized void addNode(String node){
        init = false;
        nodes.add(node);
        init();
    }

    private void init(){
        //对所有节点，生成numberOfReplicas个虚拟节点
        for(String node:nodes){
            //每四个虚拟节点为1组
            for(int i=0;i

 
  
 五，一致性哈希算法在redis中的应用 
  
 
  
 　　Redis本身不支持集群，所以需要借助API或者其他第三方产品，来实现集群部署。当然，也可以借助一致性哈希算法来 
  
 实现Redis集群。Memcached对大家应该不陌生，通过把Key映射到Memcached Server上，实现快速读取。我们可以动态对其节点 
  
 增加，并未影响之前已经映射到内存的Key与memcached Server之间的关系，这就是因为使用了一致性哈希算法。Memcached的 
  
 哈希策略是在客户端实现的，因此不同的客户端实现有区别，以Spymemcache、Xmemcache为例，都是使用了KETAMA作为其实现。 
  
     实现redis分布式集群，可以参考下面几种思路: 
  
     * 使用jedis 
  
     * 自己实现一致性哈希算法； 
  
 
  
 1，jedis 
  
     jedis是redis客户端API。Redis-server端并没有sharding方法，但是我们可以使用jedis来实现分布式。jedis使用了一种 
  
 叫做sharding的思想。 
  
     什么是sharding呢？简单的来说，就是数据库“分片”。sharding的核心理念就是将数据按照一定的策略"分散"存储在集群 
  
 中不同的物理机器上，从根本上来讲，实现了"大数据"分布式存储，体现了"集群"的概念。比如1亿条数据，我们可以根据数据 
  
 的hashcode，把数据散列存储在5个物理机器上。 
  
     sharding的实现，也是基于一致性哈希算法。我们先来看一下sharding实现的关键源代码。 
  
     1.1 hashcode取值：源码来自redis.clients.util.Hashing。Jedis中默认的hash算法是MD5，即我们熟悉的第五代信息摘要 
  
 算法：Message Digest Algorithm 5 。 
   
      //少量优化性能  
    public ThreadLocal md5Holder = new ThreadLocal();  
    public static final Hashing MD5 = new Hashing() {  
	    public long hash(String key) {  
	        return hash(SafeEncoder.encode(key));  
	    }  
	    // sharding使用的哈希算法是MD5
	    public long hash(byte[] key) {  
	        try {  
	            if (md5Holder.get() == null) {  
	                md5Holder.set(MessageDigest.getInstance("MD5"));  
	            }  
	        } 
	        catch (NoSuchAlgorithmException e) {  
	            throw new IllegalStateException("++++ no md5 algorythm found");  
	        }  
	        MessageDigest md5 = md5Holder.get();  
	        md5.reset();  
	        md5.update(key); 
	        //获得MD5字节序列
	        byte[] bKey = md5.digest();  
	        //前四个字节作为计算参数，最终获得一个32位int值.  
	        //此种计算方式，能够确保key的hash值更加“随机”/“离散”  
	        //如果hash值过于密集，不利于一致性hash的实现(特别是有“虚拟节点”设计时)  
	        long res = ((long) (bKey[3] & 0xFF) << 24)  
	                 | ((long) (bKey[2] & 0xFF) << 16)  
	                 | ((long) (bKey[1] & 0xFF) << 8) 
	                 | (long) (bKey[0] & 0xFF);  
	        return res;  
	    }  
    };  
 
  
     1.2 node构建过程(redis.clients.util.Sharded)： 
   
      //shards列表为客户端提供了所有redis-server配置信息，包括：ip，port，weight，name  
    //其中weight为权重，将直接决定“虚拟节点”的“比例”(密度)，权重越高，在存储是被hash命中的概率越高  
    //--其上存储的数据越多。  
    //其中name为“节点名称”，jedis使用name作为“节点hash值”的一个计算参数。  
    //---  
    //一致性hash算法，要求每个“虚拟节点”必须具备“hash值”，每个实际的server可以有多个“虚拟节点”(API级别)  
    //其中虚拟节点的个数= “逻辑区间长度” * weight，每个server的“虚拟节点”将会以“hash”的方式分布在全局区域中  
    //全局区域总长为2^32.每个“虚拟节点”以hash值的方式映射在全局区域中。  
    // 环形：0-->vnode1(:1230)-->vnode2(:2800)-->vnode3(400000)---2^32-->0  
    //所有的“虚拟节点”将按照其”节点hash“顺序排列(正序/反序均可)，因此相邻两个“虚拟节点”之间必有hash值差，  
    //那么此差值，即为前一个(或者后一个，根据实现而定)“虚拟节点”所负载的数据hash值区间。  
    //比如hash值为“2000”的数据将会被vnode1所接受。  
    private void initialize(List shards){
        //虚拟节点，采取TreeMap存储:排序，二叉树  
        nodes = new TreeMap();  
        for (int i = 0; i != shards.size(); ++i) {  
            final S shardInfo = shards.get(i);  
            if (shardInfo.getName() == null)  
                    //当没有设置“name”是，将“SHARD-NODE”作为“虚拟节点”hash值计算的参数  
                    //"逻辑区间步长"为160,为什么呢??  
                    //最终多个server的“虚拟节点”将会交错布局，不一定非常均匀。  
                for (int n = 0; n < 160 * shardInfo.getWeight(); n++) {  
                    nodes.put(this.algo.hash("SHARD-" + i + "-NODE-" + n), shardInfo);  
                }  
            else  
                for (int n = 0; n < 160 * shardInfo.getWeight(); n++) {  
                    nodes.put(this.algo.hash(shardInfo.getName() + "*" + shardInfo.getWeight() + n), shardInfo);  
                }  
            resources.put(shardInfo, shardInfo.createResource());  
        }  
    }
 
  
     1.3，node选择方式： 
   
      public R getShard(String key) {  
        return resources.get(getShardInfo(key));  
    }    
    public S getShardInfo(byte[] key) {  
        //获取>=key的“虚拟节点”的列表  
        SortedMap tail = nodes.tailMap(algo.hash(key));  
        //如果不存在“虚拟节点”，则将返回首节点。  
        if (tail.size() == 0) {  
            return nodes.get(nodes.firstKey());  
        }  
        //如果存在，则返回符合(>=key)条件的“虚拟节点”的第一个节点  
        return tail.get(tail.firstKey());  
    }   
  
     Jedis sharding模式下，如果某个server失效，客户端并不会删除此sharding，所以如果访问此sharding将会抛出异常。 
  
 这是为了保持所有的客户端数据视图一致性。你可能希望动态的一致性hash拓扑结构（即如果某个shard失效，sharding结构 
  
 则重新调整，失效的sharding上的数据则被hash到其他sharding上），但是很遗憾，SharedJedis客户端无法支持，如果非要 
  
 支持，则需要巨大的代码调整，而且还需要引入额外的拓扑自动发现机制。（参看：redis cluster架构，已提供此问题的完 
  
 善解决方案）。不过，在持久存储的情况下,我们可以使用"强hash"分片,则需要重写其Hash算法。强hash算法下,如果某个虚 
  
 拟节点所在的物理server故障，将导致数据无法访问(读取/存储)，即不会从虚拟节点列表中删除那些失效的server。 
  
     对于jedis如果重写了一致性哈希算法，你需要考虑以下几个方面： 
  
     1) 虚拟节点hash是否相对均匀 
  
     2) 数据的hash值分布是否均匀 
  
     3) 虚拟节点在“全局”是否散列均匀。 
  
     如果设计不良，很有可能导致数据在server上分布不均，而失去了sharding的本身意义。 
  
 
  
 2，java中使用jedis的demo 
   
  package redis.cn;
import java.util.ArrayList;
import java.util.List;
import org.apache.commons.pool2.impl.GenericObjectPoolConfig;
import redis.clients.jedis.JedisShardInfo;
import redis.clients.jedis.ShardedJedis;
import redis.clients.jedis.ShardedJedisPool;
/**
 * @author yangcq 
 * @category jedis也是一致性哈希算法的一种实现。搭建redis分布式集群，可以使用jedis。
 */
public class ShardedRedis {

	// 除了jdk自带的工具包以后，还需要导入下面2个jar包
	//    commons-pool2-2.0.jar
    //    jedis-2.4.2.jar
	
    public static void main(String[] args){
    	// jedis配置参数
        GenericObjectPoolConfig genericObjectPoolConfig = new GenericObjectPoolConfig();
        genericObjectPoolConfig.setMaxTotal(1000);
        genericObjectPoolConfig.setMaxIdle(500);

        List jedisShardInfoList = new ArrayList();
        JedisShardInfo jedisShardInfo1 = new JedisShardInfo("127.0.0.1",1234);
        JedisShardInfo jedisShardInfo2 = new JedisShardInfo("127.0.0.1",1235);
        JedisShardInfo jedisShardInfo3 = new JedisShardInfo("127.0.0.1",1236);
        jedisShardInfoList.add(jedisShardInfo1);
        jedisShardInfoList.add(jedisShardInfo2);
        jedisShardInfoList.add(jedisShardInfo3);

        ShardedJedisPool shardedJedisPool = new ShardedJedisPool(genericObjectPoolConfig,jedisShardInfoList);

        set("key1","value1",shardedJedisPool);
        set("key2","value2",shardedJedisPool);
        set("key3","value3",shardedJedisPool);
        set("key4","value4",shardedJedisPool);
        set("key5","value5",shardedJedisPool);
        
        // jedis隐藏了实现一致性哈希算法的细节，只是给我们提供了简单的接口调用，就可以实现redis分布式集群的搭建
        // 那么jedis到底是如何实现一致性哈希算法的呢？ 
    }

    public static void set(String key,String value,ShardedJedisPool pool){
    	// 从共享资源池中获取redis实例
        ShardedJedis shardedJedis = pool.getResource();
        // 赋值
        shardedJedis.set(key,value);
        pool.returnResource(shardedJedis);
    }
} 
  
 ------------------------------------------------------ 
  
 
  
 参考源码： 
  
 
  
 Jedis是通过ShardedJedis向redis集群写入的数据，ShardedJedis中的关键方法： 
   
  public Sharded(List shards, Hashing algo, Pattern tagPattern) {
    this.algo = algo;
    this.tagPattern = tagPattern;
    initialize(shards);
}

//初始化哈希环
private void initialize(List shards) {
    nodes = new TreeMap();

    for (int i = 0; i != shards.size(); ++i) {
        final S shardInfo = shards.get(i);
        if (shardInfo.getName() == null)
        for (int n = 0; n < 160 * shardInfo.getWeight(); n++) {
            nodes.put(this.algo.hash("SHARD-" + i + "-NODE-" + n),
                shardInfo);
        }
        else
        for (int n = 0; n < 160 * shardInfo.getWeight(); n++) {
            nodes.put(
                this.algo.hash(shardInfo.getName() + "*"
                    + shardInfo.getWeight() + n), shardInfo);
        }
        resources.put(shardInfo, shardInfo.createResource());
    }
}

//将key，value存储到相应的shard
 public String set(String key, String value) {
    Jedis j = getShard(key);
    return j.set(key, value);
 }

public R getShard(String key) {
    return resources.get(getShardInfo(key));
}

//根据key获取shard
public S getShardInfo(byte[] key) {
    SortedMap tail = nodes.tailMap(algo.hash(key));
    if (tail.isEmpty()) {
        return nodes.get(nodes.firstKey());
    }
    return tail.get(tail.firstKey());
}

PostgreSQL认证指南 leegong23111 postgresql 数据库
PostgreSQL作为一款强大的开源关系型数据库，深受开发者和企业的青睐。获得PostgreSQL专家认证，不仅能提升个人在数据库领域的专业能力，还能为职业发展增添有力筹码。下面为大家详细介绍PostgreSQL专家认证的学习路径。一、深入理解基础知识·数据类型与存储：PostgreSQL支持多种数据类型，如常见的整数、浮点数、字符串，还有特殊的几何类型、JSON类型等。深入了解每种数据类型的存
DeepSeek系列模型：高效能推理与多模态处理的技术突破与实践路径张3蜂人工智能开源技术选型人工智能开源机器人
目录引言一、高效能推理的核心技术路径二、多模态处理的技术创新三、技术协同与落地实践四、未来技术演进方向结论引言背景与挑战AI模型规模化趋势下，推理效率与多模态融合成为关键瓶颈。DeepSeek系列模型的定位：平衡性能、效率与多模态能力的技术创新者。核心命题如何通过架构设计与算法优化实现高效推理？如何突破模态边界实现跨模态语义理解与生成？一、高效能推理的核心技术路径轻量化模型架构设计动态稀疏注意力机
带权重的最近任务安排算法（最近面试策略） WePlayDirty 算法面试数据结构
一个任务j在sj开始，并在fj结束;并且每个任务都有权重。任务相容：任务安排的时间没有重叠目标：找到最大权重，且相容的任务安排#includeusingnamespacestd;typedefstruct{intiStartT;intiFinshT;intiWight;}TASK_INFO;intg_i=0;voidFindSolution(TASK_INFO*schedule,int**comp
NoSQL数据库介绍与分类码农老起 nosql 数据库
目录一.NoSQL数据库的定义及其特点二.NoSQL的四种主要类型2.1文档型数据库（Document-BasedDatabase）2.2键值型数据库（Key-ValueStore）2.3列族型数据库（Column-FamilyStore）2.4图数据库（GraphDatabase）三.主要的NoSQL数据库3.1MongoDB3.2Redis3.3Cassandra3.4Neo4j四.使用NoS
算法-队列-买票需要的时间程序员南飞算法数据结构 java 职场和发展 leetcode
力扣题目：2073.买票需要的时间-力扣（LeetCode）有n个人前来排队买票，其中第0人站在队伍最前方，第(n-1)人站在队伍最后方。给你一个下标从0开始的整数数组tickets，数组长度为n，其中第i人想要购买的票数为tickets[i]。每个人买票都需要用掉恰好1秒。一个人一次只能买一张票，如果需要购买更多票，他必须走到队尾重新排队（瞬间发生，不计时间）。如果一个人没有剩下需要买的票，那他
CPP集群聊天服务器开发实践（一）：用户注册与登录杨枝甘露小码 CPP集群聊天服务器开发服务器 c++数据库单例模式
目录1客户端用户注册与登录1.1主要思想1.2网络层1.3业务层1.4数据层1.5测试结果1客户端用户注册与登录1.1主要思想实现网络层、业务层、数据层的解耦，提高系统的可维护性。网络层：主要实现对客户端连接、客户端读写请求的捕获与回调，将其分发到多个线程中执行。业务层：主要实现客户端读写请求回调的具体操作，当前阶段主要包含：登录业务、注册业务、用户异常退出业务数据层：主要实现数据库中表的CUAD
基于Java毕业设计学术会议论文稿件管理系统源码+系统+mysql+lw文档+部署软件练练科技 java 课程设计 mysql
基于Java毕业设计学术会议论文稿件管理系统源码+系统+mysql+lw文档+部署软件基于Java毕业设计学术会议论文稿件管理系统源码+系统+mysql+lw文档+部署软件本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5.7
java计算机毕业设计web实验室课表管理系统源码+mysql数据库+系统+lw文档+部署花样1999 mysql 数据库 java
java计算机毕业设计web实验室课表管理系统源码+mysql数据库+系统+lw文档+部署java计算机毕业设计web实验室课表管理系统源码+mysql数据库+系统+lw文档+部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQ
java计算机毕业设计运动会管理系统源码+mysql数据库+系统+lw文档+部署沪港 mysql java 数据库
java计算机毕业设计运动会管理系统源码+mysql数据库+系统+lw文档+部署java计算机毕业设计运动会管理系统源码+mysql数据库+系统+lw文档+部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5.7/8.0源码
关系数据库的基本术语 iamphp 系统架构设计师数据库
(1)属性(Attribute):在现实世界中，要描述一个事物常常取若干特征来表示。这些特征称为属性。例如学生通过学号、姓名、性别、系别、年龄、籍贯等属性来描述。(2)域(Domain):每个属性的取值范围对应一个值的集合，称为该属性的域。例如，学号的域是6位整型数；姓名的域是10位字符；性别的域为{男，女}等。一般在关系数据模型中，对域还加了一个限制，即所有的域都应是原子数据(AtomicDat
关系数据库运算 iamphp 系统架构设计师机器学习人工智能
关系操作的特点是操作对象和操作结果都是集合。关系代数运算符有4类：集合运算符、专门的关系运算符、算术比较符和逻辑运算符。根据运算符的不同，关系代数运算可分为传统的集合运算和专门的关系运算。传统的集合运算是从关系的水平方向进行的，包括并、交、差及广义笛卡儿积。专门的关系运算既可以从关系的水平方向进行运算，又可以向关系的垂直方向运算，包括选择、投影、连接以及除法。5种基本的关系代数运算包括并、差、笛卡
【重温设计模式】模板方法模式及其Java示例万猫学社重温设计模式及其Java实现设计模式模板方法模式 java
模板方法模式的基本概念模板方法模式是一种常见的设计模式，它的名字来源于其核心思想：定义一个操作中的算法的骨架，而将一些步骤延迟到子类中。模板方法使得子类可以不改变一个算法的结构即可重定义该算法的某些特定步骤。听起来可能有些抽象，但其实我们在生活中经常会遇到这样的场景。比如，我们在做饭时，通常会有一套固定的流程：洗菜、切菜、炒菜。这个流程就是一个模板，而具体的做法，比如切菜的方式、炒菜的时间等，就是
深入解析 NoSQL 数据库的分类与特点一休哥助手数据库数据库 nosql
目录NoSQL数据库概述NoSQL数据库的主要分类2.1键值存储2.2文档存储2.3列族存储2.4图数据库NoSQL数据库的特点
消息队列简述八二年的栗子 java
消息队列（MessageQueue），是分布式系统中重要的组件，其通用的使用场景可以简单地描述为：当不需要立即获得结果，但是并发量又需要进行控制的时候，差不多就是需要使用消息队列的时候。消息队列主要解决了应用耦合、异步处理、流量削锋等问题。当前使用较多的消息队列有RabbitMQ、RocketMQ、ActiveMQ、Kafka、ZeroMQ、MetaMq等，而部分数据库如Redis、Mysql以及
NoSQL调研与学习（一） JUNPR NoSQL redis nosql 数据库
NoSQL数据库调研与学习简言1.1NoSQL概述NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在处理web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，出现了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，特别是大数
YashanDB表介绍数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%A6%82%E5%BF%B5%...在关系型数据库中一个表就是一个关系（Relation），一个关系数据库可以包含多个表。表是一种按行、列排列的具有相关信息的逻辑结构，是关系数据库中组织数据的基本单元。表的元素列数据库中表包含若干个列（或字段），列表示关系模型的
【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码默默科研仔粉丝福利机器学习人工智能
标题：【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码一、引言1.1研究背景和意义概述研究的背景以及该研究在领域内的重要性。1.2研究现状分析当前领域的研究进展和存在的问题。二、极限学习机（ELM）基本原理2.1ELM的基本模型描述ELM的基本模型结构和工作原理。2.2ELM的学习过程介绍ELM的学习算法和训练过程。三、半监督极限学习机（SS-ELM）3.1SS-ELM的提
DolphinScheduler环境搭建、服务启动等常见问题及解决方案数据库
ApacheDolphinScheduler作为一款分布式易扩展的工作流调度系统，广泛应用于大数据任务编排。然而，在实际使用中，用户可能会遇到环境搭建、服务启动、工作流执行等问题。本文结合社区文档与用户实践经验，整理以下高频问题及详细解决方案，帮助用户快速定位并解决问题。一、安装与部署问题环境依赖配置错误问题：部署时因缺少JDK、Maven或数据库配置导致失败。解决方案：安装JDK1.8+并配置J
什么关系型数据库和非关系型数据库 yqcoder 数据库 nosql
一、关系型数据库1.定义关系型数据库是基于关系模型的数据库，用二维表结构来存储数据，表与表之间可以通过关系（如主键-外键关系）相互关联。2.特点2.1数据结构化数据按照预定义的表结构进行存储，每个表有固定的列和数据类型。例如，一个存储员工信息的表，可能包含“员工ID”“姓名”“部门”等列，每列都有明确的数据类型。2.2支持SQL查询使用结构化查询语言（SQL）进行数据的增删改查操作，SQL是一种标
Docker搭建达梦数据库--基于 X86 架构 ❀͜͡傀儡师数据库 docker 架构
1、部署环境X86_64架构的服务器1台,安装好docker拉取镜像官方最新非授权版本有些函数方法无法使用dockerpullregistry.cn-hangzhou.aliyuncs.com/qiluo-images/dm8_single:dm8_20230808_rev197096_x86_rh6_64查看镜像dockerimages|grepdm8运行容器dockerrun-d\-p5236
NoSQL数据库-体系框架 iamphp 系统架构设计师 nosql 数据库
NoSQL整体框架分为4层，由下至上分为数据持久层(DataPersistence)、数据分布层(DataDistributionModel)、数据逻辑模型层(DataLogicalModel)和接口层(Interface),层次之间相辅相成，协调工作。(1)数据持久层定义了数据的存储形式，主要包括基于内存、硬盘、内存和硬盘接口、订制可插拔4种形式。基于内存形式的数据存取速度最快，但可能会造成数据
springboot029网上购物商城系统 Q_97095639 springboot毕业设计数据库毕业设计课程设计
版权声明所有作品均为本人原创，提供参考学习使用，如需要源码+数据库+配套文档请移步www.taobysj.com搜索获取技术实现开发语言：Java+vue。框架：后端spingboot+前端vue。模式：B/S。数据库：mysql。开发工具：idea。论文字数：1万左右。数据库表个数：10个左右。运行环境：jdk+idea+mysql。版本不限制，包安装运行！项目优点：前后端分离，注释详细，代码简
Jieba分词算法应用 C嘎嘎嵌入式开发算法服务器数据库 c++linux
1.Jieba分词算法简介Jieba是一个用于中文分词的Python库，其核心思想是基于词典和统计模型来进行分词。由于中文文本中没有明显的单词边界，因此分词是中文处理中的一个重要任务。Jieba提供了以下几种主要的分词模式：精确模式：尽可能准确地切分句子，适合用于文本分析。全模式：将句子中所有可能的词语都切分出来，适合用于搜索引擎。搜索引擎模式：在精确模式的基础上，对长词再次切分，适合用于搜索引擎
MyBatis-Plus分页查询 pan_junbiao MyBatis-Plus 我の原创 java 数据库开发语言
在实际开发中，对于大量数据的查询，可以通过分页查询的方式来减少查询量和提高查询效率。在MyBatis-Plus中，分页查询可以通过使用Page对象和IService接口提供的分页方法来实现。MyBatis-Plus的分页插件PaginationInnerInterceptor提供了强大的分页功能，支持多种数据库，使得分页查询变得简单高效。官方文档：《MyBatis-Plus分页插件》Page类的说
挑战分库分表后实现跨分页查询 java
想象你有一个图书馆（单库单表），所有书按顺序放在书架上。当你要找第100-110本书时，直接数到第100本就能拿到。但图书馆的书爆炸式增长后，馆长决定：分库：把书分到10个房间（10个数据库）分表：每个房间再分成20个书架（20张表）每个书架只放特定规则的书（比如按ID取模：ID%200）问题来了：当用户要求「按时间倒序排列，显示第1000-1010条数据」时：每个房间的书架都是独立排序的无法直接
YashanDB表介绍数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%A6%82%E5%BF%B5%...在关系型数据库中一个表就是一个关系（Relation），一个关系数据库可以包含多个表。表是一种按行、列排列的具有相关信息的逻辑结构，是关系数据库中组织数据的基本单元。表的元素列数据库中表包含若干个列（或字段），列表示关系模型的
DeepSeek的训练与优化流程程序猿000001号 DeepSeek 训练优化
DeepSeek的训练与优化流程一、数据工程体系1.多模态数据融合处理动态数据湖架构：实时摄入互联网文本、科学论文、专利文献、传感器数据等20+数据源日均处理原始数据量达1.2PB，支持200+文件格式自动解析智能清洗流水线：基于大模型的语义去重算法，重复数据识别准确率99.6%创新应用对抗网络生成噪声数据，增强模型鲁棒性专利级数据质量评估体系（DQAS3.0）包含87个质量维度2.知识增强处理结
YashanDB应用程序与网络体系数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%A6%82%E5%BF%B5%...#程序接口程序接口是应用程序与数据库的必要纽带，是数据库提供给数据库应用程序使用的，可以访问操作数据库的软件层。程序接口具备以下能力：简化数据库操作，通过简单的函数调用完成复杂的数据库操作。跨机器访问，能解决不同机器间数据格式
搜广推校招面经十九 Y1nhl 搜广推面经搜索引擎推荐算法 python 求职招聘
快手推荐算法一、1*1的cnn有什么作用？1.1.降维与通道数调整（ChannelReduction）在CNN中，特征图（FeatureMap）通常有多个通道（channels）。1×1卷积可以用于减少通道数，从而降低计算量，提高模型效率。1×1卷积可以增加通道数，以增强特征表达能力。示例代码（PyTorch）：importtorchimporttorch.nnasnnconv1x1=nn.Con
DeepSeek 部署中的常见问题及解决方案 The god of big data 人工智能赋能工作与生活 ai
DeepSeek作为一款智能语义搜索框架，其本地化部署在实际操作中可能因环境配置、权限管理、硬件资源等因素遇到多种问题。本文结合当前市面上的实践经验，整合了部署中的常见问题及解决方案，帮助用户高效排查和优化部署流程。一、权限不足问题原因分析账号权限不足：用户账号可能缺乏访问或操作特定资源（如文件系统、数据库）的权限。系统或依赖服务权限限制：例如，DeepSeek依赖的数据库或文件系统未开放访问权限
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

一致性哈希算法及其实现（Consistent Hashing）

你可能感兴趣的:(算法,数据库)