我就是我352

常见的应用级算法(下)

常见的应用级算法

1.负载均衡算法
- 1.轮询（RR)
- 2.随机
- 3.源地址哈希
- 4.加权轮询
- 5.加权随机
- 6.应用案例
2.加密算法的应用
- 1.散列
- 2. 对称
- 3.非对称
3.一致性hash及其应用
- 1.背景
- 2. 原理
- 3.特性
- 4.实现
- 5.验证
4.典型业务场景应用
- 1.网站敏感词过滤
- 2.最优商品topk

1.负载均衡算法

1.轮询（RR)

1.概述:轮询即排好队，一个接一个。前面调度算法中用到的时间片轮转，就是一种典型的轮询。但是前面使用数组和下标轮询实现。这里尝试手动写一个双向链表形式实现服务器列表的请求轮询算法

2.代码实现

package com.andy.load;

/**
 * @author Andy
 * @version 0.0.1
 * @since 2023-09-15 15:58
 */
public class RR {
    class Server {
        Server prev;
        Server next;
        String name;

        public Server(String name) {
            this.name = name;
        }
    }


    // 当前服务节点
    Server current;

    // 初始化轮询类，多个服务器ip用逗号隔开
    public RR(String serverName) {
        System.out.println("init server list : " + serverName);
        String[] names = serverName.split(",");
        for (int i = 0; i < names.length; i++) {
            Server server = new Server(names[i]);
            if (current == null) {
                // 如果当前服务器为空，说明是第一台机器，current就指向新创建的server
                this.current = server;
                // 同时，server的前后均指向自己。
                current.prev = current;
                current.next = current;
            } else {
                // 否则说明已经有机器了，按新加处理。
                addServer(names[i]);
            }
        }

    }

    // 添加机器
    void addServer(String serverName) {
        System.out.println("add server : " + serverName);
        Server server = new Server(serverName);
        Server next = this.current.next;
        // 在当前节点后插入新节点
        this.current.next = server;
        server.prev = this.current;

        // 修改下一节点的prev指针
        server.next = next;
        next.prev = server;
    }

    // 将当前服务器移除，同时修改前后节点的指针，让其直接关联
    // 移除的current会被回收器回收掉
    void remove() {
        System.out.println("remove current = " + current.name);
        this.current.prev.next = this.current.next;
        this.current.next.prev = this.current.prev;
        this.current = current.next;
    }

    // 请求。由当前节点处理即可
    // 注意：处理完成后，current指针后移
    void request() {
        System.out.println(this.current.name);
        this.current = current.next;
    }

    public static void main(String[] args) throws InterruptedException {
        // 初始化两台机器
        RR rr = new RR("192.168.0.1,192.168.0.2");
        // 启动一个额外线程，模拟不停的请求
        new Thread(new Runnable() {
            @Override
            public void run() {
                while (true) {
                    try {
                        Thread.sleep(500);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                    rr.request();
                }
            }
        }).start();

        // 3s后，3号机器加入清单
        Thread.currentThread().sleep(3000);
        rr.addServer("192.168.0.3");

        // 3s后，当前服务节点被移除
        Thread.currentThread().sleep(3000);
        rr.remove();

    }

}

3.结果分析

初始化后，只有1，2，两者轮询
3加入后，1，2，3，三者轮询
移除2后，只剩1和3轮询

4.优缺点

实现简单，机器列表可以自由加减，且时间复杂度为o(1)
无法针对节点做偏向性定制，节点处理能力的强弱无法区分对待

2.随机

1.概述：从可服务的列表中随机取一个提供响应。随机存取的场景下，适合使用数组更高效的实现下标随机读取

2.实现

package com.andy.load;

import java.util.ArrayList;
import java.util.Random;

/**
 * @author Andy
 * @version 0.0.1
 * @since 2023-09-15 16:11
 */
public class Rand {
    ArrayList<String> ips;

    public Rand(String nodeNames) {
        System.out.println("init list : " + nodeNames);
        String[] nodes = nodeNames.split(",");
        // 初始化服务器列表，长度取机器数
        ips = new ArrayList<>(nodes.length);
        for (String node : nodes) {
            ips.add(node);
        }
    }

    // 请求
    void request() {
        // 下标，随机数，注意因子
        int i = new Random().nextInt(ips.size());
        System.out.println(ips.get(i));
    }

    // 添加节点，注意，添加节点会造成内部数组扩容
    // 可以根据实际情况初始化时预留一定空间
    void addnode(String nodeName) {
        System.out.println("add node : " + nodeName);
        ips.add(nodeName);
    }

    // 移除
    void remove(String nodeName) {
        System.out.println("remove node : " + nodeName);
        ips.remove(nodeName);
    }


    public static void main(String[] args) throws InterruptedException {
        Rand rd = new Rand("192.168.0.1,192.168.0.2");

        // 启动一个额外线程，模拟不停的请求
        new Thread(new Runnable() {
            @Override
            public void run() {
                while (true) {
                    try {
                        Thread.sleep(500);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                    rd.request();
                }
            }
        }).start();

        // 3s后，3号机器加入清单
        Thread.currentThread().sleep(3000);
        rd.addnode("192.168.0.3");

        // 3s后，当前服务节点被移除
        Thread.currentThread().sleep(3000);
        rd.remove("192.168.0.2");
    }
}

3.结果分析

初始化为1，2，两者不按顺序轮询，而是随机出现
3加入服务节点列表
移除2后，只剩1，3，依然是两者随机，无序

3.源地址哈希

1.概述:对当前访问的ip地址做一个hash值，相同的key被路由到同一台机器去。场景常见于分布式集群环境下，用户登录时的请求路由和会话保持。

2.实现

package com.andy.load;

import java.util.ArrayList;

/**
 * @author Andy
 * @version 0.0.1
 * @since 2023-09-15 16:18
 * 源地址哈希
 */
public class Hash {

    ArrayList<String> ips;

    public Hash(String nodeNames) {
        System.out.println("init list : " + nodeNames);
        String[] nodes = nodeNames.split(",");
        // 初始化服务器列表，长度取机器数
        ips = new ArrayList<>(nodes.length);
        for (String node : nodes) {
            ips.add(node);
        }
    }

    // 添加节点，注意，添加节点会造成内部Hash重排，思考为什么呢？？？
    // 这是个问题！在一致性hash中会进入详细探讨
    void addnode(String nodeName) {
        System.out.println("add node : " + nodeName);
        ips.add(nodeName);
    }

    // 移除
    void remove(String nodeName) {
        System.out.println("remove node : " + nodeName);
        ips.remove(nodeName);
    }

    // 映射到key的算法，这里取余数做下标
    private int hash(String ip) {
        int last = Integer.valueOf(ip.substring(ip.lastIndexOf(".") + 1, ip.length()));
        return last % ips.size();
    }

    // 请求
    // 注意，这里和来访ip是有关系的，采用一个参数，表示当前的来访ip
    void request(String ip) {
        // 下标
        int i = hash(ip);
        System.out.println(ip + "-->" + ips.get(i));
    }

    public static void main(String[] args) {
        Hash hash = new Hash("192.168.0.1,192.168.0.2");
        for (int i = 1; i < 10; i++) {
            // 模拟请求的来源ip
            String ip = "192.168.1." + i;
            hash.request(ip);
        }

        hash.addnode("192.168.0.3");
        for (int i = 1; i < 10; i++) {
            // 模拟请求的来源ip
            String ip = "192.168.1." + i;
            hash.request(ip);
        }
    }

}

3.结果分析

初始化后，只有1，2，下标为末尾ip取余数，多次运行，响应的机器不变，实现了会话保持
3加入后，重新hash，机器分布发生变化
2被移除后，原来hash到2的请求被重新定位给3响应

4.加权轮询

1.概述：WeightRoundRobin，轮询只是机械的旋转，加权轮询弥补了所有机器一视同仁的缺点。在轮询的基础上，初始化时，机器携带一个比重

2.实现：维护一个链表，每个机器根据权重不同，占据的个数不同。轮询时权重大的，个数多，自然取到的次数变大。举个例子：a，b，c 三台机器，权重分别为4，2，1，排位后会是a,a,a,a,b,b,c，每次请求时，从列表中依次取节点，下次请求再取下一个。到末尾时，再从头开始

但是这样有一个问题：机器分布不够均匀，扎堆出现了…
解决：为解决机器平滑出现的问题，nginx的源码中使用了一种平滑的加权轮询的算法，规则如下：
每个节点两个权重，weight和currentWeight，weight永远不变是配置时的值，current不停变化
变化规律如下：选择前所有current+=weight，选current最大的响应，响应后让它的current-=total

次数	响应前	被选中	响应后
1	4，2，1	a	-3，2，1
2	1，4，2	b	1，-3，2
3	5，-1，3	a	-2，-1，3
4	2，1，4	c	2，1，-3
5	6，3，-2	a	-1，3，-2
6	3，5，-1	b	3，-2，-1
7	7，0，0	a	0，0，0

统计：a=4，b=2，c=1 且分布平滑均衡

package com.andy.load;

import java.util.ArrayList;

/**
 * @author Andy
 * @version 0.0.1
 * @since 2023-09-15 16:29
 */
public class WRR {
    class Node {
        int weight, currentWeight;
        String name;

        public Node(String name, int weight) {
            this.name = name;
            this.weight = weight;
            this.currentWeight = 0;
        }

        @Override
        public String toString() {
            return String.valueOf(currentWeight);
        }
    }


    // 所有节点的列表
    ArrayList<Node> list;
    // 总权重
    int total;

    // 初始化节点列表，格式：a#4,b#2,c#1
    public WRR(String nodes) {
        String[] ns = nodes.split(",");
        list = new ArrayList<>(ns.length);
        for (String n : ns) {
            String[] n1 = n.split("#");
            int weight = Integer.valueOf(n1[1]);
            list.add(new Node(n1[0], weight));
            total += weight;
        }
    }

    // 获取当前节点
    Node getCurrent() {
        // 执行前，current加权重
        for (Node node : list) {
            node.currentWeight += node.weight;
        }

        // 遍历，取权重最高的返回
        Node current = list.get(0);
        int i = 0;
        for (Node node : list) {
            if (node.currentWeight > i) {
                i = node.currentWeight;
                current = node;
            }
        }
        return current;
    }

    // 响应
    void request() {
        // 获取当前节点
        Node node = this.getCurrent();
        // 第一列，执行前的current
        System.out.print(list.toString() + "---");
        // 第二列，选中的节点开始响应
        System.out.print(node.name + "---");
        // 响应后，current减掉total
        node.currentWeight -= total;
        // 第三列，执行后的current
        System.out.println(list);
    }

    public static void main(String[] args) {
        WRR wrr = new WRR("a#4,b#2,c#1");
        // 7次执行请求，看结果
        for (int i = 0; i < 7; i++) {
            wrr.request();
        }
    }

}

5.加权随机

1.概述:WeightRandom，机器随机被筛选，但是做一组加权值，根据权值不同，选中的概率不同。在这个概念上，可以认为随机是一种等权值的特殊情况

2.实现:设计思路依然相同，根据权值大小，生成不同数量的节点，节点排队后，随机获取。这里的数据结构主要涉及到随机的读取，所以优选为数组。与随机相同的是，同样为数组随机筛选，不同在于，随机只是每台机器1个，加权后变为多个。

package com.andy.load;

import java.util.ArrayList;
import java.util.Random;

/**
 * @author Andy
 * @version 0.0.1
 * @since 2023-09-15 16:32
 */
public class WR {
    // 所有节点的列表
    ArrayList<String> list;

    // 初始化节点列表
    public WR(String nodes) {
        String[] ns = nodes.split(",");
        list = new ArrayList<>();
        for (String n : ns) {
            String[] n1 = n.split("#");
            int weight = Integer.valueOf(n1[1]);
            for (int i = 0; i < weight; i++) {
                list.add(n1[0]);
            }
        }
    }

    void request() {
        // 下标，随机数，注意因子
        int i = new Random().nextInt(list.size());
        System.out.println(list.get(i));
    }

    public static void main(String[] args) {
        WR wr = new WR("a#2,b#1");
        for (int i = 0; i < 9; i++) {
            wr.request();
        }
    }
}

3.结果分析

运行9次，a，b交替出现，a=6,b=3,满足2:1比例
注意！既然是随机，就存在随机性，不见得每次执行都会严格比例。样本趋向无穷时，比例约准确

6.应用案例

1.nginx upstream

upstream frontend {
    #源地址hash
    ip_hash;
    server 192.168.0.1:8081;
    server 192.168.0.2:8082 weight=1 down;
    server 192.168.0.3:8083 weight=2;
    server 192.168.0.4:8084 weight=3 backup;
    server 192.168.0.5:8085 weight=4 max_fails=3 fail_timeout=30s;
}

ip_hash：即源地址hash算法
down：表示当前的server暂时不参与负载
weight：即加权算法，默认为1，weight越大，负载的权重就越大。
backup：备份机器，只有其它所有的非backup机器down或者忙的时候，再请求+ backup机器
max_fails：最大失败次数，默认值为1，这里为3，也就是最多进行3次尝试
fail_timeout：超时时间为30秒，默认值是10s。
注意！weight和backup不能和ip_hash关键字一起使用。

2.springcloud ribbon IRule

#设置负载均衡策略 eureka-application-service为调用的服务的名称
eureka-application-service.ribbon.NFLoadBalancerRuleClassName=com.netflix.loadbalancer.RandomRule

RoundRobinRule：轮询
RandomRule：随机
AvailabilityFilteringRule：先过滤掉由于多次访问故障而处于断路器跳闸状态的服务，还有并发的连接数量超过阈值的服务，然后对剩余的服务轮询
WeightedResponseTimeRule：根据平均响应时间计算所有服务的权重，响应时间越快服务权重越大。刚启动时如果统计信息不足，则使用RoundRobinRule策略，等统计信息足够，会切换到该策略
RetryRule：先按照RoundRobinRule的策略，如果获取服务失败则在指定时间内重试，获取可用的服务
BestAvailableRule：会先过滤掉由于多次访问故障而处于断路器跳闸状态的服务，然后选择一个并发量最小的服务
ZoneAvoidanceRule：默认规则，综合判断server所在区域的性能和server的可用性

3.dubbo负载均衡

@Service(loadbalance = "roundrobin",weight = 100)

RandomLoadBalance: 随机，这种方式是dubbo默认的负载均衡策略
RoundRobinLoadBalance：轮询
LeastActiveLoadBalance：最少活跃次数，dubbo框架自定义了一个Filter，用于计算服务被调用的次数
ConsistentHashLoadBalance：一致性hash

2.加密算法的应用

1.散列

1.概述：严格来讲这不算是一种加密，而应该叫做信息摘要算法。该算法使用散列函数把消息或数据压缩成摘要，使得数据量变小，将数据的格式固定下来。通过数据打乱混合，重新创建一个叫做散列值
2.常见算法：MD5、SHA（128、256）系列

3.应用：

常用于密码存储，或文件指纹校验
网站用户注册后，密码经过MD5加密后的值，存储进DB。再次登录时，将用户输入的密码按同样的方式加密，与数据库中的密文比对。这样即使数据库被破解，或者开发人员可见，基于MD5的不可逆性，仍然不知道密码是什么
其次是文件校验场景。例如从某站下载的文件（尤其是大文件，比如系统镜像iso），官方网站都会放置一个签名（可能是MD5，或者SHA），当用户拿到文件后，可以本地执行散列算法与官网签名比对是否一致，来判断文件是否被篡改

4.实现
添加commons坐标


<dependency>
    <groupId>commons-codecgroupId>
    <artifactId>commons-codecartifactId>
    <version>1.15version>
dependency>

代码：

package com.andy.encrypt;

import org.apache.commons.codec.digest.DigestUtils;

import java.math.BigInteger;
import java.security.MessageDigest;

/**
 * @author Andy
 * @version 0.0.1
 * @since 2023-09-15 17:03
 * 散列
 */
public class Hash {
    /**
     * jdk的security实现md5
     * 也可以借助commons-codec包
     */
    public static String md5(String src) {
        byte[] pwd = null;
        try {
            pwd = MessageDigest.getInstance("md5").digest(src.getBytes("utf-8"));
        } catch (Exception e) {
            e.printStackTrace();
        }
        String code = new BigInteger(1, pwd).toString(16);
        for (int i = 0; i < 32 - code.length(); i++) {
            code = "0" + code;
        }
        return code;
    }

    public static String commonsMd5(String src) {
        return DigestUtils.md5Hex(src);
    }

    /**
     * jdk实现sha算法
     * 也可以借助commons-codec包
     */
    public static String sha(String src) throws Exception {
        MessageDigest sha = MessageDigest.getInstance("sha");
        byte[] shaByte = sha.digest(src.getBytes("utf-8"));
        StringBuffer code = new StringBuffer();
        for (int i = 0; i < shaByte.length; i++) {
            int val = ((int) shaByte[i]) & 0xff;
            if (val < 16) {
                code.append("0");
            }
            code.append(Integer.toHexString(val));
        }
        return code.toString();
    }

    public static String commonsSha(String src) throws Exception {
        return DigestUtils.sha1Hex(src);
    }


    public static void main(String[] args) throws Exception {
        String name = "Andy测试算法";
        System.out.println(name);
        System.out.println(md5(name));
        System.out.println(commonsMd5(name));
        System.out.println(sha(name));
        System.out.println(commonsSha(name));
    }
}

4.结果分析

jdk与commons均生成了相同的散列值
多次运行，依然生成固定值
commons-codec还有很多可用方法，如：sha256，sha512…

2. 对称

1.概述:加密与解密用的都是同一个秘钥，性能比非对称加密高很多。

2.常见算法:常见的对称加密算法有 DES、3DES、AES

DES算法在POS、ATM、磁卡及智能卡（IC卡）、加油站、高速公路收费站等领域被广泛应用，以此来实现关键数据的保密，如信用卡持卡人的PIN的加密传输，IC卡与POS间的双向认证、金融交易数据包的MAC校验等
3DES是DES加密算法的一种模式，是DES的一个更安全的变形。从DES向AES的过渡算法
AES，是下一代的加密算法标准，速度快，安全级别更高。

3.应用:常用于对效率要求较高的实时数据加密通信

4.实现:

package com.andy.encrypt;

import org.apache.commons.codec.binary.Base64;

import javax.crypto.Cipher;
import javax.crypto.KeyGenerator;
import javax.crypto.spec.SecretKeySpec;
import java.security.Key;

/**
 * @author Andy
 * @version 0.0.1
 * @since 2023-09-15 17:27
 */
public class AES {

    public static void main(String[] args) throws Exception {
        // 生成KEY
        KeyGenerator keyGenerator = KeyGenerator.getInstance("AES");
        keyGenerator.init(128);
        // key转换
        Key key = new SecretKeySpec(keyGenerator.generateKey().getEncoded(), "AES");

        Cipher cipher = Cipher.getInstance("AES/ECB/PKCS5Padding");

        String src = "Andy测试AES";
        System.out.println("明文：" + src);
        // 加密
        cipher.init(Cipher.ENCRYPT_MODE, key);
        byte[] result = cipher.doFinal(src.getBytes());
        System.out.println("加密：" + Base64.encodeBase64String(result));

        // 解密
        cipher.init(Cipher.DECRYPT_MODE, key);
        result = cipher.doFinal(result);
        System.out.println("解密：" + new String(result));
    }
}

5.运行结果分析：加密成功，且解密后明文一致

3.非对称

1.概述：非对称即加密与解密不是同一把钥匙，而是分成公钥和私钥。私钥在个人手里，公钥公开。这一对钥匙一个用于加密，另一个用于解密。使用其中一个加密后，则原始明文只能用对应的另一个密钥解密，即使最初用于加密的密钥也不能用作解密。正是因为这种特性，所以称为非对称加密
2.常见算法：RSA、ElGamal、背包算法、Rabin（RSA的特例）、迪菲－赫尔曼密钥交换协议中的公钥加密算法、椭圆曲线加密算法（英语：Elliptic Curve Cryptography, ECC）。使用最广泛的是RSA算法

3.应用

最常见的，两点：https和数字签名。
严格意义上讲，https并非所有请求都使用非对称。基于性能考虑，https先使用非对称约定一个key，后期使用该key进行对称加密和数据传输

数字签名则是用于验证报文是否为服务器发出的，用于防伪和认证。过程如下：

签发：
服务器外发布公钥，私钥保密
服务器对消息M计算摘要（如MD5等公开算法），得到摘要D
服务器使用私钥对D进行签名，得到签名S
将M和S一起发给客户

验证：
客户端对M使用同一摘要算法计算摘要，得到摘要D
使用服务器公钥对S进行解密，得到摘要D’
如果D和D’相同，那么证明M确实是服务器发出的

4.代码：


package com.andy.encrypt;

import org.apache.commons.codec.binary.Base64;

import javax.crypto.Cipher;
import java.security.KeyFactory;
import java.security.KeyPair;
import java.security.KeyPairGenerator;
import java.security.NoSuchAlgorithmException;
import java.security.SecureRandom;
import java.security.interfaces.RSAPrivateKey;
import java.security.interfaces.RSAPublicKey;
import java.security.spec.PKCS8EncodedKeySpec;
import java.security.spec.X509EncodedKeySpec;

/**
 * @author Andy
 * @version 0.0.1
 * @since 2023-09-15 17:32
 */
public class RSAUtil {
    static String privKey;
    static String publicKey;

    public static void main(String[] args) throws Exception {
        // 生成公钥和私钥
        genKeyPair();
        // 加密字符串
        String message = "Andy测试RES";
        System.out.println("明文：" + message);
        System.out.println("随机公钥为:" + publicKey);
        System.out.println("随机私钥为:" + privKey);

        String messageEn = encrypt(message, publicKey);
        System.out.println("公钥加密:" + messageEn);
        String messageDe = decrypt(messageEn, privKey);
        System.out.println("私钥解密:" + messageDe);

    }

    /**
     * 随机生成密钥对
     */
    public static void genKeyPair() throws NoSuchAlgorithmException {
        // KeyPairGenerator类用于生成公钥和私钥对，基于RSA算法生成对象
        KeyPairGenerator keyPairGen = KeyPairGenerator.getInstance("RSA");
        // 初始化密钥对生成器，密钥大小为96-1024位
        keyPairGen.initialize(1024, new SecureRandom());
        // 生成一个密钥对，保存在keyPair中
        KeyPair keyPair = keyPairGen.generateKeyPair();

        privKey = new String(Base64.encodeBase64((keyPair.getPrivate().getEncoded())));
        publicKey = new String(Base64.encodeBase64(keyPair.getPublic().getEncoded()));

    }

    /**
     * RSA公钥加密
     */
    public static String encrypt(String str, String publicKey) throws Exception {
        // base64编码的公钥
        byte[] decoded = Base64.decodeBase64(publicKey);
        RSAPublicKey pubKey = (RSAPublicKey) KeyFactory.getInstance("RSA").generatePublic(new X509EncodedKeySpec(decoded));
        // RSA加密
        Cipher cipher = Cipher.getInstance("RSA");
        cipher.init(Cipher.ENCRYPT_MODE, pubKey);
        String outStr = Base64.encodeBase64String(cipher.doFinal(str.getBytes("UTF-8")));
        return outStr;
    }

    /**
     * RSA私钥解密
     */
    public static String decrypt(String str, String privateKey) throws Exception {
        // 64位解码加密后的字符串
        byte[] inputByte = Base64.decodeBase64(str.getBytes("UTF-8"));
        byte[] decoded = Base64.decodeBase64(privateKey);
        RSAPrivateKey priKey = (RSAPrivateKey) KeyFactory.getInstance("RSA").generatePrivate(new PKCS8EncodedKeySpec(decoded));
        Cipher cipher = Cipher.getInstance("RSA");
        cipher.init(Cipher.DECRYPT_MODE, priKey);
        return new String(cipher.doFinal(inputByte));
    }
}

5.结果分析

加密解密实现完整还原
必须用另一把钥匙解密，如果用公钥加密后再使用公钥解密，则失败

3.一致性hash及其应用

1.背景

负载均衡策略中，我们提到过源地址hash算法，让某些请求固定的落在对应的服务器上。这样可以解决会话信息保留的问题。同时，标准的hash，如果机器节点数发生变更。那么请求会被重新hash，打破了原始的设计初衷，怎么解决呢？一致性hash上场。

2. 原理

以4台机器为例，一致性hash的算法如下：
首先求出各个服务器的哈希值，并将其配置到0～232的圆上
然后采用同样的方法求出存储数据的键的哈希值，也映射圆上
从数据映射到的位置开始顺时针查找，将数据保存到找到的第一个服务器上
如果到最大值仍然找不到，就取第一个。这就是为啥形象的称之为环

3.特性

单调性(Monotonicity)：单调性是指如果已经有一些请求通过哈希分派到了相应的服务器进行处理，又有新的服务器加入到系统中时候，应保证原有的请求可以被映射到原有的或者新的服务器中去，而不会被映射到原来的其它服务器上去。
分散性(Spread)：分布式环境中，客户端请求时可能只知道其中一部分服务器，那么两个客户端看到不同的部分，并且认为自己看到的都是完整的hash环，那么问题来了，相同的key可能被路由到不同服务器上去。以上图为例，加入client1看到的是1,4；client2看到的是2,3；那么2-4之间的key会被俩客户端重复映射到3,4上去。分散性反应的是这种问题的严重程度。
平衡性(Balance)：平衡性是指客户端hash后的请求应该能够分散到不同的服务器上去。一致性hash可以做到尽量分散，但是不能保证每个服务器处理的请求的数量完全相同。这种偏差称为hash倾斜。如果节点的分布算法设计不合理，那么平衡性就会收到很大的影响。

优化：增加虚拟节点可以优化hash算法，使得切段和分布更细化。即实际有m台机器，但是扩充n倍，在环上放置m*n个，那么均分后，key的段会分布更细化

4.实现

package com.andy.hash;

import java.util.SortedMap;
import java.util.TreeMap;

/**
 * @author Andy
 * @version 0.0.1
 * @since 2023-09-15 17:41
 * Hash一致性算法
 */
public class Hash {

    // 服务器列表
    private static String[] servers = {"192.168.0.1",
            "192.168.0.2", "192.168.0.3", "192.168.0.4"};

    // key表示服务器的hash值，value表示服务器
    private static SortedMap<Integer, String> serverMap = new TreeMap<Integer, String>();

    static {
        for (int i = 0; i < servers.length; i++) {
            int hash = getHash(servers[i]);
            // 理论上，hash环的最大值为2^32
            // 这里为做实例，将ip末尾作为上限也就是254
            // 那么服务器是0-4，乘以60后可以均匀分布到 0-254 的环上去
            // 实际的请求ip到来时，在环上查找即可
            hash *= 60;
            System.out.println("add " + servers[i] + ", hash=" + hash);
            serverMap.put(hash, servers[i]);
        }
    }

    // 查找节点
    private static String getServer(String key) {
        int hash = getHash(key);
        // 得到大于该Hash值的所有server
        SortedMap<Integer, String> subMap = serverMap.tailMap(hash);
        if (subMap.isEmpty()) {
            // 如果没有比该key的hash值大的，则从第一个node开始
            Integer i = serverMap.firstKey();
            // 返回对应的服务器
            return serverMap.get(i);
        } else {
            // 第一个Key就是顺时针过去离node最近的那个结点
            Integer i = subMap.firstKey();
            // 返回对应的服务器
            return subMap.get(i);
        }
    }

    // 运算hash值
    // 该函数可以自由定义，只要做到取值离散即可
    // 这里取ip地址的最后一节
    private static int getHash(String str) {
        String last = str.substring(str.lastIndexOf(".") + 1, str.length());
        return Integer.valueOf(last);
    }

    public static void main(String[] args) {
        // 模拟5个随机ip请求
        for (int i = 1; i < 8; i++) {
            String ip = "192.168.1." + i * 30;
            System.out.println(ip + " ---> " + getServer(ip));
        }
        // 将5号服务器加到2-3之间，取中间位置，150
        System.out.println("add 192.168.0.5，hash=150");
        serverMap.put(150, "192.168.0.5");
        // 再次发起5个请求
        for (int i = 1; i < 8; i++) {
            String ip = "192.168.1." + i * 30;
            System.out.println(ip + " ---> " + getServer(ip));
        }
    }

}

5.验证

4台机器加入hash环
模拟请求，根据hash值，准确调度到下游节点
添加节点5，key取150
再次发起请求

4.典型业务场景应用

1.网站敏感词过滤

1.场景：敏感词、文字过滤是一个网站必不可少的功能，高效的过滤算法是非常有必要的。针对过滤首先想到的可能是这样：

方案一、使用java里的String contains，逐个遍历敏感词：

String[] s = "广告,广告词,中奖".split(",");
String text = "讨厌的广告词";
boolean flag = false;
for (String s1 : s) {
    if (text.contains(s1)){
        flag = true;
        break;
    }
}
System.out.println(flag);

方案二、正则表达式：

System.out.println(text.matches(".*(广告|广告词|中奖).*"));

2.概述

DFA即Deterministic Finite Automaton，也就是确定有穷自动机，它是是通过event和当前的state得到下一个state，即event+state=nextstate。

对照到以上案例，查找和停止查找是动作，找没找到是状态，每一步的查找和结果决定下一步要不要继续。DFA算法在敏感词上应用的关键是构建敏感词库，如果我们把以上案例翻译成json表达如下

{
    "isEnd": 0,
    "广": {
        "isEnd": 0,
        "告": {
            "isEnd": 1,
            "词": {
                "isEnd": 1
            }
        }
    },
    "中": {
        "isEnd": 0,
        "奖": {
            "isEnd": 1
        }

    }
}

查找过程如下：首先把text按字拆分，逐个字查找词库的key，先从“讨”开始，没有就下一个字“厌”，直到“广”，找到就判断isEnd，如果为1，说明匹配成功包含敏感词，如果为0，那就继续匹配“告”，直到isEnd=1为止。

匹配策略上，有两种。最小和最大匹配。最小则匹配【广告】，最大则需要匹配到底【广告词】

3.java实现:

package com.andy.app;

import com.alibaba.fastjson2.JSON;

import java.util.HashMap;
import java.util.HashSet;
import java.util.Map;
import java.util.Set;

/**
 * @author Andy
 * @version 0.0.1
 * @since 2023-09-15 17:49
 * 敏感词处理DFA算法
 */
public class SensitiveWordUtil {
    // 短匹配规则，如：敏感词库["广告","广告词"]，语句："我是广告词"，匹配结果：我是[广告]
    public static final int SHORT_MATCH = 1;
    // 长匹配规则，如：敏感词库["广告","广告词"]，语句："我是广告词"，匹配结果：我是[广告词]
    public static final int LONG_MATCH = 2;

    /**
     * 敏感词库
     */
    public static HashMap sensitiveWordMap;


    /**
     * 初始化敏感词库
     * words:敏感词，多个用英文逗号分隔
     */
    private static void initSensitiveWordMap(String words) {
        String[] w = words.split(",");
        sensitiveWordMap = new HashMap(w.length);
        Map nowMap;
        for (String key : w) {
            nowMap = sensitiveWordMap;
            for (int i = 0; i < key.length(); i++) {
                // 转换成char型
                char keyChar = key.charAt(i);
                // 库中获取关键字
                Map wordMap = (Map) nowMap.get(keyChar);
                // 如果不存在新建一个，并加入词库
                if (wordMap == null) {
                    wordMap = new HashMap();
                    wordMap.put("isEnd", "0");
                    nowMap.put(keyChar, wordMap);
                }
                nowMap = wordMap;
                if (i == key.length() - 1) {
                    // 最后一个
                    nowMap.put("isEnd", "1");
                }
            }
        }
    }

    /**
     * 判断文字是否包含敏感字符
     *
     * @return 若包含返回true，否则返回false
     */
    public static boolean contains(String txt, int matchType) {
        for (int i = 0; i < txt.length(); i++) {
            int matchFlag = checkSensitiveWord(txt, i, matchType); // 判断是否包含敏感字符
            if (matchFlag > 0) {    // 大于0存在，返回true
                return true;
            }
        }
        return false;
    }


    /**
     * 沿着文本字符挨个往后检索文字中的敏感词
     */
    public static Set<String> getSensitiveWord(String txt, int matchType) {
        Set<String> sensitiveWordList = new HashSet<>();
        for (int i = 0; i < txt.length(); i++) {
            // 判断是否包含敏感字符
            int length = checkSensitiveWord(txt, i, matchType);
            if (length > 0) {// 存在,加入list中
                sensitiveWordList.add(txt.substring(i, i + length));
                // 指针沿着文本往后移动敏感词的长度
                // 也就是一旦找到敏感词，加到列表后，越过这个词的字符，继续往下搜索
                // 但是必须减1，因为for循环会自增，如果不减会造成下次循环跳格而忽略字符
                // 这会造成严重误差
                i = i + length - 1;
            }
            // 如果找不到，i就老老实实一个字一个字的往后移动，作为begin进行下一轮
        }

        return sensitiveWordList;
    }


    /**
     * 从第beginIndex个字符的位置，往后查找敏感词
     * 如果找到，返回敏感词字符的长度，不存在返回0
     * 这个长度用于找到后提取敏感词和后移指针，是个性能关注点
     */
    private static int checkSensitiveWord(String txt, int beginIndex, int matchType) {
        // 敏感词结束标识位：用于敏感词只有1位的情况
        boolean flag = false;
        // 匹配到的敏感字的个数，也就是敏感词长度
        int length = 0;
        char word;
        // 从根Map开始查找
        Map nowMap = sensitiveWordMap;
        for (int i = beginIndex; i < txt.length(); i++) {
            // 被判断语句的第i个字符开始
            word = txt.charAt(i);
            // 获取指定key，并且将敏感库指针指向下级map
            nowMap = (Map) nowMap.get(word);
            if (nowMap != null) {// 存在，则判断是否为最后一个
                // 找到相应key，匹配长度+1
                length++;
                // 如果为最后一个匹配规则,结束循环，返回匹配标识数
                if ("1".equals(nowMap.get("isEnd"))) {
                    // 结束标志位为true
                    flag = true;
                    // 短匹配，直接返回,长匹配还需继续查找
                    if (SHORT_MATCH == matchType) {
                        break;
                    }
                }
            } else {
                // 敏感库不存在，直接中断
                break;
            }
        }
        if (length < 2 || !flag) {
            // 长度必须大于等于1才算是词，字的话就不必这么折腾了
            length = 0;
        }
        return length;
    }


    public static void main(String[] args) {

        // 初始化敏感词库
        SensitiveWordUtil.initSensitiveWordMap("广告,广告词,中奖");

        System.out.println("敏感词库结构：" + JSON.toJSONString(sensitiveWordMap));
        String string = "关于中奖广告的广告词筛选";
        System.out.println("被检测文本：" + string);
        System.out.println("待检测字数：" + string.length());

        // 是否含有关键字
        boolean result = SensitiveWordUtil.contains(string, SensitiveWordUtil.LONG_MATCH);
        System.out.println("长匹配：" + result);
        result = SensitiveWordUtil.contains(string, SensitiveWordUtil.SHORT_MATCH);
        System.out.println("短匹配：" + result);

        // 获取语句中的敏感词
        Set<String> set = SensitiveWordUtil.getSensitiveWord(string, SensitiveWordUtil.LONG_MATCH);
        System.out.println("长匹配到：" + set);
        set = SensitiveWordUtil.getSensitiveWord(string, SensitiveWordUtil.SHORT_MATCH);
        System.out.println("短匹配到：" + set);

    }

}

4.结果分析

敏感词结构初始化后符合预期
检测和长短匹配有结果
匹配的敏感词列表正确

2.最优商品topk

1.背景:topk是一个典型的业务场景，除了最优商品，包括推荐排名、积分排名所有涉及到排名前k的地方都是该算法的应用场合

2.方案；

方案一
- 全局排序，将集合整体排序后，取出最大的k个值就是需要的结果
- 这种方案最糟糕，我只需要排名前k的元素，其他n-k个的顺序我并不关心，但是运算过程中，都得跟着做了没用的排序操作
方案二
- 局部排序，既然全局没必要，那我只取前k个，后面的就没必要理会了
- 冒泡排序在排序算法中可以胜任该操作。我们按最大值往上冒泡为例，只要执行k次冒泡，那前k名就可以确定。但是这种方案依然不是最优办法。因为我们需要的是前k名，那至于这k个，谁大谁小并不需要关心，排序依然是个浪费
方案三
- 最小堆，既然没必要排序，那我们就不排序
- 先将前k个元素形成一个最小堆，后面的n-k个元素依次与堆顶比较，小则丢弃大则替换堆顶并调整堆。直到n个全部完成为止。最小堆是topk的经典解决方案

3.代码：

package com.andy.app;

import java.util.Arrays;

/**
 * @author Andy
 * @version 0.0.1
 * @since 2023-09-15 18:00
 */
public class Topk {
    // 堆元素下沉，形成最小堆，序号从i开始
    static void down(int[] nodes, int i) {
        // 顶点序号遍历，只要到1半即可，时间复杂度为O(log2n)
        while (i << 1 < nodes.length) {
            // 左子，为何左移1位？回顾一下二叉树序号
            int left = i << 1;
            // 右子，左+1即可
            int right = left + 1;
            // 标记，指向 本节点，左、右子节点里最小的，一开始取i自己
            int flag = i;
            // 判断左子是否小于本节点
            if (nodes[left] < nodes[i]) {
                flag = left;
            }
            // 判断右子
            if (right < nodes.length && nodes[flag] > nodes[right]) {
                flag = right;
            }
            // 两者中最小的与本节点不相等，则交换
            if (flag != i) {
                int temp = nodes[i];
                nodes[i] = nodes[flag];
                nodes[flag] = temp;
                i = flag;
            } else {
                // 否则相等，堆排序完成，退出循环即可
                break;
            }
        }

    }

    public static void main(String[] args) {
        // 原始数据
        int[] src = {3, 6, 2, 7, 4, 8, 1, 9, 2, 5};
        // 要取几个
        int k = 5;
        // 堆，为啥是k+1？请注意，最小堆的0是无用的，序号从1开始
        int[] nodes = new int[k + 1];
        // 取前k个数，注意这里只是个二叉树，还不满足最小堆的要求
        for (int i = 0; i < k; i++) {
            nodes[i + 1] = src[i];
        }
        System.out.println("before:" + Arrays.toString(nodes));
        // 从最底的子树开始，堆顶下沉
        // 这里才真正的形成最小堆
        for (int i = k >> 1; i >= 1; i--) {
            down(nodes, i);
        }
        System.out.println("create:" + Arrays.toString(nodes));

        // 把余下的n-k个数，放到堆顶，依次下沉，topk堆算法的开始
        for (int i = src.length - k; i < src.length; i++) {
            if (nodes[1] < src[i]) {
                nodes[1] = src[i];
                down(nodes, 1);
            }
        }
        System.out.println("topk:" + Arrays.toString(nodes));
    }

}

4.结果分析

最终获取k个值成功，符合要求
中间不涉及排序问题

你可能感兴趣的:(算法,windows)

算法-图-查找路径程序员南飞算法 java 数据结构职场和发展 leetcode
力扣题目：1971.寻找图中是否存在路径-力扣（LeetCode）有一个具有n个顶点的双向图，其中每个顶点标记从0到n-1（包含0和n-1）。图中的边用一个二维整数数组edges表示，其中edges[i]=[ui,vi]表示顶点ui和顶点vi之间的双向边。每个顶点对由最多一条边连接，并且没有顶点存在与自身相连的边。请你确定是否存在从顶点source开始，到顶点destination结束的有效路径。
数据采集技术：selenium/正则匹配/xpath/beautifulsoup爬虫实例写代码的中青年 3天入门机器学习 selenium beautifulsoup 爬虫 python xpath 正则表达式
专栏介绍1.专栏面向零基础或基础较差的机器学习入门的读者朋友，旨在利用实际代码案例和通俗化文字说明，使读者朋友快速上手机器学习及其相关知识体系。2.专栏内容上包括数据采集、数据读写、数据预处理、分类\回归\聚类算法、可视化等技术。3.需要强调的是，专栏仅介绍主流、初阶知识，每一技术模块都是AI研究的细分领域，同更多技术有所交叠，此处不进行讨论和分享。数据采集技术：selenium/正则匹配/xpa
BCPD++(非刚性配准) 算法原理详解点云SLAM 点云数据处理技术算法 BCPD++非刚性拼接点云数据处理贝叶斯模型
BCPD++算法原理详解一、算法概述BCPD++（BayesianCoherentPointDrift++）是BCPD（BayesianCoherentPointDrift）的增强版本，专为非刚性点云配准设计。它基于贝叶斯概率框架，结合变分推断与高效优化策略，显著提升了配准精度、鲁棒性与计算效率。BCPD++的核心创新在于：分层贝叶斯模型：自适应学习超参数，减少人工调参需求。变分贝叶斯推断：替代传
Git最佳实践指南（Windows/Linux双系统详解） i建模前端开发 git windows linux web
Git最佳实践指南：从入门到熟练（Windows/Linux双系统详解）一、环境搭建与基础配置（适用Windows/Linux）1.1Git安装与验证#Windows系统安装（推荐Chocolatey包管理）#直接下载git二进制文件安装包更方便chocoinstallgit#Linux系统安装（Debian系）sudoapt-getupdate&&sudoapt-getinstallgit#验证
点云配准（点云拼接）论文综述点云SLAM 点云数据处理技术点云数据处理点云配准 DeepICP ICP 深度学习配准方法特征匹配
点云配准（点云拼接）论文综述1.引言点云配准（PointCloudRegistration）是三维计算机视觉与机器人感知领域的核心任务，其目标是通过几何变换将多个点云对齐至统一坐标系，形成完整的场景表示。该技术广泛应用于自动驾驶、增强现实、工业检测、医学影像等领域。随着传感器技术（如LiDAR、RGB-D相机）的进步与深度学习的发展，点云配准方法经历了从传统优化算法到数据驱动模型的演变。本文系统综
CPD（Coherent Point Drift）非刚性点云配准算法点云SLAM 点云数据处理技术算法概率论机器学习非刚性配准 CPD配准算法 EM算法非刚性拼接
CPD（CoherentPointDrift）非刚性点云配准算法详解一、算法概述CPD（CoherentPointDrift）是一种基于概率模型的非刚性点云配准方法，由AndriyMyronenko等人在2009年提出。它通过将点云配准问题转化为概率密度估计问题，结合高斯混合模型（GMM）与正则化形变场，能够有效处理复杂形变（如人体运动、器官形变）的点云对齐任务。核心特点：非刚性对齐：支持大范围、
解读 DeepSeek 关键 RL 算法 GRPO 进一步有进一步的欢喜 LLM 算法 DeepSeek GRPO
DeepSeekGRPO：面向超大规模RLHF的梯度正则化策略优化算法引言在当下人工智能蓬勃发展的浪潮里，DeepSeek无疑是一颗耀眼的明星，频繁出现在各类科技前沿讨论中，热度持续攀升。从惊艳的模型表现，到不断拓展的应用场景，DeepSeek正以强劲之势重塑着行业格局。大家不难发现，无论是复杂的自然语言处理任务，还是充满挑战的智能推理难题，DeepSeek都能展现出卓越的性能。而这斐然成绩的背后
java开发工程师面试技巧酷爱码经验分享 java 面试开发语言
Java开发工程师面试是一个常见的技术岗位面试，以下是一些面试技巧和建议：熟悉Java基础知识：在面试中，会经常被问到Java基础知识，包括面向对象编程、集合框架、异常处理、多线程等内容。要确保对这些知识点有扎实的掌握。练习编程题目：在面试中，通常会有编程题目要求，因此建议提前练习一些常见的编程题目，例如算法和数据结构题目。深入了解项目经历：准备好详细了解自己之前的项目经历，包括项目的背景、自己的
electron部署更新服务器 zhhao1 部署 vercel electron
1.electron更新有两种方式windows应用安装打包有两种1.squirrel第一种通过electron包里的autoUpdater模块，设置github用户名/repo仓库名，会自动拼接feedurl为https://update.electronjs.org/${用户名}/${仓库名}/${arch}/${version},更新服务器update.electronjs.org会去git
MySQL 8.0 社区版安装与配置全流程指南（Windows平台） waicsdn_haha 程序员教程数据库 mysql windows python django pygame virtualenv
一、软件定位与特性MySQL8.0是开源关系型数据库管理系统的里程碑版本，支持ACID事务、JSON文档存储、窗口函数等特性，广泛应用于Web开发、数据分析等领域。相较于旧版本，8.0版引入以下核心升级：性能优化：查询速度提升2倍以上安全性增强：默认启用caching_sha2_password认证插件功能扩展：支持CTE（公共表表达式）和原子DDL二、安装环境准备1.系统要求项目最低配置推荐配置
2024年前端框架选择指南：React、Vue、Angular与新兴框架对比海豹工匠前端框架
在当今快速发展的前端技术领域，选择合适的框架对于项目成功至关重要。本文将深入探讨主流前端框架的特点、优缺点及适用场景，为开发者提供全面的选择指南。主流框架概览React特点：基于组件的开发方式，虚拟DOM差分算法优点：灵活性强，生态系统丰富缺点：需要学习JSX和状态管理库适用场景：中大型项目，需要高度灵活性和复杂状态管理的应用Vue特点：简单易学，模板直观，内置状态管理优点：学习曲线平缓，适合快速
使用 yolov8 进行对象检测算法资料吧！ YOLO
在计算机视觉领域，YOLOv8对象检测确实以其超高的准确性和速度而脱颖而出。它是YOLO系列的最新版本，以能够实时检测物体而闻名。YOLOv8凭借其一流的对象检测将Web应用程序、API和图像分析提升到一个新的水平。在本文中，我们将了解如何利用yolov8进行对象检测。YOLO概述YOLO（YouOnlyLookOnce）是一种改变游戏规则的对象检测算法，于2015年问世，以其一次闪电般快速处理整
为什么你的硬盘容量总是缩水?512G的硬盘查看发现只有476G?纯小白也能看懂 *星之卡比* 科普硬件工程电脑科技
文章目录为什么电脑容量是512G但是查看的时候总是比512G少?原因一:OP空间使用OP空间的好处:OP空间的大小：原因二:硬盘厂商(十进制)和windows系统(二进制)使用的进制算法不同名词解释为什么电脑容量是512G但是查看的时候总是比512G少?原因一:OP空间op空间(Over-Provisioning空间),是是指额外预留的存储空间，超出用户可用存储容量的部分。简单来说，OP空间是一种
Python 从基础到进阶（一套打通）浪子西科 Python python 开发语言
文章目录一、Python入门1.1Python简介1.2安装PythonWindowsLinuxmacOS1.3第一个Python程序交互式环境脚本文件二、Python基础语法2.1变量和数据类型变量数据类型数字类型字符串类型（str）布尔类型（bool）2.2运算符算术运算符比较运算符逻辑运算符位运算符2.3控制流语句条件语句循环语句`for`循环`while`循环三、Python数据结构3.1
代码随想录算法训练营Day57 | 拓扑排序精讲、dijkstra（朴素版）精讲 Harryline-lx 代码随想录算法
文章目录117.软件构建思路与重点47.参加科学大会思路与重点117.软件构建题目链接：117.软件构建讲解链接：代码随想录状态：一遍AC。思路与重点概括来说，给出一个有向图，把这个有向图转成线性的排序就叫拓扑排序。拓扑排序也是图论中判断有向无环图的常用方法。拓扑排序模板题。#include#include#include#includeusingnamespacestd;intmain(){in
安装Miniconda3-Python 3.8环境管理工具 Lemaden
本文还有配套的精品资源，点击获取简介：Miniconda3-py38_4.11.0-Windows-x86_64.zip提供了一个针对Python3.8版本的轻量级Miniconda发行版，适用于64位Windows系统。它包括Python解释器、Conda包管理器和基本科学计算库，支持创建独立的Python环境。此版本的Conda包管理器版本号为4.11.0。用户可以通过安装后使用Conda命令
Linux+conda+R+Rstudio下载安装环境全方面配置爱吃鱼子酱程序语言大数据 linux conda r语言
很多小伙伴不习惯在R中用到conda环境，其实这可能是因为你还没有使用到对环境有更高要求的包。假如我们想安装R包A，它要求的R版本是4.3.0，但是你现在R版本是4.2.0，并且你其他的算法包都是根据4.2.0所创建的，那么就会造成这个包装不上的尴尬场景。此外，conda还能帮你解决安装R包时出现的各种系统错误（例如gcc版本等）conda环境可以为每个项目创建一个单独的环境，刚开始用可能比较棘手
数据结构------最短路弗洛伊德算法（Flody) 不羁修士数据结构 c++图论数据结构图搜索算法动态规划
目录前言一、Foldy代码核心介绍二、Flody代码详解：三、所有代码：四、Foldy算法分析:总结前言如果你要求所有顶点至所有顶点的最短路径问题时，弗洛伊德算法是非常不错的选择。因为它十分简洁。一、Foldy代码核心介绍(1)两个二维数组D[v][w]和P[v][w]，分别存最短距离和最短路径。(2)D[v][w]=min(D[v,w]，D[v][k]+D[k][w])二、Flody代码详解：/
代码随想录算法训练营第58天|拓扑排序精讲、dijkstra（朴素版）精讲 Yinems 算法
打卡Day581.拓扑排序精讲2.dijkstra（朴素版）精讲1.拓扑排序精讲题目链接：拓扑排序精讲文档讲解：代码随想录给出一个有向图，把这个有向图转成线性的排序就叫拓扑排序。拓扑排序要检测这个有向图是否有环，即存在循环依赖的情况，因为这种情况是不能做线性排序的。所以拓扑排序是图论中判断有向无环图的常用方法。拓扑排序的过程，有两步，第一步，找到入度为0的节点，加入结果集；第二步，将该节点从图中移
【Qt】14 计算器核心解析算法(下) c++
一、后缀表达式中的数字与运算符后缀表达式的数字和运算符当前元素为数字：进栈当前元素的运算符1.从栈中弹出右操作符2.从栈中弹出右操作符3.根据符号进行运算4.将运算结果压入栈中遍历结束栈中的唯一数字为运算结果。while(!exp.isEmpty){if(当前元素为数字){入栈；}elseif(当前元素为运算符){1.从栈中弹出右操作符2.从栈中弹出右操作符3.根据符号进行运算4.将运算结果压入栈
《人工智能之高维数据降维算法：PCA与LDA深度剖析》机器学习人工智能
在人工智能与机器学习蓬勃发展的当下，数据处理成为关键环节。高维数据在带来丰富信息的同时，也引入了计算复杂度高、过拟合风险增大以及数据稀疏性等难题。降维算法应运而生，它能将高维数据映射到低维空间，在减少维度的同时最大程度保留关键信息。主成分分析（PCA）与线性判别分析（LDA）作为两种常用的降维算法，在人工智能领域应用广泛。本文将深入探讨它们的原理。PCA：无监督的降维利器核心思想PCA基于最大方差
【leetcode刷题版】哈希表学废了wuwu leetcode 算法 python 哈希算法
系列文章目录文章目录系列文章目录背景知识一、有效的字母异位词二、两个数组的交集三、快乐数四、两数之和五、四数相加六、赎金信七、三数之和八、四数之和背景知识哈希函数（HashFunction）：哈希函数是一种将任意长度的输入（键）通过某种算法转换为固定长度的输出（哈希值）的函数。好的哈希函数应该能够将输入均匀地分布在哈希表中，以减少冲突。冲突（Collision）：当两个不同的键通过哈希函数得到相同
【leetcode刷题版】回溯算法学废了wuwu 算法 leetcode python
系列文章目录文章目录系列文章目录背景知识一、组合二、组合优化三、电话号码的字母组合四、组合总和五、组合总和Ⅱ六、分割回文串七、复原IP地址八、子集九、子集（需要去重）十、非递减子序列十一、全排列十一、全排列Ⅱ十二、重新安排行程（难）十三、N皇后十四、解数独背景知识回溯算法是一种通过试错来解决问题的算法。它会在解决问题的过程中剪枝，以避免无效搜索。在Python中实现回溯算法通常涉及以下几个步骤：定
IntelliJ IDEA的快捷键不生效山高自有客行路 IntelliJ IDEA java
当你遇到IntelliJIDEA的快捷键不生效的问题时，可以按照以下步骤逐一排查和解决问题。检查冲突的快捷键查找冲突源：首先，你需要找出是哪个软件与IDEA的快捷键发生了冲突。常见的冲突源包括输入法（特别是Windows自带的输入法）、聊天软件（如QQ或微信）等。你可以尝试关闭这些软件，看看IDEA的快捷键是否恢复正常。修改快捷键：如果找到了冲突的软件，你可以在那个软件中禁用冲突的快捷键，或者在I
【动手学运动规划】2.6 Reeds Shepp曲线自动驾驶小白说动手学运动规划自动驾驶算法运动规划
我出来打工，我不惦记钱，我惦记什么？—武林外传黄豆豆代码及环境配置：请参考环境配置和代码运行!ReedsShepp，通常简称为RS曲线，是一种用于路径规划的算法，由J.A.Reeds和L.A.Shepp在1990年的论文《OptimalPathsforaCarThatGoesBothForwardsandBackwards》中提出。该算法主要用于描述机器人或车辆在平面上的运动轨迹，特别是在需要考虑
使用django调用deepseek api，搭建ai网站陈王卜人工智能
一、deepseek简介DeepSeek是一家人工智能公司，专注于开发先进的人工智能模型和技术。以下是关于DeepSeek的一些详细介绍：1.公司背景DeepSeek由杭州深度求索人工智能基础技术研究有限公司开发，致力于通过创新的技术和算法，推动人工智能领域的发展。2.技术与模型DeepSeek-V3：这是DeepSeek开发的一个大型语言模型，具有超过600B的参数，在多项性能指标上与国际顶尖模
大批量影像瓦片优化水塔鸡丝 GIS 瓦片处理影像 GIS
背景在很多场景中，需要用的影像瓦片，常规的思路是将tif进行切图，做成分层的瓦片：但是，如果层级太高，产生的文件将十分庞大，据测试，某地级市18层级切片，内存占用高达200多G，在部署和传输的过程中，都很不利。通用处理因此，采取的思路是如何能够压缩每一张图层，在尽可能保留原有分辨率和色彩的同时，减少影像图片内存的大小。最初采用开源压缩工具：pngquantwindows下有GUI版本，但是GUI版
避免死锁的方式蜗牛^^O^ java
1、加锁顺序保持一致2、加锁不成功，立即释放所有抢占到的锁3、银行家算法银行家算法：使用向量维护所有闲置资源每个进程不断申请的资源向量已知比如P0进程需要申请a向量，还需要申请b向量P1进程需要申请c向量，还需要申请d向量通过预判演算出一种安全序列，谁先申请谁后申请，谁先释放，释放后在申请。争取实现资源的最大化利用。但是这种算法不现实，因为每个进程申请的资源是不可预知。每个进程请求资源时，先预判是
window NT - WDM - WDF 驱动概念指掀涛澜天下惊 c++驱动程序 windows c++驱动开发
NT是驱动模型：NT式驱动程序模型是一种比较老式的驱动程序模型，但适用于现有的Windows系统。NT式驱动模型没有固定的形式，最简单的NT式驱动程序模型这一特点，程序开发者可以编写一个完全不支持硬件工作的驱动程序，却可以将代码运行在内核模式中。NT设备驱动程序的动态加载主要是由服务控制管理程序组件来完成的。Windows服务可以在系统启动时加载，用户也可以按需在服务控制平台开启或者关闭服务。程序
DirectX12（D3D12）基础教程二“纹理” 指掀涛澜天下惊 d3d12 c++vc 3d c++visual studio windows 开发语言
什么是纹理，简单理解叫贴图,比如现在一张1920X1080图片要显示在1920X1080的窗口上，那么图片像素与窗口一一对应简单的复制粘贴。如果图片大小与目标大小不一样时通过某种算法实现显示目标窗口上，这就叫纹理过滤。纹理坐标范围0到1，原点在左下角使用d3d12窗口显示一张图片，如果用gdi+现实简单多了，调用一个函数就可以解决。1.读取图片信息大小，像素深度BPP，d3d12所要的格式,数据。
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt