xushiyu1996818

哈希（散列，Hash）算法总结-java版

哈希算法简介

哈希算法的分类

加法Hash

位运算Hash

乘法Hash

除法Hash

查表Hash

混合Hash

常用的哈希算法

直接寻址法

数字分析法

平方取中法

折叠法

随机数法

除留余数法

流行的哈希算法

MD4

MD5

SHA及其他

碰撞性

哈希算法在java中的使用

Object

Integer

Long

String

HashMap

哈希算法简介

Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入（又叫做预映射， pre-image），通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，而不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。

哈希表是根据设定的哈希函数H（key）和处理冲突方法将一组关键字映射到一个有限的地址区间上，并以关键字在地址区间中的象作为记录在表中的存储位置，这种表称为哈希表或散列，所得存储位置称为哈希地址或散列地址。作为线性数据结构与表格和队列等相比，哈希表无疑是查找速度比较快的一种。

通过将单向数学函数（有时称为“哈希算法”）应用到任意数量的数据所得到的固定大小的结果。如果输入数据中有变化，则哈希也会发生变化。哈希可用于许多操作，包括身份验证和数字签名。也称为“消息摘要”。

简单解释：哈希（Hash）算法，即散列函数。它是一种单向密码体制，即它是一个从明文到密文的不可逆的映射，只有加密过程，没有解密过程。同时，哈希函数可以将任意长度的输入经过变化以后得到固定长度的输出。哈希函数的这种单向特征和输出数据长度固定的特征使得它可以生成消息或者数据。

不同的应用对Hash函数有着不同的要求；比如，用于加密的Hash函数主要考虑它和单项函数的差距（不能被破解），而用于查找的Hash函数主要考虑它映射到小范围的冲突率。

哈希算法的分类

加法Hash

所谓的加法Hash就是把输入元素一个一个的加起来构成最后的结果。标准的加法Hash的构造如下：

static int additiveHash(String key, int prime)
{
 int hash, i;
 for (hash = key.length(), i = 0; i < key.length(); i++)
  hash += key.charAt(i);
 return (hash % prime);
}

这里的prime是任意的质数，看得出，结果的值域为[0,prime-1]。

位运算Hash

这类型Hash函数通过利用各种位运算（常见的是移位和异或）来充分的混合输入元素。比如，标准的旋转Hash的构造如下：

static int rotatingHash(String key, int prime)
{
 int hash, i;
 for (hash=key.length(), i=0; i
   hash = (hash<<4>>28)^key.charAt(i);
 return (hash % prime);
}

先移位，然后再进行各种位运算是这种类型Hash函数的主要特点。比如，以上的那段计算hash的代码还可以有如下几种变形：

hash = (hash<<5>>27)^key.charAt(i);
hash += key.charAt(i);
hash += (hash << 10);
hash ^= (hash >> 6);
if((i&1) == 0)
{
hash ^= (hash<<7>>3);
 }
else
 {
 hash ^= ~((hash<<11>>5));
 }
hash += (hash<<5>
hash = key.charAt(i) + (hash<<6>>16) ? hash;
hash ^= ((hash<<5>>2));

乘法Hash

这种类型的Hash函数利用了乘法的不相关性（乘法的这种性质，最有名的莫过于平方取头尾的随机数生成算法，虽然这种算法效果并不好）。

就是每次hash=hash*n+x

    uint32_t time33(char const *str, int len) 
    { 
        unsigned long  hash = 0; 
        for (int i = 0; i < len; i++) { 
            hash = hash *33 + (unsigned long) str[i]; 
        } 
        return hash; 
    }

jdk5.0里面的String类的hashCode()方法也使用乘法Hash。不过，它使用的乘数是31。推荐的乘数还有：131, 1313, 13131, 131313等等。
使用这种方式的著名Hash函数还有：

// 32位FNV算法
int M_SHIFT = 0;
  public int FNVHash(byte[] data)
  {
      int hash = (int)2166136261L;
      for(byte b : data)
          hash = (hash * 16777619) ^ b;
      if (M_SHIFT == 0)
          return hash;
      return (hash ^ (hash >> M_SHIFT)) & M_MASK;
}

以及改进的FNV算法：

public static int FNVHash1(String data)
{
      final int p = 16777619;
      int hash = (int)2166136261L;
      for(int i=0;i
          hash = (hash ^ data.charAt(i)) * p;
      hash += hash << 13;
      hash ^= hash >> 7;
      hash += hash << 3;
      hash ^= hash >> 17;
      hash += hash << 5;
      return hash;
}

除了乘以一个固定的数，常见的还有乘以一个不断改变的数，比如：

static int RSHash(String str)
{
      int b    = 378551;
      int a    = 63689;
      int hash = 0;

     for(int i = 0; i < str.length(); i++)
     {
        hash = hash * a + str.charAt(i);
        a    = a * b;
     }
     return (hash & 0x7FFFFFFF);
}

虽然Adler32算法的应用没有CRC32广泛，不过，它可能是乘法Hash里面最有名的一个了。关于它的介绍，大家可以去看RFC 1950规范。

除法Hash

除法和乘法一样，同样具有表面上看起来的不相关性。不过，因为除法太慢，这种方式几乎找不到真正的应用。需要注意的是，我们在前面看到的hash的结果除以一个prime的目的只是为了保证结果的范围。

限制一个范围，一般都是与2^n -1 进行与运算

hash=hash & 1111111

保证结果在[0,2^n -1] 的范围内

如果你需要它限制一个范围的话，运用上面的公式即可，但是会发现hash位数高的部分被截断了，只留下位数低的部分，所以在做除法前，可以使用如下的代码

”hash%prime”： hash = hash ^ (hash>>10) ^ (hash>>20)。

这个公式能让hash的后位与前位进行混合，比如0-10位与10-20,20-30 进行亦或操作，让位数低的部分包含位数高的部分的特征

查表Hash

查表Hash最有名的例子莫过于CRC系列算法。虽然CRC系列算法本身并不是查表，但是，查表是它的一种最快的实现方式。下面是CRC32的实现：

static int crctab[256] = {
0x00000000, 0x77073096, 0xee0e612c, 0x990951ba, 0x076dc419, 0x706af48f, 0xe963a535, 0x9e6495a3, 0x0edb8832, 0x79dcb8a4, 0xe0d5e91e, 0x97d2d988, 0x09b64c2b, 0x7eb17cbd, 0xe7b82d07, 0x90bf1d91, 0x1db71064, 0x6ab020f2, 0xf3b97148, 0x84be41de, 0x1adad47d, 0x6ddde4eb, 0xf4d4b551, 0x83d385c7, 0x136c9856, 0x646ba8c0, 0xfd62f97a, 0x8a65c9ec, 0x14015c4f, 0x63066cd9, 0xfa0f3d63, 0x8d080df5, 0x3b6e20c8, 0x4c69105e, 0xd56041e4, 0xa2677172, 0x3c03e4d1, 0x4b04d447, 0xd20d85fd, 0xa50ab56b, 0x35b5a8fa, 0x42b2986c, 0xdbbbc9d6, 0xacbcf940, 0x32d86ce3, 0x45df5c75, 0xdcd60dcf, 0xabd13d59, 0x26d930ac, 0x51de003a, 0xc8d75180, 0xbfd06116, 0x21b4f4b5, 0x56b3c423, 0xcfba9599, 0xb8bda50f, 0x2802b89e, 0x5f058808, 0xc60cd9b2, 0xb10be924, 0x2f6f7c87, 0x58684c11, 0xc1611dab, 0xb6662d3d, 0x76dc4190, 0x01db7106, 0x98d220bc, 0xefd5102a, 0x71b18589, 0x06b6b51f, 0x9fbfe4a5, 0xe8b8d433, 0x7807c9a2, 0x0f00f934, 0x9609a88e, 0xe10e9818, 0x7f6a0dbb, 0x086d3d2d, 0x91646c97, 0xe6635c01, 0x6b6b51f4, 0x1c6c6162, 0x856530d8, 0xf262004e, 0x6c0695ed, 0x1b01a57b, 0x8208f4c1, 0xf50fc457, 0x65b0d9c6, 0x12b7e950, 0x8bbeb8ea, 0xfcb9887c, 0x62dd1ddf, 0x15da2d49, 0x8cd37cf3, 0xfbd44c65, 0x4db26158, 0x3ab551ce, 0xa3bc0074, 0xd4bb30e2, 0x4adfa541, 0x3dd895d7, 0xa4d1c46d, 0xd3d6f4fb, 0x4369e96a, 0x346ed9fc, 0xad678846, 0xda60b8d0, 0x44042d73, 0x33031de5, 0xaa0a4c5f, 0xdd0d7cc9, 0x5005713c, 0x270241aa, 0xbe0b1010, 0xc90c2086, 0x5768b525, 0x206f85b3, 0xb966d409, 0xce61e49f, 0x5edef90e, 0x29d9c998, 0xb0d09822, 0xc7d7a8b4, 0x59b33d17, 0x2eb40d81, 0xb7bd5c3b, 0xc0ba6cad, 0xedb88320, 0x9abfb3b6, 0x03b6e20c, 0x74b1d29a, 0xead54739, 0x9dd277af, 0x04db2615, 0x73dc1683, 0xe3630b12, 0x94643b84, 0x0d6d6a3e, 0x7a6a5aa8, 0xe40ecf0b, 0x9309ff9d, 0x0a00ae27, 0x7d079eb1, 0xf00f9344, 0x8708a3d2, 0x1e01f268, 0x6906c2fe, 0xf762575d, 0x806567cb,
0x196c3671, 0x6e6b06e7, 0xfed41b76, 0x89d32be0, 0x10da7a5a, 0x67dd4acc, 0xf9b9df6f, 0x8ebeeff9, 0x17b7be43, 0x60b08ed5, 0xd6d6a3e8, 0xa1d1937e, 0x38d8c2c4, 0x4fdff252, 0xd1bb67f1, 0xa6bc5767, 0x3fb506dd, 0x48b2364b, 0xd80d2bda, 0xaf0a1b4c, 0x36034af6, 0x41047a60, 0xdf60efc3, 0xa867df55, 0x316e8eef, 0x4669be79, 0xcb61b38c, 0xbc66831a, 0x256fd2a0, 0x5268e236, 0xcc0c7795, 0xbb0b4703, 0x220216b9, 0x5505262f, 0xc5ba3bbe, 0xb2bd0b28, 0x2bb45a92, 0x5cb36a04, 0xc2d7ffa7, 0xb5d0cf31, 0x2cd99e8b, 0x5bdeae1d, 0x9b64c2b0, 0xec63f226, 0x756aa39c, 0x026d930a, 0x9c0906a9, 0xeb0e363f, 0x72076785, 0x05005713, 0x95bf4a82, 0xe2b87a14, 0x7bb12bae, 0x0cb61b38, 0x92d28e9b, 0xe5d5be0d, 0x7cdcefb7, 0x0bdbdf21, 0x86d3d2d4, 0xf1d4e242, 0x68ddb3f8, 0x1fda836e, 0x81be16cd, 0xf6b9265b, 0x6fb077e1, 0x18b74777, 0x88085ae6, 0xff0f6a70, 0x66063bca, 0x11010b5c, 0x8f659eff, 0xf862ae69, 0x616bffd3, 0x166ccf45, 0xa00ae278, 0xd70dd2ee, 0x4e048354, 0x3903b3c2, 0xa7672661, 0xd06016f7, 0x4969474d, 0x3e6e77db, 0xaed16a4a, 0xd9d65adc, 0x40df0b66, 0x37d83bf0, 0xa9bcae53, 0xdebb9ec5, 0x47b2cf7f, 0x30b5ffe9, 0xbdbdf21c, 0xcabac28a, 0x53b39330, 0x24b4a3a6, 0xbad03605, 0xcdd70693, 0x54de5729, 0x23d967bf, 0xb3667a2e, 0xc4614ab8, 0x5d681b02, 0x2a6f2b94, 0xb40bbe37, 0xc30c8ea1, 0x5a05df1b, 0x2d02ef8d
};

int crc32(String key, int hash)
{
int i;
for (hash=key.length(), i=0; i
  hash = (hash >> 8) ^ crctab[(hash & 0xff) ^ k.charAt(i)];
return hash;
}

查表Hash中有名的例子有：Universal Hashing和Zobrist Hashing。他们的表格都是随机生成的。

相当于以一个数组的杂乱哈希，作为基础，生成hashcode

混合Hash

混合Hash算法利用了以上各种方式。各种常见的Hash算法，比如MD5、Tiger都属于这个范围。它们一般很少在面向查找的Hash函数里面使用。（一般用于对文件之类的，生成一个对象的特征，需要加密和安全，比较复杂）

常用的哈希算法

直接寻址法

取关键字或关键字的某个线性函数值为散列地址。即H(key)=key或H(key) = a•key + b，其中a和b为常数（这种散列函数叫做自身函数）

数字分析法

分析一组数据，比如一组员工的出生年月日，这时我们发现出生年月日的前几位数字大体相同，这样的话，出现冲突的几率就会很大，但是我们发现年月日的后几位表示月份和具体日期的数字差别很大，如果用后面的数字来构成散列地址，则冲突的几率会明显降低。因此数字分析法就是找出数字的规律，尽可能利用这些数据来构造冲突几率较低的散列地址。

平方取中法

取关键字平方后的中间几位作为散列地址。

折叠法

将关键字分割成位数相同的几部分，最后一部分位数可以不同，然后取这几部分的叠加和（去除进位）作为散列地址。

随机数法

选择一随机函数，取关键字的随机值作为散列地址，通常用于关键字长度不同的场合。

除留余数法

取关键字被某个不大于散列表表长m的数p除后所得的余数为散列地址。即 H(key) = key MOD p, p<=m。不仅可以对关键字直接取模，也可在折叠、平方取中等运算之后取模。对p的选择很重要，一般取素数或m，若p选的不好，容易产生同义词。

流行的哈希算法

MD4

MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年设计的，MD 是 Message Digest 的缩写。它适用在32位字长的处理器上用高速软件实现--它是基于 32 位操作数的位操作来实现的。其输出为 128 位。MD4 已证明不够安全。

MD5

MD5(RFC 1321)是 Rivest 于1991年对MD4的改进版本。它对输入仍以512位分组，其输出是4个32位字的级联(128位)，与 MD4 相同。MD5比MD4来得复杂，并且速度较之要慢一点，但更安全，在抗分析和抗差分方面表现更好。MD5 已被证明不具备"强抗碰撞性"。

SHA及其他

SHA （Secure Hash Algorithm）是一个 Hash 函数族，由 NIST（National Institute of Standards and Technology）于 1993 年发布第一个算法。目前知名的 SHA-1 在 1995 年面世，它的输出为长度 160 位的 hash 值，因此抗穷举性更好。SHA-1 设计时基于和 MD4 相同原理，并且模仿了该算法。SHA-1 已被证明不具"强抗碰撞性"。

为了提高安全性，NIST 还设计出了 SHA-224、SHA-256、SHA-384，和 SHA-512 算法（统称为 SHA-2），跟 SHA-1 算法原理类似。SHA-3 相关算法也已被提出。

对于一些大的商业机构来说， MD5 和 SHA1 已经不够安全，推荐至少使用 SHA2-256 算法。

碰撞性

你可能已经发现了，在实现算法章节的第一个例子，我们尝试的散列算法得到的值一定是一个不大于8的自然数，因此，如果我们随便拿9个数去计算，肯定至少会得到两个相同的值，我们把这种情况就叫做散列算法的「碰撞」（Collision）。

这很容易理解，因为作为一种可用的散列算法，其位数一定是有限的，也就是说它能记录的文件是有限的——而文件数量是无限的，两个文件指纹发生碰撞的概率永远不会是零。

但这并不意味着散列算法就不能用了，因为凡事都要考虑代价，买光所有彩票去中一次头奖是毫无意义的。现代散列算法所存在的理由就是，它的不可逆性能在较大概率上得到实现，也就是说，发现碰撞的概率很小，这种碰撞能被利用的概率更小。

随意找到一组碰撞是有可能的，只要穷举就可以。散列算法得到的指纹位数是有限的，比如MD5算法指纹字长为128位，意味着只要我们穷举2^128次，就肯定能得到一组碰撞——当然，这个时间代价是难以想象的，而更重要的是，仅仅找到一组碰撞并没有什么实际意义。更有意义的是，如果我们已经有了一组指纹，能否找到一个原始文件，让它的散列计算结果等于这组指纹。如果这一点被实现，我们就可以很容易地篡改和伪造网络证书、密码等关键信息。

你也许已经听过MD5已经被破解的新闻——但事实上，即便是MD5这种已经过时的散列算法，也很难实现逆向运算。我们现在更多的还是依赖于海量字典来进行尝试，也就是通过已经知道的大量的文件——指纹对应关系，搜索某个指纹所对应的文件是否在数据库里存在。

哈希算法在java中的使用

Object

public native int hashCode();

可以看到，java的object的hashCode方法是个本地方法，其实是有java虚拟机来实现的，一般来说，这个hashcode与object在内存中所处的位置相关

Integer

    @Override
    public int hashCode() {
        return Integer.hashCode(value);
    }

    public static int hashCode(int value) {
        return value;
    }

可以看到integer类的hashcode是直接返回value，而value其实就是integer对象中存储的值

因为hashCode方法返回一个int，所以integer类型直接把自己返回过去

这样能保证同一个value，返回的hashCode相同

不同value，返回的hashCode一定不同

Long

    @Override
    public int hashCode() {
        return Long.hashCode(value);
    }

    public static int hashCode(long value) {
        return (int)(value ^ (value >>> 32));
    }

可以看到返回的结果是，0-31位与32-63位进行亦或操作，将前后的特征混合了（高位的由于强行转int，被删除了）

String

    public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }

使用了之前提到的乘法hash操作每次=hash*31+new

HashMap

此版本为1.8

    public V get(Object key) {
        Node e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

    final Node getNode(int hash, Object key) {
        Node[] tab; Node first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            if ((e = first.next) != null) {
                if (first instanceof TreeNode)
                    return ((TreeNode)first).getTreeNode(hash, key);
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

tab = table
n = tab.length
first = tab[(n - 1) & hash]

可以看到hashmap，定位一个key

首先调用hash方法，这个方法内部，是

如果key为null，则hashcode为0

如果不为null，则先调用key自身的hashcode方法，将hashcode 与 hashcode>>>16 进行亦或操作

相当于0-15位与16-31位进行亦或操作，让低位包含高位特征，高位不变

在getNode方法内部，根据hash定位到数组中具体的元素

index=hash& (n-1)

hash为之前的hash方法得到的hash，n为数组的长度，为2^k,

相当于hash mod (n-1) 得到结果[0,n-1]

之所以hash方法要进行亦或操作，是因为后面的操作会截断位数0-k ，普通的情况下k会比较小，这样就只剩下位数低的位，高位会消失，亦或让高位与低位混合，而且耗时较小

用队列实现生产者-消费者模型 —— 详解与代码讲解百年孤独_ C语言项目计算机网络 C 操作系统
用队列实现生产者-消费者模型——详解与代码讲解一、引言生产者-消费者问题（Producer-ConsumerProblem）是操作系统、并发编程和数据结构课程中的经典案例。它描述了两个角色：生产者负责生产数据并放入缓冲区，消费者则从缓冲区取出数据进行消费。两者通过一个共享的缓冲区（通常为队列）进行协作，既要保证数据的正确流转，又要避免资源竞争和数据丢失。本篇文章将以循环队列为核心，详细讲解如何用C
挑战华为社招：7年老Java一次坑爹的面试经历 m0_57286571 程序员 java 后端面试
前言今天刚好有空，跟大家聊聊如何学好算法进大厂。前两天一个读者和我说，他坚持刷算法题2个月，薪资翻番去了他梦寐以求的大厂，期间面字节跳动还遇到了原题…其实据我所知目前国内的大厂和一些独角兽，已经越来越效仿硅谷公司的做法，通过编程定题面试，来考察数据结构和算法的扎实程度。以我的经验来说，**对于新手来说，扎实的掌握一门语言是其一，其二就是要有基本的算法能力，这个非常重要。对于进阶的用户，更多技术栈的
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
【数据结构】栈会的全对٩(ˊᗜˋ*)و 数据结构数据结构经验分享栈
要求：熟悉栈的定义，栈的特点以及栈的基本操作。能够根据实际情况选择合适的存储结构，解决实际问题。对任意给定的一个中缀算术表达式输出等价的后缀形式。代码实现：#include#include#includeusingnamespacestd;intprio(charop){//给运算符优先级排序intt;if(op=='*'||op=='/')t=2;if(op=='+'||op=='-')t=1;
冒泡和快速排序的区别郭尘帅666 算法数据结构
冒泡算法快速排序时间复杂度O（n^2）最坏/平均O（nlogn）平均，O（n^2）最坏空间复杂度O（1）O（logn）最好/O(n)最坏稳定性很稳定(元素顺序不变)不稳定(元素顺序可能改变)适用场景小规模数据或接近有序的数据大规模数据核心思想重复遍历，每轮都会把最大的元素移至末尾选择基准值，比基准值小的元素放左边，大的放右边代码实现对比1.冒泡排序publicstaticvoidbubbleSor
《剑指迷宫：破解矩阵路径之谜》一只咸鱼大王故事版本数据结构与算法 C++数据结构算法递归回溯
故事标题：《剑与路之书——矩阵迷宫的路径密钥》引子：迷宫之城的秘密在遥远的算法大陆，有一座神秘的城市——“迷宫之城”。在这座城市的中心，矗立着一座名为“命运之塔”的古老建筑。传说中，这里藏着一本神秘的典籍——《剑指天书》，书中记载着无数关于矩阵、路径和逻辑推理的奥秘。在这片土地上，有一种被称为“矩阵迷宫”的古老魔法阵。它由一个个字符格子组成，每一步只能向上下左右移动一格。而最神奇的是，如果一条路径
常见手撕项目C++ 氏族归来 c++开发语言
常见手撕项目C++设计模式单例模式饿汉模式懒汉模式策略模式策略接口实现具体的策略（虚函数重写）定义上下文用户调用代码最短路径算法使用函数模板写冒泡排序写一个类模板stringreplace详解方法概览参数介绍代码示例多线程信号量解释设计模式单例模式单例模式是一种常用的软件设计模式，其目的是确保一个类只有一个实例，并提供一个全局访问点来获取该实例。优点：资源控制：单例模式能够确保一个类只有一个实例存
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
树的分裂操作的性能评估 hi error.cn 经验分享
树的分裂操作的性能评估在计算机科学中，树是一种常用的数据结构，广泛应用于文件系统、数据库索引等场景。树的分裂操作是维护树平衡性和高效性的重要手段之一。本文旨在对树的分裂操作进行详细的性能评估，探讨不同实现方式下的表现和优劣。树的基本概念树是由节点（Node）组成的一种层次结构，其中每个节点包含一个值以及指向其子节点的指针。常见的树类型包括二叉搜索树、B树、红黑树等。分裂操作通常用于处理超过最大节点
Python scikit-learn 【机器学习库】全面讲解
让AI成为我们的得力助手：《用Cursor玩转AI辅助编程——不写代码也能做软件开发》scikit-learn（简称sklearn）是Python最流行的机器学习库之一，提供简单高效的数据挖掘和数据分析工具。它基于NumPy、SciPy和Matplotlib构建，广泛应用于工业界和学术界。核心优势统一API设计：所有模型使用一致的接口（fit()、predict()、score()）丰富的算法：覆
Nystromformer：一种基于 Nyström 方法的自注意力近似算法 AI专题精讲 Paper阅读人工智能自然语言处理 AI
1.摘要Transformer已经成为广泛自然语言处理任务中的强大工具。推动Transformer展现出卓越性能的一个关键组件是self-attention机制，它对每个token编码了其他token的影响或依赖关系。虽然self-attention机制具有诸多优势，但其在输入序列长度上的二次复杂度限制了其在较长序列上的应用——这是当前社区积极研究的一个主题。为了解决这一限制，我们提出了Nystr
PHP接单涨薪系列（八）之AI内容工厂：用PHP批量生成SEO文章系统（2025接单秘籍）攻城狮凌霄 PHP PHP接单涨薪 AI 人工智能 php android
某SEO团队采用本方案后，内容产出效率提升10倍，网站流量3个月增长300%，单月通过内容外包获利超¥50,000。本文将揭秘如何用PHP+AI打造全自动SEO内容工厂，让你成为搜索引擎优化领域的抢手人才！一、SEO市场新机遇：AI内容生成的红利期1.12025年SEO行业巨变搜索引擎算法升级2025核心变革SGE体验优化EEAT权重提升多模态内容整合2025年SEO关键数据：指标20232025
协同过滤算法：挖掘用户偏好，精准推荐商品 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
1.背景介绍协同过滤（CollaborativeFiltering，CF）作为推荐系统中的重要技术，其核心思想是利用用户和物品间的行为数据，挖掘用户隐性偏好，从而实现精准推荐。自20世纪90年代提出以来，协同过滤算法已经在电子商务、社交媒体、音乐视频等多个领域中广泛应用，取得了显著的推荐效果。协同过滤算法主要分为基于用户的协同过滤和基于物品的协同过滤两种。基于用户的协同过滤通过比较用户间的相似性，
SQL注入与防御-第四章-6：窃取哈希口令在安全厂商修设备 SQL注入与防御 sql 网络安全 web安全
SQL注入利用——窃取哈希口令一、核心逻辑：哈希口令的价值与窃取路径数据库中，用户口令通常以哈希形式存储（防明文泄露）。攻击者通过SQL注入窃取哈希后，可：暴力破解：用工具（如JohntheRipper）枚举原始口令。横向渗透：利用“用户reused口令”（同一口令用于多系统）入侵其他设备。不同数据库的哈希存储位置、算法差异极大，需针对性分析。二、SQLServer：哈希存储与窃取（分版本）（一）
Map和Set 爱吃小土豆豆豆豆 java 开发语言
Map和Set概念：Map和set是一种专门用来进行搜索的容器或者数据结构，其搜索的效率与其具体的实例化子类有关。以前常见的搜索方式有：直接遍历，时间复杂度为O(N)，元素如果比较多效率会非常慢二分查找，时间复杂度为,但搜索前必须要求序列是有序的上述排序比较适合静态类型的查找，即一般不会对区间进行插入和删除操作了，而现实中的查找比如：根据姓名查询考试成绩通讯录，即根据姓名查询联系方式不重复集合，即
真题训练1-算法思维训练不懂的浪漫数据结构与算法算法题
真题训练1-算法思维训练文章目录真题训练1-算法思维训练前言项目环境例题1：斐波那契数列例题2：判断一个数组中是否存在某个数参考前言第十四章《通用解题的方法论》我们讨论了解题的方法论，宏观上可以分为以下4个步骤：复杂度分析，估算问题中的复杂度的上限和下限。定位问题，根据问题类型，确定采用何种算法思维。数据操作分析，根据增、删、查和数据顺序关系选择合适的数据结构，利用空间换时间的思想。编码实现。本章
供应链管理：MES制造执行系统与APS高级排程系统解析快雪时晴-初晴融雪供应链管理供应链管理
一、MES制造执行系统与APS高级排程系统解析维度MES制造执行系统APS高级排程系统定义制造执行系统，用于管理和监控制造过程，实现生产过程的实时监控、数据采集、质量管理、工艺执行等功能。高级计划与排程系统，通过优化算法和模型，在有限资源条件下制定最优生产计划，提高生产效率和灵活性。核心功能-生产计划与调度：细化ERP计划为可执行工单，动态调整生产进度。-生产过程管理：记录工序执行情况，实时监控异
vue中添加原生右键菜单叹一曲当时只道是寻常 vue.js javascript
数据结构定义conststate=reactive({contextMenu:{visible:false,x:0,y:0,currentItem:null}});//新增右键菜单处理函数consthandleContextMenu=(event,item)=>{event.preventDefault();state.contextMenu={visible:true,x:event.clien
【极光优化算法+分解对比】VMD-PLO-Transformer-LSTM多变量时间序列光伏功率预测Matlab代码 matlab科研助手算法 transformer lstm
✅作者简介：热爱数据处理、建模、算法设计的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍光伏发电作为一种清洁能源，其功率预测对于电网稳定运行和电力系统调度至关重要。然而，光伏功率具有高度的非线性和波动性，传统的预测方法难以准确捕捉其动态特性。近年来，深度学习技术在时间序列预测领域取得了显著进展，为提高光伏功率预测精度提供了新的途径
【MySQL基础】MVCC多版本并发控制 scj1022 MySQL mysql
文章目录MVCC-多版本并发控制一、MVCC概述1、三种并发场景2、当前读&快照读3、MVCC的作用4、结合MVCC处理并发问题二、MVCC实现原理1、隐式字段2、回滚日志UndoLog3、一致性视图ReadView1）什么时候生成？2）可见性判断3）可见性算法（属性）4）可见性算法（实现）5）可见性算法（小结）4、举例说明（版本链）三、MVCC与可重复读RR1、事务的启动时机2、事务A读取流程3
【算法训练营Day07】字符串part1
文章目录反转字符串反转字符串II替换数字反转字符串题目链接：344.反转字符串双指针法，两个指针的元素直接调转即可classSolution{publicvoidreverseString(char[]s){inthead=0;intend=s.length-1;while(head=k){reverseString(charArray,head,head+k-1);}else{reverseSt
对称加密及AES加密算法一只牛_007 安全加密解密非对称
目录一、对称加密 1、什么是对称加密？ 2、对称加密的工作过程 3、对称加密的优点 4、对称加密的两大不足二、AES加密算法 1、什么是AES加密算法及AES加密算法的形成过程 2、AES的加密流程（要理解AES的加密流程，会涉及到AES的五个关键词：分组密码体制、Padding、初始向量IV、密钥、四种加密模式） 3、AES的加密原理（要理解AES的加密原理，会涉及到AES的四个关键词：密钥扩展
[代码随想录算法训练营 Day09 字符串 Part2] yancyss 算法 python 开发语言
Day09文章目录Day09字符串6.实现strStr（力扣28）7.重复的子字符串（力扣459）字符串今天两道KMP：KMP功能，在一个字符串中找到是否出现另一个字符串本篇会再更新~6.实现strStr（力扣28）题目描述：找出字符串中第一个匹配项的下标heystack干草堆，needle针，大海捞针~思路：KMP算法B站一个讲的很好的视频整体思路：假设有主串n和模式串m，在暴力算法当中，每当主
DAY08 算法训练营| 字符串part01 天空的孩子算法
344.反转字符串-力扣（LeetCode）字符串和数组算法题目思路类似反转字符串是经典双指针法（回忆反转链表，有序数组的平方，三数之和，四数之和）classSolution{public:voidreverseString(vector&s){len=s.length();for(inti=0,j=s.size()-1;iusingnamespacestd;intmain(){strings;/
寻路算法作品集勤奋的大熊猫 Python学习之路 Python 寻路算法
寻路算法作品集正文初始点与结尾点均具有方向性的自动寻路算法（不包含限制点）正文初始点与结尾点均具有方向性的自动寻路算法（不包含限制点）如果大家觉得有用，就点个赞让更多的人看到吧~
Python pip：包的云计算部署
Pythonpip：包的云计算部署关键词：Pythonpip、云计算部署、包管理、虚拟环境、云平台摘要：本文围绕Pythonpip进行包的云计算部署展开深入探讨。首先介绍了Pythonpip在包管理中的重要性以及云计算部署的背景和意义。接着详细阐述了pip的核心概念和工作原理，包括其与Python生态系统的紧密联系。通过具体的Python代码示例，讲解了pip包管理的核心算法原理和操作步骤。同时，
余数定理问题和余数类问题的解法 wangychf python 抽象代数
一、引言Python里面有一个重要的求模运算符号“％”，作为一个小白，实验了好多次求模的运算，发现这个算法不同于一般的四则运算，其运算效率简直可以用神奇来形容。例如以当今知道的最大质数——梅森素数为例，进行求模计算，速度快得惊人。当前知道的最大的梅森素数是第51个梅森素数，也是迄今为止知道的最大的素数。它的表示为：2^82589933–1,如果用十进制打开，这个数有24862048位，是2018年
用Python解锁图像处理之力：从基础到智能应用的深度探索熊猫钓鱼>_> python 图像处理开发语言
在像素构成的数字世界里，Python已成为解码图像奥秘的核心引擎。一、为何选择Python处理图像？超越工具的本质思考当人们谈论图像处理时，往往会陷入工具对比的漩涡（PythonvsMATLABvsC++）。但Python的真正价值在于其构建的完整生态闭环：科学计算基石：NumPy的ndarray结构完美对应图像的多维矩阵本质算法实现自由：从传统算子到深度学习模型的无缝衔接可视化即战力：Matpl
微算法科技（NASDAQ MLGO）开发基于量子搜索算法的多方量子密钥协议
随着量子信息技术的快速发展，传统加密技术面临量子计算带来的破解威胁。密码技术是网络安全的基石，而量子信息安全则使用基于量子物理和数据算法的密码技术，嵌套在网络的不同环节，提供额外的安全层。量子密钥分发（QKD）作为量子信息安全的核心技术之一，正在逐步走向实际应用。微算法科技（NASDAQMLGO）开发基于量子搜索算法的多方量子密钥协议，旨在提升信息安全水平。基于量子搜索算法的多方量子密钥协议是一种
分布式领域后端服务的限流算法实现大厂资深架构师 Spring Boot 开发实战分布式算法 wpf ai
分布式领域后端服务的限流算法实现关键词：分布式系统、限流算法、令牌桶、漏桶、滑动窗口、Redis、高并发摘要：本文深入探讨分布式系统中后端服务的限流算法实现。我们将从基础概念出发，详细分析各种限流算法的原理和适用场景，包括计数器算法、滑动窗口算法、令牌桶算法和漏桶算法。文章将提供Python实现代码和数学建模，并通过实际案例展示如何在分布式环境中使用Redis实现高效的限流机制。最后，我们将讨论限
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

哈希（散列，Hash）算法总结-java版

哈希算法简介

哈希算法的分类

加法Hash

位运算Hash

乘法Hash

除法Hash

查表Hash

混合Hash

常用的哈希算法

直接寻址法

数字分析法

平方取中法

折叠法

随机数法

除留余数法

流行的哈希算法

MD4

MD5

SHA及其他

碰撞性

哈希算法在java中的使用

Object

Integer

Long

String

HashMap

你可能感兴趣的:(数据结构-哈希表,数据结构,算法)