心城追梦

无损压缩算法专题——RLE算法实现

一、前言

本文是基于我的另一篇博客《无损压缩算法专题——无损压缩算法介绍》的基础上来实现的，RLE算法最简单的理解就是用（重复数，数据值）这样一个标记来代替待压缩数据中的连续重复的数据，以此来达到数据压缩的目的。说是这么说，但是具体实现起来有好几种方案，接下来一一介绍RLE（游程编码）的基本实现以及对该算法的改进。

二、PCX图像文件的RLE压缩方式

如果图像数据有连续相同的值，则用两个字节来代替这一串相同的字节，第一个字节的高两个bit设置为1做标志位，其余6个bit的值用来代表相同数据的个数，最多表示63；第二个字节用来代表这串相同数据的值。如果图像数据值不相同，分两种情况考虑：一种情况是数据值大于等于0xC0，则用两个字节表示，第一个字节为0xC1，第二个字节为该数据；第二种情况是数据值小于0xC0，则直接用一个字节输出该数据。下图是PCX文件中RLE压缩算法的数据结构图：

这幅图是我直接引用了一篇论文上的图，这篇论文在下文会继续提到。上面提到的这种压缩方式个人觉得不是非常的好，在对重复量非常少的数据进行该算法的话，很有可能使得压缩后的数据反而增大了，原因是对于不同的数据值而言，花费了大量的标记字节0xC1去区分它们。

三、 RLE算法改进——对连续数据和不连续数据段统一分段处理

这种方式其实是比较容易思考到的一个方向，我也是参考了网上的一片博客的，吃水不忘挖井人，这里我贴上链接表示感谢https://www.cnblogs.com/makai/p/11188968.html，浓缩一下讲述的内容，就是在遇到不重复的单个数据时，不是一个标记一个数据这样的输出方式，而是直接将这段区间内不连续的数据个数做一个统计，然后用一个标记表明接下来有多少个数据是不连续的，这种压缩方式只用一个标记字节就完成了对许多不重复字节的标记，相比较于PCX方式而言是很明显有优势的，节省了大量标记字节的开销。由于需要区分这个标记字节是标记的重复的数据还是不重复的数据，所以取字节的最高位来做标记，为0表示是不重复的数据，为1表示是重复的数据，剩下的7个bit用来表示数据的个数，所以最大可以标记127个字节，和PCX方式对比，不但节省了标记字节，还把标记数据的最大数目从63提升到了127。接下来是该算法的实现，代码中的注释已经标的不能再详细了。

Python实现如下：

import ctypes

class RLE():
    def __init__(self):
        self.threshold = 3  #启动压缩的阈值，大于这个阈值才有必要压缩

    #文件压缩
    def RLE_encode(self, readfilename, writefilename):
        fread = open(readfilename, "rb")  #以二进制方式读取文件
        fwrite = open(writefilename, "wb")  #以二进制方式写入文件
        buf = b''  #前向缓冲区
        bufSize = 127 + self.threshold  #前向缓冲区大小
        singleStore = b''  #无匹配的数据暂存区
        sigleStoreSize = 127  #无匹配的数据长度，没有加上阈值是因为匹配数可能小于阈值

        buf = fread.read(bufSize - len(buf))  #尽可能将buf填满

        while len(buf) >= self.threshold:  #大于3个字节才有必要压缩
            curIndex = 0  #当前匹配位置
            if (buf[curIndex] == buf[curIndex + 1]):  #如果和下一个数据相同
                if (buf[curIndex + 1] == buf[curIndex + 2]):  #如果往后两个数据都是相同的，启动压缩
                    curIndex += 1
                    #不断向后寻找相同的数据
                    while ((curIndex + 2) < (len(buf))) and (buf[curIndex + 1] == buf[curIndex + 2]):
                        curIndex += 1
                    #相同的数据搜索完毕，如果之前有无匹配的数据没写入文件，先写入
                    if singleStore != b'':
                        fwrite.write(bytes(ctypes.c_uint8(len(singleStore))))  #写入 标记+匹配数
                        fwrite.write(singleStore)  #写入所有无匹配的数据
                        singleStore = b''  #清空暂存区
                    fwrite.write(bytes(ctypes.c_uint8((1 << 7) + curIndex + 2 - self.threshold)))  #写入 标记+匹配数
                    fwrite.write(bytes(ctypes.c_uint8(buf[0])))  #写入这个重复出现的数据
                else:
                    singleStore += buf[curIndex: curIndex + 2]  #将2个不能匹配的数据加入暂存区

                buf = buf[curIndex + 2 : ]  #从buf里清掉已经处理过的数据
            else:
                singleStore += buf[curIndex: curIndex + 1]  #将1个不能匹配的数据加入暂存区
                buf = buf[curIndex + 1:]  #从buf里清掉已经处理过的数据

            # 无匹配的数据存满了暂存区需要写入一次文件
            if len(singleStore) >= sigleStoreSize:
                fwrite.write(bytes(ctypes.c_uint8(sigleStoreSize)))  # 写入 标记+匹配数
                fwrite.write(singleStore[0:sigleStoreSize])  # 写入bufSize个无匹配的数据
                singleStore = singleStore[sigleStoreSize:]  # 从暂存区里清掉已经处理过的数据

            buf += fread.read(bufSize - len(buf))  #尽可能将buf填满

        singleStore += buf  #将前向缓冲区里剩余的数据加入无匹配数据暂存区

        if len(singleStore) >= sigleStoreSize:
            fwrite.write(bytes(ctypes.c_uint8(sigleStoreSize)))  # 写入 标记+匹配数
            fwrite.write(singleStore[0:sigleStoreSize])  # 写入bufSize个无匹配的数据
            singleStore = singleStore[sigleStoreSize:]  # 从暂存区里清掉已经处理过的数据

        if singleStore != b'':
            fwrite.write(bytes(ctypes.c_uint8(len(singleStore))))
            fwrite.write(singleStore)

        fread.close()
        fwrite.close()

    #文件解压
    def RLE_decode(self, readfilename, writefilename):
        fread = open(readfilename, "rb")  #以二进制方式读取文件
        fwrite = open(writefilename, "wb")  #以二进制方式写入文件

        sign = fread.read(1)  #读取标记字节
        while sign != b'':
            if sign[0] >= (1<<7):  #如果是压缩标记
                fwrite.write(fread.read(1) * (sign[0] - (1 << 7) + self.threshold))  #解压释放数据
            else:  #如果不是压缩标记
                buf = fread.read(sign[0])  #读取无匹配的所有数据
                fwrite.write(buf)  #写入无匹配的数据

            sign = fread.read(1)  #读取下一个标记字节

        fread.close()
        fwrite.close()


if __name__ == '__main__':
    Demo = RLE()
    Demo.RLE_encode('5.bmp', 'test.encode')
    Demo.RLE_decode('test.encode', 'test.decode')

在我具体实现的时候做了一小点的改动，加了个threshold阈值变量来扩充可标记的最大数目，因为对于连续的重复数据来说，如果只有两个字节重复，是没有必要压缩的，因为压缩后也占用两个字节的空间，又何必去多走一趟压缩算法耗费时间呢，直接输出就行了，所以最少三个字节才启动压缩。所以重复数据的数目不会存在0、1和2这三个数，那么咱就把它们用上让0对应3，1对应4，2对应5这样子，匹配范围于是从0到127变成了3到130。

四、RLE算法改进——对相似数据进行压缩

这种压缩方法来自于我对一篇论文的参考，下面也贴出这篇论文以表感谢，写的挺好的，通俗易懂。
[1]蓝波,林小竹,籍俊伟.一种改进的RLE算法在图像数据编码中的应用[J].微电子学与计算机,2004(05):101-103+107.

在这篇论文中，作者对这种改进的算法称为RLE-N算法，往往一想到RLE算法，我们都是去简单想到压缩数据中的重复数据值，但是往往在一幅图片中，不总是有很多重复的数据值存在的，更多的一种情况是相邻的数据虽然不重复，但是数据值非常的接近，从字节上面来看就是重复比特位有5到8个，不同的也就那几个比特位而已，既然这串数据的大部分比特位都是相同的，就那么一两个比特位不同，我们干脆就只记录这些会改变的比特位就是了，那些不变的我们只记录一次就行了。以上就是RLE-N的核心思想。下面从论文中摘抄一段文字来举个例子：

从图像的颜色分布看，在一幅图像中，如果两个像素点颜色相同或相近，表现在数值上为这两个像素的颜色值相等或相差很小，即一个字节的高位表示相似性，低位表示差异性。如果对两个字节进行从最高位到最低位比较，相应有高n位相同（n取值为0～8）九种情况。这样如果用标志位定义九种不同情况，需要4Bit来表示，那么一个字节中余下的4Bit表示行程长度，最多可以表示16个字节。高0位相同和RLE压缩算法中的不相同对应，高8位相同则表示两个字节完全相同。数据经过本算法处理后分为两部分：第一部分为一个字节，该字节的高位为标志位，低位表示行程长度；第二部分为数据。

我们先考虑一种简单的情况，假设标志位1000表示数据值全相同，0000表示数据值全不同，0100表示数据值高4位相同，其它情况暂不考虑。那么第二部分中，如果是相同颜色值的重复数据，则以一个字节表示该数据；如果是相近颜色值的数据串，数据值由相同部分和不同部分顺序连接而成，该部分的字节长度由所压缩数据串确定；如果颜色值完全不同，则原样排列。分析以下这一串数据：

则使用改进的RLE压缩算法可表示为：

压缩后的数据串中第1个、第3个和第8个字节分别为三个数据段的第一部分，也就是标志位和行程长度部分，紧跟在其后的是第二部分即数据部分。注意第四个字节0xC2, 其高四位为相近数据的相同部分0xC，而低四位即该数据的不同部分0x2；第五、六、七字节为其余六个相近数据不同部分的顺序组合。

以上就是这篇论文的核心思想了，大家可以抽时间看完全篇，接下来我实现的代码中，用一个字节中的高两位来区别匹配的比特数目，剩下的6个bit用来表示匹配的数目，同样启动压缩的阈值为3个字节，所以匹配数范围是3到66。

Python实现如下：

import ctypes

#输出1字节，其中高2位为标记，低6位为匹配数

class RLE():
    def __init__(self):
        self.threshold = 3  #启动压缩的阈值，大于这个阈值才有必要压缩
        self.matchBitsToSign_T = {8:3, 6:2, 5:1}  #匹配数到标记的映射
        self.matchOrder = [8, 6, 5]  #设置匹配顺序，即优先匹配多少字节

    #比较两个字节中从高位开始的比特位匹配数，返回标记号
    def cmpSameBits(self, byte1, byte2):
        for matchBits in self.matchOrder:
            if (byte1 >> (8 - matchBits)) == (byte2 >> (8 - matchBits)):
                return self.matchBitsToSign_T[matchBits]
        return 0

    #文件压缩
    def RLE_encode(self, readfilename, writefilename):
        fread = open(readfilename, "rb")
        fwrite = open(writefilename, "wb")
        buf = b''   #前向缓冲区
        bufSize = 63 + self.threshold  #前向缓冲区大小
        singleStore = b''  #无匹配的数据暂存区
        singleStoreSize = 63  #无匹配的数据长度，没有加上阈值是因为匹配数可能小于阈值

        buf = fread.read(bufSize - len(buf))  #尽可能将buf填满

        while len(buf) >= self.threshold:
            curIndex = 0  #当前匹配位置
            cmpValue = self.cmpSameBits(buf[curIndex], buf[curIndex + 1])  #比较2个数据
            if cmpValue != 0:  #如果和下一个数据存在匹配关系
                cmpValue2 = self.cmpSameBits(buf[curIndex + 1], buf[curIndex + 2])  #再往后比较两个数据
                if cmpValue == cmpValue2:  #如果还存在相同的匹配关系
                    curIndex += 1
                    #不断向下匹配具有相同匹配关系的数据
                    while ((curIndex + 2) < (len(buf))) and (cmpValue == self.cmpSameBits(buf[curIndex + 1], buf[curIndex + 2])):
                        curIndex += 1
                    # 相同的数据搜索完毕，如果之前有无匹配的数据没写入文件，先写入
                    if singleStore != b'':
                        fwrite.write(bytes(ctypes.c_uint8(len(singleStore))))
                        fwrite.write(singleStore)
                        singleStore = b''

                    fwrite.write(bytes(ctypes.c_uint8((cmpValue << 6) + curIndex + 2 - self.threshold)))  #写入 标记+匹配数

                    bitsStore = 0  #比特位暂存区，相当于一个比特位队列
                    bitsCnt = 0  #比特位暂存区存在的比特位数目
                    for matchBits in self.matchBitsToSign_T:  #寻找是哪一种匹配类型
                        if self.matchBitsToSign_T[matchBits] == cmpValue:
                            if matchBits == 8:  #如果匹配数是8，特殊情况特殊处理
                                fwrite.write(bytes(ctypes.c_uint8(buf[0])))
                            else:  #其他匹配数的处理都是有通性的
                                fwrite.write(bytes(ctypes.c_uint8(buf[0])))
                                for num in range(1, curIndex + 2):  #将匹配的数据全部以比特位为单位进行编码
                                    bitsStore += (((buf[num] << matchBits) & 0xFF) >> matchBits) << bitsCnt #处理完的比特位进入队列
                                    bitsCnt += (8 - matchBits)
                                    if bitsCnt >= 8:  #队列中比特位数大于等于8了即一个字节，就可以输出一次到文件了
                                        fwrite.write(bytes(ctypes.c_uint8(bitsStore & 0xFF)))
                                        bitsStore >>= 8  #出队列
                                        bitsCnt -= 8
                            break

                    if bitsCnt > 0:  #将队列中剩余的数据写入文件
                        fwrite.write(bytes(ctypes.c_uint8(bitsStore & 0xFF)))
                else:
                    singleStore += buf[curIndex: curIndex + 2]

                buf = buf[curIndex + 2 : ] #从buf里清掉已经处理过的数据
            else:
                singleStore += buf[curIndex: curIndex + 1]  #将1个不能匹配的数据加入暂存区
                buf = buf[curIndex + 1:]  #从buf里清掉已经处理过的数据

            # 无匹配的数据存满了暂存区需要写入一次文件
            if len(singleStore) >= singleStoreSize:
                fwrite.write(bytes(ctypes.c_uint8(singleStoreSize)))
                fwrite.write(singleStore[0:singleStoreSize])
                singleStore = singleStore[singleStoreSize:]

            buf += fread.read(bufSize - len(buf))  #尽可能将buf填满

        singleStore += buf

        # 无匹配的数据存满了暂存区需要写入一次文件
        if len(singleStore) >= singleStoreSize:
            fwrite.write(bytes(ctypes.c_uint8(singleStoreSize)))
            fwrite.write(singleStore[0:singleStoreSize])
            singleStore = singleStore[singleStoreSize:]

        if singleStore != b'':
            fwrite.write(bytes(ctypes.c_uint8(len(singleStore))))
            fwrite.write(singleStore)

        fread.close()
        fwrite.close()

    #文件解压
    def RLE_decode(self, readfilename, writefilename):
        fread = open(readfilename, "rb")
        fwrite = open(writefilename, "wb")

        sign = fread.read(1)  #读取标记字节
        while sign != b'':
            if (sign[0] >> 6) == 0:  #直接输出原始数据
                buf = fread.read(sign[0])
                fwrite.write(buf)
            else:
                for matchBits in self.matchBitsToSign_T: #寻找对应的匹配类型
                    if self.matchBitsToSign_T[matchBits] == (sign[0] >> 6):
                        if matchBits == 8:  #特殊情况特殊处理
                            fwrite.write(fread.read(1) * ((sign[0] & 0x3F) + self.threshold))
                        else:
                            num = (sign[0] & 0x3F) + self.threshold  #需要解压的数据个数
                            same = fread.read(1)  #取一个模板数据
                            fwrite.write(same)
                            bitsStore = 0  #比特位队列
                            bitsCnt = 0  #记录比特位队列中比特位的数目
                            for i in range(1, num):  #不断从比特位队列中解压出数据
                                if bitsCnt < (8 - matchBits):
                                    tmp = fread.read(1)
                                    if tmp == b'':
                                        break
                                    bitsStore += tmp[0] << bitsCnt
                                    bitsCnt += 8

                                fwrite.write(bytes(ctypes.c_uint8(((same[0] >> (8 - matchBits)) << (8 - matchBits)) + (((bitsStore << matchBits) & 0xFF) >> matchBits))))
                                bitsStore >>= (8 - matchBits)
                                bitsCnt -= (8 - matchBits)
                        break

            sign = fread.read(1)  #读取下一个标记字节

        fread.close()
        fwrite.close()

if __name__ == '__main__':
    Demo = RLE()
    Demo.RLE_encode('random.txt', 'RLE-N.encode')
    Demo.RLE_decode('RLE-N.encode', 'RLE-N.decode')

五、压缩比性能测试

为了展示一下RLE-N这个算法的优点，做一个极端一点的测试，我生成了1个500KB的随机数文件，每个字节的大小范围是0xF0到0xF3，就是这些字节的高6位bit全部相同，只有低2位bit在变化，我截个图大概看一下数据情况：

接下来展示一张压缩性能图：

其中random.txt是原始文件，RLE.encode是本文介绍的第一个RLE算法改进的压缩文件，lzss.encode是我上一篇博客所介绍的lzss算法的压缩文件，其中preBufSizeBits设置为3，random.zip是PC自带的ZIP压缩软件的压缩文件，random.rar是PC自带的RAR压缩软件的压缩文件，RLE-N.encode是采用RLE-N算法的压缩文件。因为我事先是知道这文件里面的数据特征的，所以原始文件里面的所有数据都被进行了6bit的匹配压缩，可见RLE-N在针对这种相似数据的压缩时，单从压缩比上来说甚至超过RAR。其实平常我们开发测试的时候有的测试数据也是有着这一类的特征的，这种压缩方法具有一定的实用性。

一般而言，RLE是对局部连续数据块的信息压缩，不会单独只使用RLE来对文件压缩就完了，因为全局的大方向上的信息还可以进行一轮压缩，所以一般还会再加一层压缩算法。带着好奇心的我又继续用LZSS、ZIP、RAR对RLE-N.encode进行压缩，看下最终效果：

二次压缩之后RAR的压缩比排在了第一位，ZIP次之，这就说明了RLE-N压缩后的文件仍然存在一定的可压缩空间；而用LZSS二次压缩后，文件反而还变大了。

接下来再做一组测试，对一张横向渐变色的bmp图片进行压缩测试：

再附上性能图：

5.bmp是原始文件，因为数据时渐变的，所以单纯用LZSS算法压缩效果不太大，用RLE和RLE-N效果几乎一样，RAR在第一轮压缩中为15KB，在第二轮对RLE-N.encode的压缩后压缩文件大小居然变成了658字节。ZIP第二次压缩后压缩率也大幅度提高了。

六、总结

本文介绍了RLE算法的两种改进方法，展示了RLE-N算法在压缩相似性数据方面的优势。同时也通过对RLE算法的第一种改进和RLE-N算法的实现和对比实验，说明了在对相邻数据间相似性比较大的数据进行压缩时，先进行一遍RLE-N算法压缩，之后再进行一遍词典压缩，这样的复合压缩算法会具有更强的压缩性能。

信奥赛CSP-J复赛集训（模拟算法专题）（11）：P1420 最长连号王老师青少年编程算法 csp 信奥赛 c++数据结构模拟算法 gesp
信奥赛CSP-J复赛集训（模拟算法专题）（11）：P1420最长连号题目描述输入长度为nnn的一个正整数序列，要求输出序列中最长连号的长度。连号指在序列中，从小到大的连续自然数。输入格式第一行，一个整数nnn。第二行，nnn个整数aia_iai，之间用空格隔开。输出格式一个数，最长连号的个数。输入输出样例#1输入#1101562345689输出#15说明/提示数据规模与约定对于100%100\%1
算法系列之数据结构-Huffman树修己xj 算法算法数据结构 java
在数据压缩领域，Huffman编码是一种经典的无损压缩算法，而Huffman树则是实现这种编码的关键数据结构。它以其高效性和简洁性被广泛应用于各种场景，从文件压缩到通信协议，都离不开Huffman树的身影。本文将深入探讨Huffman树的原理、构建过程以及其Java如何实现Huffman树。Huffman树的构建步骤Huffman树（哈夫曼树）又称最优二叉树，是一种带权路径长度最短的二叉树，常用于
信奥赛CSP-J复赛集训（模拟算法专题）（1）：P8813 [CSP-J 2022] 乘方王老师青少年编程 csp 信奥赛 c++算法数据结构 gesp
信奥赛CSP-J复赛集训（模拟算法专题）（1）：P8813[CSP-J2022]乘方题目描述小文同学刚刚接触了信息学竞赛，有一天她遇到了这样一个题：给定正整数aaa和bbb，求aba^bab的值是多少。aba^bab即bbb个aaa相乘的值，例如232^323即为333个222相乘，结果为2×2×2=82\times2\times2=82×2×2=8。“简单！”小文心想，同时很快就写出了一份程序，
【笔试题汇总】华为春招笔试题解 2024-4-17 PXM的算法星球大厂面试题面试算法 c++华为
这里是paoxiaomo，一个现役ACMer，之后将会持续更新算法笔记系列以及笔试题题解系列本文章面向想打ICPC/蓝桥杯/天梯赛等程序设计竞赛，以及各个大厂笔试的选手感谢大家的订阅➕和喜欢有什么想看的算法专题可以私信博主（本文题面由清隆学长收集）01.扑克牌消消乐题目描述K小姐最近沉迷于一款扑克牌消除游戏。游戏规则如下：从一副扑克牌中随机抽取nnn张牌组成一个序列，如果有连续的333张相同牌号的
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用 xiao5kou4chang6kai4 深度学习遥感勘测 python 深度学习分类
专题一：深度学习发展与机器学习深度学习的历史发展过程机器学习，深度学习等任务的基本处理流程梯度下降算法讲解不同初始化，学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络、卷积运算的基本原理池化操作，全连接层，以及分类器的作用BP反向传播算法的理解一个简单CNN模型代码理解特征图，卷积核可视化分析专题三TensorFlow与keras介绍与入门TensorFlow
【C++】双指针算法专题啊QQQQQ c++数据结构开发语言
目录前言对撞指针快慢指针习题练习1.移动零.-力扣（LeetCode）算法思路算法流程代码实现2.复写零.-力扣（LeetCode）算法思路算法流程代码实现3.快乐数.-力扣（LeetCode）算法思路算法流程代码实现4.盛水最多的容器.-力扣（LeetCode）算法思路代码实现5.有效三角形的个数.-力扣（LeetCode）算法思路代码实现6.和为S的两个数.-力扣（LeetCode）算法思路代
Springboot使用Thumbnailator压缩图片上传到阿里云OSS(无损压缩) 一勺菠萝丶 Java #OSS #SpringBoot
前提:图片的压缩大致有两种，一种是将图片的尺寸压缩小，另一种是尺寸不变，将压缩质量，一般对于项目我们需要第一种,即用户上传一张分辨率为3840 × 2160的图片，通过上传图片接口后上传到OSS上的图片分辨率会变成1920×1080（如3840 × 2160的图片大小为11.4M，上传后的图片大概会为1.9M），此时上传后到OSS的图片和原图质量上一致，也就是说看上去只的大小的区别，清晰度上没有任
常见“栈“相关题目我要学编程(ಥ_ಥ) 优选算法专题数据结构 leetcode 栈
找往期文章包括但不限于本期文章中不懂的知识点：个人主页：我要学编程(ಥ_ಥ)-CSDN博客所属专栏：优选算法专题目录1047.删除字符串中的所有相邻重复项844.比较含退格的字符串227.基本计算器II394.字符串解码946.验证栈序列1047.删除字符串中的所有相邻重复项题目：给出由小写字母组成的字符串s，重复项删除操作会选择两个相邻且相同的字母，并删除它们。在s上反复执行重复项删除操作，直到
【算法】回溯算法专题① ——子集型回溯 python 查理零世算法 python
目录引入变形实战演练总结引入子集https://leetcode.cn/problems/subsets/description/给你一个整数数组nums，数组中的元素互不相同。返回该数组所有可能的子集（幂集）。解集不能包含重复的子集。你可以按任意顺序返回解集。示例1：输入：nums=[1,2,3]输出：[[],[1],[2],[1,2],[3],[1,3],[2,3],[1,2,3]]示例2：输
常见字符串相关题目我要学编程(ಥ_ಥ) 优选算法专题 java 算法 leetcode
找往期文章包括但不限于本期文章中不懂的知识点：个人主页：我要学编程(ಥ_ಥ)-CSDN博客所属专栏：优选算法专题目录14.最长公共前缀5.最长回文子串67.二进制求和43.字符串相乘14.最长公共前缀题目：编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀，返回空字符串""。示例1：输入：strs=["flower","flow","flight"]输出："fl"示例2：输入：str
图像处理篇---图像压缩格式&编码格式 Ronin-Lotus 图像处理篇图像处理计算机视觉人工智能学习程序人生图像压缩编码格式
文章目录前言图像压缩格式无损压缩（LosslessCompression）1.PNG（PortableNetworkGraphics）2.GIF（GraphicsInterchangeFormat）3.BMP（Bitmap）4.TIFF（TaggedImageFileFormat）有损压缩（LossyCompression）1.JPEG（JointPhotographicExpertsGroup）
常见哈希表相关题目我要学编程(ಥ_ಥ) 优选算法专题算法数据结构哈希表
找往期文章包括但不限于本期文章中不懂的知识点：个人主页：我要学编程(ಥ_ಥ)-CSDN博客所属专栏：优选算法专题目录1.两数之和面试题01.02.判定是否互为字符重排217.存在重复元素219.存在重复元素II49.字母异位词分组哈希表我们在数据结构阶段也是重点学习了，并且也已经刷了一部分的题目了。下面还练习一部分题目即可。1.两数之和题目：给定一个整数数组nums和一个整数目标值target，请
2024最新前端面试题(八股文)一阶段总结（html，css）!!!!新手必看必背!通俗易通!全面!全是干货！沐光M 前端面试题 css html es6 前端
1.网络中使用最多的图片格式有哪些•gif支持动画，只有全透明和不透明两种模式，只有256种颜色,适用于简单动画、徽标和简单图形等应用场景。•jpeg常见格式,采用有损压缩算法，保持图像质量的同时减小文件大小,体积较小，不支持透明，不支持动画•png采用无损压缩算法，体积也相对较小，支持透明背景，不支持动画•svg一般会保存颜色及形状相对简单的图片，可任意放大图形显示，边缘异常清晰•BMP画质最好
利用python实现图片格式之间的相互转换难得北窗高卧 python 开发语言
一、概要图片一般有多种格式，常见的图片格式包括：JPEG（.jpg或.jpeg）：一种广泛使用的有损压缩格式，适用于摄影图像和网页上的图片。PNG（.png）：一种无损压缩格式，支持透明度和更好的图像质量，常用于图标、图形和需要透明背景的图片。该图片是4通道的，外加一个透明通道。如截屏GIF（.gif）：一种支持动画和透明度的格式，常用于简单的动画和图标。BMP（.bmp）：一种无损格式，存储图像
【笔试题汇总】华为春招笔试题题解 2024-3-20 PXM的算法星球大厂面试题华为面试数据结构算法
这里是paoxiaomo，一个现役ACMer，之后将会持续更新算法笔记系列以及笔试题题解系列本文章面向想打ICPC/蓝桥杯/天梯赛等程序设计竞赛，以及各个大厂笔试的选手感谢大家的订阅➕和喜欢有什么想看的算法专题可以私信博主（本文题面由清隆学长收集）01.K小姐的魔法药水问题描述K小姐是一位魔法师，她最近在研究一种神奇的魔法药水。这种药水由一系列魔法材料制成，每种材料都有一个正整数的魔法值。K小姐按
【Zstd: 压缩全能王】 wn531 后端算法 node.js typescript 前端
什么是Zstdzstd是Facebook在2016年开源的新无损压缩算法，优点是压缩率和压缩/解压缩性能都很突出。效果对比压缩率与压缩速度，此图来源Zstd官网，为一些经典的压缩算法对比，CompressornameRatioCompressionDecompress.zstd1.5.6-12.887510MB/s1580MB/shttps://www.zlib.net/1.2.11-12.743
iOS 获取本地图片URL Code&Ocean iOS 移动开发 iOS 开发问题踩坑 url
Assetcatalog图片是无法通过Path读取URL的首先，我们需要知道的是，放在Assetcatalog中的图片是无法通过path方式读取的。为什么了？因为在Assetcatalog中的图片，ImageSet类型的图片会经过无损压缩和合成，编译后就无法通过path读取了，只能通过named方式加载。Tip:动图最好不要使用ImageSet类型，避免编译压缩合成后不一致的问题，建议使用Data
png图片怎么转换成jpg？png转jpg批量 qq_33537961
png图片怎么转换成jpg？png和jpg作为目前最为主流的两种图片格式，已经深入我们的日常工作和生活学习中，大家对这两种图片格式都非常的熟悉。png是一种无损压缩图片格式，所以它的体积会更大一些，但是图片的质量好清晰度高。而jpg是一种有损压缩的图片格式，图片质量稍差一些，但是图片的体积比较小。所以对图片清晰度没有较高要求的时候，有不少小伙伴喜欢将png图片转换成jpg后再使用。这就需要进行图片
Python(C)图像压缩导图亚图跨际 Python C/C++交叉知识傅里叶压缩制作树结构象限量化模型有损压缩压缩解压缩算法矩阵分解
要点傅里叶和小波变换主成分分析彩色图压缩制作不同尺寸图像K均值和生成式对抗网络压缩无损压缩算法压缩和解压缩算法离散小波变换压缩树结构象限算法压缩矩阵分解有损压缩算法量化模型有损压缩算法JPEG压缩解压缩算法Python图像压缩图像压缩可以是有损的，也可以是无损的。无损压缩是档案用途的首选，通常用于医学成像、技术图纸、剪贴画或漫画。有损压缩方法，尤其是在低比特率下使用时，会产生压缩伪影。有损方法特别
高等数学精解【12】未来之蓝基础数学与应用数学线性代数数值优化数据压缩高等数学算法
文章目录无损压缩算法常见算法概述1.**霍夫曼编码（HuffmanCoding）**2.**Lempel-Ziv-Welch(LZW)**3.**游程编码（Run-LengthEncoding,RLE）**4.**算术编码（ArithmeticCoding）**5.**DEFLATE**6.转换编码（TransformCoding）7.预测编码（PredictiveCoding）转换编码的无损压缩
动态规划的时间复杂度优化闻缺陷则喜何志丹 #算法基础数据结构与算法动态规划算法 c++LeetCode 状态转移状态表示逆向思考
作者推荐视频算法专题本文涉及知识点动态规划汇总优化动态规划的时间复杂度，主要有如下几种：一，不同的状态表示。比如：n个人，m顶帽子。第一种方式：dp[i][mask],i表示前i个人已经选择帽子，mask表示那些帽子已经选择。空间复杂度：O(n2m)。第二种方式：dp[i][mask],i表示前i个帽子已经选择，mask表示那些人已经选择。空间复杂度：O(m22)。n大，则现在方式一；否则选择方式
如何减少 HTTP 响应的数据大小踏遍三十六岸网络 http 网络协议网络
资料来源:小林coding小林官方网站:小林coding(xiaolincoding.com)如何减少HTTP响应的数据大小?对于HTTP的请求和响应，通常HTTP的响应的数据大小会比较大，也就是服务器返回的资源会比较大。于是，我们可以考虑对响应的资源进行压缩，这样就可以减少响应的数据大小，从而提高网络传输的效率。压缩的方式一般分为2种，分别是:无损压缩有损压缩无损压缩无损压缩是指资源经过压缩后，
算法专题：线性DP Q天马A行空Q 算法导论算法 leetcode 线性DP
参考练习习题总集文章目录10.正则表达式匹配44.通配符匹配45.跳跃游戏II53.最大子数组和(LCR161连续天数的最高销售额)91.解码方法97.交错字符串115.不同的子序列119.杨辉三角II198.打家劫舍(LCR089打家劫舍)213.打家劫舍II(LCR090打家劫舍II)10.正则表达式匹配第一道题就是困难题让我很难蚌，真是磨人啊。classSolution{public:boo
算法专题：滑动窗口 Q天马A行空Q 算法导论算法 leetcode 滑动窗口
参考练习习题总集文章目录3.无重复字符的最长子串30.串联所有单词的子串76.最小覆盖子串187.重复的DNA序列219.存在重复元素II220.存在重复元素III396.旋转函数424.替换后的最长重复字符438.找到字符串中所有字母异位词滑动窗口太简单了，没啥说的自己做吧。3.无重复字符的最长子串classSolution{public:intlengthOfLongestSubstring(
算法专题：前缀和 Q天马A行空Q 算法导论算法 leetcode 前缀和
参考练习习题总集文章目录53.最大子数组和(LCR161连续天数的最高销售额)85.最大矩形187.重复的DNA序列209.长度最小的子数组238.除自身以外数组的乘积363.矩形区域不超过K的最大数值和396.旋转函数53.最大子数组和(LCR161连续天数的最高销售额)线性DPclassSolution{public:intmaxSubArray(vector&nums){for(inti=1
压缩算法在单片机升级中的应用 Dokin丶 STM32 算法单片机压缩 bootloader解压 STM32压缩单片机升级
在项目开发过程中，难免会遇到需要在线升级的情况，而升级包过大会导致升级时间过长，影响产品性能和用户体验，因此我们可以将需要升级的程序压缩，然后在bootloader中解压。差分升级实际上就是对比出两个升级包的差异，然后再对差异进行压缩。这里我们不讲差分，只讲压缩。压缩算法有很多，QuickLZ是比较适合单片机的一种轻量级无损压缩算法。QuickLZ是一个号称压缩速度最快的压缩库，以下是几种较流行的
关闭Windows自动更新的6种方法人不走空 windows
人不走空个人主页：人不走空系列专栏：算法专题⏰诗词歌赋：斯是陋室，惟吾德馨目录个人主页：人不走空系列专栏：算法专题⏰诗词歌赋：斯是陋室，惟吾德馨✔方法1.Windows设置✔方法2.关闭WindowsUpdate服务✔方法3.本地组策略编辑器✔方法4.任务计划程序✔方法5.注册表编辑器✔方法6.通过工具关闭Win10自动更新作者其他作品：这里我们将为您分享6种关闭Win10自动更新的方法，分别是通
【深度优先搜索】【树】【图论】2973. 树中每个节点放置的金币数目闻缺陷则喜何志丹 #算法题深度优先图论算法 c++LeetCode 树金币
作者推荐视频算法专题本博文涉及知识点深度优先搜索树图论分类讨论LeetCode2973.树中每个节点放置的金币数目给你一棵n个节点的无向树，节点编号为0到n-1，树的根节点在节点0处。同时给你一个长度为n-1的二维整数数组edges，其中edges[i]=[ai,bi]表示树中节点ai和bi之间有一条边。给你一个长度为n下标从0开始的整数数组cost，其中cost[i]是第i个节点的开销。你需要在
前端性能优化 - Gzip压缩
什么是Gzip压缩？gzip是GNUzip的缩写，是一种文件的压缩格式（也可以说是若干种文件压缩程序），类似的压缩格式还有compress，deflate等。web上使用gzip编码格式传输有几个要点：浏览器和服务器都需要支持gzip编码采用LZ77算法与Huffman编码来压缩文件，是一种无损压缩算法压缩比率在3-10倍左右（纯文本），可以大大节省服务器的网络带宽是否前端所有资源都需要Gzip压
Java和JavaScript区别与联系人不走空 javascript
人不走空个人主页：人不走空系列专栏：算法专题⏰诗词歌赋：斯是陋室，惟吾德馨目录个人主页：人不走空系列专栏：算法专题⏰诗词歌赋：斯是陋室，惟吾德馨梗概：一、起源与发展二、语言特性对比六、二者详细对比六、两者示例代码七、总结作者其他作品：梗概：Java和JavaScript是两种截然不同的编程语言，尽管它们的名称相似，但它们在设计理念、语法规则、应用领域等方面有着本质的区别。Java是一种静态类型的、
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文