ELT.ZIP
团队,ELT<=>Elite(精英),.ZIP为压缩格式,ELT.ZIP即压缩精英。7个地方
的同学,我们在OpenHarmony成长计划啃论文俱乐部
里,与华为、软通动力、润和软件、拓维信息、深开鸿
等公司一起,学习和研究操作系统技术
… ① 2月23日 《老子到此一游系列》之 老子为什么是老子 —— ++综述视角解读压缩编码++
② 3月11日 《老子到此一游系列》之 老子带你看懂这些风景 —— ++多维探秘通用无损压缩++
③ 3月25日 《老子到此一游系列》之 老子见证的沧海桑田 —— ++轻翻那些永垂不朽的诗篇++
④ 4月4日 《老子到此一游系列》之 老子游玩了一条河 —— ++细数生活中的压缩点滴++
⑤ 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——一文穿透多媒体过往前沿++
⑥ 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——这些小风景你不应该错过++
⑦ 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——浅析稀疏表示医学图像++
高速缓存与压缩算法会碰撞出什么火花呢?
图像、医疗、机器人、通信都在这里了
你可能少有听说的TinyOS操作系统
揭秘 3D 网格压缩的三类方式
殿堂级 WARP 寄存器压缩技术
计算机视觉就是其中之一
。目前传感器的功能已经非常强大,能够通过使用各种传感器来模拟人眼
,以获取周边环境的信息,比如物体的形状、大小等。这些特征能够让我们运用几何学、物理学、统计学等知识构造各种模型。相机、电缆、电脑以及各种接入设备
来捕获我们需要的信息。当我们与他人分享这些信息时,我们可以考虑存储空间、速率等多种因素
来确定合适的压缩算法来进行信息的传播。再现真实的图像
,这最终会增加带宽和存储空间
。因此,我们利用 JPEG 变形算法将图像转换为压缩图像,并保护了重要的特性。挖掘大规模图像数据中隐含的知识、图像内或图像间的各种关系以及其他隐藏在图像数据中的各种模式
的一种技术,应用于 MRI、钻石眼、脑肿瘤分析
等。一般先要进行 Run length 编码,然后是 Huffman 编码算法,以相对较低的成本存储大量的数据,并从给定的图像中提取越来越多的信息。隐藏了多种疾病的发病机制和有效治疗相关信息
。我们需要无损压缩,因为我们不能冒序列和描述丢失的风险,因此,为了压缩这些数据,使用并行计算算法来压缩给定的数据,首先数据根据不同的模式进行分区,然后这些模式使用算术代码进行压缩。隐写术是一种将保密信息隐藏在公开信息中
的技术,利用图像文件的特性,我们可以把一些想要刻意隐藏的信息或者证明身份、版权的信息隐藏在图像文件中。比如早期流行的将一些下载链接、种子文件隐藏在图片文件中进行传播,再比如某互联网公司内部论坛“月饼事件”中通过员工截图精准定位个人信息的技术,都可以归为图像隐写技术(Image Steganography)。
我们可以利用 GIF,因为它可以在任何硬件或软件上运行。使用 LZW- 无损技术对数据进行压缩,然后将这些数据嵌入到边缘设备中。
提高图像信息的利用率、改善计算机解译精度和可靠性、提升原始图像的空间分辨率和光谱分辨率,利于监测
。第一步对结构进行二进制编码
第二步用算术编码器对第一步得到的编码进行压缩。我们不能承受信息的丢失,所以我们使用无损算法
人体姿势跟踪
计算像素块的运动来估计这些块在附近帧中的外观
,文中提出了一种带有拓展剩余编码的基线视频压缩算法,该算法为 3D 姿态跟踪 + 基于 pde 的图像压缩 + 半色调的三种方法的结合,能够在背景所带来的噪声不大的情况下超过 MPEG-1与 MPEG-4
,在背景噪声影响较大的情况下,优于 MPEG-1。“表情”是我们日常生活中提到很多的一个词语,在人际沟通中,人们通过控制自己的面部表情,可以加强沟通效果。人类的面部表情至少有21种,除了常见的高兴、吃惊、悲伤、愤怒、厌恶和恐惧6种,还有惊喜(高兴+吃惊)、悲愤(悲伤+愤怒)等15种可被区分的复合表情。
面部表情检测使用几何最小化和 JPEG 2000。一个面部表情中有大量的特征,所以我们需要适当的存储细节,对数据有很高的要求。
将图像序列或视频中发生空间位置变化的物体作为前景提出并标示
的过程,它一直是一个十分热门的研究领域,广泛应用于智能监控、多媒体应用
等领域。运动目标检测主要有以下几种方法:光流法计算复杂,不适用于实时监控系统;帧间差分法计算简单,但是检测结果不完整;背景差分效果较好,然而建立一个良好的背景模型需要花费很大计算量和存储量的开销。
医学影像对疾病的识别和手术计划有非常重要的影响。然而,每个病人的成像设备仍然会产生大量的信息,通常为 1000 张或 500 MB。这些信息需要大的存储空间和经济的传输;尽管传输存储空间和通信技术有了更大的改进,医学图像压缩仍然发挥着要求很高的作用。
主成分分析(PCA)通常是一种有损压缩方案,通过将复杂的数据集转换为更小的维数来实现图像压缩。下图为 canny 边缘分割技术得到的 ROI,在非感兴趣区域要求最高的压缩,而感兴趣区域要求图像质量高。
超声波是一种波长极短的机械波,在空气中波长一般短于 2 厘米。它必须依靠介质进行传播,无法存在于真空(如太空)中。它在水中传播距离比空气中远,但因其波长短,在空气中则极易损耗,容易散射
,不如可听声和次声波传得远,不过波长短更易于获得各向异性的声能,可用于清洗、碎石、杀菌消毒
等,在医学、工业上有很多的应用。
超声波图像存储和传输通过一个通道,需要使用 JPEG 压缩算法。将图像分割成数小块,利用 2D-DCT 变换对每个块进行编码,生成量化矩阵,然后采用熵编码进行编码,得到压缩后的图像。我们也可以使用 MPEG-1、MPEG-2 和 H.26x.
微创脊柱外科技术意味着在一定医疗风险下避免大切口,采用微小切口或穿刺通道,运用特殊的器械和装置,在影像仪器监视下或导航技术引导下,从正常的解剖结构到达病变处,使用各种微型的手动或电动器械和器材,在可视条件下完成整个手术过程。
压缩时一般基于运动学和指数。数据处理采用最小二乘法,利用遗传算法选择一种生物方式来压缩数据,它不会压缩大容量的数据。
眼动追踪技术已成为心理学、神经营销学、神经认知、用户体验、基础研究及市场研究
等多个领域视觉行为和人类行为的技术手段之一。该技术还可以用于医学分析和筛查。从眼动的历史发展进程来看,早期的眼动追踪系统是侵入性的且不能移动,受限非常严重,仅在有限的实验中使用,并且在现在社会受到伦理方面的考验。随着眼动追踪系统的发展,现代的眼动追踪系统利用红外光进行捕捉眼球运动,该系统是非侵入的且更加方便易用。
眼动跟踪使用 JPEG 2000 进行压缩,因为它提供了眼睛运动的 2D 刻度上的各种深度信息,并存储信息,我们可以利用有损压缩的方式进行眼动跟踪。
它利用了波压缩。数据需要存储和传输,一般使用无损压缩技术,增加了 Cr ,可达 x50。
全国首例跨区域5G远程操控视频脑电图诊断在蚌埠成功实施
机器人视觉,是指不仅要把视觉信息作为输入,而且还要对这些信息进行处理
,进而提取出有用的信息提供给机器人。今天的机器人已经能够完成识别人的手势和面部表情等多种功能了。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SHtawWvc-1652207475923)(https://ycnx.online/wp-content/uploads/2022/04/image-1651155482415.png)]
奇异值分解 (Singular Value Decomposition,简称SVD)是在机器学习领域广泛应用的算法。SVD算法主要用在降维算法中的特征分解、推荐系统、自然语言处理计算机视觉
等领域。它不光可以用于降维算法中的特征分解,通过 SVD,我们将图片矩阵分成正交矩阵、对角矩阵以及正交矩阵这三个矩阵的乘积。为了增加通道的使用,我们取多张图像,将重叠的图像拼接在一起,找出任何物体的运动。
随着工业生产中对自动化的要求越来越高,视觉技术已被广泛引入工业机器人行业,具备视觉的工业机器人能更快、更准、更灵活地完成定位抓取、对位组装
等。基于图像分析的视觉技术在机器人引导相关应用中的主要作用是精确获取对象物(待抓取物体)和目标物(待组装物体)的坐标位置和角度,并将图像坐标转换为机器人能识别的机器人坐标,指导机器人进行纠偏和组装。因此,对图片进行压缩并能使机器人精确完成相关任务是非常重要的。
机器人引导压缩通常是在数据量大、传输困难的情况下进行的。一般使用小波变换和基于 VQ 的模糊 c 均值聚类。
Facebook 是有名的社交媒体网站,每个月的活跃用户数量超过20亿,所以有着高负荷的数据输入和输出。维护这么多的数据是一件很难的事,Facebook使用 Zstandard 压缩数据,以使信道不会受到流量堵塞。
Zstd 是一种快速无损压缩算法,针对 zlib 级别的实时压缩场景和更好的压缩比,它由 Huff0 和 FSE 库提供的非常快的熵阶段提供支持
。当需要时,它可以将压缩速度交换为更高的压缩比率(压缩速度与压缩比率的权衡可以通过小增量来配置),反之亦然。在运行 Ubuntu 20.04(Linux 5.11.0-41-generic)的桌面上测试和比较几种快速压缩算法,使用 lzench 在 Silesia 压缩语料库上编译,可以得到如下对比:
压缩方式 | 压缩比 | 压缩速度 | 解压缩速度 |
---|---|---|---|
zstd 1.5.1 -1 | 2.887 | 530 MB/s | 1700 MB/s |
Zlib 1.2.11 -1 | 2.743 | 95 MB/s | 400 MB/s |
brotli 1.0.9 -0 | 2.702 | 395 MB/s | 450 MB/s |
zstd 1.5.1 --fast=1 | 2.437 | 600 MB/s | 2150 MB/s |
zstd 1.5.1 --fast=3 | 2.239 | 670 MB/s | 2250 MB/s |
quicklz 1.5.0 -1 | 2.238 | 540 MB/s | 760 MB/s |
zstd 1.5.1 --fast=4 | 2.148 | 710 MB/s | 2300 MB/s |
lzo1x 2.10 -1 | 2.106 | 660 MB/s | 845 MB/s |
lz4 1.9.3 | 2.101 | 740 MB/s | 4500 MB/s |
lzf 3.6 -1 | 2.077 | 410 MB/s | 830 MB/s |
snappy 1.1.9 | 2.073 | 550 MB/s | 1750 MB/s、 |
H.261、H.263、H.263+
等;还有 ISO/IEC 的 MPEG 标准 MPEG1、MPEG2、MPEG4
等等。H.264/AVC 是 ISO/IEC 和 ITU-T 的团体联合开发,旨在提高压缩性能。H.264/MPEG-4 AVC(H.264)是 1995 年自 MPEG-2 视频压缩标准发布以后的最新、最有前途的视频压缩标准
。通过该标准,在同等图像质量下的压缩效率比以前的标准提高了 2 倍以上。因为高清视频光盘保存的信息应该使用无损压缩进行编码,所以采用内容自适应的游程编码(content-adaptive run length code)。四个具有内容自适应长度的游程压缩规则用于压缩每个位平面的二进制位流。 采用可逆无损变换作为可选编码过程,对内容进行预处理,以拟合大于 0 的内容特征。
下图表示的是一种基于子图的压缩编码的结构:
每个子图包括一个图头和若干子图对象。每个子图对象都有一个对象头来描述其在 x 和 y 方向的显示位置。子图对象可以包括一个或多个位平面。位平面编号、图像大小和对象大小记录在图头中。原始位平面数据包括多个二进制位 0 和 1,二进制位由四个游程编码规则压缩。
对子图中的每个位平面 N1, N2,都用下图所示的过程进行编码:
移动对象的时空轨迹(Spatio-Temporal Trajectory)来源于对一定时间间隔的位置采用,依据采样点信息重建时空轨迹。
GPS传输的信息数据量大且包含特定的模式,《Data Compression System for LiDAR Based on Quad-tree Structure》中提出了一种用于压缩激光雷达数据的方法,由于 GPS 数据与激光雷达数据的相似性,所以也可用论文中提到的方式对 GPS 数据进行压缩。我们首先压缩关键数据项并制作四叉树,然后将叶子节点放入线性列表中,并获取每个节点并找到与节点边缘对应的邻居并找到高度差,如果我们获得的高度差小于预定值,则我们将位置坐标和高度值平均,最后得到一个压缩节点。
DTED(Digital Terrain Elevation Data,数字地形高程数据)是数字数据集的标准,它由地形高程值矩阵(即数字高程模型)组成。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-paYngMDU-1652207475927)(https://ycnx.online/wp-content/uploads/2022/04/image-1651161155127.png)]
DTED 可以使用 ADCT 和平均残差矢量量化算法进行压缩,因为我们有灰度图像,需要对其进行压缩以获得更好的效率并降低存储和传输成本。在这种情况下,像素是通过使用经度和纬度来找到的,海拔代表像素的值。
广域监控系统(Wide Area Measurement System,WAMS)是指基于同步相量技术构成的新一代电网动态监测和控制系统。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ygasVmHa-1652207475927)(https://ycnx.online/wp-content/uploads/2022/04/image-1651161475086.png)]
WAMS数据采用 PMU(phasor measurement unit,相量测量单元) 的形式,我们需要使用无损压缩,此外还需要松弛交错。使用 PCA 查找空间重复性和 DCT 查找时间重复性并使用 LZMA 进行压缩。
实验结果表明:这种基于帧之间相似性测量的压缩技术在监控视频上的实现的压缩比 JPEG 有损、JPEG 无损和 MPEG-4 等其他标准压缩技术都要好。
随着多媒体技术的进步,动态3D模型的使用逐渐增加,以在许多图形应用程序(如视频游戏、电影、科学可视化和计算机动画
)中提供逼真的视觉体验。对于图形渲染,3D 模型主要以三角形网格形式
表示,该网格形式由顶点和描绘顶点之间连接的面组成。这种网格表示需要很大的存储空间来存储详细的 3D 模型,并且还需要占用很大的网络带宽来传输。因此,对 3D 模型的高效和紧凑表示的需求越来越大。使用各种类型的终端用户设备不同的异构网络上传输动画 3D 模型变得越来越重要。这带来了以适应网络传输速率和接收设备的可扩展方式压缩数据
的额外要求。
动画几何压缩涉及压缩表示动画帧的动态三维三角形网格的几何数据。几何体压缩的可伸缩性问题解决了在单个尺度中压缩几何体,并在多个尺度中解压几何体的问题。假设一个动画有 F 帧,每一帧有 V 个顶点,每个顶点是三维空间中的一个点,所以需要存储 x, y, z 三个坐标值。因此,动画序列可以用 3V × F 的矩阵表示:
Sanjib Das 等人在《Temporally Scalable Compression of Animation Geometry》中提出了一个编码器和一个解码器结构,以实现时间可伸缩的实现中的一种算法的动画几何压缩。该算法使用在预测误差上遵循TWT(temporal wavelet transform,时间小波变换)的蒙皮模型进行顶点的运动预测。然后使用熵编码对顶点的仿射变换数据、每个顶点簇对应的权重和预测误差的小波系数进行量化和编码。
QR 码是 Quick Response codes 的的缩写,意思是快速响应码
,最初是零售和生产中常用的标准 UPC 条形码的扩展。与一维条形码不同,QR 码是一种二维矩阵码,通过将黑白元素以矩阵形式排列在列和行中来传递信息,为给定数据生成二维条形码,从而隐藏了数据的可读性
。
Mona M. Umaria 和 Gordhan Jethava 在《Enhancing the data storage Capacity in QR code using Compression Algorithm and achieving security and Further data storage capacity provement using Multiplexing》中提出压缩二维码表示的数据以增大二维码存储的信息,并且采用二维码复用的方式进一步提升数据存储容量。
先用 ASCII 将字符转换为0、1,然后用 ZIP 压缩比特数据,最后生成压缩数据对应的二维码,这样就可以使同样复杂的二维码存储更多的信息。除此之外,把 5 个二维码结合为一个二维码,在扫码的时候先将一个二维码转换为 5 个二维码,在分别读取二维码中的信息,不仅可以存储更多的数据,而且增强了保密性
:
环境科学、水资源、生态系统、结构健康和医疗保健应用
等领域的持续监测极为重要。在这种应用中,监测传感器网络中的大量观测数据需要传输到数据汇进行分析。优点:
缺点:
专为嵌入式无线传感网络设计
,操作系统基于构件的架构使得快速的更新成为可能,而这又减小了受传感网络存储器限制的代码长度。传感器网络、普适计算、个人局域网、智能家居和智能测量
等领域。可扩展传感系统(ESS)是位于圣哈辛托山脉的一个正在开发中的系统,该项目主要是为科学家提供空间密集的环境、生理和生态信息
。ESS 主要关注植物和动物栖息地的微气候等物理特征监测,包括地下根系观测和感知、根系附近土壤水分运动、地衣水化状况等,在 ESS 中,尘粒与气象感应板相连。
ESS体系结构由三个部分组成: 采样器、路由 网络内处理框架和查询处理器
。采样器协调来自查询引擎的采样请求,并指派适当的传感器驱动程序收集数据。ESS 使用扩散公司的单相拉协议在微服务器之间进行传输,查询处理提供了大多数生态学家感兴趣的数据。目前,查询处理器支持五种查询类型。随着新的查询类型的开发,查询处理器将得到扩展以支持它们,为了增加节点的生存期,查询处理器中添加了轻量级的时间压缩。
计算像素块的运动来估计这些块在附近帧中的外观
。下图为使用MB、MPEG-1、MPEG-4 编码对 HumanEva-Ⅱ序列的压缩情况图示:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1G7Jfg3H-1652207475934)(https://ycnx.online/wp-content/uploads/2022/04/image-1651194692977.png)]
可以看到,我们的方法在物体和背景区域有明显的边界,简单的模型着色算法还远远不够完美。在算法 MB+DH 加上 400 个额外的点,试图减少这个问题,更好的结果如图所示:
我们可以看到 MB 编解码器创建了清晰的边界,而 MPEG-1 以及 MPEG- 4 产生了块状的结果。由于 MB 中简单的模型着色方法的性能相当差,通过附加存储信息改进了这一点,达到了更优的效果。不过,对象模型的更精确表示应该会显著提高算法的性能。
下图是使用“Cart”序列将 MB 与 MPEG-1 和 MPEG-4 进行的比较:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-M5NHjVnW-1652207475935)(https://ycnx.online/wp-content/uploads/2022/04/image-1651194918887.png)]
可以看到,该图片背景和人物模糊不清,背景所带来的噪声非常大,它恶化了基于扩散的图像压缩方法的结果。此外,对象模型往往不能代表图中人物执行的复杂运动,例如由于肌肉收缩或关节角度缺失。还有,脚的下侧在许多帧中都是可见的。由于脚不包括在物体模型中,人是部分从内部看到的,这导致了错误的颜色。最后,该序列比 HumanEva-II 序列短,导致对象模型和背景开销较大。由于这些原因,对于这个序列,MB 算法比 MPEG-4 算法差。然而,MB 算法仍然在大多数帧中击败了 MPEG-1。
人体姿态估计(Human Pose Estimation)是计算机视觉领域中的一个重要研究方向,被广泛应用于人体活动分析、人机交互以及视频监视
等方面。人体姿态估计是指通过计算机算法在图像或视频中定位人体关键点(如肩、肘、腕、髋膝、膝、踝等)。
姿态估计的作用:
人体姿态估计数据集
。计算 2D 和 3D 姿势中的错误的误差指标
,数据集包含训练、验证和测试
(带有保留的基本实况)集。[1] Rana, K., & Thakur, S. (2017, May). Data compression algorithm for computer vision applications: A survey. In 2017 International Conference on Computing, Communication and Automation (ICCCA) (pp. 1214-1219). IEEE.
[2] GitHub - facebook/zstd: Zstandard - Fast real-time compression algorithm
[3] Van Der Schaar, M., & de With, P. H. N. (2000). Near-lossless complexity-scalable embedded compression algorithm for cost reduction in DTV receivers. IEEE Transactions on Consumer Electronics, 46 (4), 923-933.
[4] Khan, I. U., Ansari, M. A., Yadav, A., & Saeed, S. H. (2015, March). Performance analysis of H. 264 video decoder: Algorithm and applications. In 2015 International Conference on Energy Economics and Environment (ICEEE) (pp. 1-6). IEEE.
[5] Bodecek, K., & Novotny, V. (2007, March). From standard definition to high definition migration in current digital video broadcasting. In 2007 International Multi-Conference on Computing in the Global Information Technology (ICCGI’07) (pp. 15-15). IEEE.
[6] Dymczyk, M., Lynen, S., Bosse, M., & Siegwart, R. (2015, September). Keep it brief: Scalable creation of compressed localization maps. In 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) (pp. 2536-2542). IEEE.
[7] Du, R., & Lee, H. J. (2012, December). Data compression system for LiDAR based on quad-tree structure. In 2012 7th International Conference on Computing and Convergence Technology (ICCCT) (pp. 1358-1363). IEEE.
[8] Jacobs, E. W., & Boss, R. D. (1992). Fractal Image Compression Using Iterated Transforms: Applications to DTED. NAVAL COMMAND CONTROL AND OCEAN SURVEILLANCE CENTER RDT AND E DIV SAN DIEGO CA.
[9] Gadde, P. H., Biswal, M., Brahma, S., & Cao, H. (2016). Efficient compression of PMU data in WAMS. IEEE Transactions on Smart Grid,7(5), 2406-2413.
[10] Taj-Eddin, I. A., Afifi, M., Korashy, M., Hamdy, D., Nasser, M., & Derbaz, S. (2016, July). A new compression technique for surveillance videos: evaluation using new dataset. In 2016 Sixth International Conference on Digital Information and Communication Technology and its Applications (DICTAP) (pp. 159-164). IEEE.
[11] Das, S., & Bora, P. K. (2013, December). Temporally scalable compression of animation geometry. In 2013 Fourth National Conference on Computer Vision, Pattern Recognition, Image Processing and Graphics (NCVPRIPG)(pp. 1-4). IEEE.
[12] Umaria, M. M., & Jethava, G. B. (2015, December). Enhancing the data storage capacity in QR code using compression algorithm and achieving security and further data storage capacity improvement using multiplexing. In 2015 International Conference on Computational Intelligence and Communication Networks (CICN) (pp. 1094-1096). IEEE.