ELT.ZIP

【ELT.ZIP】OpenHarmony啃论文俱乐部——计算机视觉数据压缩应用

本文出自ELT.ZIP团队，ELT<=>Elite(精英)，.ZIP为压缩格式，ELT.ZIP即压缩精英。
成员：
- 上海工程技术大学大二在校生
- 合肥师范学院大二在校生
- 清华大学大二在校生
- 成都信息工程大学大一在校生
- 黑龙江大学大一在校生
- 山东大学大三在校生
- 华南理工大学大一在校生
我们是来自7个地方的同学，我们在OpenHarmony成长计划啃论文俱乐部里，与华为、软通动力、润和软件、拓维信息、深开鸿等公司一起，学习和研究操作系统技术…

文章目录

- - 【往期回顾】
  - 【本期看点】
  - 【技术DNA】
  - 【智慧场景】
- 引言
- 不同种计算机视觉应用程序与压缩算法
- - 一、图像修整应用程序
  - 二、从3D到2D转换的应用程序
  - 三、医疗应用程序
  - 四、机器人应用程序
  - 五、基于通信的应用程序
  - 六、定位应用程序
  - 七、视频应用程序
  - 八、其他应用程序
- Ⅰ. 轻量级时间压缩（LTC）
- - 问题提出
  - 入题
  - - 优缺点
    - 场景一：TinyOS 的应用
    - 场景二：可扩展传感系统
  - 总结
- Ⅱ. 能够击败 MPEG-4 的图像压缩编码
- - 背景
  - 入题
  - 实验
  - 实验二
  - HumanEva Dataset
  - - 人体姿态估计
    - 介绍
- 参考文献

【往期回顾】

① 2月23日《老子到此一游系列》之 老子为什么是老子 —— ++综述视角解读压缩编码++
② 3月11日《老子到此一游系列》之 老子带你看懂这些风景 —— ++多维探秘通用无损压缩++
③ 3月25日《老子到此一游系列》之 老子见证的沧海桑田 —— ++轻翻那些永垂不朽的诗篇++
④ 4月4日《老子到此一游系列》之 老子游玩了一条河 —— ++细数生活中的压缩点滴++
⑤ 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——一文穿透多媒体过往前沿++
⑥ 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——这些小风景你不应该错过++
⑦ 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——浅析稀疏表示医学图像++

【本期看点】

高速缓存与压缩算法会碰撞出什么火花呢？
图像、医疗、机器人、通信都在这里了
你可能少有听说的TinyOS操作系统
揭秘 3D 网格压缩的三类方式
殿堂级 WARP 寄存器压缩技术

【技术DNA】

【智慧场景】

引言

随着计算机需求的日益增长，致使计算机在各个领域都有应用，计算机视觉就是其中之一。目前传感器的功能已经非常强大，能够通过使用各种传感器来模拟人眼，以获取周边环境的信息，比如物体的形状、大小等。这些特征能够让我们运用几何学、物理学、统计学等知识构造各种模型。
为了达到我们的目的，我们通常使用相机、电缆、电脑以及各种接入设备来捕获我们需要的信息。当我们与他人分享这些信息时，我们可以考虑存储空间、速率等多种因素来确定合适的压缩算法来进行信息的传播。

不同种计算机视觉应用程序与压缩算法

一、图像修整应用程序

图片编辑

我们需要存储或传输真实的图像以及压缩后的图像来再现真实的图像，这最终会增加带宽和存储空间。因此，我们利用 JPEG 变形算法将图像转换为压缩图像，并保护了重要的特性。

图像挖掘

图像数据挖掘是用来挖掘大规模图像数据中隐含的知识、图像内或图像间的各种关系以及其他隐藏在图像数据中的各种模式的一种技术，应用于 MRI、钻石眼、脑肿瘤分析等。一般先要进行 Run length 编码，然后是 Huffman 编码算法，以相对较低的成本存储大量的数据，并从给定的图像中提取越来越多的信息。

图像测序

随着医学图像和基因测序技术的提高，越来越多的医学图像和测序数据被检测和存储。这些海量数据的背后隐藏了多种疾病的发病机制和有效治疗相关信息。我们需要无损压缩，因为我们不能冒序列和描述丢失的风险，因此，为了压缩这些数据，使用并行计算算法来压缩给定的数据，首先数据根据不同的模式进行分区，然后这些模式使用算术代码进行压缩。

Z-Stack 图像

Z-Stack其实就是在Z轴方向上连续拍很多张图，然后可以做一个叠加，拍摄的间隔距离或是切片（形象的说法）是可以自己设置的，然后拍出来的从上往下看可以想象成一个长方体，然后把这个长方体像拆开盒子一样将各个面铺开，展现出来的就是下面的图片。

图像信息隐写

隐写术是一种将保密信息隐藏在公开信息中的技术，利用图像文件的特性，我们可以把一些想要刻意隐藏的信息或者证明身份、版权的信息隐藏在图像文件中。比如早期流行的将一些下载链接、种子文件隐藏在图片文件中进行传播，再比如某互联网公司内部论坛“月饼事件”中通过员工截图精准定位个人信息的技术，都可以归为图像隐写技术（Image Steganography）。
我们可以利用 GIF，因为它可以在任何硬件或软件上运行。使用 LZW- 无损技术对数据进行压缩，然后将这些数据嵌入到边缘设备中。

图像融合

图像融合是指将多源信道所采集到的关于同一目标的图像数据经过图像处理和计算机技术等，最大限度的提取各自信道中的有利信息，最后综合成高质量的图像，以提高图像信息的利用率、改善计算机解译精度和可靠性、提升原始图像的空间分辨率和光谱分辨率，利于监测。

二、从3D到2D转换的应用程序

3D映射

它利用几何最小化之后的算术编码来压缩占用非常大的 OBJ 格式的数据，需要存储和传输。采用无损压缩的方式对其进行压缩是最合适的。

地形建模

地形建模的数据结构和结构的描述需要存储，需要使用 Shannon 算法对图进行无损压缩，描述使用 SZIP 压缩。它也有两个步骤：

第一步对结构进行二进制编码
第二步用算术编码器对第一步得到的编码进行压缩。我们不能承受信息的丢失，所以我们使用无损算法
人体姿势跟踪

由于每天创建和观看的视频数量巨大且分辨率不断提高，视频压缩仍然是一个正在进行的研究课题。最流行的视频压缩算法，如 MPEG 和 H.26x 家族，通过计算像素块的运动来估计这些块在附近帧中的外观，文中提出了一种带有拓展剩余编码的基线视频压缩算法，该算法为 3D 姿态跟踪 + 基于 pde 的图像压缩 + 半色调的三种方法的结合，能够在背景所带来的噪声不大的情况下超过 MPEG-1与 MPEG-4，在背景噪声影响较大的情况下，优于 MPEG-1。

汽车应用中基于夜视行人检测

汽车应用中的行人检测主要使用 JPEG2000 和 H.264/AVC 进行压缩。我们需要在一个高流量通道上传输数据，一般通过使用 8位像素深度/颜色通道的编码器来进行有损压缩。

面部表情检测

“表情”是我们日常生活中提到很多的一个词语，在人际沟通中，人们通过控制自己的面部表情，可以加强沟通效果。人类的面部表情至少有21种，除了常见的高兴、吃惊、悲伤、愤怒、厌恶和恐惧6种，还有惊喜（高兴＋吃惊）、悲愤（悲伤＋愤怒）等15种可被区分的复合表情。
面部表情检测使用几何最小化和 JPEG 2000。一个面部表情中有大量的特征，所以我们需要适当的存储细节，对数据有很高的要求。

运动目标检测

运动目标检测是指将图像序列或视频中发生空间位置变化的物体作为前景提出并标示的过程，它一直是一个十分热门的研究领域，广泛应用于智能监控、多媒体应用等领域。运动目标检测主要有以下几种方法：

光流法
帧间差分法
背景差分法

光流法计算复杂，不适用于实时监控系统；帧间差分法计算简单，但是检测结果不完整；背景差分效果较好，然而建立一个良好的背景模型需要花费很大计算量和存储量的开销。

可扩展传感系统

可扩展传感系统(ESS)是位于圣哈辛托山脉的一个正在开发中的系统。该项目主要是为科学家提供空间密集的环境、生理和生态信息，通过 LTC 压缩算法，具有了更好的性能。LTC 压缩算法的优点如下：

算法简单，存储空间小
通过使用 LTC，可以将数据压缩到 -20 到 -1。在这种压缩方案的帮助下，可以高速率进行采样。
LTC 算法主要针对 8 位处理器的云母，没有处理浮点值的硬件。这将 LTC 的应用限制为仅压缩整数数据。像 LTC 这样的有损压缩方案通过识别和删除不必要的信息来减少比特数。在传输之前对数据进行压缩，可以显著减少资源使用，增加网络设备寿命。

三、医疗应用程序

医学影像

医学影像对疾病的识别和手术计划有非常重要的影响。然而，每个病人的成像设备仍然会产生大量的信息，通常为 1000 张或 500 MB。这些信息需要大的存储空间和经济的传输；尽管传输存储空间和通信技术有了更大的改进，医学图像压缩仍然发挥着要求很高的作用。
主成分分析(PCA)通常是一种有损压缩方案，通过将复杂的数据集转换为更小的维数来实现图像压缩。下图为 canny 边缘分割技术得到的 ROI，在非感兴趣区域要求最高的压缩，而感兴趣区域要求图像质量高。

超声波

超声波是一种波长极短的机械波，在空气中波长一般短于 2 厘米。它必须依靠介质进行传播，无法存在于真空（如太空）中。它在水中传播距离比空气中远，但因其波长短，在空气中则极易损耗，容易散射，不如可听声和次声波传得远，不过波长短更易于获得各向异性的声能，可用于清洗、碎石、杀菌消毒等，在医学、工业上有很多的应用。
超声波图像存储和传输通过一个通道，需要使用 JPEG 压缩算法。将图像分割成数小块，利用 2D-DCT 变换对每个块进行编码，生成量化矩阵，然后采用熵编码进行编码，得到压缩后的图像。我们也可以使用 MPEG-1、MPEG-2 和 H.26x.

微创脊椎手术

微创脊柱外科技术意味着在一定医疗风险下避免大切口，采用微小切口或穿刺通道，运用特殊的器械和装置，在影像仪器监视下或导航技术引导下，从正常的解剖结构到达病变处，使用各种微型的手动或电动器械和器材，在可视条件下完成整个手术过程。
压缩时一般基于运动学和指数。数据处理采用最小二乘法，利用遗传算法选择一种生物方式来压缩数据，它不会压缩大容量的数据。

眼动跟踪

眼动追踪技术已成为心理学、神经营销学、神经认知、用户体验、基础研究及市场研究等多个领域视觉行为和人类行为的技术手段之一。该技术还可以用于医学分析和筛查。从眼动的历史发展进程来看，早期的眼动追踪系统是侵入性的且不能移动，受限非常严重，仅在有限的实验中使用，并且在现在社会受到伦理方面的考验。随着眼动追踪系统的发展，现代的眼动追踪系统利用红外光进行捕捉眼球运动，该系统是非侵入的且更加方便易用。
眼动跟踪使用 JPEG 2000 进行压缩，因为它提供了眼睛运动的 2D 刻度上的各种深度信息，并存储信息，我们可以利用有损压缩的方式进行眼动跟踪。

自动化视觉检测

视觉检测就是用机器代替人眼来做测量和判断，是一般将被摄取目标转换成图像信号，传送给专用的图像处理系统，根据像素分布和亮度、颜色等信息，转变成数字化信号；图像系统对这些信号进行各种运算来抽取目标的特征，进而根据判别的结果来控制现场的设备动作。
我们可以通过跟踪视频的有用部分，并根据其优先级编码，在压缩后最小化视频的大小，这是一个小的角度空间之间的 2-5° 围绕眼睛所望方向的中心，我们使用带有漏斗的 MPEG-4。

远程视频脑电图

远程视频脑电图就是远程、脑电图以及视频的结合。在脑电图设备基础上增加了视频设备（白天高清摄像头拍摄，晚间红外线照明），进而远程传输同步拍摄病人的临床表现。

它利用了波压缩。数据需要存储和传输，一般使用无损压缩技术，增加了 Cr ，可达 x50。
全国首例跨区域5G远程操控视频脑电图诊断在蚌埠成功实施

电有氧运动图

该技术所用的数据占用了大量数据存储空间，导致网络传输困难。采用离散小波变换和游程编码，通过小波变换来降低噪声，通过删除所有无用的系数来减少数据大小。

四、机器人应用程序

外部建筑清洗系统

外部建筑清洗系统通常需要小波变换和 VQ 来进行有损压缩。它使用字典和三级 DWT 对系统误差进行检测，数据空间小，需要通过信号传输清洗位置以及维护 PSNR。

自动化森林采伐

用于耕地，这里考虑浮动孔径算法，它用于发现一个通道是否需要在采样时间存储。

机器人视觉

机器人视觉，是指不仅要把视觉信息作为输入，而且还要对这些信息进行处理，进而提取出有用的信息提供给机器人。今天的机器人已经能够完成识别人的手势和面部表情等多种功能了。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SHtawWvc-1652207475923)(https://ycnx.online/wp-content/uploads/2022/04/image-1651155482415.png)]
奇异值分解 (Singular Value Decomposition，简称SVD)是在机器学习领域广泛应用的算法。SVD算法主要用在降维算法中的特征分解、推荐系统、自然语言处理计算机视觉等领域。它不光可以用于降维算法中的特征分解，通过 SVD，我们将图片矩阵分成正交矩阵、对角矩阵以及正交矩阵这三个矩阵的乘积。为了增加通道的使用，我们取多张图像，将重叠的图像拼接在一起，找出任何物体的运动。

机器人引导

随着工业生产中对自动化的要求越来越高，视觉技术已被广泛引入工业机器人行业，具备视觉的工业机器人能更快、更准、更灵活地完成定位抓取、对位组装等。基于图像分析的视觉技术在机器人引导相关应用中的主要作用是精确获取对象物（待抓取物体）和目标物（待组装物体）的坐标位置和角度，并将图像坐标转换为机器人能识别的机器人坐标，指导机器人进行纠偏和组装。因此，对图片进行压缩并能使机器人精确完成相关任务是非常重要的。
机器人引导压缩通常是在数据量大、传输困难的情况下进行的。一般使用小波变换和基于 VQ 的模糊 c 均值聚类。

五、基于通信的应用程序

Facebook

Facebook 是有名的社交媒体网站，每个月的活跃用户数量超过20亿，所以有着高负荷的数据输入和输出。维护这么多的数据是一件很难的事，Facebook使用 Zstandard 压缩数据，以使信道不会受到流量堵塞。
Zstd 是一种快速无损压缩算法，针对 zlib 级别的实时压缩场景和更好的压缩比，它由 Huff0 和 FSE 库提供的非常快的熵阶段提供支持。当需要时，它可以将压缩速度交换为更高的压缩比率（压缩速度与压缩比率的权衡可以通过小增量来配置），反之亦然。在运行 Ubuntu 20.04（Linux 5.11.0-41-generic）的桌面上测试和比较几种快速压缩算法，使用 lzench 在 Silesia 压缩语料库上编译，可以得到如下对比：

压缩方式	压缩比	压缩速度	解压缩速度
zstd 1.5.1 -1	2.887	530 MB/s	1700 MB/s
Zlib 1.2.11 -1	2.743	95 MB/s	400 MB/s
brotli 1.0.9 -0	2.702	395 MB/s	450 MB/s
zstd 1.5.1 --fast=1	2.437	600 MB/s	2150 MB/s
zstd 1.5.1 --fast=3	2.239	670 MB/s	2250 MB/s
quicklz 1.5.0 -1	2.238	540 MB/s	760 MB/s
zstd 1.5.1 --fast=4	2.148	710 MB/s	2300 MB/s
lzo1x 2.10 -1	2.106	660 MB/s	845 MB/s
lz4 1.9.3	2.101	740 MB/s	4500 MB/s
lzf 3.6 -1	2.077	410 MB/s	830 MB/s
snappy 1.1.9	2.073	550 MB/s	1750 MB/s、

数字电视、视频电话

视频编解码技术有两套标准，国际电联（ITU-T）的标准 H.261、H.263、H.263+ 等；还有 ISO/IEC 的 MPEG 标准 MPEG1、MPEG2、MPEG4 等等。H.264/AVC 是 ISO/IEC 和 ITU-T 的团体联合开发，旨在提高压缩性能。H.264/MPEG-4 AVC（H.264）是 1995 年自 MPEG-2 视频压缩标准发布以后的最新、最有前途的视频压缩标准。通过该标准，在同等图像质量下的压缩效率比以前的标准提高了 2 倍以上。
H.264 的编解码流程主要包括 5 个部分：帧间和帧内预测（Estimation）、变换（Transform）和反变换、量化（Quantization）和反量化、环路滤波（Loop Filter）、熵编码（Entropy Coding），有如下优点：
1. 低码率
2. 高质量的图像
3. 容错能力强
4. 网络适应性强

HDTV广播

HDTV 即高清晰度电视（High Definition Television），与当前采用模拟信号传输的传统电视系统不同，HDTV 采用了数字信号传输。由于 HDTV 从电视节目的采集、制作到电视节目的传输，以及到用户终端的接收全部实现数字化，因此 HDTV 给我们带来了极高的清晰度，分辨率最高可 1920×1080，帧率高达 60fps。在 HDTV 中，我们使用 MPEG-4/AVC 也即 H.264，因为 MPEG-2 压缩算法无法为我们提供良好的比特率来制作单频道，这提供了 MPEG-2 所需压缩率的大约 50%。

高清视频光盘

因为高清视频光盘保存的信息应该使用无损压缩进行编码，所以采用内容自适应的游程编码(content-adaptive run length code)。四个具有内容自适应长度的游程压缩规则用于压缩每个位平面的二进制位流。采用可逆无损变换作为可选编码过程，对内容进行预处理，以拟合大于 0 的内容特征。
下图表示的是一种基于子图的压缩编码的结构：
每个子图包括一个图头和若干子图对象。每个子图对象都有一个对象头来描述其在 x 和 y 方向的显示位置。子图对象可以包括一个或多个位平面。位平面编号、图像大小和对象大小记录在图头中。原始位平面数据包括多个二进制位 0 和 1，二进制位由四个游程编码规则压缩。

对子图中的每个位平面 N₁, N₂，都用下图所示的过程进行编码：

颜色匹配

颜色匹配应用使用的压缩技术是 JPEG，它维护一个字典，该字典具有与某些索引值匹配的真实颜色值，这在颜色匹配应用程序中非常有用。

六、定位应用程序

GPS设备

移动对象的时空轨迹（Spatio-Temporal Trajectory）来源于对一定时间间隔的位置采用，依据采样点信息重建时空轨迹。
GPS传输的信息数据量大且包含特定的模式，《Data Compression System for LiDAR Based on Quad-tree Structure》中提出了一种用于压缩激光雷达数据的方法，由于 GPS 数据与激光雷达数据的相似性，所以也可用论文中提到的方式对 GPS 数据进行压缩。我们首先压缩关键数据项并制作四叉树，然后将叶子节点放入线性列表中，并获取每个节点并找到与节点边缘对应的邻居并找到高度差，如果我们获得的高度差小于预定值，则我们将位置坐标和高度值平均，最后得到一个压缩节点。

海军活动的DTED管理

DTED（Digital Terrain Elevation Data，数字地形高程数据）是数字数据集的标准，它由地形高程值矩阵（即数字高程模型）组成。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-paYngMDU-1652207475927)(https://ycnx.online/wp-content/uploads/2022/04/image-1651161155127.png)]
DTED 可以使用 ADCT 和平均残差矢量量化算法进行压缩，因为我们有灰度图像，需要对其进行压缩以获得更好的效率并降低存储和传输成本。在这种情况下，像素是通过使用经度和纬度来找到的，海拔代表像素的值。

本地化地图

要存储真实世界的地图，我们需要很大的空间。所以我们在这种情况下使用汇总图。汇总地图仅包含主要地标，进而增强了传输。查询被分成多个片段，每个片段都描述了实际发现，然后使用基于 ILP 的压缩。

WAMS（广域监控系统）

广域监控系统（Wide Area Measurement System，WAMS）是指基于同步相量技术构成的新一代电网动态监测和控制系统。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ygasVmHa-1652207475927)(https://ycnx.online/wp-content/uploads/2022/04/image-1651161475086.png)]
WAMS数据采用 PMU（phasor measurement unit，相量测量单元）的形式，我们需要使用无损压缩，此外还需要松弛交错。使用 PCA 查找空间重复性和 DCT 查找时间重复性并使用 LZMA 进行压缩。

七、视频应用程序

视频监控

视频监控占用大量空间存储，记录监控摄像头捕获的所有内容会消耗系统使用的存储设备。视频监控录制的视频时间长，从中提取有用的信息是一个耗时的过程，这些缺点限制了传统视频监控系统的有效性。
为了用更小的空间存储监控视频，有多种方法，比如消除环境冗余的仅模型编码（Exploiting global redundancy in big surveillance video data for efficient coding），基于对象的监控视频压缩技术（Object-based Surveillance Video Compression using Foreground Motion Compensation），基于事件的监控的开放框架（IBM smart surveillance system (S3): event based video surveillancesystem with an open and extensible framework）等等。利用监控视频可能持续很长时间而其监控的场景没有变化的事实，Islam Taj-Eddin 等人开发了一种基于帧之间相似性测量的有效压缩方法，可以有效减小视频大小（A New Compression Technique for Surveillance Videos: Evaluation Using New Dataset）。
由于监控视频通常包含大量连续帧，这些帧引用相同的场景而没有变化。所以我们可以丢弃相似的帧，只保留包含相当大变化的帧。具体的算法包含两个阶段：

通过删除相似的顺序帧来生成给定视频的摘要视频。
通过将每一帧表示为一组子帧的小窗口来对超细化视频进行编码。对于每个子帧，重新应用相似性测量来删除每个相似的子帧。

实验结果表明：这种基于帧之间相似性测量的压缩技术在监控视频上的实现的压缩比 JPEG 有损、JPEG 无损和 MPEG-4 等其他标准压缩技术都要好。

动画图片

随着多媒体技术的进步，动态3D模型的使用逐渐增加，以在许多图形应用程序（如视频游戏、电影、科学可视化和计算机动画）中提供逼真的视觉体验。对于图形渲染，3D 模型主要以三角形网格形式表示，该网格形式由顶点和描绘顶点之间连接的面组成。这种网格表示需要很大的存储空间来存储详细的 3D 模型，并且还需要占用很大的网络带宽来传输。因此，对 3D 模型的高效和紧凑表示的需求越来越大。使用各种类型的终端用户设备不同的异构网络上传输动画 3D 模型变得越来越重要。这带来了以适应网络传输速率和接收设备的可扩展方式压缩数据的额外要求。
动画几何压缩涉及压缩表示动画帧的动态三维三角形网格的几何数据。几何体压缩的可伸缩性问题解决了在单个尺度中压缩几何体，并在多个尺度中解压几何体的问题。假设一个动画有 F 帧，每一帧有 V 个顶点，每个顶点是三维空间中的一个点，所以需要存储 x, y, z 三个坐标值。因此，动画序列可以用 3V × F 的矩阵表示：
Sanjib Das 等人在《Temporally Scalable Compression of Animation Geometry》中提出了一个编码器和一个解码器结构，以实现时间可伸缩的实现中的一种算法的动画几何压缩。该算法使用在预测误差上遵循TWT（temporal wavelet transform，时间小波变换）的蒙皮模型进行顶点的运动预测。然后使用熵编码对顶点的仿射变换数据、每个顶点簇对应的权重和预测误差的小波系数进行量化和编码。

八、其他应用程序

读取二维码

QR 码是 Quick Response codes 的的缩写，意思是快速响应码，最初是零售和生产中常用的标准 UPC 条形码的扩展。与一维条形码不同，QR 码是一种二维矩阵码，通过将黑白元素以矩阵形式排列在列和行中来传递信息，为给定数据生成二维条形码，从而隐藏了数据的可读性。
Mona M. Umaria 和 Gordhan Jethava 在《Enhancing the data storage Capacity in QR code using Compression Algorithm and achieving security and Further data storage capacity provement using Multiplexing》中提出压缩二维码表示的数据以增大二维码存储的信息，并且采用二维码复用的方式进一步提升数据存储容量。
先用 ASCII 将字符转换为0、1，然后用 ZIP 压缩比特数据，最后生成压缩数据对应的二维码，这样就可以使同样复杂的二维码存储更多的信息。除此之外，把 5 个二维码结合为一个二维码，在扫码的时候先将一个二维码转换为 5 个二维码，在分别读取二维码中的信息，不仅可以存储更多的数据，而且增强了保密性：

生物识别

生物识别技术，是指用数理统计方法对生物进行分析，现在多指对生物体（一般特指人）本身的生物特征来区分生物体个体的计算机技术，包含电子护照使用的指纹和面部识别等。可以使用 JPEG 2000 和 SPIHT，其中 JPEG 2000 用于人脸识别；SPIHT 是一种基于 0-tree 的编解码器，它根据子带提取系数。

Ⅰ. 轻量级时间压缩（LTC）

问题提出

无线传感器网络（WSNs）对于环境科学、水资源、生态系统、结构健康和医疗保健应用等领域的持续监测极为重要。在这种应用中，监测传感器网络中的大量观测数据需要传输到数据汇进行分析。
建设大规模的无线传感器网络与实用性的发展机制，使传感器设备仅仅依靠有限的能量来运行更长的时间，以便传输更多的信息。数据通信是消耗网络能量储备的主要因素，如何减少传感器节点传输的信息量是一个非常重要的问题。

入题

当传感器采样时，由于噪声，它会产生一系列的读数。传感器制造商指定传感器的操作范围以及精度，轻量级时间压缩（LTC）设计用于在传感器精度以余量表示且误差概率分布均匀或未知的情况下压缩数据。
在 LTC 中，利用时间线性用于压缩数据。下图描述了 LTC 算法，x 轴表示时间，y 轴表示值。

优缺点

优点：

可以高速率进行采样。即使我们发送少量的数据，高数据率的采样对检测任何环境变化都是有用的。
LTC 的大部分增益发生在传感器制造商规定的工作误差范围内。对于 LTC，原始数据点与其对应的压缩后重构数据点之间的最大误差范围可以任意设置。这是一个调节旋钮，调节压缩数据大小和精度之间的权衡。

缺点：

当原始误差分布不均匀时，它可能会对原始误差分布进行卷积。环境数据如温度和湿度具有良好的性质，它们通常在时间维度上是连续的，在足够小的时间窗下近似线性。环境现象本身就非常复杂，很难建模。

场景一：TinyOS 的应用

TinyOS是 UC Berkeley 开发的开放源代码操作系统，专为嵌入式无线传感网络设计，操作系统基于构件的架构使得快速的更新成为可能，而这又减小了受传感网络存储器限制的代码长度。
TinyOS是一个具备较高专业性，专门为低功耗无线设备设计的操作系统，主要应用于传感器网络、普适计算、个人局域网、智能家居和智能测量等领域。

场景二：可扩展传感系统

可扩展传感系统（ESS）是位于圣哈辛托山脉的一个正在开发中的系统，该项目主要是为科学家提供空间密集的环境、生理和生态信息。ESS 主要关注植物和动物栖息地的微气候等物理特征监测，包括地下根系观测和感知、根系附近土壤水分运动、地衣水化状况等，在 ESS 中，尘粒与气象感应板相连。
ESS体系结构由三个部分组成: 采样器、路由网络内处理框架和查询处理器。采样器协调来自查询引擎的采样请求，并指派适当的传感器驱动程序收集数据。ESS 使用扩散公司的单相拉协议在微服务器之间进行传输，查询处理提供了大多数生态学家感兴趣的数据。目前，查询处理器支持五种查询类型。随着新的查询类型的开发，查询处理器将得到扩展以支持它们，为了增加节点的生存期，查询处理器中添加了轻量级的时间压缩。

总结

提出了一种可调轻量级时间压缩方案（LTC）
与其他压缩技术相比，该算法简单，存储空间小
通过使用 LTC，可以将数据压缩到 -20 到 -1，在这种压缩方案的帮助下，有可能以高速率进行采样
LTC 算法主要针对 8 位处理器的云母，没有处理浮点值的硬件。这将 LTC 的应用限制为仅压缩整数数据。像 LTC 这样的有损压缩方案通过识别和删除不必要的信息来减少比特数。在传输之前对数据进行压缩，可以显著减少资源使用，增加网络寿命
长期目标是检查 LTC 的过滤能力噪音。对尘粒进行特征提取是很有用的

Ⅱ. 能够击败 MPEG-4 的图像压缩编码

背景

由于每天创建和观看的视频数量巨大且分辨率不断提高，视频压缩仍然是一个正在进行的研究课题。最流行的视频压缩算法，如 MPEG 和 H.26x 家族，通过计算像素块的运动来估计这些块在附近帧中的外观。

入题

文中提出的基于模型的视频压缩编解码器与这些现有的方法有很大的不同，它结合了来自明显不相关领域的三种最先进的算法，即 3-D 姿态跟踪、基于 pde 的图像压缩和半色调。它们的组合使得击败 MPEG-1 甚至 MPEG-4，与许多其他基于模型的编码算法相比，该压缩方法不是专门针对人脸或其他特定对象的，因此适用于不同类型的视频。

实验

下图为使用MB、MPEG-1、MPEG-4 编码对 HumanEva-Ⅱ序列的压缩情况图示：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1G7Jfg3H-1652207475934)(https://ycnx.online/wp-content/uploads/2022/04/image-1651194692977.png)]
可以看到，我们的方法在物体和背景区域有明显的边界，简单的模型着色算法还远远不够完美。在算法 MB+DH 加上 400 个额外的点，试图减少这个问题，更好的结果如图所示：
我们可以看到 MB 编解码器创建了清晰的边界，而 MPEG-1 以及 MPEG- 4 产生了块状的结果。由于 MB 中简单的模型着色方法的性能相当差，通过附加存储信息改进了这一点，达到了更优的效果。不过，对象模型的更精确表示应该会显著提高算法的性能。

实验二

下图是使用“Cart”序列将 MB 与 MPEG-1 和 MPEG-4 进行的比较：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-M5NHjVnW-1652207475935)(https://ycnx.online/wp-content/uploads/2022/04/image-1651194918887.png)]
可以看到，该图片背景和人物模糊不清，背景所带来的噪声非常大，它恶化了基于扩散的图像压缩方法的结果。此外，对象模型往往不能代表图中人物执行的复杂运动，例如由于肌肉收缩或关节角度缺失。还有，脚的下侧在许多帧中都是可见的。由于脚不包括在物体模型中，人是部分从内部看到的，这导致了错误的颜色。最后，该序列比 HumanEva-II 序列短，导致对象模型和背景开销较大。由于这些原因，对于这个序列，MB 算法比 MPEG-4 算法差。然而，MB 算法仍然在大多数帧中击败了 MPEG-1。

HumanEva Dataset

官网链接：HumanEva Dataset

人体姿态估计

人体姿态估计（Human Pose Estimation）是计算机视觉领域中的一个重要研究方向，被广泛应用于人体活动分析、人机交互以及视频监视等方面。人体姿态估计是指通过计算机算法在图像或视频中定位人体关键点（如肩、肘、腕、髋膝、膝、踝等）。
姿态估计的作用：

利用人体姿态进行摔倒检测或用于增强安保和监控
用于健身、体育和舞蹈等教学
训练机器人，让机器人“学会”移动自己的关节
电影特效制作或交互游戏中追踪人体的运动。通过追踪人体姿态的变化，实现虚拟人物与现实人物动作的融合与同步

姿态估计数据集：
人体姿态估计数据集就是一堆用于训练人体姿态模型的数据。由于缺乏高质量的数据集，在人体姿势估计方面进展缓慢。在近几年中，一些具有挑战性的数据集已经发布，这使得研究人员进行研发工作。本文所使用的 HumanEva Dataset 就是一种人体姿态估计数据集。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OV8bMuDa-1652207475936)(https://ycnx.online/wp-content/uploads/2022/04/2b55fe28-20f4-4f69-aa34-0a8cba7c92b5.gif)]

介绍

HumanEva 数据集目前有 HumanEva_1 与 HumanEva_2 两个版本。
HumanEva-I 数据集包含 7 个经过校准的视频序列（4个灰度和3个颜色），这些序列与从动作捕捉系统获得的 3D 身体姿势同步。该数据库包含4个执行6种常见动作（例如步行，慢跑，手势等）的受试者。向参与者提供用于计算 2D 和 3D 姿势中的错误的误差指标，数据集包含训练、验证和测试（带有保留的基本实况）集。

参考文献

[1] Rana, K., & Thakur, S. (2017, May). Data compression algorithm for computer vision applications: A survey. In 2017 International Conference on Computing, Communication and Automation (ICCCA) (pp. 1214-1219). IEEE.
[2] GitHub - facebook/zstd: Zstandard - Fast real-time compression algorithm
[3] Van Der Schaar, M., & de With, P. H. N. (2000). Near-lossless complexity-scalable embedded compression algorithm for cost reduction in DTV receivers. IEEE Transactions on Consumer Electronics, 46 (4), 923-933.
[4] Khan, I. U., Ansari, M. A., Yadav, A., & Saeed, S. H. (2015, March). Performance analysis of H. 264 video decoder: Algorithm and applications. In 2015 International Conference on Energy Economics and Environment (ICEEE) (pp. 1-6). IEEE.
[5] Bodecek, K., & Novotny, V. (2007, March). From standard definition to high definition migration in current digital video broadcasting. In 2007 International Multi-Conference on Computing in the Global Information Technology (ICCGI’07) (pp. 15-15). IEEE.
[6] Dymczyk, M., Lynen, S., Bosse, M., & Siegwart, R. (2015, September). Keep it brief: Scalable creation of compressed localization maps. In 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) (pp. 2536-2542). IEEE.
[7] Du, R., & Lee, H. J. (2012, December). Data compression system for LiDAR based on quad-tree structure. In 2012 7th International Conference on Computing and Convergence Technology (ICCCT) (pp. 1358-1363). IEEE.
[8] Jacobs, E. W., & Boss, R. D. (1992). Fractal Image Compression Using Iterated Transforms: Applications to DTED. NAVAL COMMAND CONTROL AND OCEAN SURVEILLANCE CENTER RDT AND E DIV SAN DIEGO CA.
[9] Gadde, P. H., Biswal, M., Brahma, S., & Cao, H. (2016). Efficient compression of PMU data in WAMS. IEEE Transactions on Smart Grid,7(5), 2406-2413.
[10] Taj-Eddin, I. A., Afifi, M., Korashy, M., Hamdy, D., Nasser, M., & Derbaz, S. (2016, July). A new compression technique for surveillance videos: evaluation using new dataset. In 2016 Sixth International Conference on Digital Information and Communication Technology and its Applications (DICTAP) (pp. 159-164). IEEE.
[11] Das, S., & Bora, P. K. (2013, December). Temporally scalable compression of animation geometry. In 2013 Fourth National Conference on Computer Vision, Pattern Recognition, Image Processing and Graphics (NCVPRIPG)(pp. 1-4). IEEE.
[12] Umaria, M. M., & Jethava, G. B. (2015, December). Enhancing the data storage capacity in QR code using compression algorithm and achieving security and further data storage capacity improvement using multiplexing. In 2015 International Conference on Computational Intelligence and Communication Networks (CICN) (pp. 1094-1096). IEEE.

你可能感兴趣的:(压缩算法,计算机视觉,人工智能,harmonyos,算法)

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
具身语义导航算法总揽 Shilong Wang 具身导航算法算法
端到端方法小脑大脑GNMNavDPNaVILAViNTNomadNavidStreamVLNMapNavNavGPTUni-NavidOctoNavNavGPT2模仿学习行为克隆BCDAgger模块化方法GOATVLFMSayPlanLM-NavETPNavVoroNavEmbodiedRAGVL-NavStairwaytoSuccess业内大佬北大王鹤NavidUni-NavidOctoNav吴
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
android去除gps漂移代码,GPS漂移过滤算法扇贝君
GPS漂移过滤算法基本思想：逐点过滤，再经过基础过滤后，进行判断运动状态，静止状态和运动中。如果静止，则使用电子围栏；如果运动，则先过滤大速度，再过滤加速度，然后过滤距离(包括超大距离，和速度相关距离)。对于要过滤的点，采用之前最近的可靠点，进行替换，同时，无效次数+1，如果后面是有效点，则无效次数-1，如果无效次数归0，认为这个点才是真正可靠点(无效次数为正时，都为要被替换的点)。如果遇到不定点
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
《C++性能优化指南》 linux版代码及原理解读第四章 v俊逸 C++性能优化指南性能优化 C++性能优化指南性能优化
目录概述为什么字符串很麻烦字符串是动态分配的字符串赋值背后的操作如何面对字符串会进行大量复制写时复制COW（copyonwrite）尝试优化字符串避免临时字符串通过预留存储空间减少内存分配通过传递引用减少实参复制使用迭代器操作减少循环中的比较操作减少返回值的复制还没有结束，使用字符数组代替字符串再次优化字符串尝试其他的算法叠加以前的优化方式使用其他的编译器使用其他字符串的库功能丰富的字符串库使用s
rtos内存管理林内克思 java linux 算法
FreeRTOS将内存分配API保留在其可移植层，提供了五种内存管理算法：heap_1：最简单，不允许释放内存。heap_2：允许释放内存，但不会合并相邻的空闲块。heap_3：简单包装了标准malloc()和free()，以保证线程安全。heap_4：合并相邻的空闲块以避免碎片化。包含绝对地址放置选项。heap_5：如同heap_4，能够跨越多个不相邻内存区域的堆。特点缺点heap_1简单、不支
c++中迭代器的本质三月微风 c++开发语言
C++迭代器的本质与实现原理迭代器是C++标准模板库(STL)的核心组件之一，它作为容器与算法之间的桥梁，提供了统一访问容器元素的方式。下面从多个维度深入解析迭代器的本质特性。一、迭代器的基本定义与分类迭代器的本质迭代器是一种行为类似指针的对象，用于遍历和操作容器中的元素。它提供了一种统一的方式来访问不同容器中的元素，而无需关心容器的具体实现细节。标准分类体系C++标准定义了5种迭代器类型，按功能
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep