译:NLP-Fast: 一个用于加速大规模异构NLP模型的快速、可扩展、灵活的系统
简介:现有的NLP模型中不能提供足够的可扩展性和灵活性,因为它们既没有识别也没有优化最近的NLP模型中出现的广泛的性能关键操作,而只是专注于优化特定操作。因此,本文提出了NLP-Fast,一个以加速广泛的大规模NLP模型的系统解决方案。NLP-Fast主要由两部分组成。(1) NLP-Perf:一个深入的性能分析工具,用于识别新兴NLP模型中的关键操作;(2) NLP-Opt:三种端到端的优化技术,用于加速各种硬件平台(如CPU、GPU、FPGA)上识别的性能关键操作。NLP-Fast可以在不同的硬件平台上加速各种类型的NLP模型,通过NLP-Perf识别其关键操作并应用NLP-Opt的整体优化。在CPU、GPU和FPGA上评估了NLP-Fast,总体吞吐量比每个平台的基线最多可提高2.92倍、1.59倍和4.47倍。
发表于:International Conference on Parallel Architectures and Compilation Techniques(PACT)
等级:CCF: B
原文链接:https://ieeexplore.ieee.org/document/9563012
日期:2021.10.18
译:精确合批:用于GPU上高效的神经网络推理的比特序列分解
简介:基于以下三个观点:1)传统硬件架构(如:GPU)上的低批处理量的神经网络推理是有内存限制的,2)激活精度对提高量化模型的质量至关重要,3)矩阵-向量乘法可以分解为二进制矩阵-矩阵乘法,以更多的算术运算为代价,实现更高精度的激活的量化推理。本文提出了PrecisionBatching,这是一种量化的推理算法,用于在低位宽的传统硬件平台上加快神经网络推理的速度。通过将内存约束问题转变为计算约束问题,实现了极端量化水平(<8比特)的推理,并在固定精度阈值下与标准量化推理方法相比实现了更高的计算效率和运行时速度。在各种应用(MNIST、语言建模、自然语言推理、强化学习)和神经网络架构(全连接、RNN、LSTM)中,PrecisionBatching在全精度基线<1-5%的误差范围内,在GPU上获得了超过8倍的端到端加速,在相同的误差容限下,比传统的8位量化推理要好1.5 × - 2倍。
发表于:International Conference on Parallel Architectures and Compilation Techniques(PACT)
等级:CCF: B
原文链接:https://ieeexplore.ieee.org/document/9563027
日期:2021.10.18
译:我可以在这里做什么?通过想象视觉功能可供性来学习新技能
简介:一个配备了所学技能的通用机器人必须能够在许多不同的环境中执行许多任务,但遇到一个新的环境或物体时,它可能需要对其先前学到的一些技能进行微调,以适应这种变化。但是以前学过的行为和模型仍应适合加速这种再学习。本文旨在研究可能结果的生成模型如何能让机器人学习功能可供性的视觉表征,从而使机器人能够在新的情况下对潜在的可能结果进行采样,然后进一步训练其策略以实现这些结果。实际上,先前的数据被用来学习什么样的结果是可能的,这样,当机器人遇到一个不熟悉的环境时,它可以从其模型中抽取潜在的结果,尝试达到这些结果,从而更新其技能和结果模型。这种方法可用于训练以原始图像输入为基础的目标条件策略,并可通过我们提出的以功能可供性为导向的探索方案迅速学会操纵新物体。
发表于:IEEE International Conference on Robotics and Automation(ICRA)
等级:CCF: B
原文链接:https://ieeexplore.ieee.org/document/9561692
日期:2021.10.18
译:用于多机器人协同导航的视觉运动强化学习
简介:本文研究了基于原始视觉观察的多机器人协同导航问题。提出了一个完全端到端的学习框架,它利用图神经网络来学习局部运动协调,并利用深度强化学习来产生视觉运动策略,使每个机器人能够在不需要环境地图和全球定位信息的情况下移动到其目标。实验结果表明,在有几十个机器人的情况下,该方法与基于模仿学习的方法在鸟瞰状态输入方面取得了相当的性能,同时,具有对于拥挤和大环境的通用性以及对训练机器人数量的十倍的可扩展性。另外,该模型也能提高在未知环境中单机器人导航任务的成功率。
发表于:IEEE Transactions on Automation Science and Engineering(TASAE)
等级:CCF: B; 中科院分区:2区
原文链接:https://ieeexplore.ieee.org/document/9555922
日期:2021.10.01
译:MRDet: 用于航空遥感图像中精确旋转目标检测的多头(Multi-Head)网络
简介:航空遥感图像中的物体通常具有任意的方向,并且密集地分布在地面上,这使得它们的检测非常困难。本文提出了一个任意定向区域建议网络(AO-RPN)来生成从水平锚点转化而来的定向建议,只比原来的RPN增加少量的参数。为了获得准确的边界盒,将检测任务解耦为多个子任务,并提出一个多头网络来完成这些任务。每个头都是专门为学习相应任务的最佳特征而设计的,使得该网络能够准确地检测物体。在DOTA和HRSC2016上,评估了拟议的MRDet的性能。
源码:https://github.com/qinr/MRDet
发表于:IEEE Transactions on Geoscience and Remote Sensing(TGARS)
等级:CCF: B; 中科院分区:2区
原文链接:https://ieeexplore.ieee.org/document/9555822
日期:2021.10.01
译:用于遥感图像锐化的基于注意力的多阶段融合网络
简介:锐化是遥感图像处理领域的一个重要分支,其目的是通过一定的规则融合全色(PAN)和多光谱(MS)图像,生成高分辨率MS(HRMS)图像。如何提高融合后图像的空间分辨率和光谱分辨率是急需解决的问题。本文提出了一种多级遥感影像融合网络(MRFNet),以获得能够更加全面、完整地反映地面特征的清晰融合影像。该网络由三个阶段组成,通过跨阶段融合连接。前两个阶段用于提取PAN和MS图像的特征。编码器-解码器的结构和信道关注模块被用来提取信道域中的遥感图像特征。第三阶段是图像重建阶段,将提取的特征与原始图像融合,以提高融合结果的空间和光谱分辨率。在基准数据集WorldView II、GF-2和QuickBird上的实验分析MRFNet在视觉效果和评价指标值方面的优势。
发表于:IEEE Transactions on Geoscience and Remote Sensing(TGARS)
等级:CCF: B; 中科院分区:2区
原文链接:https://ieeexplore.ieee.org/document/9555829
日期:2021.10.01
译:使用递归注意网络对交通路口的子周期波形进行建模
简介:城市干道交叉口附近的交通流动态是一种复杂的非线性现象,受信号灯配时计划、道路几何形状、司机行为等因素的影响。预测这种流量动态是城市交通信号控制和规划的一项重要任务。使用微观模拟来研究每个路口的大量信号配时计划的影响的一个主要缺点是:基于源目的地交通生成模型,不能纳入高分辨率的环形探测器数据。探测器上每辆车的到达(或离开)信息可以被认为是一个时间序列波形。这些波形可以被建模,以了解在各种信号配时计划下,车辆如何穿越走廊。展示了基于深度神经网络的机器学习系统可以用来有效地利用在交叉口上的多个传感器(停车杆和先进的)收集的波形来模拟一个交叉口和跨交叉口的交通动态。对这些波形的建模有助于了解不同信号灯配时计划下的交通流动态,并有可能被整合到信号灯配时优化软件中。这些方法比使用微观模拟要快三到四个数量级。
发表于:IEEE Transactions on Intelligent Transportation Systems(TITS)
等级:CCF: B; 中科院分区:2区
原文链接:https://ieeexplore.ieee.org/document/9597466
日期:2021.11.01
译:GCN2CDD:通过在图卷积网络上嵌入空间聚类的一种商业区发现框架
简介:现代企业对商业区的选择非常重视。本文提出了一个通过在图卷积网络上嵌入空间聚类的无监督商业区发现框架来解决商业区发现的问题。通过图卷积网络根据地理上的相似性来聚合人类的流动性特征。基于图卷积网络的嵌入空间,应用分层聚类法来挖掘隐藏在不同人类模式中的潜在功能区域。然后,通过核密度估计,可以获得聚类结果的语义标签来发现商业区。通过分析萧山区和成都市的多源数据实验,验证了该框架的有效性。
发表于:IEEE Transactions on Industrial Informatics(TII)
等级:中科院分区:1区
原文链接:https://ieeexplore.ieee.org/document/9325057
日期:2021.01.14
译:KDnet-RUL:一个知识蒸馏框架,用于压缩机器剩余使用寿命预测的深度神经网络
简介:机器剩余使用寿命(RUL)的预测对于提高工业系统的可靠性和降低维护成本至关重要。基于长短时记忆(LSTM)的算法在该方面取得了最先进的性能,因为它们具有强大的连续感觉数据建模能力。但RUL预测算法需要部署在边缘设备上,以支持实时决策,降低数据通信成本,并保护数据隐私。但基于LSTM的方法具有很高的复杂性,不能部署在计算能力和内存有限的边缘设备上。为此,本文提出了一个知识提蒸馏框架,名为KDnet-RUL,用于压缩复杂的基于LSTM的RUL预测方法。它包括基于生成对抗网络的知识蒸馏(GAN-KD),用于不同架构的知识转移;基于学习-教学的知识蒸馏(LDT-KD),用于相同架构的知识转移;以及基于LDT-KD的顺序蒸馏,用于复杂数据集。实验表明,所提出的方法明显优于最先进的KD方法。压缩模型的权重减少了12.8倍,浮点运算总量减少了46.2倍,甚至达到了与复杂的LSTM模型在RUL预测方面相当的性能。
发表于:IEEE Transactions on Industrial Informatics(TII)
等级:中科院分区:1区
原文链接:https://ieeexplore.ieee.org/document/9351733
日期:2021.02.09
译:采用双边激励方案的多负载感应式电力传输系统的设计与分析
简介:级联结构的中继器可用于抑制多串联感应式电力传输(ML-IPT)系统中非相邻中继器之间的交叉耦合。在本文中,ML-IPT系统中使用的级联中继器既是功率发射器又是负载载体。基于级联方案,建立了两个不同负载位置的单励磁(SE)方案的ML-IPT系统模型,并设计了高阶补偿以实现恒定的负载电流。参照两个采用SE方案的ML-IPT系统的拓扑结构,进一步提出了一个双边励磁(BE)方案,以改善输出电流和系统的可靠性,同时还介绍了传统方案和拟议方案的比较。最后,建立了一个采用拟议的BE方案的ML-IPT系统原型,在8个负载的情况下,输出电流的最大偏差小于13%,最大功率传输效率达到89.2%。
发表于:IEEE Transactions on Industrial Informatics(TII)
等级:中科院分区:1区
原文链接:https://ieeexplore.ieee.org/document/9417679
日期:2021.04.28
译:用于协同AIoT的一种结合特征提取和模糊聚类的新型两阶段无监督故障识别框架
简介:一种新的物联网结构,即人工智能物联网(AIoTs)。随着AIoT的发展,积累了大量的未标记的工业大数据,分析这些数据是一项劳动密集型的任务,而且很费时间。因此,本文提出了一种新型的两阶段无监督故障识别算法,即深度自适应模糊聚类算法(DAFC)用于无监督故障聚类。DAFC将堆叠稀疏自动编码器(SSAE)与自适应加权Gath-Geva(AWGG)聚类结合起来,形成一个无监督的故障识别框架,用于对无标签的工业大数据进行聚类分析。SSAE可以提取原始数据的高度抽象特征,并采用不同的无监督策略分两个阶段对网络进行微调。AWGG是对Gath-Geva聚类的改进,可以在不预设聚类数量的情况下自适应地获得最优聚类结果。实验证明所提出的DAFC能够稳定地从未标记的数据中提取故障特征,并在不预先知道聚类数量的情况下自动获得最佳聚类结果。DAFC可以成为协同式AIoT的一个可行的工业大数据应用。诊断人员分析DAFC得到的聚类结果,而不是原始的无标签数据,大大节省了时间和人力成本。
发表于:IEEE Transactions on Industrial Informatics(TII)
等级:中科院分区:1区
原文链接:https://ieeexplore.ieee.org/document/9416869
日期:2021.04.27
译:针对工业物联网中恶意对手的可验证数据挖掘
简介:目前的IIoT架构倾向于采用云计算来进一步及时挖掘IIoT数据,但是其隐私问题也成为一大挑战。大多数现有的隐私保护数据挖掘(PPDM)技术都是为了抵御诚实但好奇的对手(即云服务器和数据用户)。由于IIoT的复杂性和开放性,PPDM在IIoT中存在恶意的对手,他们可能会产生不正确的学习模型和推理结果,这对PPDM来说非常困难。因此,本文提出了一个框架来扩展现有的PPDM,以防范线性回归的恶意行为(以下简称GuardLR)。为了防止云服务器的不诚实计算和数据用户的不一致输入。首先为线性回归设计了一个保护隐私的可验证学习方案,保证学习的正确性。然后,为了避免恶意的云返回不正确的推理结果,设计了一个具有轻量级验证的隐私保护的预测方案。实验表明,GuardLR具有很高的计算效率和准确性。
发表于:IEEE Transactions on Industrial Informatics(TII)
等级:中科院分区:1区
原文链接:https://ieeexplore.ieee.org/document/9422191
日期:2021.05.03
译:半监督学习中的深度神经后门:威胁与对策
简介:尽管无标签数据的可用性给半监督学习(SSL)带来了巨大的热情,但无标签数据的不可信性导致了许多未知的安全风险。首先确定了SSL的一个潜在的后门威胁,即未标记的训练数据被从监督环境中迁移的后门方法所感染。为了进一步利用这一威胁,提出了一个深度神经后门(DeNeB)方案,它需要更少的数据中毒预算,并产生更强的后门效力。通过毒化一部分未标记的训练数据,DeNeB实现了对训练模型的非法操纵,而无需修改训练过程。最后,提出了一个高效的检测和净化防御(DePuD)框架来对抗拟议的计划,通过构建一个深度检测器来定位未标记的训练数据中的触发模式,并通过净化的未标记数据进行安全的SSL训练,其中检测到的触发模式被混淆了。基于基准数据集进行的大量实验证明了DeNeB的巨大威胁性和DePuD的有效性。
发表于:IEEE Transactions on Information Forensics and Security(TIFS)
等级:CCF: A; 中科院分区:2区
原文链接:https://ieeexplore.ieee.org/document/9551983
日期:2021.09.29
译:使用PDA的线性子包化的多路接入编码缓存方案
简介:本文考虑了由Hachem等人提出的多路接入编码缓存问题,其中每个用户都能以循环环绕的方式访问L个邻近的缓存。专注于基于 “位置传递阵列”(PDA)概念的特定类别的多路接入编码缓存问题的确定性方案。构建了新的PDA,为本文讨论的特定类别的多路接入编码缓存问题指定了交付方案。对于所提出的方案,在某些制度下,编码增益比最先进的方案要大,而子包化水平只与用户数呈线性变化。因此,与现有方案相比,该方案以最小的子包化水平实现了较低的传输率。
发表于: IEEE Transactions on Visualization and Computer Graphics(TVCG)
等级:CCF: B; 中科院分区:2区
原文链接:https://ieeexplore.ieee.org/document/9551929
日期:2021.09.29
译:覆盖等离子体护套的高超音速飞行器的ISAR成像分析
简介:本文提出了一个高超音速目标电磁(EM)散射回波模型,结合不均匀带状介质模型(IZMM)和经典散射中心模型(SCM),以分布式星载阵列雷达为探测平台。基于对S-X超宽带范围内高分辨率测距剖面的分析,重建二维电磁散射回波数据(目标)和运动补偿,采用平行物理光学(PO)方法对覆盖有等离子体鞘的移动高超声速目标进行多视角反合成孔径雷达(ISAR)成像。结果表明,不均匀的等离子体鞘流场表面是一个具有随机和不规则波动特征的激励层,它增加了高超声速目标一维测距剖面的虚假散射中心点,并会干扰和破坏雷达沿径向对目标的定位。此外,电磁波的浅层散射发生在等离子体鞘中,目标的平均信号强度可以从60公里和20Ma的0.5×10-⁵逐渐降低到30公里和20Ma的0.1×10-⁵,整体散射回波信号减弱了5倍。特别是,高超音速目标在30公里高度的飞行速度越快,成像的散射回波信号就越弱,从15到25Ma,成像信号的平均强度减弱了大约三倍。本研究结果可作为高超声速目标精细结构特征分析的参考,用于特征提取和目标的分类识别。
发表于: IEEE Transactions on Geoscience and Remote Sensing(TGARS)
等级:CCF: B; 中科院分区:2区
原文链接:https://ieeexplore.ieee.org/document/9552517
日期:2021.09.29
译:一种用于加密云文件系统中安全文档检索的实用框架
简介:随着云计算的发展,越来越多的数据拥有者将他们的文件外包给云,并与授权的数据用户安全、灵活地分享。为了保护数据隐私,文件在被外包到云端之前一般都会被加密,因此它们的可搜索性就会降低。本文设计了一个新的加密文档检索系统,并将代理服务器集成到系统中,以减轻数据所有者的工作量并提高整个系统的安全水平。同时考虑了一个更实用、更强大的威胁模型,即云服务器可以与少数数据用户勾结。为了支持多种文档搜索模式,为文件名和作者构建了两个AVL树,为文档向量构建了一个层次检索特征树(HRF树)。又为HRF树设计了一种深度优先搜索算法,并利用增强型非对称标量保全加密算法(Enhanced Asymmetric Scalar-Product-Preserving Encryption)对HRF树进行加密。所有三个索引树都是相互联系的,以有效地支持多参数的搜索请求。
发表于:IEEE Transactions on Parallel and Distributed Systems(TPDS)
等级:CCF: A; 中科院分区:3区
原文链接:https://ieeexplore.ieee.org/document/9524492
日期:2021.08.27
译:用于移动设备充电/供电的双T型谐振网络电容式电力传输系统
简介:在移动设备的无线电力传输应用中,无线电力传输系统的取力器经常需要移入和移出。系统结构的突然变化将导致高瞬态电压或电流,这可能会损坏电容式电力传输(CPT)的电力电子装置。此外,系统的待机功率将过高,在移除取电装置后无法工作。为了解决这些问题,有人提出了一个带有双T型谐振网络的CPT系统。建立了没有接收器的系统的稳态模型和它的正常状态条件。分析了谐振网络参数之间的关系,并提供了一个系统的电路参数设计方法。提出的CPT拓扑结构和参数设计方法已经通过仿真和实验得到验证。该系统不仅在严重的负载变化下实现了自我保护,而且在取力器移出后自动进入待机模式。此外,当取力器移入时,系统可恢复到正常状态,无需额外的检测和控制电路。
发表于:IEEE Transactions on Power Electronics(TPE)
等级:中科院分区:1区
原文链接:https://ieeexplore.ieee.org/document/9517027
日期:2021.08.18
译:客座社论:人工智能物联网的先进协同技术
简介:如今,一种被称为人工智能物联网(AIoT)的新智能结构开始发挥作用。广义上讲,AIoT是人工智能(AI)和物联网(IoT)在实际应用中的融合。它将人工智能应用于边缘,使设备有能力理解数据,观察周围的环境,并决定做什么最好。然而,云、边缘、区块链、5G和人工智能之间的联系带来了许多挑战,需要协同的方法和对整个架构、通信和处理的重新思考,以满足延迟、可靠性等方面的要求。本专刊的目的是为学术界和工业界提供一个涵盖人工智能和物联网最先进的协作方法和系统的各个方面的场所,以推动其在未来的应用。
发表于:IEEE Transactions on Industrial Informatics(TII)
等级:中科院分区:1区
原文链接:https://ieeexplore.ieee.org/document/9516913
日期:2021.08.18
译:一种用于构建安全和灵活的密钥转置的去中心化识别器的新方法
简介:由于区块链技术的引入,人们提出了一种去中心化的身份模型,以取代基于中心化机构的传统身份模型。由不同参与者操作的区块链平台为实体识别和访问控制提供了新的信任根功能。每个实体都会生成并注册自己的标识符和凭证(公钥)到区块链上,这样任何实体都可以获得其他实体的公钥。当相应的私钥被破坏时,应进行密钥转置以生成和注册一个新的密钥对。然而,目前用公钥加密绑定去中心化标识符的方法会诱发一个严重的安全问题,导致身份窃取攻击和一个实体的多个标识符。本文提出了一种新的去中心化标识来解决上述安全问题,它是基于一个新提出的加密基元(无限单向哈希链),以及它在Hyperledger Fabric和Contiki Cooja模拟器上的安全分析和性能评估。为了证明所提出的去中心化身份对各种安全协议的适用性,还设计了一个认证的密钥交换协议。
发表于:IEEE Internet of Things Journal(ITJ)
等级: 中科院分区:1区
原文链接:https://ieeexplore.ieee.org/document/9583584
日期:2021.10.21
译:BDTwin:一个在赛博孪生驱动的汽车工业物联网中加强安全和隐私的综合框架
简介:汽车工业物联网的快速发展需要安全的网络基础设施来实现数字化。赛博孪生(Cybertwin)是下一代网络架构,作为通信和数字资产所有者,可以使车辆到一切(V2X)网络灵活和安全。然而,Cybertwin本身可以将最终用户的数字资产作为一种服务发布给其他实体,这使得数据安全和隐私成为实现V2X应用的主要障碍。在上述讨论的启发下,本文提出了BDTwin,一个基于区块链和深度学习的综合框架,以提高Cybertwin驱动的V2X应用的安全性和隐私。具体来说,设计了一个区块链方案,以确保车辆、路边设备、cybertwin-edge服务器和云服务器之间使用基于智能合约的投票共识机制进行安全通信。智能合约用于执行规则和条例,以不可否认和自动化的方式管理V2X实体的行为。在深度学习方案中,自动回归-深度变异自动编码器(AR-DVAE)模型与基于注意力的双向长短时记忆(A-BLSTM)相结合,通过分析V2X环境中的cybertwin-edge服务器数据进行自动特征提取和攻击检测。
发表于:IEEE Internet of Things Journal(ITJ)
等级: 中科院分区:1区
原文链接:https://ieeexplore.ieee.org/document/9583667
日期:2021.10.21
译:区块链在物联网边缘计算中的安全和取证管理:一个全面的调查
简介:安全和取证代表了网络管理的两个关键组成部分,尤其是为了保证物联网(IoT)等大规模接入网络的可信运行。MEC服务的过程涉及三类实体:设备、设备产生的数据和数据交互后产生的数字证据。这些实体是完全分布式的,很难通过传统的、高度集中的安全和认证机制来保护。作为一个去中心化的共享账本和数据库,新兴的区块链被认为可以在多个主体之间提供合作信任和协作行动,同时确保数据的完整性和保密性。由于区块链的匿名性、不可篡改性和可追溯性,引起了对区块链和边缘计算结合的研究,用于物联网的设备安全、数据安全和取证。本调查分析了区块链在MEC-IoT系统中的应用,主要关注管理物联网安全和取证问题的方法和技术。最后提出了开放的问题和未来工作的前景和研究方向。
发表于:IEEE Transactions on Network and Service Management(TNSM)
等级:CCF: C; 中科院分区:2区
原文链接:https://ieeexplore.ieee.org/document/9585025
日期:2021.10.22
周报内容来源:IEEE Xplore、LetPub、Unsplash、MONO、SCI-HUB、中国知网、谷歌学术中国计算机学会推荐国际学术会议和期刊目录、花瓣网、南风窗。由[学术云工坊]整理编辑,内容版权归原单位/作者所有,此处仅作分享学习使用,如有侵权,请联系本号做删除处理。以上分类方法按文章keywords进行分类。如有分类不当、专业术语表达有误的地方,欢迎联系本号进行处理。
更多往期精彩欢迎关注我的公众号【学术云工坊】