2021极术通讯-Vector的前世今生:ARM SVE简述

首发极术社区
如对Arm相关技术感兴趣,欢迎私信 aijishu20加入技术微信群。

导读:极术社区推出极术通讯,引入行业媒体和技术社区、咨询机构优质内容,定期分享产业技术趋势与市场应用热点。

芯方向

  • Vector的前世今生(2):ARM SVE简述

作为RSIC处理器的代表,ARM一直走在技术的最前列。不过对于Vector指令集的支持却一直十分谨慎。第一代ARM SVE (Scalable Vector Extension)作为AArchv8的扩展推出,后者早就大获成功,而SVE商用中只有作为超算的富岳(Fugaku)支持了该扩展。最近推出的SVE v2进一步拓展了Vector可支持的运算类型。本文简述ARM SVE的发展以及和NEON的区别来探讨Vector在AI中的应用。(来源:极术社区AI处理器架构设计专栏)

  • 边缘计算安全技术与标准研究

基于边缘计算概念、模型、产业发展、标准化进展,分析边缘计算面临的主要安全风险,提出了覆盖应用安全、网络安全、数据安全、基础设施安全、物理环境安全、安全运维支撑、安全管理等7个维度的边缘计算安全参考架构,并从标准研制、能力建设、应用测评等3个方面提出边缘计算安全标准化工作建议。(来源:极术社区边缘计算专栏)

  • 谷歌AI新成果:可实现实时视图合成

视图合成是一种计算机视觉技术,它利用观察到的图像来恢复 3D 场景表示,并能在新的、未观察到的视点上渲染场景。近年来,神经体积表示技术的应用取得了显著进展。谷歌的研究人员通过实时渲染一个经过训练的 NeRF,同时还能显示微小的几何细节和令人信服的视图相关效果。(来源:极术社区InfoQ AI专栏)

  • NTIRE2021竞赛"三冠一亚"方案BasicVSR++,Vid4新巅峰29.04dB

本文是南洋理工大学Chen Change Loy团队在视频超分方面最新进展。在BasicVSR的基础上,将双向信息传播进化为网格状双向信息传播,将光流对齐进化为光流引导的形变对齐,同时利用光流对齐与形变对齐各自的优点得到本文的BasicVSR++。该方案在Vid4数据集上达到了史无前例的29.04dB;该方案在NTIRE2021视频超分、压缩视频增强四个赛道取得了“三冠一亚”的优异成绩。实乃视频超分的顶峰。(来源:极术社区深度学习从入门到精通专栏)

  • 服务器BIOS应用调优:低延时、虚拟化、数据库、SDS和CSP

服务器的BIOS应该怎样设置,才能发挥出最高性能效率呢?不同类别的应用,根据其工作负载特点(比如哪些资源开销大,容易形成性能瓶颈等),都有着各自针对的调优方法。意义我就不多说了,无论用于生产工作还是各种测试。本文内容整理自公开文档《Understanding Dell EMC Server BIOS Workload Profiles》。(来源:极术社区企业存储技术专栏)

芯观察

  • 华为存储:引领者如何定义未来新方向?

在日前举办的首届华为数据存储用户精英论坛上,华为存储发布的“产品、方案、商业模式”的三级创新理念再次获得关注,基于JIC联合创新、JDC联合产品定义、TOPN联合体验改进、华为存储MVP计划四大机制,华为存储不断深入场景,切实帮助企业解决实际问题,推动企业数字化进程。(来源:极术社区E企实验室专栏)

  • 从 AirTag 的软硬件和系统生态的 15
    个细节,探秘苹果的一盘大棋

苹果春季发布会上推出的 AirTag 追踪器,引发了不少人的关注,风头一度盖过了当日同时推出的 M1 芯片的 iMac 和 iPad Pro。作为追踪器赛道的后进入者AirTag,有什么本事超越、甚至成为行业标杆?我们将从 AirTag 硬件和配件、苹果的「查找」网路、以及苹果与第三方设备商的合作和竞争策略,逐渐展开,探秘苹果正在下的一盘大棋。(来源:极术社区深圳湾专栏)

  • 【芯视野】苹果的芯节奏:造车梦和暴涨的业绩

以苹果目前的M1芯片为例,其算力已经超过了特斯拉的FSD芯片。如果苹果将现有芯片平移到汽车领域,只要稍加改动,就可以完全胜任。未来汽车的发展趋势就是元器件、芯片和软件将逐渐占据重要地位,有研究机构称2030年这些成本将占据BOM成本的40%。从华为造车就可以看出,ICT公司完全是以后造车的核心。(来源:极术社区芯视野专栏)

  • FPGA智能网卡综述(1):PISA+Rocket

2020年预印本公开了一篇“The nanoPU: Redesigning the CPU-Network Interface to Minimize RPC Tail Latency”,提出并设计实现了一种融合CPU的新型网卡架构NanoPU。NanoPU的目标是实现高效的亚微秒级RPC,它可以在服务器上以不到1ms的通信开销调用。一个关键指标是线-线延迟,定义为从RPC请求消息的第一比特到达NIC,直到处理的RPC响应的第一比特离开NIC的时间。典型的中位数线线延迟约为850ns。NanoPU目标是将中位数和尾数都减少到100ns以下,使运行“nanoService”变得有价值;短的RPC需要不到1ms的工作时间。(来源:极术社区FPGA加速器专栏)

相关阅读

  • 2021极术通讯-46FPS+1080Px2超分+手机NPU,Arm提出一种基于重参数化思想的超高效图像超分方案

  • 2021极术通讯-从Grace到Jarvis:NVIDIA的AI帝国正浮出水面

你可能感兴趣的:(Arm,技术,芯片,arm)