zyl910

[译] .NET 8 中的硬件内在函数（支持 Wasm 和 AVX-512）

原文链接：
https://devblogs.microsoft.com/dotnet/dotnet-8-hardware-intrinsics/
Hardware Intrinsics in .NET 8
Tanner Gooding [MSFT]
December 11th, 2023

译文：

.NET 8 中的硬件内在函数

坦纳·古丁 [MSFT]

2023年12月11日

.NET在通过JIT编译器本质上理解的API提供对附加硬件功能的访问方面有着悠久的历史。这始于2014年的.NET Framework，并随着2019年.NET Core 3.0的引入而扩展。从那时起，运行时迭代地提供了更多的API，并在每个版本中更好地利用了这一点。

简要概述如下：

2014年- .NET 4.5.2 -第一批在 System.Numerics 命名空间中公开的 API
- 介绍Vector
- 引入Vector2、Vector3、Vector4、Matrix4x4、Quaternion和Plane
- 64-仅位
- 另请参阅：https://devblogs.microsoft.com/dotnet/the-jit-finally-proposed-jit-and-simd-are-getting-married/
2019年- .NET Core 3.0 -第一批在 System.Runtime.Intrinsics 命名空间中公开的 API
- 介绍Vector128和Vector256
- 为x86和x64引入Sse、Sse2、Sse3、Ssse3、Sse41、Sse42、Avx、Avx2、Fma、Bmi1、Bmi2、Lzcnt、Popcnt、Aes、Pclmul
- 32-位和64位支持
- 另请参阅：https://devblogs.microsoft.com/dotnet/hardware-intrinsics-in-net-core/
2020年- .NET 5 - System.Runtime.Intrinsics 命名空间中添加了 Arm 支持
- 介绍Vector64
- 为Arm/Arm64引入AdvSimd、ArmBase、Dp、Rdm、Aes、Crc32、Sha1、Sha256
- 为X86Base/x86引入x64
- 另请参阅：https://devblogs.microsoft.com/dotnet/announcing-net-5-0-preview-7/
2021 - .NET 6 - Codegen和基础设施改进
- 为x86/x64引入AvxVnni
- 重写System.Numerics实现以使用System.Runtime.Intrinsics
- 另请参阅：https://devblogs.microsoft.com/dotnet/performance-improvements-in-net-6/
2022 - .NET 7 -支持编写跨平台算法
- 在跨平台工作的Vector64、Vector128和Vector256类型上引入了重要的新功能
- 为x86/x64引入X86Serialize
- 使上述向量类型和Vector公开的API界面具有奇偶性
- 另请参阅：https://devblogs.microsoft.com/dotnet/performance_improvements_in_net_7/
2023 - .NET 8 - 支持 wasm 和AVX-512
- 为Wasm引入PackedSimd和WasmBase
- 介绍Vector512
- 为x86/x64引入Avx512F、Avx512BW、Avx512CD、Avx512DQ、Avx512Vbmi
- 另请参阅：此博客文章的其余部分

由于这项工作，每个版本的.NET库和应用程序都获得了更多的能力来利用底层硬件。在这篇文章中，我将深入介绍我们在.NET 8中引入的内容以及它所支持的功能类型。

WebAssembly支持

WebAssembly，简称Wasm，本质上是在浏览器中运行的代码，它允许比典型的解释型脚本支持更高的性能配置文件。作为一个平台，Wasm已经开始提供底层SIMD（单指令，多数据）支持，以便可以加速核心算法，.NET相应地选择通过硬件内部函数公开对此功能的支持。

这种支持与其他平台提供的基础非常相似，因此我们不会详细介绍。相反，您可以简单地期望使用Vector128的现有跨平台算法将隐式地照亮支持的地方。如果您想更直接地利用Wasm独有的功能，那么您可以显式地使用PackedSimd命名空间中的WasmBase和System.Runtime.Intrinsics.Wasm类公开的API。

AVX-512支持

AVX-512是为x86和x64计算机提供的新功能集。它带来了沿着的大量新指令和硬件功能，包括支持16个额外的SIMD寄存器，专用掩码，以及一次操作512位数据。访问此功能需要一个相对较新的处理器，即需要英特尔的Skylake-X或更新版本，以及AMD的Zen 4或更新版本。因此，可以利用此新功能的用户数量较少，但它可以为硬件带来的改进仍然很重要，并且值得支持数据繁重的工作负载。此外，JIT将在其确定存在益处的情况下针对现有SIMD代码机会性地利用这些指令。一些例子包括：

当完成按位条件选择时使用vpternlog而不是and, andn, or（Vector128.ConditionalSelect）
使用EVEX编码将更多操作放入更少的代码字节中，例如用于嵌入式广播（x + Vector128.Create(5)）
使用更新的指令，其中支持AVX-512，例如全宽度混洗和许多long/ulong（Int64/UInt64）操作
还有其他的改进，这里没有列出，你可以期待随着时间的推移会有更多的改进。
- 某些情况下，例如Vector允许扩展到512位，在.NET 8中没有完成

为了支持512位的新向量大小，.NET引入了Vector512类型。这公开了与其他固定大小的向量类型（如Vector256）相同的通用API表面。它同样继续暴露Vector512.IsHardwareAccelerated属性，该属性允许您确定是否应该在硬件中加速通用逻辑，或者是否最终通过软件回退来模拟行为。

Vector 512在Ice Lake和更新的硬件上默认使用AVX-512加速（因此Vector512.IsHardwareAccelerated报告true），其中AVX-512指令不会导致CPU显著降频;而使用AVX-512指令会导致Skylake-X，Cascade Lake和库珀Lake硬件上更显著的降频（另请参见2.5.3 Skylake Server Power Management中的Intel® 64 and IA-32 Architectures Optimization Reference Manual: Volume 1）。虽然这最终有利于大型工作负载，但它可能会对其他较小的工作负载产生负面影响，因此我们默认在这些平台上报告false为Vector512.IsHardwareAccelerated。Avx512F.IsSupported仍然会报告true，如果直接调用，Vector512的底层实现仍然会使用AVX-512指令。这允许工作负载利用他们知道的功能，而不会意外地对其他人造成负面影响。

特别感谢

这一功能的实现得益于我们在英特尔的朋友们的巨大贡献。多年来，.NET团队和英特尔已经进行了多次合作，我们继续在整体设计和实现方面进行合作，从而使AVX-512支持登陆.NET 8。

还有来自.NET社区的大量输入和验证，帮助实现了成功并使发布变得更好。

如果您想贡献或提供输入，请加入我们在GitHub上的dotnet/runtimerepos，并按照我们的时间表在.NET Foundation YouTube频道上收听API Review，您可以看到我们讨论.NET库的新添加，甚至通过聊天频道提供您自己的输入。

不只是512位？

与名称相反，AVX-512不仅仅是512位支持。额外的寄存器、掩码支持、嵌入式舍入或广播支持以及新指令也都适用于128位和256位向量。这意味着您现有的工作负载可以隐式地变得更好，并且您可以显式地利用新功能，而这种隐式的点亮是不可能的。

当SSE于1999年在Intel Pentium III上首次引入时，它提供了8个寄存器，每个寄存器长度为128位。这些寄存器被称为xmm0到xmm7。当x64平台后来于2003年在AMD Athlon 64上推出时，它提供了8个额外的寄存器，可以访问64位代码。这些寄存器被命名为xmm8到xmm15。这种初始支持使用了一种简单的编码方案，其工作方式与通用指令非常相似，只允许指定2个寄存器。对于需要2个输入的加法，这意味着其中一个寄存器既充当输入又充当输出。这意味着如果你的输入和输出需要不同，你需要2条指令来完成操作。z = x + y会变成z = x; z += y。在高级别上，这些行为是相同的，但在低级别上，有两个步骤而不是一个步骤来实现它。

2011年，英特尔在基于桑迪桥的处理器上推出了AVX，将支持扩展到256位，从而进一步扩展了这一点。这些较新的寄存器被命名为ymm0到ymm15，只有直到ymm7的寄存器才能访问32位代码。这也引入了一种称为VEX（矢量扩展）的新编码，允许对3个寄存器进行编码。这意味着您可以直接编码z = x + y，而不必将其分为两个单独的步骤。

AVX-512随后由英特尔于2017年推出，采用基于Skylake-X的处理器。这将支持扩展到512位，并将寄存器命名为zmm0到zmm15。它还引入了16个新寄存器，恰当地命名为zmm16到zmm31，并且还有xmm16-xmm31和ymm16-ymm31变体。与前面的情况一样，只有zmm7以下的寄存器才能访问32位代码。它引入了8个新的寄存器，命名为k0到k7，旨在支持“掩码”和另一种名为EVEX（增强型矢量扩展）的新编码，允许表达所有这些新信息。EVEX编码还具有允许以更紧凑的方式表达更常见的信息和操作的其他特征。这可以帮助减少代码大小，同时提高性能。

有哪些新的指示？

有很多新功能，太多了，无法在这篇博客文章中涵盖所有内容。但一些最值得注意的新指令提供了以下内容：

支持对64位整数进行Abs、Max、Min和移位等操作-以前必须使用多条指令来模拟此功能
支持在无符号整数和浮点类型之间进行转换
支持使用浮点边缘情况
支持在一个或多个向量中完全重新排列元素
支持在单个指令中执行2个按位操作

64位整数支持是值得注意的，因为这意味着处理64位数据不需要使用较慢或替代的代码序列来支持相同的功能。这使得编写代码并期望其行为相同变得更加容易，而不管您正在使用的底层数据类型如何。

浮点数到无符号整数转换的支持也是出于类似的原因。从double转换到long需要一条指令，但是从double转换到ulong需要很多指令。使用AVX-512，这变成了一条指令，允许用户在处理无符号数据时获得预期的性能。这在各种图像处理或机器学习场景中很常见。

对浮点数据的扩展支持是我最喜欢的AVX-512特性之一。一些示例包括提取无偏指数（Avx512F.GetExponent）或归一化尾数（Avx512F.GetMantissa）、将浮点值舍入为特定小数位数（Avx512F.RoundScale）、将值乘以2^x（Avx512F.Scale，在C中称为scalebn），以正确处理Min和Max（MinMagnitude）来执行MaxMagnitude、+0、-0和Avx512DQ.Range，甚至可以进行简化，这在处理像Sin或Cos（Avx512DQ.Reduce）这样的三角函数的大值时是有用的。

然而，我个人最喜欢的指令之一是名为vfixupimm（Avx512F.Fixup）的指令。在高级别上，此指令允许您检测许多输入边缘情况，并将输出“修复”为常见输出之一，并按元素执行此操作。这可以大大提高某些算法的性能，并大大减少所需的处理量。它的工作方式是它需要4个输入，即left，right，table和control。它首先对right中的浮点值进行分类，并确定它是QNaN（0）、SNaN（1）、+/-0（2）、+1（3）、-Infinity（4）、+Infinity（5）、Negative（6）还是Positive（7）。然后，它使用它从4读取table位（QNaN是0，读取位0..3;Negative是6读取位24..27）。table中这4位的值决定了结果。可能的结果（每个元素）是：

位模式	定义
0b0000	左[i]
0b0001	右[i]
0b0010	QNaN（右[i]）
0b0011	QNaN
0b0100	-Infinity
0b0101	+Infinity
0b0110	IsNegative（right[i]）？-Infinity：+Infinity
0b0111	-0.0
0b1000	+0.0
0b1001	-1.0
0b1010	+1.0
0b1011	+0.5
0b1100	+90.0
0b1101	Pi / 2
0b1110	MaxValue
0b1111	MinValue

在SSE中，有一些支持在向量中重新排列数据。例如，你有0, 1, 2, 3，你想订购3, 1, 2, 0。随着AVX的引入和扩展到256位，这种支持也得到了扩展。然而，由于指令的操作方式，你实际上会执行两次相同的128位操作。这使得将现有算法扩展到256位变得简单，因为你实际上只是做了两次同样的事情。然而，当你实际上需要考虑整个向量时，它使使用其他算法变得更加困难。有一些指令可以让你在整个256位向量中重新排列数据，但它们通常在数据如何重新排列或它们支持的类型方面受到限制（字节元素的完全洗牌是缺少支持的一个明显例子）。AVX-512对于其扩展的512位支持有许多相同的考虑。但是，它还引入了新的指令来填充差距，现在可以让您完全重新排列任何大小的元素的元素。

最后，我个人最喜欢的指令之一是名为vpternlog（Avx512F.TernaryLogic）的指令。此指令允许您采用任何2个按位操作并将它们联合收割机组合，因此它们可以在单个指令中执行。例如，您可以执行(a & b) | c。它的工作方式是它需要4个输入，a，b，c和control。然后你有三个键要记住：A: 0xF0，B: 0xCC，C: 0xAA。为了表示所需的操作，您只需通过对这些键执行该操作来构建control。所以，如果你想简单地返回a，你可以使用0xF0。如果你想做a & b，你会使用(byte)(0xF0 & 0xCC)。如果你想做(a & b) | c，那么它就是(byte)((0xF0 & 0xCC) | 0xAA。总共有256种不同的操作，基本的构建块是那些键和以下按位操作：

操作	定义
not	~x
and	X & Y
nand	~x & y
or	X	和
nor	~x	和
xor	X ^ y
xnor	~x ^ y

然后还有一些特殊的操作，也支持上述基本操作，并且可以进一步扩展。

操作	定义
假	位模式为0x00
真	0xFF的位模式
主要	如果两个或多个输入位为0，则返回0;如果两个或多个输入位为1，则返回1
次要	如果两个或多个输入位为1，则返回0;如果两个或多个输入位为0，则返回1
条件选择	逻辑上是`(x & y) \| (~x & z)`，因为它是`(x and y) or (x nand y)`

在.NET 8中，我们没有完成对隐式识别和折叠这些模式以发出vpternlog的支持。我们希望它在.NET 9中首次亮相。

什么是屏蔽支持？

在最简单的级别上，编写向量化代码涉及使用SIMD在单个指令中对类型Count的T不同元素执行相同的基本操作。当需要对所有数据执行相同的操作时，这非常有效。然而，并非所有数据都是统一的，有时您需要以不同的方式处理特定的输入。例如，您可能希望对正数和负数执行不同的操作。如果用户传入了NaN，你可能需要返回一个不同的结果，等等。在编写常规代码时，你通常会用一个分支来处理这个问题，这工作得很好。但是，在编写向量化代码时，这样的分支会破坏使用SIMD指令的能力，因为您必须独立处理每个元素。.NET在不同的地方利用了这一点，包括新的TensorPrimitivesAPI，它允许我们处理不适合完整向量的尾随数据。

典型的解决方案是编写“无分支”代码。最简单的方法之一是计算两个答案，然后使用按位运算来选择正确的答案。你可以把它想象成一个三元条件cond ? result1 : result2。为了在SIMD中支持这一点，存在一个名为ConditionalSelect的API，它接受一个掩码和两个结果。掩码也是一个向量，但其值通常为AllBitsSet或Zero。当你有了这个模式，那么ConditionalSelect的实现实际上就是(cond & result1) | (~cond & result2)。这分解为从result1中取出位，其中cond中的对应位是1，否则从result2中取出对应位（当cond中的位是0时）。因此，如果你想将所有负值转换为0，那么对于常规代码，你会得到类似于(x < 0) ? 0 : x的值，而对于矢量化代码，你会得到类似于Vector128.ConditionalSelect(Vector128.LessThan(x, Vector128.Zero), Vector128.Zero, x)的值。它有点冗长，但也可以提供显著的性能改进。

当硬件第一次开始支持SIMD时，您必须通过执行3条指令来支持这种掩码：and, nand, or。随着新硬件的出现，添加了更多优化版本，允许您在单个指令中执行此操作，例如x86/x64上的blendv和Arm 64上的bsl。AVX-512则进一步引入了专用硬件支持来表达掩码并在寄存器中跟踪它们（前面提到的k0-k7）。然后，它提供了额外的支持，允许这种掩蔽作为几乎任何其他操作的一部分来完成。因此，不必指定vcmpltps; vblendvps; vaddps（比较，掩码，然后添加），您可以直接将掩码编码为加法的一部分（从而发出vcmpltps; vaddps）。这允许硬件在更少的空间中表示更多的操作，提高代码密度，并更好地利用预期的行为。

值得注意的是，我们在这里没有直接公开与底层硬件的1对1概念。相反，JIT继续获取并返回用于比较结果的常规向量，并基于此进行相关的模式识别和掩蔽特征的后续机会光照。这允许暴露的API表面显著更小（减少超过3000个API），现有代码在很大程度上“只是工作”并利用较新的硬件支持而无需显式操作，并且希望支持AVX-512的用户不必学习新概念或以新方式编写代码。

AVX-512在实践中的使用示例如何？

AVX-512可用于加速所有与SSE或AVX相同的场景。识别.NET库已经使用这种加速的一种简单方法是搜索我们称之为Vector512.IsHardwareAccelerated的地方

我们加速了以下案例：

System.Collections.BitArray – creation, bitwise and, bitwise or, bitwise xor, bitwise not
System.Linq.Enumerable – Max and Min
System.Buffers.Text.Base64 – Decoding, Encoding
System.String – Equals, IgnoreCase
System.Span – IndexOf, IndexOfAny, IndexOfAnyInRange, SequenceEqual, Reverse, Contains, etc

在.NET库和一般的.NET生态系统中还有其他例子，太多了，无法列出和覆盖。这些包括但不限于颜色转换、图像处理、机器学习、文本转码、JSON解析、软件渲染、光线跟踪、游戏加速等场景。

接下来呢？

我们计划继续改进.NET中的硬件内部支持，无论何时何地。请注意，以下项目是前瞻性的思考和推测。该列表是不完整的，我们不提供任何这些功能将土地或当他们将船舶，如果他们这样做。

我们长期路线图中的一些项目包括以下内容：

Arm64的SVE和SVE 2
x86/x64的AVX10
允许Vector隐式扩展到512位
ISimdVector接口，允许更好地重用SIMD逻辑
一个分析器，帮助鼓励用户使用语义相同的跨平台API（使用x + y而不是Sse.Add(x, y)）
一个分析器，用于识别可能具有更优替代方案的模式（执行value + value而不是value * 2或Sse.UnpackHigh(value, value)而不是Sse.Shuffle(value, value, 0b11_11_10_10)
在各种.NET API中额外显式使用硬件内部函数
额外的跨平台API，帮助抽象通用操作
- 获取掩码中第一个/最后一个匹配项的索引
- 获取掩码中的匹配数
- 确定是否存在任何匹配项
- 允许像Shuffle或ConditionalSelect这样的情况下的非确定性行为
- 这些API在当今的所有平台上都有定义良好的行为，例如Shuffle将任何超出范围的索引视为将目标元素归零
- 新的API（如ShuffleUnsafe）将允许超出范围索引的不同行为
- 对于这种情况，Arm64将具有相同的行为，而x64只有在设置了最高有效位时才具有相同的行为
其他模式识别，例如
- 嵌入式屏蔽（AVX 512，AVX 10，SVE/SVE 2）
- 组合位操作（AVX512上的vpternlog）
- 有限的JIT时间常数折叠机会

你可能感兴趣的:(SIMD,c#,.net,SIMD,wasm)

k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
如何解决 NPM proxy，当我们在终端nodejs应用程序时出现代理相关报错
Thisisaproblemrelatedtonetworkconnectivity.npmERR!networkInmostcasesyouarebehindaproxyorhavebadnetworksettings.在使用npminstall下载包的时候总是报以下错误:在控制台或VisualStudioCode终端中运行以下命令：npmconfigrmproxynpmconfigrmhttp
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
Spring Cloud Gateway 的执行链路详解愤怒的代码 SpringCloud spring cloud
SpringCloudGateway的执行链路详解核心目标明确SpringCloudGateway的请求处理全过程（从接收到请求→到转发→到返回响应），方便你在合适的生命周期节点插入你的逻辑。核心执行链路图（执行顺序）┌──────────────┐│客户端请求│└────┬─────────┘↓┌────┴─────────────┐│NettyHttpServer│←→ReactorNetty
Docker指定网桥和指定网桥IP
$dockernetworklsNETWORKIDNAMEDRIVER7fca4eb8c647bridgebridge9f904ee27bf5nonenullcf03ee007fb4hosthostBridge默认bridge网络,我们可以使用dockernetworkinspect命令查看返回的网络信息，我们使用dockerrun命令是将网络自动应用到新的容器Host如果是hosts模式，启动容
C#接口实现详解：从理论到实践，掌握面向对象编程的核心技巧钢铁男儿 C#图解教程 c#java 前端
在C#的世界里，接口是实现多态性和解耦设计的利器接口实现的核心规则实现主体限制只有类和结构体（struct）能实现接口。接口本身不包含实现代码，而是定义一组必须由实现类提供的成员契约。双重实现要求声明关联：在类/结构体的基类列表中明确包含接口名称classMyClass:IMyInterface//接口声明在冒号后成员实现：为接口声明的每个成员提供具体的实现代码，包括匹配的方法签名、属性和返回值类
C# 设计模式（结构型模式）：组合模式硅谷调试员玩转C#设计模式 c#设计模式组合模式
C#设计模式（结构型模式）：组合模式在软件设计中，有时我们需要处理的是一组对象，而这些对象既可以是单独的元素，也可以是由多个子元素组成的复合体。这时，组合模式（CompositePattern）便能提供帮助。它允许客户端将单个对象和对象集合统一对待，从而简化了树形结构的管理。1.组合模式的定义组合模式是一个结构型设计模式，主要用于将多个对象组合成树形结构，以表示“部分-整体”的层次关系。通过组合模
C#中的设计模式：构建更加优雅的代码 Envyᥫᩣᩚ c#开发语言
C#在面向对象编程（OOP）方面的强大支持，我们可以探讨“C#中的设计模式”。这不仅有助于理解如何更好地组织代码，还能提高代码的可维护性和可扩展性。引言设计模式是软件工程中经过实践验证的解决方案模板，它们提供了一种标准化的方法来解决常见的开发问题。对于使用C#进行开发的程序员来说，理解和应用这些模式可以帮助创建结构良好、易于维护和扩展的应用程序。本文将介绍几种常用的设计模式，并展示如何用C#实现它
.NET中的强名称和签名机制
.NET中的强名称（StrongName）和签名机制是.NETFramework引入的一种安全性和版本控制机制。以下是关于.NET中强名称和签名机制的详细解释：强名称定义：强名称是由程序集的标识加上公钥和数字签名组成的。程序集的标识包括简单文本名称、版本号和区域性信息（如果提供的话）。作用：强名称主要用于确保程序集的唯一性和完整性。通过签发具有强名称的程序集，可以确保名称的全局唯一性，防止名称冲突
树莓派 5 - Raspberry Pi OS 新版本 Bookworm（书虫） kuan_li_lyg 树莓派 &Jetson 教程机器人 stm32 嵌入式硬件自动驾驶 ROS 树莓派 raspberry pi
文章目录在这里插入图片描述版本说明前言二、PipeWire三、Networking四、Firefox五、Documentation六、What’smissing? 新版本下载地址为：https://www.raspberrypi.com/software/operating-systems/版本说明 2023-10-10:基于Debianbookworm版本支持树莓派5在RaspberryPi4和
.Net程序集强签名详解
强签名：1.可以将强签名的dll注册到GAC，不同的应用程序可以共享同一dll。2.强签名的库，或者应用程序只能引用强签名的dll，不能引用未强签名的dll，但是未强签名的dll可以引用强签名的dll。3.强签名无法保护源代码，强签名的dll是可以被反编译的。4.强签名的dll可以防止第三方恶意篡改。强签名的方法：1.有源代码：1.1使用vstoolcommand：snk–kmykey.snk生成
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
如何对.NET应用程序进行数字签名溪源More 服务器 linux 网络运维
我们可以为我们的程序进行数字签名,这样就可以证明该程序的作者是可信的.首先为了签名程序,我们需要先创建一个证书.证书是由证书颁发机构(CA)颁发的,CA是受信任的第三方机构,它可以为我们颁发证书.当然我们也可以自己创建证书.接下来简单介绍下如何利用OpenSSL工具创建证书.创建证书下载openssl安装包并安装,推荐下载最新64位版本.打开命令行,输入openssl,如果提示Openssl不是内
.NET 一款基于BGInfo的红队内网渗透工具 dot.Net安全矩阵网络 .net 安全 .netcore web安全矩阵
01阅读须知此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他方面02基本介绍在内网渗透过程中，白名单绕过是红队常见的技术需求。Sharp4Bginfo.exe是一款基于微软签名工具
.NET nupkg包的深度解析与安全防护指南深盾科技 .net
在.NET开发领域，nupkg包是开发者们不可或缺的工具。它不仅是代码分发和资源共享的核心载体，还贯穿了开发、构建、部署的全流程。今天，我们将深入探讨nupkg包的核心功能、打包发布流程以及安全防护措施，帮助你在.NET开发中更加得心应手。nupkg包的核心功能nupkg是NuGet包的文件格式，本质上是一个ZIP压缩包，包含编译后的程序集（.dll文件）、调试符号（.pdb文件）、描述文件（.n
.NET 程序的强名称签名与安全防护技术干货深盾科技安全
在.NET开发领域，保障程序的安全性和完整性至关重要。强名称签名和有效的安全防护措施是实现这一目标的关键手段。下面将详细介绍.NET程序的强名称签名以及相关的安全防护方法。一、什么是强名称签名强名称签名是.NET框架提供的一种安全机制，其主要作用是唯一标识程序集、验证程序集的完整性以及解决版本冲突问题。它本质上是通过加密技术为程序集创建数字签名，确保程序集在分发和运行过程中的安全性。二、签名文件要
Kubernetes自动扩缩容方案对比与实践指南浅沫云归后端技术栈小结 kubernetes autoscaling devops
Kubernetes自动扩缩容方案对比与实践指南随着微服务架构和容器化的广泛采用，Kubernetes自动扩缩容（Autoscaling）成为保障生产环境性能稳定与资源高效利用的关键技术。面对水平Pod扩缩容、垂直资源调整、集群节点扩缩容以及事件驱动扩缩容等多种需求，社区提供了HPA、VPA、ClusterAutoscaler、KEDA等多种方案。本篇文章将从业务背景、方案对比、优缺点分析、选型建
【运维实战】解决 K8s 节点无法拉取 pause:3.6 镜像导致 API Server 启动失败的问题 gs80140 各种问题运维 kubernetes 容器
目录【运维实战】解决K8s节点无法拉取pause:3.6镜像导致APIServer启动失败的问题问题分析✅解决方案：替代拉取方式导入pause镜像Step1.从私有仓库拉取pause镜像Step2.重新打tag为Kubernetes默认命名Step3.导出镜像为tar包Step4.拷贝镜像到目标节点Step5.在目标节点导入镜像到containerd的k8s.io命名空间Step6.验证镜像是否导
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
C#学习日记 future1412 学习
一、基础概念回顾：值类型变量直接包含值本身，通常分配在栈（Stack）内存中。基本数据类型：int,float,char,bool,enum自定义结构体struct引用类型（ReferenceType）引用类型变量包含的是指向实际对象的引用地址，实际数据位于堆（Heap）内存中。string（虽然看起来像值，但本质是引用类型）数组、类class接口interface、委托delegate结构体（s
【Freertos实战】零基础制作基于stm32的物联网温湿度检测(教程非常简易)持续更新中......... 熬夜的猪仔 stm32 物联网嵌入式硬件
本次记录采用Freertos的第二个DIY作品，基于Onenet的物联网温湿度检测系统，此次代码依然是全部开源。通过网盘分享的文件：物联网温湿度检测.rar链接:https://pan.baidu.com/s/1uj9UURVtGE6ZB6OsL2W8lw?pwd=qm2e提取码:qm2e大家也可以看看我上个的开源项目【Freertos实战】零基础制作基于stm32智能小车(教程非常简易)实物演示
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
在 Linux（openEuler 24.03 LTS-SP1）上安装 Kubernetes + KubeSphere 的防火墙放行全攻略
目录在Linux（openEuler24.03LTS-SP1）上安装Kubernetes+KubeSphere的防火墙放行全攻略一、为什么要先搞定防火墙？二、目标环境三、需放行的端口和协议列表四、核心工具说明1.修正后的exec.sh脚本（支持管道/重定向）2.批量放行脚本：open_firewall.sh五、使用示例1.批量放行端口2.查看当前防火墙规则3.仅开放单一端口（临时需求）4.检查特定
C#常见面试题 rapLiu c#数据库开发语言
1.http和https的区别1.HTTP明文传输，数据都是未加密的，安全性较差，HTTPS（SSL+HTTP）数据传输过程是加密的，安全性较好。2.使用HTTPS协议需要到CA（CertificateAuthority，数字证书认证机构）申请证书，一般免费证书较少，因而需要一定费用。证书颁发机构如：Symantec、Comodo、GoDaddy和GlobalSign等。3.HTTP页面响应速度比
C#常见面试题 rapLiu java 开发语言
1.i++中为什么用到锁在C#中，i++通常不需要用锁，因为i++操作本身是一个原子操作。原子操作是指一个操作要么完全执行，要么完全不执行，不会被中断。因此，在单线程环境下，i++操作是安全的。然而，在多线程环境下，如果多个线程同时对i进行++操作，就可能会出现竞争条件（racecondition），导致数据不一致或错误的结果。为了避免这种情况，需要使用锁来保护i的操作，确保在同一时刻只有一个线程
使用内联汇编实现CAS操作（含详细讲解）（Charon）汇编
在多线程环境下，如何安全地更新共享变量，一直是一个重要的话题。今天，我们通过一段使用内联汇编实现的CAS（CompareAndSwap）代码，深入学习它的原理和用法。完整示例代码如下：#include//标准输入输出头文件#include//pthread多线程编程相关头文件#include//usleep函数需要的头文件#defineTHREAD_COUNT10//定义线程数量为10volati
C语言手写简易 DNS 客户端（接收部分）（Charon） c语言开发语言
本文通过纯C语言手动构造DNS请求报文，使用UDP协议发送到公共DNS服务器，并接收响应，完整演示DNS请求流程。主流程：dns_client_commit()这是整个流程的核心函数，下面我们按顺序拆解每一步的逻辑，尤其突出发送sendto与接收recvfrom的设计思路和实现。第一步：创建UDP套接字intsockfd=socket(AF_INET,SOCK_DGRAM,0);if(sockfd
8个Java TCP/UDP框架：优缺点及应用场景全解析！技术男老张 #编程语言 -JAVA 编程语言 java tcp/ip udp ssl 网络协议 websocket http
JavaTCP框架在现代网络编程中扮演着至关重要的角色，尤其是在需要高效、稳定且可扩展的网络通信解决方案时。本文将深入探讨一些主流的JavaTCP/UDP框架，分析它们的优缺点以及适用场景，旨在为开发者提供一份详尽的指南。一、NettyNetty是一个异步事件驱动的网络应用框架，用于快速开发高性能、高可靠性的网络IO程序。Netty的设计目标是简化网络编程的复杂性，同时提高网络应用的性能和可扩展性
基于TCP/UDP的应用层协议 huangxy10 面试专题——网络知识
1，基于TCP的有：Telnet(TeletypeovertheNetwork,网络电传)，通过一个终端(terminal)登陆到网络
【代码学习】扩散模型原理+代码李加号pluuuus CV基础代码学习扩散模型机器学习算法学习
来源：超详细的扩散模型（DiffusionModels）原理+代码-知乎(zhihu.com)代码：drizzlezyk/DDPM-MindSpore(github.com)DDPM1.Unet1.1正弦位置编码classSinusoidalPosEmb(nn.Cell):def__init__(self,dim):super().__init__()half_dim=dim//2#将给定的维度除
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户