jerwey

XAPP599-Vivado HLS的浮点设计

文章目录

使用Vivado HLS工具进行浮点设计的基础知识

在基于ANSI / ISO-C的项目中使用

Vivado HLS工具支持C/C ++浮点和双精度数据类型，它们基于IEEE-754标准定义的单、双精度二进制浮点格式。浮点数值格式由于精度有限不能表示每个实数。

计算不匹配的来源包括

舍入误差的累积，舍入误差对运算的顺序很敏感
FPU支持的扩展精度对舍入结果的影响，例如x87 80位格式;SIMD (SSE等)指令与x87的行为不同
库函数近似，例如浮点三角函数
许多浮点字面值只能近似表示，即使是有理数
传播常数/折叠效果
subnormals的处理
（subnormals有时用于表示比普通浮点格式所能表示的数字小的数字。例如，在单精度格式中，最小的标准浮点值是2-126。但是，当支持subnormals时，尾数位用于表示具有固定指数值2-127的定点数。）
正规数、次正规数见https://www.cnblogs.com/HDK2016/p/10506083.html
（把常量表达式的值求出来作为常量嵌在最终生成的代码中，这种优化叫做常量折叠（constant folding））
（常数传播（constant propagation）都是编译器最佳化技术，被使用于现代的编译器中。）

使用Vivado HLS工具进行浮点设计的基础知识

尽管可以使用CORE Generator工具为自定义精度浮点类型生成这些内核，但是Vivado HLS工具仅生成IEEE-754标准描述的内核的单精度和双精度版本。
基于浮点运算符内核的软件与硬件生成的结果可能（微小）差异的来源是，这些内核通过“冲洗为零”来处理次标准输入(subnormal inputs)，也就是说，遇到这种情况时将它们替换为0.0。

在基于ANSI / ISO-C的项目中使用

要在基于ANSI/ISO-C的项目中使用受支持的标准数学库函数，math.h头文件应该包含在所有调用它们的源文件中。基函数用于操作(并返回)双精度值，例如，double sqrt(double)。
大多数函数的单精度版本都在函数名后面附加了一个“f”，例如，float sqrtf(float)、float sinf(float)和float ceilf(float)。记住这一点很重要，因为如果不这样做，即使参数和返回变量是单精度的，也会实现更大的(在FPGA资源中)双精度版本，而且会使用额外的资源并增加计算的延迟。

在ANSI/ISO-C中工作时的另一个考虑是，当将代码作为软件编译和运行时(包括RTL co-simulation期间的C测试台端)，使用的算法与在HLS生成的RTL中实现的算法不同。在软件中，调用GCC libc函数，在硬件端使用Vivado HLS工具math library代码。这可能导致两者之间的位级不匹配(bit-level mismatches )，当两个结果可能非常接近实际答案(在分析意义上)时.

Example 3: Unintended Use of Double-Precision Math Function:
// Unintended consequences?
#include 
float top_level(float inval)
{
	return log(inval); // double-precision natural logarithm
}

这个示例生成了一个RTL实现，它将输入转换为双精度格式，以双精度计算自然对数，然后将结果转换为单精度输出

Example 4: Explicit Use of Single-Precision Math Function:
// Be sure to use the right version of math functions...
#include 
float top_level(float inval)
{
	return logf(inval); // single-precision natural logarithm
}

return logf(inval); // single-precision natural logarithm 因为调用了对数函数的单精度版本，所以该版本在RTL中实现，不需要进行输入/输出格式转换

Using in C++ Projects

使用C ++设计时，获得对标准数学库的支持的最直接方法是在所有调用其函数的源文件中包括系统头文件。
这个头文件提供了重载的基(双精度)函数的版本，以接受参数并在std名称空间中返回单精度(浮点)值。
对于要使用的单精度版本，必须通过作用域解析操作符(::)或通过使用using指令导入整个名称空间，将std名称空间包含在范围内。

C++ 的基函数对于单精度浮点、双精度浮点使用重载的方式。在使用单精度时方法如下
std:: 或 using namespace std

Example 5: Explicit Scope Resolution:
// Using explicit scope resolution
#include 
float top_level(float inval)
{
	return std::log(inval); // single-precision natural logarithm
}

Example 6: Exposing Contents of a Namespace to File Scope:
// import std:: namespace
#include 
using namespace std;
float top_level(float inval)
{
	return log(inval); // single-precision natural logarithm
}

当在由Vivado HLS工具合成的代码中使用cmath的函数时，软件运行的代码与RTL实现之间的结果可能会不同，因为使用了不同的近似算法。
因此，可以访问用于合成RTL的算法，以用于C ++建模。?

当验证HLS的C++代码，以及使用C++的测试平台对RTL进行co-simulating时，建议HLS源码调用相同的数学库，而测试代码使用 C++标准库生成参考值。这为开发期间的HLS模型和数学库提供了额外的验证。

为了遵循这种方法，Vivado HLS头文件应该只包含在任何要综合的RTL源文件中。对于验证HLS设计的源文件，如测试程序和支持代码，应该包括系统头文件。
hls_math头文件中的函数是HLS::名称空间的一部分。
对于要为软件建模/验证而编译的HLS版本，请对每个函数调用使用hls ::作用域解析。

NOTE：在使用c++标准数学库调用时，不建议导入hls:: namespace(通过’using namespace hls’)，因为这可能导致在hls期间出现编译错误。
示例7a说明了这种用法

测试程序7a使用标准的c++数学库
Example 7a: Test Program Uses Standard C++ Math Library:
// Contents of main.cpp - The C++ test bench
#include 
#include 
using namespace std;
extern float hw_cos_top(float);
int main(void)
{
	int mismatches = 0;
	for (int i = 0; i < 64; i++) {
		float test_val = float(i) * M_PI / 64.0f;
		float sw_result = cos(test_val); //float std::cos(float)
		float hw_result = hw_cos_top(test_val);
		if (sw_result != hw_result) {
			mismatches++;
			cout << "!!! Mismatch on iteration #" << i;
			cout << " -- Expected: " << sw_result;
			cout << "\t Got: " << hw_result;
			cout << "\t Delta: " << hw_result - sw_result << endl;
		}
	}
	return mismatches;
}
Example 7b: The HLS Design Code Uses the hls_math Library
// Contents of hw_cos.cpp
#include 
float hw_cos_top(float x)
{
	return hls::cos(x); // hls::cos for both C++ model and RTL co-sim
}

将此代码编译并作为软件运行后（例如，Vivado HLS GUI中的“运行C / C ++项目”），hw_cos_top()返回的结果与HLS生成的RTL产生的值相同，并且程序会测试与软件参考模型的不匹配情况，即std :: cos()。
如果在hw_cos.cpp中包含头文件，那么当C/C++项目被编译并作为软件运行时就不会出现不匹配，但是在RTL co-sim时就会出现不匹配。

其他事项

不要假设Vivado HLS工具所做的优化对于人眼而言似乎是显而易见的且微不足道的。与大多数C / C ++软件编译器一样，在HLS期间可能无法优化涉及浮点数（数字常量）的表达式。考虑以下示例代码。？

同样运算目的，不同表达。产生RTL以及结果精度都不一样。

Example 8: Algebraically idEntical; Very Different HLS Implementations:
// 3 different results
void top(float *r0, float *r1, float *r2, float inval)
{
	*r0 = 0.1 * inval; // double-precision multiplier & conversions 不是精确的
	*r1 = 0.1f * inval; // single-precision multiplier 不是精确的
	*r2 = inval / 10.0f; // single-precision divider 可能是精确的
}

r0 r1 r2 的运算目的都是乘0.1，不仅RTL电路不一样，结果也不一样。分析如下：

r0：根据C/C++的规则，文字值0.1表示无法精确表示的双精度数，因此，实例化了双精度（double）乘法器core，以及将inval转换为double的core，并将结果乘积变回float(*r0的类型是float)的core。

r1：当需要单精度(浮点)常数时，必须将f附加到文字值，例如0.1f。因此，上面r1的值是(不精确的)浮点数表示0.100和inval之间的单精度乘法的结果。

r2：最后，r2 由单精度除法core产生, inval为分子，10.0f为分母。实数10（1010）是用二进制浮点格式精确表示的，因此(取决于inval的值)，计算r2可能是精确的，而r0和r1可能都不是精确的。

Note：因为浮点运算的发生顺序可能会影响结果（例如，由于在不同时间舍入），所以表达式中涉及的多个浮点文字可能不会合并在一起

Example 9: Order of Operations Can Impact Constant Folding:
操作数顺序影响常数合并
// very different implementations
void top(float *r0, float *r1, float inval)
{
*r0 = 0.1f * 10.0f * inval; // *r0 = inval; constants eliminated
*r1 = 0.1f * inval * 10.0f; // two double-precision multiplies
}

在上面的示例中，由于分配给r0的表达式的求值顺序，编译器会将整个表达式识别为恒等式，因此不会生成任何硬件。但是，同样的情况不适用于r1;做了两次乘法。

Example 10: Avoid Floating Point Literals in Integer Expressions:
void top(int *r0, int *r1, int inval)
{
*r0 = 0.5 * inval; //
*r1 = inval / 2; //移位实现高效
}

对于本例，HLS实现r0的逻辑，方法是将inval转换为双精度格式，将其乘以0.5(一个双精度数值)，然后将其转换回整数。
另一方面，HLS将2的整数幂的乘法和除法分别优化为左移和右移操作，这在硬件中被实现为简单的线选择(根据操作数的方向和类型使用零填充或符号扩展)。因此，在实现相同的算术结果时，为r1而创建的逻辑要高效得多。

并行性、并发性和资源共享

Resource Sharing

Vivado HLS工具会尽可能高效地利用浮点资源。当数据依赖和约束允许时，浮点运算符核通常在源操作的多个调用之间共享。为了说明这个概念，下面的示例将四个浮点值相加。

Example 11: Multiple Operations Use Single Core:
// How many adder cores?
void top (float *r, float a, float b, float c, float d)
{
	*r = a + b + c + d;
}
//使用2个DSP48E

当数据带宽允许时，可能需要在给定的时间内并发地执行许多操作来完成更多的工作，否则这些操作将按顺序安排。在下面的示例中，结果数组中的值是通过在流水线循环中对两个源数组的元素进行求和生成的。
Vivado HLS将顶层数组参数映射到存储器接口，因此，每个周期的访问次数是有限的，例如，双端口RAM每个周期访问两次，FIFO每个周期访问一次，等等。

Example 12: Independent Sums:
// Independent sums, but I/O only allows throughput of one result per cycle
void top (float r0[32], float a[32], float b[32])
{
#pragma HLS interface ap_fifo port=a,b,r0
    for (int i = 0; i < 32; i++) {
        #pragma HLS pipeline
        r0[i] = a[i] + b[i];
    }
}

默认情况下，Vivado HLS工具将该循环安排为迭代32次并实现单个加法器核。如果输入数据是连续可用的，并且输出FIFO永远不会满，则生成的RTL块需要32个周期，外加一些刷新加法器的流水线。

Concurrency

扩展前面的示例，使用Vivado HLS工具的array reshape指令，通过将接口的宽度加倍来增加I / O带宽。为了提高处理速度，将loop部分展开两倍，以匹配带宽的增加。

Example 13: Independent Sums:
// Independent sums, with increased I/O bandwidth -> high throughput and
area
void top (float r0[32], float a[32], float b[32])
{
	#pragma HLS interface ap_fifo port=a,b,r0
	#pragma HLS array_reshape cyclic factor=2 variable=a,b,r0
	for (int i = 0; i < 32; i++) {
		#pragma HLS pipeline
		#pragma HLS unroll factor=2
		r0[i] = a[i] + b[i];
	}
}

通过添加指令，Vivado HLS工具合成的RTL有两个adder管道。

接下来，将给出Vivado HLS工具如何通过浮点运算处理反馈/重复发生的详细示例，然后讨论如何在这种情况下提高性能。

Dependency

Example 14: Dependency through an Operation:
// Floating point accumulator
float top(float x[32])
{
	#pragma HLS interface ap_fifo port=x
	float acc = 0;
	for (int i = 0; i < 32; i++) {
		#pragma HLS pipeline
		acc += x[i];
	}
	return acc;
}

由于在递归式中实现累加，而浮点加的延迟通常大于一个周期,所以这条管道不能达到每个周期的一个累加的吞吐量。

如果浮点adder有4个latency的延迟,那么管道启动区间也是四个周期,因为依赖项要求每个累积在另一个可以开始之前完成。因此,可以实现的最好的吞吐量是每4个周期的累积。累积循环迭代32次,每次行程进行四个周期,总共达到128个周期,再加上一些来刷新管道。

更高性能的替代方法可能是将四个部分累加交织到同一加法器内核上，每个累加器每四个周期完成一次，从而减少了完成32个加法运算的时间。但是，Vivado HLS工具无法从上面提供的代码中推断出这种优化，因为它需要更改累加操作的顺序。如果每个部分累加都将x []的第四个元素作为输入，则各个和的顺序将发生变化，这可能会导致不同的结果。
可以通过对源代码进行少量修改来解决此限制，以使设计者的意图更加明确。以下示例代码引入了一个数组acc_part [4]，用于存储部分和，该部分和随后被求和，并且主累积循环被部分展开。

Example 15: Explicit Reordering of Operations for Better Performance:
// Floating point accumulator
float top(float x[32])
{
	#pragma HLS interface ap_fifo port=x
	float acc_part[4] = {0.0f, 0.0f, 0.0f, 0.0f};
	for (int i = 0; i < 32; i += 4) { // Manually unroll by 4
		for (int j = 0; j < 4; j++) { // Partial accumulations
			#pragma HLS pipeline
			acc_part[j] += x[i + j];
		}
		for (int i = 1; i < 4; i++) { // Final accumulation
			#pragma HLS unroll
			acc_part[0] += acc_part[i];
		}
		return acc_part[0];
	}
}

使用这个代码结构,Vivado HLS工具识别到它可以将四个部分累积安排在交替循环的一个adder核心上,这是更有效地使用资源(参见图3)。后续的最终积累可能还使用相同的adder核心,这取决于其他因素。
现在,主要的累积循环在8次迭代(32/4)中完成,每一次进行四个周期来产生4个部分累积。
在FPGA资源小增加的情况下,同样数量的工作完成的时间更短。最后的累积循环,同时使用相同的adder核心,增加额外的循环,但是这个数字是固定的和小的相对于节省的主要积累循环,特别是当数据集大的时候。最后的累积步骤可以进一步优化,但相对于性能和区域的回报递减。

当更大的I / O带宽可用时,可以指定更大的不滚动因素,以带来更多的算术核心。如果在前面的例子中,每一个时钟周期中有两个x[]元素,则不滚动因子可以增加到8,在这种情况下,将实现两个adder内核,每个周期进行8次部分累积。精确的操作员延迟可能受到目标设备选择和用户时间限制的影响。一般来说,需要运行HLS,并对一个简单的基本情况进行一些性能分析。以表14为例,确定最优的未滚动量。

控制实现的资源

Xilinx LogiCORE IP浮点运算符内核允许控制某些支持的操作对DSP48的利用。例如，乘法器内核具有四个变体，可以替代逻辑（LUT）资源以使用DSP48。
通常，Vivado HLS工具会根据性能限制自动确定要使用的内核类型。 Vivado HLS工具的RESOURCE指令可用于覆盖自动选择并指定给定操作实例使用哪种类型的浮点运算符核。
例如，对于示例14中所示的代码，加法器通常使用Kintex -7 FPGA上的两个DSP48E1资源，使用“完全使用”内核来实现，如综合报告的“组件”部分所示（请参见图4）。

在下面的示例代码中，强制将加法操作映射到FAddSub_nodsp核心。

// Floating point accumulator
float top(float x[32])
{
	#pragma HLS interface ap_fifo port=x
	float acc = 0;
	for (int i = 0; i < 32; i++) {
		#pragma HLS pipeline
		#pragma HLS resource variable=acc core=FAddSub_nodsp
		acc += x[i];
	}
	return acc;
}

请参见UG902，了解资源指令使用的详细信息和可用核列表。

验证

通过不同的方法完成的相同浮点计算，其结果之间存在位级(或更大)不匹配的原因有很多。例如，不同的近似算法，对操作进行重新排序以导致舍入差异以及处理非正规subnormal(浮点运算核将其刷新为零)。一般来说，两个浮点值对比的结果(特别是相等值)可能会引起误解。被比较的两个值可能是最后一个“单位”不同（unit in the last place，ULP；其二进制格式的最低有效位），它可以表示一个非常小的相对错误,但是’ = = ‘运算符返回false。例如，在使用单精度浮点格式时，如果两个操作数都是非零(and non-subnormal)值，一个ULP的不同表示在0.00001%的量级上的相对错误。因此，优良作法是避免使用’==‘和’！='运算符比较浮点数。相反，建议通过引入可接受的错误阈值来检查值是否“足够接近”。
大多数情况，设置一个可接受的ULP或相对错误水平可以很好地工作，并且比绝对误差（或“ε”）阈值更可取。
但是，当被比较的其中一个值恰好为零(0.0)时，此方法就失效了。如果被比较的某个值可以取零值(或具有常量)，那么应该使用绝对错误阈值。
下面的示例代码提供了一种方法，该方法可用于比较两个浮点数以实现近似相等，并允许用户设置ULP和绝对错误限制。
此功能旨在用于C / C ++“测试台”代码中，以验证对HLS源代码的修改并在RTL co-simulation过程中进行验证。类似的技术也可以在用于HLS实现的代码中使用。

Example 17: C Code to Test Floating Point Values for Approximate Equivalence:
// Create a union based type for easy access to binary representation
typedef union {
float fval;
unsigned int rawbits;
} float_union_t;
bool approx_eqf(float x, float y, int ulp_err_lim, float abs_err_lim)
{
	float_union_t lx, ly;
	lx.fval = x;
	ly.fval = y;
	// ULP based comparison is likely to be meaningless when x or y
	// is exactly zero or their signs differ, so test against an
	// absolute error threshold this test also handles (-0.0 == +0.0),
	// which should return true.
	// N.B. that the abs_err_lim must be chosen wisely, based on
	// knowledge of calculations/algorithms that lead up to the
	// comparison. There is no substitute for proper error analysis
	// when accuracy of results matter.
	if (((x == 0.0f) ^ (y == 0.0f)) || (__signbit(x) != __signbit(y))) {
		#ifndef NDEBUG
				if (x != y) { // (-0.0 == +0.0) so warning not printed for that case
				printf("\nWARNING: Comparing floating point value against zero ");
				printf("or values w/ differing signs. ");
				printf("Absolute error limit has been used.\n");
					}
		#endif
		return fabs(x - y) <= fabs(abs_err_lim);
	}
	// Do ULP base comparison for all other cases
	return abs((int)lx.rawbits - (int)ly.rawbits) <= ulp_err_lim;
}

缩减版

C/C++ 在使用浮点单、双精度时，要注意上面提到的方法；
软件运行的代码（包括co-sim）与RTL实现之间的结果可能会不同
Vivado HLS 数学库 (hls_math.h) 可为标准 C 语言库 (math.h) 和 C++ 库 (cmath.h) 提供支持，并自动用于指定综合期间的数学运算。此支持包含对应所有函数的浮点支持（单精度、双精度和半精度）以及对应部分函数的定点支持。
Example 9: 同样运算目的，不同表达。产生RTL以及结果精度都不一样。
因为浮点运算的发生顺序可能会影响结果（例如，由于在不同时间舍入），所以一个表达式中涉及多个浮点数可能不会合并在一起
Example 9: 操作数顺序影响常数合并
Example 10: HLS将2的整数幂的乘法和除法分别优化为左移和右移操作。
Example 13: 提到性能：接口位宽扩展（ array reshape directive），loop unrolled
可用控制实现core的资源。见ug902 Controlling Hardware Resources
验证时，大多数情况设置一个可接受的ULP或相对错误水平可以很好地工作，并且比绝对误差（或“ε”）阈值更可取。
但是，当被比较的其中一个值恰好为零(0.0)时，此方法就失效了。如果被比较的某个值可以取零值(或具有常量)，那么应该使用绝对错误阈值。

pointpillar项目计划

工作内容	时间	[√]
方案设计、架构设计	~7.24	[√]
学习HLS的浮点设计方法	7.27~7.31	[√]
HLS/RTL开发加速core	8.3~8.21	[]
测试程序C model开发	8.3~8.14	[]
功能仿真以及调试：挂载ddr4_models、与c model对比结果	8.25~9.4	[]
zynq系统搭建 PS端代码	9.7~9.11	[]
Bare Metal程序验证	9.14~9.19	[]
加入系统集成测试	9.21~9.25
专利撰写	9.28~9.30

Mon 13 Mon 20 Mon 27 Mon 03 Mon 10 Mon 17 Mon 24 Mon 31 Mon 07 Mon 14 Mon 21 Mon 28 Mon 05 方案以及架构设计 HLS浮点开发技巧 HLS开发功能仿真以及调试 zynq搭建PS端代码 Bare Metal程序验证项目A Pointpillars预处理加速

python的变量和数据类型筱920 python
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录一、python的变量变量的命名规则二、python的数据类型五种基本数据类型：整型，浮点型，字符串型，布尔型，空型。（其中type方法是检测变量是什么类型）1，整型毋庸置疑就是整数，python中变量值为0b开头可以定义一个二进制，bin方法可以将十进制数转换成二进制。2，浮点型就是小数，即定义变量的值为小数，主要利用科学计数法
Rust标量、复合类型与自定义类型、第三方并发结构穗余 Rust rust 数据结构 python
以下是Rust中标量类型、对象类型（含结构体、复合类型、堆分配类型）以及常用第三方并发数据结构的完整分类、示例和区别对比，帮助你系统掌握它们的本质异同：一、标量类型（ScalarTypes，存储于栈上）标量是最基本的值类型，固定大小，存储在栈上，实现Copy，性能极高。类别示例类型示例代码特性说明整数i8i128,u8u128,isize,usizeletx:u32=42;固定大小，快速拷贝浮点数
AI 大模型应用进阶系列（一）：Python 基础人工智能python
本文已同步到githubAI大模型应用进阶系列（一）：Python基础，欢迎Star。数据类型数字在Python中，数字类型是基本数据类型之一，用于表示数值整数a=10#十进制整数b=0b1010#二进制整数（等于十进制的10）c=0o12#八进制整数（等于十进制的10）d=0xA#十六进制整数（等于十进制的10）print(a,b,c,d)#输出:10101010浮点数x=3.14y=1.23e
TI Sitara AM57x 多核SoC开发板（DSP + ARM）-性能及参数资料 Tronlong创龙嵌入式ARM 软硬件原理图规格资料平台 AM5708 嵌入式硬件嵌入式 arm fpga开发 linux
创龙科技TL570x-EVM是一款基于TISitara系列AM5708ARMCortex-A15+浮点DSPC66x处理器设计的异构多核SoC评估板，由核心板和评估底板组成。核心板经过专业的PCBLayout和高低温测试验证，稳定可靠，可满足各种工业应用环境。评估板接口资源丰富，引出双路PRU百兆网口、千兆网口、USB3.0、CAMERA、GPMC、HDMI、PCIe等接口，方便用户快速进行产品方
C#教程（2）———— 各式各样的数据类型值类型篇大朋Sir C#教程 c#
C#教程（2）————各式各样的数据类型前言1数据类型概述2值类型2.1数值类型2.1.1整数类型2.2浮点数类型2.3字符类型2.4布尔类型2.5其它值类型2.6sizeof关键字总结前言在上一篇文章中，我们简单介绍了C#语言的历史，并通过一个简单的打印“HelloWorld”的程序，一起了解了C#程序的基本结构，那么在今天，我们将进一步学习更多的内容。我们的现实生活中总是存在着各式各样的数据，
JAX study notes[9] 身在此心在彼计算综合 python 开发语言
文章目录usingfunctionfrommoudleimportthespecialfuntionapplythefunctionimportedfromthelibrarywriteintofileusingosmoduleusingsysmoduletogettheargumentsofsysreferencesnotation#单行注释variablex=10#整数y=3.14#浮点数na
C++：格式化输入和输出、非格式化输入和输出（控制布尔值格式、整型值格式、浮点数格式；单字节操作put和get、多字节操作getline等）还下着雨ZG C++杂谈 c++开发语言
1、格式化输入和输出(1)What标准库定义了一组操纵符（本质是函数或对象）来修改流的格式状态当操作符改变流的格式状态时，通常改变后的状态对所有后续IO都生效(2)WhichA.控制布尔值的格式boolbFlag=true;std::cout<
Qt 各种功能学习笔记栈不收 qt 学习笔记
目录1.Qt关于数据库1.1Qt链接数据库1.2将数据库的模型显示在控件中2.Qt关于控件2.1用正则表达式设置输入框只能输入正浮点数2.2设置QDateTimeEdit的时间格式和设置为当前时间1.Qt关于数据库1.1Qt链接数据库基础教学：使用Qt链接MySql数据库_qt连接mysql_栈不收的博客-CSDN博客需要注意的问题：在链接MySQL的时候，首先要确保MySQL已经安装成功在目录Q
一周搞定Redis面试题|第一天认识Redis以及Redis数据类型天天开心(∩_∩) redis 数据库面试缓存
目录认识Redis1.介绍一下Redis2.使用Redis的好处在哪里Redis的数据类型3.Redis的数据类型有哪些String三种编码方式常见面试题4.在Redis中String数据类型的编码方式有几种，区别是什么？5.浮点型在String使用什么编码方式6.为什么EMBSTR的阈值是44字节7.String可以有多大？8.SDS有什么作用？List常见面试题9.List对象底层存储的编码实
暑假复习篇之运算与逻辑清梚不喝粥 25暑假 java 算法后端
运算符算术运算符：+-*/%（取余）【优先级与数学上的优先级一致】赋值运算符：=、+=、-=、*=、/=、%=、++、--比较运算符：==、！=、>、=、>（向右位移）>>>（无符号向右位移）<<（向左位移）位运算符：&（按位与）、|（按位或）、^（按位异或）运算符：①一个浮点与整数运算时的结果还是浮点数②一个整数除另一个整数的结果还是整数整除③注意不同数据类型的常规类型【注意范围问题】赋值运算符
AI算力综述和资料整理木鱼时刻人工智能
目录总体介绍计算精度传输协议GPU池化资源调度CUDA技术GPU硬件参考链接总体介绍AI算力是人工智能系统的核心基础设施，涵盖了从计算精度、传输协议到硬件架构的完整技术栈。计算精度混合精度训练原生满血版DeepSeek671B是FP8精度。FP16在训练计算力占比有80-90%，FP32占比10%-20%。大模型训练中通常会用到FP16（半精度浮点数），但并不是只使用FP16，而是采用**混合精度
鹅厂JS面试题——0.1+0.2=0.3吗? 孤舟蓑影 JavaScript javascript 开发语言 ecmascript 前端学习
首先公布答案:在JavaScript中，0.1+0.2≠0.3为什么？JavaScript中的数字使用IEEE754标准的双精度浮点数（64位）进行表示。这种表示方式在处理十进制小数时，不能精确地表示某些数字。比如0.1和0.2这样的十进制小数，在转换成二进制浮点数时会产生无限循环的小数，导致它们在内存中只能近似表示。0.1在二进制中表示为一个近似值：0.000110011001100110011
【基于ESP32-S3的Modbus RTU单双精度浮点数验证方案】 2345VOR #Arduino小项目开发工业通讯 esp32s3 ModBusRTU 浮点数
基于ESP32-S3的ModbusRTU单双精度浮点数验证方案一、核心功能升级在工业自动化场景中，单纯的整型数据已无法满足高精度测量需求。本文在原有ADC数据采集方案基础上，通过ModbusRTU协议扩展实现以下功能升级：新增1路16位浮点数（3.3V量程）新增1路32位双精度浮点数（±2.5V量程）保持原有4通道ADC数据传输本方案在原有ADC数据采集基础上，重点实现单双精度浮点数（float&
Python3 数字(Number) froginwe11 开发语言
Python3数字(Number)引言在编程语言中，数字是构成程序的基础元素之一。Python3作为一种高级编程语言，提供了丰富的数字类型和操作方法。本文将详细介绍Python3中的数字类型，包括整数、浮点数、复数等，并探讨它们的特性和应用。整数（Integer）整数是Python3中最基本的数据类型之一，用于表示没有小数部分的数值。在Python3中，整数类型没有大小限制，可以表示任意大小的整数
C++ 数据类型風清掦 C++c++经验分享
使用编程语言进行编程时，需要用到各种变量来存储各种信息。变量保留的是它所存储的值的内存位置。这意味着，当创建一个变量时，就会在内存中保留一些空间。可能需要存储各种数据类型（比如字符型、宽字符型、整型、浮点型、双浮点型、布尔型等）的信息，操作系统会根据变量的数据类型，来分配内存和决定在保留内存中存储什么。基本的内置类型C++提供了种类丰富的内置数据类型和用户自定义的数据类型。下表列出了七种基本的C+
C++day02(基本数据类型) 有点。 #C++少儿 c++
学习目标初始C++基本数据类型整数与加减乘除学习变量与赋值语句老师要求你每天做题之后记录做题总共用了多少秒。但是计时器只能显示分钟+秒的格式。你有办法编写程序进行时间换算吗?想知道计算机如何表示数值吗?计算机又能进行哪些计算呢?玩过身份推理桌游吗?这类桌游中的角色有不同的身份。比如狼人杀中有狼人、平民、预言家、女巫等等不同身份的身份卡。编程语言的数据也有不同的类型,比如整数类型、字符类型、浮点数类
大模型量化需要重新演唱大模型量化
大模型量化是一种优化技术，旨在减少深度学习模型的内存占用和提高推理速度，同时尽量保持模型的精度。量化通过将模型中的浮点数权重和激活值转换为较低精度的表示形式来实现这一目标。以下是关于大模型量化的详细知识：目录1.量化基础1.1量化定义1.2量化优势1.3量化挑战2.量化方法2.1量化类型2.2量化粒度2.3量化算法3.量化实践3.1量化流程3.2量化工具4.量化案例4.1BERT量化4.2GPT-
嵌入式八股文 NAccept c语言
对一个寄存器某个位进行改变，用位操作怎么做new对象时，怎么知道内存是否分配成功浮点数在计算机中怎么存储模板使用和多态左值和右值的区别静态链接，动态链接引用传递define宏lambda表达式和变量捕获C++面向对象多态实现，模板算不算多态？C++类的组合虚拟内存（为了解决什么问题）线程与进程的区别？进程间的通信方式进程的虚拟地址空间划分线程安全和线程不安全内存分段和分页new对象时，怎么知道内存
Python 标准库之 random 模块 Json19970108018 Python 进阶应用教程 python 前端数据库
Python的random模块提供了生成伪随机数的工具，可用于模拟随机过程、生成测试数据、实现随机化算法等场景。以下是该模块的核心功能和常见用法：1.随机数生成基础1.1浮点数随机数pythonimportrandom#生成[0.0,1.0)范围内的随机浮点数random.random()#生成[a,b]范围内的随机浮点数random.uniform(1,10)1.2整数随机数python#生成[
C语言之数学运算强化练习题林赢56 湖南工业大学（移动云启）c语言开发语言
第1关：逐一挑出来100任务要求参考答案评论46任务描述相关知识算数运算符floor编程要求测试说明任务描述本关需要完成一个输出某个三位数各个位上的数字的小程序。相关知识算数运算符%是取模运算符，获得整除后的余数。/是通过分子除以分母，获得整除后的整数部分。floorfloor()是返回一个浮点型的整数部分，即向下取整。语法：floor(doublex)说明：x是需要传入的浮点型数。举例如下：fl
鸿蒙Next仓颉开发语言中的数据类型总结分享幽蓝计划开发语言 harmonyos
大家好，今天总结一下仓颉中的数据类型。数字仓颉中的数字类型复杂多样，首先分为整型和浮点型两种，也就是Int类型和Float类型，Int类型有Int、Int8、Int32、Int64几种类型，Float也有Float16、Float32和Float64几种类型，下面为大家介绍它们的区别。其实无论是Int8、Int32还是Int64，它们都属于整型，只不过是长度上的区别。比如Int8最短，只占用1个字
Python从入门到入坑(一) 小样贼猖狂 python学习ing 后端大数据 python
初识Python什么是代码？什么是写代码？Python的基本数据类型Number大类整数浮点型布尔类型complex复数一个知识点组大类序列字符串列表[]元组()总结序列集合字典dict总结什么是代码？什么是写代码？代码是现实世界事物在计算机世界的映射！写代码就是将现实世界中的事物用计算机语言来描述.—>画家、摄影师：光影、图形、颜色、结构。—>我的世界：石英、矿石、水晶。—>计算机语言：基本数据
第六章数据的基本类型全知全能的LAIN 算法
目录6.1整型一、类型二、进制三、整数溢出四、输入/输出整数的转换说明符6.2浮点型一、类型二、输入/输出浮点数的转换说明符6.3字符类型（char）一、字符操作的原理二、类别三、字符处理方法(一)、大小写字母的互相转换(二)、判断字符是否为字母......四、输入/输出字符(一)调用scanf函数与printf函数(二)调用getchar函数与putchar函数1°getchar函数用于输入单个
数的三次方根（二分） Atopos_n 算法
题目描述给定一个浮点数n，求它的三次方根。输入格式共一行，包含一个浮点数n。输出格式共一行，包含一个浮点数，表示问题的解。注意，结果保留6位小数。数据范围−10000≤n≤10000输入样例：1000.00输出样例：10.000000分析题目隐藏了有序这一特点，从-1000到1000这个大范围内，寻找给定的数，使用二分能够快速得到答案但二分的关键在于判断条件怎么写，可以通过给定的数据精度，六位，因
【acwing】数的三次方根 GUO_YYDS c++算法
数的三次方根给定一个浮点数nnn，求它的三次方根。输入格式共一行，包含一个浮点数nnn。输出格式共一行，包含一个浮点数，表示问题的解。注意，结果保留666位小数。数据范围−10000≤n≤10000-10000\len\le10000−10000≤n≤10000输入样例：1000.00输出样例：10.000000第一种代码#include#includeusingnamespacestd;doub
Vitis HLS 学习笔记--hls::stream（理解串流：基础） hi94 Vitis HLS 学习笔记 c++fpga开发 HLS
目录1.介绍2.示例2.1代码解析2.2定义串流2.3串流的综合报告3.总结1.介绍在VitisHLS中，hls::stream是一个用于在C/C++中进行高级合成的关键数据结构。它类似于C++标准库中的std::stream，但是专门设计用于硬件描述语言（如Verilog或VHDL）中的数据流。hls::stream提供了一种方便的方法来处理数据流，使得在设计硬件加速器时更加灵活和可控。hls:
Python基础语法做好自己吧! Python学习 python
一.数据类型和变量Python没有常量，不能保证他是常量，通常用全大写表示他是常量，很动态。和静态语言不同的主要是不用提前声明类型名，常用的数字（整数，浮点数直接赋值就是了），字符串就用双引号单引号Python有很好的r''''''语句可以保留里面内容的转义字符当然转义字符也可以用\表示pyhon表示逻辑的是andornot这些与c的符号表示不同，说明了Python更贴合人类自然语言（有实际意思）
数据表示——原码/反码/补码/移码/浮点数
计算机中的数值信息分成整数和实数两大类。整数不使用小数点，或者说小数点总是隐含在个位数的右边，所以整数也称为“定点数”,包含原码、反码、补码和移码。相应地，实数也称为“浮点数”。正数负数原码最高位为符号位0，其他位为真值的二进制。最高位为符号位1，其他位为真值的二进制。反码等于原码。按原码除符号位外，其他位取反。补码等于原码。等于反码+1或者求(2机器字长-负数的绝对值)的原码。移码补码的符号位取
如何正确处理音频数据：16位整数与32位浮点数 niuguangshuo 音频算法音视频
在音频处理领域，音频数据的格式对后续的分析和处理至关重要。常见的音频格式包括16位整数和32位浮点数。本文将介绍如何正确处理这两种格式的音频数据，包括使用scipy.io.wavfile读取音频、使用librosa进行处理，以及使用soundfile（sf）写入音频文件。1.16位整数音频1.1读取音频16位整数音频通常以int16格式存储。使用scipy.io.wavfile读取音频文件时，返回
【QT】QPointF、QRectF、QPolygonF 介绍我不是程序猿儿 QT之路 qt 开发语言
QPointF确实存在于Qt框架中，它是一个类，用于表示二维空间中的一个点，其中包含了浮点精度的x和y坐标。主要特点和用途高精度坐标：QPointF使用double类型来存储x和y坐标，这提供了比QPoint（后者存储整数坐标）更高的精度。这在需要精确定位或处理图形和界面元素时特别有用，例如在绘图、图像处理或任何需要几何计算的应用中。数学运算支持：QPointF提供了一系列便利的数学运算，如加法、
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号