jerwey

ug902-ch1：High-Level Synthesis-Optimizing the Design

文章目录

1. Clock, Reset, and RTL Output

2. Optimizing for Throughput

Function and Loop Pipelining

Rewinding Pipelined Loops for Performance
Flushing Pipelines
Automatic Loop Pipelining
Addressing Failure to Pipeline
Static Variables

Partitioning Arrays to Improve Pipelining
Dependencies with Vivado HLS
Removing False Dependencies to Improve Loop Pipelining
Scalar Dependencies
Optimal Loop Unrolling to Improve Pipelining
2.7 Exploiting Task Level Parallelism: Dataflow Optimization

2.7.1 canonical Form：规范形式
2.7.2 Canonical Body
2.7.3 Dataflow Checking
2.7.4 Dataflow Optimization Limitations

Single-producer-consumer Violations
Bypassing Tasks
Feedback Between Tasks
Conditional Execution of Tasks
Loops with Multiple Exit Conditions

2.7.5 Configuring Dataflow Memory Channels
2.7.6 Specifying Arrays as Ping-Pong Buffers or FIFOs
2.7.7 Specifying Compiler-FIFO Depth
2.7.8 Stable Arrays
2.7.9 Using ap_ctrl_none Inside the Dataflow

3 Optimizing for Latency

1.Using Latency Constraints
2.Merging Sequential Loops to Reduce Latency
3.Flattening Nested Loops to Improve Latency

4 Optimizing for Area

1.Data Types and Bit-Widths
2.Function Inlining
3.Mapping Many Arrays into One Large Array
4.Array Mapping and Special Considerations
5.Array Reshaping
6.Function Instantiation
7.Controlling Hardware Resources

5 Optimizing Logic

1.Controlling Operator Pipelining
2.Optimizing Logic Expressions

本节概述了可用于指导Vivado HLS生成满足所需性能和区域目标的微体系结构的各种优化和技术。下表列出了Vivado HLS提供的优化指令。

ug902-ch1：High-Level Synthesis-Optimizing the Design_第1张图片

ug902-ch1：High-Level Synthesis-Optimizing the Design_第2张图片

除了优化指令之外，Vivado HLS还提供了许多配置设置。配置设置用于更改合成的默认行为。配置设置如下表所示

ug902-ch1：High-Level Synthesis-Optimizing the Design_第3张图片

除了优化指令之外，Vivado HLS还提供了许多配置设置。配置设置用于更改综合的默认行为。下表显示了配置设置。

ug902-ch1：High-Level Synthesis-Optimizing the Design_第4张图片

有关如何应用优化和配置的详细信息在Applying Optimization Directives。
可以使用Solution→ Solution Settings → General ，并使用“Add ”按钮选择配置。

The Clock, Reset and RTL output are discussed together. The clock frequency along with the
target device is the primary constraint that drives optimization. Vivado HLS seeks to place as
many operations from the target device into each clock cycle. The reset style used in the final
RTL is controlled, along setting such as the FSM encoding style, using the config_rtl
configuration.
The primary optimizations for optimizing for throughput are presented together in the manner in
which they are typically used: pipeline the tasks to improve performance, improve the flow of
data between tasks, and optimize structures to improve address issues which may limit
performance.
Optimizing for latency uses the techniques of latency constraints and the removal of loop
transitions to reduce the number of clock cycles required to complete.
A focus on how operations are implemented - controlling the number of operations and how
those operations are implemented in hardware - is the principal technique for improving the area.
In addition to the pragmas and directives, Vivado HLS provides a way to integrate an existing
optimized RTL into the HLS design flow. See RTL Blackbox for more information.

1. Clock, Reset, and RTL Output

2. Optimizing for Throughput

使用以下优化来提高吞吐量或减少启动间隔（II）。

Function and Loop Pipelining

Pipelining应用对象：Functions 和 loops
作用：流水线允许操作并发发生:每个执行步骤不必在开始下一个操作之前完成所有操作
pipelining

	Function	loop

函数或循环是使用流水线指令实现流水线。指令是在构成函数或循环体的区域中指定的。初始化间隔（II）默认为1(如果没有指定)，但是可以显式指定。
流水线仅应用于指定的区域，而不应用于下面的层次结构。但是，下面层次结构中的所有循环都会自动展开？。在指定函数下面的层次结构中的任何子函数都必须单独流水线。如果子函数是流水线的，则其上的流水线函数可以利用流水线的性能。
相反，流水线顶层函数之下的任何非流水线的子函数都可能成为流水线性能的限制因素。

Functions and Loops 流水线方式的区别：
Function：流水线将永远运行下去。
Loops：管道将执行直到循环的所有迭代都完成为止。下图总结了这种行为差异

流水化的函数将不断地读取新的输入并写入新的输出。相反，因为一个loop必须在开始下一个循环之前先完成循环中的所有操作，a pipelined loop会在data stream;中产生“气泡bubble””。

Rewinding Pipelined Loops for Performance

PIPELINE pragma has an optional command “rewind”

为了避免前面图中显示的bubble问题，当此loop是top function or of a dataflow process的最外层结构时(且数据流区域被多次调用)，此命令允许对rewind loop,的连续调用的迭代重叠。

当此循环是top函数或数据流进程的最外层构造（并且多次调用数据流区域）时，此命令将使重绕循环的连续调用的迭代重叠。
下图显示了在循环流水线化时使用rewind选项时的操作。在loop迭代计数结束时，loop开始重新执行。虽然它通常会立即重新执行，但延迟是可能的，并在GUI中显示和描述。

Flushing Pipelines

只要数据在管道的输入端可用，管道就会继续执行。如果没有可用的数据来处理，管道将会停止。

在某些情况下，希望有一个可以“emptied””或“flushed”的管道。提供了flush选项来执行此操作。
当一个pipeline被“flushed”，此pipeline停止读取新输入当没有可用的(由pipeline开始处的数据有效信号确定)但继续处理，关闭每个连续的pipeline阶段，直到最终输入已处理到管道的输出为止。

Automatic Loop Pipelining

config_compile配置允许根据迭代计数自动地对循环进行流水线操作。Solution > Solution Settings >General > Add > config_compile.
pipeline_loops选项设置迭代限制。所有迭代计数低于此限制的循环都自动流水线。默认值为0:不执行自动循环管道操作。

for (y = 0; y < 480; y++) {
	for (x = 0; x < 640; x++) {
		for (i = 0; i < 5; i++) {
			// do something 5 times
			...
		}
	}
}

如果pipeline_loops选项被设置为6，那么上面代码段中最内层的for循环将被自动流水线化。这相当于下面的代码片段:

for (y = 0; y < 480; y++) {
	for (x = 0; x < 640; x++) {
		for (i = 0; i < 5; i++) {
		#pragma HLS PIPELINE II=1
			// do something 5 times
			...
		}
	}
}

如果在设计中有不希望使用automatic pipelining的loops，请将带有off选项的管道指令应用于该loop。
off选项防止automatic loop pipelining.

IMPORTANT!
Vivado HLS在执行所有用户指定的指令之后应用config_compile pipeline_loops选项。例如，如果Vivado HLS将用户指定的UNROLL指令应用于循环，则首先将循环展开，并且不能应用自动循环管道。

Addressing Failure to Pipeline

当一个函数被流水线操作时，下面层次结构中的所有循环都会自动展开。这是进行管道操作的必要条件。如果循环有可变边界，则无法展开。这将阻止函数被流水线化。

Static Variables

静态变量用于在循环迭代之间保持数据，通常在最终实现中产生寄存器。如果在流水线函数中遇到这种情况，vivado_hls可能无法充分优化设计，这会导致启动间隔超过所需时间。

Partitioning Arrays to Improve Pipelining

数组被实现为块RAM，它最多只有两个数据端口。这可能会限制读/写(或加载/存储)密集型算法的吞吐量。通过将数组(一个块RAM资源)分割成多个较小的数组(多个块RAM)，可以提高带宽，从而有效地增加端口的数量。使用ARRAY_PARTITION指令对数组进行分区。Vivado HLS提供三种类型的数组分区，如下图所示。划分的三种风格是：
block:原始数组被分割成大小相等的块，这些块由原始数组中连续的元素组成。
cyclic:原始数组被分割成大小相等的块，将原始数组的元素交错排列。
complete:默认操作是将数组拆分为各个元素。这相当于将存储解析为寄存器。

对于block分区和cyclic分区，factor选项指定要创建的数组数量。在前面的图中，使用了因子2，即将数组分成两个较小的数组。如果数组中的元素数不是因子的整数倍，则最后数组的元素数较少。
在对多维数组进行分区时，使用dimension选项指定要分区的维度。下图显示了如何使用dimension选项来划分以下示例代码:

void foo (...) {
int my_array[10][6][4];
...
}

如果dimension=0，则对所有维度进行分区。

数组自动分区
config_array_partition配置决定如何根据元素的数量对数组进行自动分区。可以通过菜单访问此配置
Solution → Solution Settings → General → Add → config_array_partition.
可以调整分区阈值，并且可以使用throughput_driven选项完全自动化分区。当选择了throughput_driven选项时，Vivado HLS会自动对数组进行分区，以实现指定的吞吐量。

Dependencies with Vivado HLS

Removing False Dependencies to Improve Loop Pipelining

Scalar Dependencies

一些标量依赖关系很难解决，通常需要对源代码进行更改。

Optimal Loop Unrolling to Improve Pipelining

默认情况下，loops在Vivado HLS中保持rolled。

Vivado HLS提供了使用unroll指令展开for循环或部分展开for循环的能力
本例假设数组a[i]、b[i]和c[i]被映射到块ram。

Rolled Loop:这个实现需要四个时钟周期，只需要一个乘法器，每个块RAM可以是一个单端口块RAM。
Partially Unrolled Loop:在本例中，循环部分展开的系数为2。这个实现需要两个乘法器和双端口RAM来支持在同一个时钟周期内对每个RAM进行两次读写。然而，这个实现只需要两个时钟周期就可以完成:一半的启动间隔和一半的滚动循环版本的延迟。
展开循环:在完全展开的版本中，所有的循环操作都可以在一个时钟周期内执行。然而，这个实现需要四个乘数。更重要的是，这个实现需要在相同的时钟周期中执行4个读和4个写操作。因为一个块RAM最多只有两个端口，所以这个实现需要对数组进行分区。

使用范围：
要执行循环展开，可以将UNROLL指令应用于设计中的各个loops。或者，您可以将UNROLL指令应用于一个function，该function将在该function的范围内展开所有循环。

如果循环是完全展开的，那么在数据依赖项和资源允许的情况下，所有操作都将并行执行。如果循环的一个迭代中的操作需要前一个迭代的结果，那么它们不能并行执行，而是在数据可用时立即执行。一个完全展开和完全优化的循环通常会涉及循环体中逻辑的多个副本。
Partially unrolling the loop by a factor of 8 will allow each of the channels (every 8th sample) to be processed in parallel (if the input and output arrays are also partitioned in a cyclic manner to allow multiple accesses per clock cycle). If the loop is also pipelined with the rewind option, this design will continuously process all 8 channels in parallel if called in a pipelined fashion (i.e., either at the top, or within a dataflow region).

void foo (dout_t d_out[N], din_t d_in[N]) {
#pragma HLS ARRAY_PARTITION variable=d_i cyclic factor=8 dim=1 partition
#pragma HLS ARRAY_PARTITION variable=d_o cyclic factor=8 dim=1 partition
int i, rem;
// Store accumulated data
static dacc_t acc[CHANNELS];
// Accumulate each channel
	For_Loop: for (i=0;i

 
  。。。 
  2.7 Exploiting Task Level Parallelism: Dataflow Optimization 
  Dataflow Optimization对于一组连续的任务(例如，functions and/or loops)非常有用，如下图所示。
 
 上面的图显示了三个任务链的具体情况，但是通信结构可能比显示的更复杂。
 使用这一系列连续的任务，dataflow优化创建了一个并发进程的体系结构，如下所示。数据流优化是一种提高设计吞吐量和延迟的强大方法。
  
  
 如果不增加硬件开销，就无法实现这种并行。
 当某个特定区域(如函数体或循环体)被标识为应用dataflow优化的区域时，Vivado HLS将分析该函数或循环体并创建单独的通道来对数据流建模，从而将每个任务的结果存储在数据流区域中。
 这些channels对于scalar variables可以是简单的fifo，对于非标量变量(比如数组)可以是ping-pong (PIPO) buffers。
 每个通道还包含指示FIFO或乒乓缓冲区何时满或空的信号。这些信号表示完全由数据驱动的握手接口。
 通过使用单独的fifo和/或ping-pong缓冲区，Vivado HLS释放每个任务以其自己的速度执行，并且吞吐量仅受输入和输出缓冲区的可用性限制。与普通流水线实现相比，这允许更好的任务执行交错，但这是以额外的FIFO 或 用于乒乓球缓冲区的块RAM寄存器为代价的。上图说明了下图中相同示例的数据流区域实现的结构。 
  
 与静态流水线解决方案statically pipelined solution相比，Dataflow优化有可能提高性能。 Dataflow使用FIFO和/或乒乓缓冲区，以更灵活和分布式的握手体系结构代替了严格的集中控制流水线停顿原理。数据流优化不限于一系列流程，而是可以在任何DAG结构上使用。 它可以产生两种不同的重叠形式：在迭代中（如果进程与FIFO连接），以及通过PIPO和FIFO在不同的迭代之间进行。 
  2.7.1 canonical Form： 规范形式 
  Vivado HLS变换区域以应用DATAFLOW优化。 Xilinx建议使用规范形式在该区域（称为规范区域）内编写代码。 数据流优化有两种主要的规范形式：
 1.不内联函数的函数的规范形式。
 void dataflow(Input0, Input1, Output0, Output1)
 {
 #pragma HLS dataflow
 UserDataType C0, C1, C2;
 func1(read Input0, read Input1, write C0, write C1);
 func2(read C0, read C1, write C2);
 func3(read C2, write Output0, write Output1);
 }
 2. Loop body中的Dataflow
 For the for loop (where no function inside is inlined), the integral loop variable should have:对于For循环(其中没有内联函数)，整环变量应该有:
 a. 在循环头中声明并设置为0的初始值
 b. 循环条件是一个正的常数值或常数函数参数
 c. 以1递增.
 d. Dataflow pragma需要在循环内部. 
  void dataflow(Input0, Input1, Output0, Output1){
for (int i = 0; i < N; i++){
	#pragma HLS dataflow
	UserDataType C0, C1, C2;
	func1(read Input0, read Input1, write C0, write C1);
	func2(read C0, read C0, read C1, write C2);
	func3(read C2, write Output0, write Output1);
	}
}
 
  2.7.2 Canonical Body 
  在规范区域内，规范主体应遵循以下准则 
   
   Use a local, non-static scalar or array/pointer variable, or local static stream variable. A local
 variable is declared inside the function body (for dataflow in a function) or loop body (for
 dataflow inside a loop). 
   A sequence of function calls that pass data forward (with no feedback), from a function to
 one that is lexically later, under the following conditions:
 a. Variables (except scalar) can have only one reading process and one writing process.
 b. Use write before read (producer before consumer) if you are using local variables, which
 then become channels.
 c. Use read before write (consumer before producer) if you are using function arguments.
 Any intra-body anti-dependencies must be preserved by the design.
 d. Function return type must be void.
 e. No loop-carried dependencies among different processes via variables.
 • Inside the canonical loop (i.e., values written by one iteration and read by a following
 one).
 • Among successive calls to the top function (i.e., inout argument written by one
 iteration and read by the following iteration). 
   
  2.7.3 Dataflow Checking 
  Vivado HLS有一个dataflow 检查器，当启用该检查器时，它将检查代码是否符合建议的规范形式(canonical form)。否则它将向用户发出错误/警告消息。默认情况下，此检查器设置为警告。您可以通过在config_dataflow TCL命令的严格模式中选择off来将检查器设置为error或禁用它 
  config_dataflow -strict_mode (off | error | warning)
 
  2.7.4 Dataflow Optimization Limitations 
  DATAFLOW优化可优化任务（功能和循环）之间的数据流，理想情况下可优化流水线化的功能和循环，以实现最佳性能。 不需要将这些任务一个接一个地链接起来，但是在数据传输方式上有一些限制。
 以下行为可以阻止或限制Vivado HLS通过DATAFLOW优化执行的重叠：
 • Single-producer-consumer violations违规
 • Bypassing tasks
 • Feedback between tasks
 • Conditional execution of tasks
 • Loops with multiple exit conditions
 IMPORTANT! 如果存在任何这些编码样式，Vivado HLS将发出一条消息来描述这种情况。
 Note: The dataflow viewer in the Analysis Perspective may be used to view the structure when the DATAFLOW directive is applied.
 分析透视图中的数据流查看器可用于在应用DATAFLOW 指令时查看结构。
 。。。 
  Single-producer-consumer Violations 
  Vivado HLS要执行数据流优化，在任务之间传递的所有元素必须遵循单生产者-消费者模型。每个变量必须从单个任务中驱动，并且只能由单个任务使用。在下面的代码示例中，temp1展开并被Loop2和Loop3使用。这违反了单一生产者-消费者模式。 
  void foo(int data_in[N], int scale, int data_out1[N], int data_out2[N]) {
int temp1[N];
	Loop1: for(int i = 0; i < N; i++) {
		temp1[i] = data_in[i] * scale;
	}
	Loop2: for(int j = 0; j < N; j++) {
		data_out1[j] = temp1[j] * 123;
	}
	Loop3: for(int k = 0; k < N; k++) {
		data_out2[k] = temp1[k] * 456;
	}
}
 
  改进版本使用函数分割function Split来创建单生产者-消费者设计。在这种情况下，数据从loop1流到函数分割，然后流到loop2和loop3。现在数据在所有4个任务之间流动，Vivado HLS可以执行数据流优化。 
  void Split (in[N], out1[N], out2[N]) {
// Duplicated data
	L1:for(int i=1;i<N;i++) {
		out1[i] = in[i];
		out2[i] = in[i];
	}
}

void foo(int data_in[N], int scale, int data_out1[N], int data_out2[N]) {
int temp1[N], temp2[N]. temp3[N];
	Loop1: for(int i = 0; i < N; i++) {
		temp1[i] = data_in[i] * scale;
	}
	Split(temp1, temp2, temp3);
	Loop2: for(int j = 0; j < N; j++) {
		data_out1[j] = temp2[j] * 123;
	}
	Loop3: for(int k = 0; k < N; k++) {
		data_out2[k] = temp3[k] * 456;
	}
}
 
  Bypassing Tasks 
  Feedback Between Tasks 
  当一个任务的输出被DATAFLOW区域中的前一个任务使用时，将发生反馈。在DATAFLOW区域中不允许任务之间的反馈。当Vivado HLS检测到反馈时，它会根据情况发出警告，并且可能不会执行DATAFLOW优化。 
  Conditional Execution of Tasks 
  DATAFLOW优化并不优化有条件执行的任务。下面的示例强调了这种限制。在本例中，Loop1和Loop2的条件执行阻止Vivado HLS优化这些循环之间的数据流，因为数据不是从一个循环流向下一个循环。 
  void foo(int data_in1[N], int data_out[N], int sel) {
int temp1[N], temp2[N];
	if (sel) {
		Loop1: for(int i = 0; i < N; i++) {
			temp1[i] = data_in[i] * 123;
			temp2[i] = data_in[i];
		}
	} 
	else {
		Loop2: for(int j = 0; j < N; j++) {
			temp1[j] = data_in[j] * 321;
			temp2[j] = data_in[j];
		}
	}
	Loop3: for(int k = 0; k < N; k++) {
		data_out[k] = temp1[k] * temp2[k];
	}
}
 
  为了确保在所有情况下都执行每个循环，您必须转换如下面的示例所示的代码。在本例中，条件语句被移动到第一个循环中。两个循环总是被执行，数据总是从一个循环流向下一个循环。 
  void foo(int data_in[N], int data_out[N], int sel) {
	int temp1[N], temp2[N];
	Loop1: for(int i = 0; i < N; i++) {
		if (sel) {
		temp1[i] = data_in[i] * 123;
		} 
		else {
		temp1[i] = data_in[i] * 321;
		}
	}
	Loop2: for(int j = 0; j < N; j++) {
		temp2[j] = data_in[j];
	}
	Loop3: for(int k = 0; k < N; k++) {
		data_out[k] = temp1[k] * temp2[k];
	}
}
 
  Loops with Multiple Exit Conditions 
  在数据流区域中不能使用具有多个出口点的循环。在下面的示例中，Loop2有三个退出条件 
  2.7.5 Configuring Dataflow Memory Channels 
  Vivado HLS将任务之间的通道实现为乒乓缓冲区或FIFO缓冲区，具体取决于数据的生产者和消费者的访问模式： 
   
   对于标量、指针和引用参数，Vivado HLS将通道实现为FIFO 
   如果参数(生产者或消费者)是一个数组，Vivado HLS将通道实现为一个乒乓缓冲区或FIFO，如下所示:
  ○ 如果Vivado HLS确定按顺序访问数据，则Vivado HLS将存储通道实现为深度为2的FIFO通道。.
 ○ 如果Vivado HLS无法确定是否按顺序访问数据或确定以任意方式访问数据，则Vivado HLS将存储通道实现为乒乓缓冲区，即作为两个Block RAM，每个RAM由 使用者或生产者数组的最大size定义。
 Note:乒乓缓冲确保通道始终有能力容纳所有样本而不损失。然而，在某些情况下，这可能是一种过于保守的方法
 要显式指定任务之间使用的默认通道，请使用config_dataflow配置（There is no pragma equivalent）。 此配置为设计中的所有通道设置默认通道。 为了减小通道中使用的内存大小并允许迭代内重叠，可以使用FIFO。  要在FIFO中显式设置深度（即元素数），请使用-fifo_depth选项。  
   
  指定FIFO通道的大小将覆盖默认方法。如果设计中存在任务，其能够以比指定的FIFO大小更大的速度生成或消耗样本，则FIFOs可能变为空的(或满的)。在这种情况下，设计将停止操作，因为它无法读(或写)。这可能会导致陷入僵局deadlock状态。 
  Note:如果出现了死锁deadlocked的情况，那么只有在执行C/RTL co-simulation或在完整的系统中使用该模块时才会看到这种情况。 
 当设置fifo的深度,Xilinx建议初始深度设置为=要传输数据的最大值(例如,任务之间传递的数组的大小),在程序设计通过C/RTL co-simulation后,然后减少fifo的大小，但要确保C/RTL co-simulation仍然没有问题。如果RTL co-simulation失败，则FIFO的大小可能太小，无法防止出现stalling or a deadlock情况。 
  解决deadlock的方法：
 当设置fifo的深度,Xilinx建议最初设置深度最大数量的传输数据值(例如,数组的大小之间传递任务),确认设计通过C/RTL co-simulation,然后减少fifo的大小，确保C/RTL co-simulation仍然完成没有问题。如果RTL co-simulation失败，则FIFO的大小可能太小，无法防止出现stalling or a deadlock情况。 
  2.7.6 Specifying Arrays as Ping-Pong Buffers or FIFOs 
  默认数组都实现为乒乓，以支持随机访问。如果需要，还可以调整这些缓冲区的大小。例如，在某些情况下，例如绕过某个任务时，可能会出现性能下降。
 为了减轻对性能的影响，可以通过使用如下所示的STREAM directive来增加这些缓冲区的大小，从而为生产者和消费者提供更多的缓冲空间。
 （pragma HLS stream作用：在使用DATAFLOW优化时，将特定数组实现为FIFO或RAM存储通道。STREAM 指定将特定存储通道实现为具有可选特定深度的FIFO。） 
  void top ( ... ) {
#pragma HLS dataflow
int A[1024];
#pragma HLS stream off variable=A depth=3
	producer(A, B, …); // producer writes A and B
	middle(B, C, ...); // middle reads B and writes C
	consumer(A, C, …); // consumer reads A and C
 
  如果将顶层函数接口上的数组设置为接口类型ap_fifo、axis或ap_hs，则数组自动指定为streaming。
 在设计内部，如果需要实现FIFO，则必须使用STREAM指令将所有阵列指定为streaming。 
  Note：当STREAM指令应用于一个数组时，在硬件中实现的FIFO，并且FIFO包含与数组相同的元素。 -depth选项可用于指定FIFO的大小。 
  STREAM指令还用于更改config_dataflow配置指定的默认实现中DATAFLOW区域中的任何数组。 
   
   如果config_dataflow default_channel设置为乒乓，那么任何数组都可以通过将STREAM指令应用到数组中来实现FIFO。
 注意:要使用FIFO实现，必须以流的方式访问数组。 
   如果config_dataflow default_channel设置为FIFO或Vivado HLS已自动确定以streaming方式访问DATAFLOW区域中的数据，则仍可以通过将STREAM指令(带有-off option)应用于数组来将任何数组实现为乒乓实现。 
   
  IMPORTANT! 为了保留访问，可能有必要通过使用volatile限定符来防止编译器优化（尤其是消除死代码）。 
  当DATAFLOW区域中的数组被指定为streaming并实现为FIFO时，通常不要求FIFO保存与原始数组相同数量的元素。DATAFLOW区域中的tasks在每个数据样本可用时立即消耗它。
 带有-fifo_depth选项的config_dataflow命令或带有-depth的STREAM指令可用于将FIFO的大小设置为确保数据流永不停止所需的最小元素数量。
 如果选择了off选项，则off选项设置乒乓缓存的深度(块的数量)。深度至少为2。 
  2.7.7 Specifying Compiler-FIFO Depth 
  Start Propagation 
  编译器可能会自动创建一个start FIFO来将一个start令牌传播到内部进程。这样的fifo有时会成为性能的瓶颈，在这种情况下，您可以使用以下命令增加默认大小(固定为2)
 config_dataflow -start_fifo_depth 
 如果生产者和消费者之间需要一个无界的松弛(unbounded slack)，并且内部流程可以永远运行，完全且安全地由它们的输入或输出(fifo或PIPOs)驱动，那么可以使用pragma在给定的数据流区域内删除这些start fifo，用户承担风险
 #pragma HLS DATAFLOW disable_start_propagation 
  Scalar Propagation 
  编译器通过进程之间的scalar FIFO自动传播C / C ++代码中的某些标量。 此类FIFO有时可能是性能的瓶颈或导致死锁，在这种情况下，可以使用以下命令设置大小（默认值设置为-fifo_depth）：
 config_dataflow -scalar_fifo_depth  
  2.7.8 Stable Arrays 
  stable pragma可用于标记数据流区域的输入或输出变量。 假设用户保证此删除确实是正确的，则其效果是删除其相应的同步。 
  void dataflow_region(int A[...], ...
#pragma HLS stable variable=A
#pragma HLS dataflow
proc1(...);
proc2(A, ...);
 
  如果没有稳定的编译指示，并且假定proc2读取了A，则proc2对于它所在的数据流区域，将是初始同步的一部分（通过ap_start）。 这意味着proc1在proc2也准备好再次启动之前不会重新启动，这将防止数据流迭代重叠，并可能导致性能损失。 稳定的实用指示表明此同步对于保持正确性不是必需的。 在前面的示例中，如果没有稳定的编译指示，并且假设proc2绕过任务读取了proc2，则将导致性能下降。 有了稳定的编译指示，编译器假定:
 • if A is read by proc2, then the memory locations that are read will not be overwritten, by any other process or calling context, while dataflow_region is being executed.
 • if A is written by proc2, then the memory locations written will not be read, before their definition, by any other process or calling context, while dataflow_region is being
 executed. 
  典型的情况是，仅当数据流区域尚未启动或已完成执行时，调用方才更新或读取这些变量。 
  2.7.9 Using ap_ctrl_none Inside the Dataflow 
  ap_ctrl_none块级I / O协议避免了ap_ctrl_hs和ap_ctrl_chain协议所隐含的严格同步方案。 这些协议要求该区域中的所有进程执行完全相同的次数，以便更好地匹配C行为。
 但是，在某些情况下，例如，我们的目的是让执行更频繁的更快的进程将工作分配给几个更慢的进程。 对于任何数据流区域（“循环数据流”除外），可以指定
 #pragma HLS interface ap_ctrl_none port=return
 只要满足以下所有条件: 
   
   The region and all the processes it contains communicates only via FIFOs (hls::stream,
 streamed arrays, AXIS); that is, excluding memories. 
   All the parents of the region, up to the top level design, must fit the following requirements:
 ○ They must be dataflow regions (excluding “dataflow-in-loop”).
 ○ They must all specify ap_ctrl_none. 
   
  这意味着在层次结构中具有ap_ctrl_none的数据流区域的父级不能是:
 • A sequential or pipelined FSM
 • A dataflow region inside a for loop (“dataflow-in-loop”)
 这个pragma的结果是ap_ctrl_chain不用于同步该区域内的任何进程。它们是根据输入fifo中的数据可用性和输出fifo中的空间来执行或停止的。例如 
  void region(...) {
#pragma HLS dataflow
#pragma HLS interface ap_ctrl_none port=return
	hls::stream<int> outStream1, outStream2;
	demux(inStream, outStream1, outStream2);
	worker1(outStream1, ...);
	worker2(outStream2, ....);
 
  In this example, demux can be executed twice as frequently as worker1 and worker2. For example, it can have II=1 while worker1 and worker2 can have II=2, and still achieving a global II=1 behavior.
 Note:
 • Non-blocking reads may need to be used very carefully inside processes that are executed less frequently to ensure that C simulation works.
 • The pragma is applied to a region, not to the individual processes inside it.
 • Deadlock detection must be disabled in co-simulation. This can be done with the
 -disable_deadlock_detection option in cosim_design. 
  3 Optimizing for Latency 
  1.Using Latency Constraints 
  2.Merging Sequential Loops to Reduce Latency 
  3.Flattening Nested Loops to Improve Latency 
  4 Optimizing for Area 
  1.Data Types and Bit-Widths 
   
   为数据类型使用适当的精度 
   确定要实现为ram或寄存器的任何数组的大小。任何过大元素的区域影响都会浪费硬件资源。 
   特别注意乘法、除法、模数或其他复杂的算术运算。如果这些变量比需要的大，则会对区域和性能产生负面影响 
   
  2.Function Inlining 
  3.Mapping Many Arrays into One Large Array 
  4.Array Mapping and Special Considerations 
  5.Array Reshaping 
  6.Function Instantiation 
  7.Controlling Hardware Resources 
  5 Optimizing Logic 
  1.Controlling Operator Pipelining 
  2.Optimizing Logic Expressions

Shader编写指南(六十一):使用 Visual Studio 调试 Unity 着色器（Windows 平台）小李也疯狂 visual studio unity 着色器 shader
在Windows平台上，可通过VisualStudio结合DirectX11/12对Unity着色器进行调试。以下是详细步骤及注意事项：一、准备工作：启用调试符号在需要调试的着色器中添加编译指令，确保生成包含调试符号的代码：hlsl#pragmaenable_d3d11_debug_symbols//启用DirectX11调试符号//或针对DirectX12（需配合PIX调试）注意：该指令会导致性
ceph报错整理时空无限 Kubernetes ceph linux 运维 kubernetes
xxdaemonshaverecentlycrashedceph-scluster:id:d82dfc33-6a35-4fa4-b5f0-c32979b714cdhealth:HEALTH_WARN74daemonshaverecentlycrashedcephcrashlsIDENTITYNEW2024-07-26T06:17:34.480675Z_bd4c30b7-2347-4307-a9e6
访问 chls.pro/ssl 进不去？别慌！Charles 救星在此！测试界的段子手 ssl 网络协议网络
各位小伙伴们，有没有遇到过这样的尴尬情况：兴致勃勃地想用Charles抓包，结果发现访问chls.pro/ssl怎么都进不去？就像想吃火锅却发现煤气罐没气一样，瞬间感觉人生都灰暗了！别担心！作为一名资深（被迫）踩坑选手，我来拯救你们于水火之中！问题描述：当你信心满满地打开浏览器，输入chls.pro/ssl，期待着Charles证书的下载页面出现时，却发现页面一片空白，或者直接提示连接超时。内心O
深入探索视频格式标准及其应用 D哥有个初二君
本文还有配套的精品资源，点击获取简介：视频格式标准对于数字媒体的编码、存储、传输和播放至关重要，它涵盖了容器格式、视频编码、音频编码等多个方面。本简介详细介绍了容器格式如MP4、AVI、MKV和TS；常见的视频编码标准包括H.264/AVC、H.265/HEVC、VP9和AV1；音频编码标准有AAC、FLAC和Opus；格式转换和流媒体协议如RTMP、HLS和DASH的重要性；以及分辨率和帧率对视
Unreal Engine开发：高级渲染技术_4.高级着色器编程 chenlz2007 游戏开发虚幻着色器游戏引擎数据库网络 rpc
4.高级着色器编程在上一节中，我们探讨了UnrealEngine中的基础渲染技术，包括光照、阴影和材质系统。本节将深入探讨高级着色器编程，帮助您掌握更复杂的渲染效果和优化技术。UnrealEngine的着色器系统是基于HLSL（High-LevelShadingLanguage）和USF（UnrealShaderFormat）的，这两种语言允许开发者编写高效的着色器代码，以实现各种视觉效果。4.1
一个可以在线播放 m3u8 的网页（非常实用）西门吹雪1998 腾讯云前端
之前在做安卓直播流hls播放的功能，有时候失败了，不知道啥问题，就一直想着找一个可以在线播放的地方测试一下，找了好久终于找到一个，记录一下，以防下次需要用到。地址：https://m3u8player.org
主流视频流格式及 Vue3 实现方案玛卡巴卡半夜不睡觉 html5 前端 vue.js
1.HLS(HTTPLiveStreaming)技术原理：基于HTTP的流媒体协议，使用.m3u8索引文件+.ts分片文件。特点：高兼容性（尤其iOS）、10+秒延迟、支持自适应码率。Vue3实现（video.js）：npminstallvideo.jsvideojs-contrib-hlsimport{ref,onMounted,onUnmounted}from'vue';importvideo
vscode配置vim silenci vscode vim excel
{"editor.fontSize":16,"editor.fontWeight":"normal","editor.fontFamily":"'FiraCode'","C_Cpp.enhancedColorization":"enabled","vim.normalModeKeyBindings":[{"before":["g","d"],"after":["*"]}],"vim.hlsearc
Vue3 - 详解播放m3u8视频流+HLS拉流推流完整方案，vue3如何播放m3u8格式文件实时视频播放教程（流媒体播放、直播视频流、实时摄像头监控视频流对接、后端服务器切片分片传输视频流边下边播）王二红 +Vue3 开发问题汇总 vue3 m3u8 hls vue3播放m3u8视频流教程 vue播放m3u8文件 vue3直播视频流播放摄像头实时监控画面视频流
前言如果您需要Vue2版本，请访问这篇文章。在vue3（PC端+移动端H5）项目开发中，实现m3u8+hls视频流播放、实时流媒体播放高性能无延迟方案及源码，vue3播放3mu8文件/直播视频流，实时流媒体播放需求、做直播实时传输播放、摄像头监控画面视频流、服务器后端视频切片分段返给前端+边下边播等需求，解决前端网页播放视频流卡顿加载慢、无法载入黑屏、播放不流畅、CORS跨域、安卓苹果浏览器兼容等
Vitis HLS 学习笔记--hls::stream（理解串流：基础） hi94 Vitis HLS 学习笔记 c++fpga开发 HLS
目录1.介绍2.示例2.1代码解析2.2定义串流2.3串流的综合报告3.总结1.介绍在VitisHLS中，hls::stream是一个用于在C/C++中进行高级合成的关键数据结构。它类似于C++标准库中的std::stream，但是专门设计用于硬件描述语言（如Verilog或VHDL）中的数据流。hls::stream提供了一种方便的方法来处理数据流，使得在设计硬件加速器时更加灵活和可控。hls:
Vue3+TS 视频播放器组件封装（Video.js + Hls.js 最佳组合，从零基础到精通，收藏这篇就够了！
.hljs-comment,.hljs-quote{color:#b6b18b}.hljs-deletion,.hljs-name,.hljs-regexp,.hljs-selector-class,.hljs-selector-id,.hljs-tag,.hljs-template-variable,.hljs-variable{color:#eb3c54}.hljs-built_in,.hlj
SRS(Simple Realtime Server) 开源直播/双录服务器 @井九开源服务器运维
一、SRS是什么？SRS（SimpleRealtimeServer）是一个纯C++编写的高性能开源流媒体服务器，目标是打造简单、高效、易用、支持多协议的直播服务系统。自2013年开源以来，已成为国内外广泛使用的RTMP/WebRTC服务端方案之一。核心特性：支持主流直播协议：RTMP、HTTP-FLV、HLS、WebRTC、SRT、GB28181⚡支持亚秒级延迟：特别是WebRTC和HTTP-FL
【以及好久没上号的闲聊】Unity记录8.1-地图-重构与优化 MWHLS Unity unity 开源
最近几年越来越懒，要是能分身多好哇，大家教教我懒得更CSDN了，所以不是很常上号，而CSDN的两周前私信显示的灰灰的也就是虽然我每次上号都有看私信，但是搞笑的是前面四个明显的消息全是CSDN的广告，我压根没看到两周前未读的私信很抱歉各位私信的好同志们这么久没回所以我特意找出了我这个游戏的开源起始篇，这篇我甚至在我自己博客上都还没发出来我的博客：mwhls.top虽然这个游戏可能还得再做好几年吧，反
FPGA基础 -- Verilog函数 sz66cm FPGA基础 fpga开发
Verilog函数（function）目标：让具备一般RTL经验的工程师，系统掌握Verilog函数的语法、约束、可综合写法以及在实际项目中的高效用法，为后续SystemVerilog及HLS设计奠定基础。1为什么要用函数？设计痛点函数带来的价值重复逻辑：CRC、Parity、优先编码等往往在多个模块出现将共用运算封装为函数，避免复制粘贴，减少Bug概率可读性差：长表达式嵌套写在连线或always
流媒体之LL-HLS 低延时HLS协议艾浅觅流媒体协议开发知识网络
文章目录1背景2LL-HLS协议2.1部分分段（PartialSegments）2.2播放列表增量更新（PlaylistDeltaUpdates）2.3阻止播放列表重新加载（BlockingofPlaylistReloads）2.4预加载提示（PreloadHints）2.5完整示例3总结LL-HLS是一个低延时HLS协议，它与HLS协议相比，在传输时，将视频数据分成多个小片，每个小片大小为1MB
MMDet实例分割loss_rpn_bbox为nan但其它loss正常的解决 MWHLS python python pytorch 深度学习人工智能
文章首发见博客：https://mwhls.top/4901.html。无图/格式错误/后续更新请见首发页。更多更新请到mwhls.top查看欢迎留言提问或批评建议，私信不回。昨天还以为这个月无活可整，没想到第二天就来事了，下个月还好久，留到下月发也不大好(º﹃º)。问题描述使用MMDetection训练实例分割，训练可执行，测试可执行，但loss_rpn_bbox为nan，loss_bbox却有
ffmpeg ，结合 SSRF任意文件读取漏洞德古拉的杂货铺渗透测试篇 ffmpeg 安全漏洞视频处理
ffmpeg，结合SSRF任意文件读取漏洞前言一、ffmpeg是什么？FFmpeg背景知识简介HLS(HTTPLiveStreaming)二、使用步骤CentOS7下的安装三、ffmpeg任意文件读取漏洞复现环境搭建漏洞利用修复建议前言初衷：最近空闲，想通过vulhub靶场进行学习，猛的看到ffmpeg，很熟悉。在2018年开发的堡垒机时，曾经用过它进行视频文件的处理。于是决定从它开始练习写博客。
MATLAB基础应用精讲-【数模应用】RGB三色合成与分离（附MATLAB代码实现）林聪木 opencv 人工智能计算机视觉
目录知识储备RGB三色原理HLS(色相、亮度、饱和度)原理算法原理什么是RGB彩色合成RGB三色的合成与分离图片的色彩空间转换色彩空间转换通道分离、合并图像rgb通道分离通道的拆分与合并通过函数拆分通道合并图像处理——颜色算子实验配置准备实验代码代码实现MATLAB知识储备RGB三色原理在中学的物理课中我们可能做过棱镜的试验，白光通过棱镜后被分解成多种颜色逐渐过渡的色谱，颜色依次为红、橙、黄、绿、
全面掌握SRS服务器在CentOS7上的安装与配置 seiji morisako
本文还有配套的精品资源，点击获取简介：SRS（SimpleRealtimeServer）是一个高效实时视频流服务服务器，尤其在LinuxCentOS764位操作系统上运行良好。它的5.0版本支持包括RTMP、WebRTC、HLS、HTTP-FLV、SRT和MPEG-DASH在内的多种网络协议，满足不同直播场景的视频传输需求。此压缩包包含安装和配置SRS所需的所有文件和文档。用户可通过修改配置参数，
Shader编写指南(六十): Shader运行时性能优化小李也疯狂 #理解着色器【Shader】性能性能优化 unity shader
不同平台的GPU性能差异显著（如高端PCGPU与低端移动GPU），为确保游戏在各类设备上流畅运行，需针对性优化着色器，减少计算量和纹理读取。以下是关键优化策略及实践建议：一、按需计算，避免冗余操作1.精简计算逻辑移除无效参数：若材质属性（如颜色）始终为固定值，直接在着色器中硬编码，避免动态计算。hlsl//反例：始终使用白色，仍从材质获取颜色fixed4color=_MainColor;//优化：
婚恋小程序直播系统框架搭建 ALLSectorSorft 小程序
逻辑分析直播流管理：需要处理主播端的直播流推送，确保直播流能够稳定、高效地传输到各个观看用户的设备上。这涉及到选择合适的流媒体协议，如RTMP（Real-TimeMessagingProtocol）、HLS（HTTPLiveStreaming）等。用户连接与互动：管理观众的连接，让他们能够顺利进入直播间观看直播。同时，提供互动功能，如聊天、点赞、送礼物等，增强用户之间以及用户与主播之间的互动性。直
使用jessibuca+wvp+zlm实现html无插件播放摄像头实时画面 nov4th webrtc html 前端实时音视频
使用jessibuca+wvp+zlm实现html无插件播放摄像头实时画面环境一、flv、hls简易版二、进阶操作环境wvp+zlmjessibuca.jshtml5+jquerycrypto-js.min.js一、flv、hls简易版简易版播放停止销毁varshowOperateBtns=true;//是否显示按钮varjessibuca=null;//播放器对象//初始化播放器function
nginx搭建直播推流服务&推流拉流鉴权 NaughtyBo 视频&流媒体 nginx
文章目录学习链接步骤使用nginx搭建直播推流服务安装依赖库下载nginx-http-flv-module模块下载nginx解压nginx，进入nginx目录设置nginx编译配置编译并安装配置nginxrtmp服务启动nginx准备另外一台电脑下载OBS下载OBSwindows|linux安装vlc观看直播flv协议hls协议使用ffmpeg命令行推流推流鉴权&拉流鉴权1、版本2、安装步骤3、n
从零搭建云点播系统（一）：开源组件选型、安全加密与成本优化 Ai财富密码副业项目开源安全
笔者最近在开发几个项目，需要内网搭建在线视频系统，于是做了相关调研分析了领课在线教育、酷瓜云等，其中主要用的技术是云点播，云点播系统的实现依赖于多项关键技术：流媒体协议（如HLS、DASH）通过自适应码率技术保障流畅播放；分布式存储（如FastDFS）与智能转码（FFmpeg）实现海量资源的弹性管理与多端适配；P2P网络与CDN边缘计算突破带宽瓶颈，降低分发延迟；多级加密方案（AES、DRM）与数
vue+ThreeJs 创建过渡圆圈效果资深前端之路 threeJs vue.js javascript 前端
嗨，我是小路。今天主要和大家分享的主题是“vue+ThreeJs创建过渡圆圈效果”。今天在做着色器过渡效果练习，发现出现了很多新的函数，这些都超出了js之外，需要更多的掌握和学习。以下是自己的复盘和梳理。1.获取距离定义：distance获取两个点之间的距离2.平滑过渡定义：smoothstep函数是用来平滑插值的函数。在HLSL或者其他着色语言中，smoothstep可能用于生成平滑的过渡效果，
通过vivado HLS设计一个FIR低通滤波器 fpga和matlab Vivado HLS开发 vivado HLS FIR低通滤波器
目录1.FIR参数确定2.FIR系数计算3.C/C++代码实现4.VivadoHLS项目创建与配置4.1在VivadoHLS中创建新项目并配置4.2在VivadoHLS中执行C仿真4.3执行C综合以将C代码转换为RTL4.4进行RTL级仿真验证4.5导出IP4.6在Vivado中集成IPVivadoHLS是一款强大的高层次综合工具，可将C/C++代码转换为硬件描述语言（HDL），显著提升FPGA开
求助：uniapp+video+hls播放m3u8视频IOS遇到播放问题 mingxia_jiang uni-app 音视频
uniapp+video+hls微信h5中，ios使用hls.js加载处理m3u8视频时会监控到报错Hls.Events.ERROR，详情是我这边测试data.fatal是false，type是mediaError，我是用hls.recoverMediaError()尝试恢复播放，在调用recoverMediaError()方法后，错误事件仍然触发，并且data.fatal变为true，data.
vivadoHLS优化 ailao4622
//HLS数据类型：ap_fixed--------------------------------------------------------------------------（优化）Directive（函数/类->变量/对象）InsertDirective（优化措施ug902->designoptimization）Directive:DATA_PACK对结构体打包:INTERFACE对
前端开发 HTML5 视频直播实现方案前端视界前端艺匠馆 html5 音视频前端 ai
前端开发HTML5视频直播实现方案关键词：HTML5视频直播、WebRTC、RTMP、HLS、WebSocket、媒体流处理、实时通信摘要：本文系统解析基于HTML5的视频直播技术体系，涵盖核心原理、协议对比、开发流程与实战案例。通过深入剖析WebRTC、RTMP、HLS等关键技术，结合媒体捕获API、编码算法和流媒体服务器架构，提供从前端采集到后端处理的完整解决方案。适合前端开发者、流媒体工程师
MMDet加载旧版本代码权重及自定义数据集的问题及解决 MWHLS python python pytorch mmdet
文章首发见博客：https://mwhls.top/4881.html。无图/格式错误/后续更新请见首发页。更多更新请到mwhls.top查看欢迎留言提问或批评建议，私信不回。场景PyTorch说它们2.0很快，那么就安个最新的Torch和MMDet。打开两年前的顶会文章，复制更早几年的代码文件以及权重。找个数据集。按照最新的config进行配置权重路径。然而，找不到加载权重。解决config配置
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

ug902-ch1：High-Level Synthesis-Optimizing the Design

文章目录

1. Clock, Reset, and RTL Output

2. Optimizing for Throughput

Function and Loop Pipelining

Rewinding Pipelined Loops for Performance

Flushing Pipelines

Automatic Loop Pipelining

Addressing Failure to Pipeline

Static Variables

Partitioning Arrays to Improve Pipelining

Dependencies with Vivado HLS

Removing False Dependencies to Improve Loop Pipelining

Scalar Dependencies

Optimal Loop Unrolling to Improve Pipelining

2.7 Exploiting Task Level Parallelism: Dataflow Optimization

2.7.1 canonical Form： 规范形式

2.7.2 Canonical Body

2.7.3 Dataflow Checking

2.7.4 Dataflow Optimization Limitations

Single-producer-consumer Violations

Bypassing Tasks

Feedback Between Tasks

Conditional Execution of Tasks

Loops with Multiple Exit Conditions

2.7.5 Configuring Dataflow Memory Channels

2.7.6 Specifying Arrays as Ping-Pong Buffers or FIFOs

2.7.7 Specifying Compiler-FIFO Depth

2.7.8 Stable Arrays

2.7.9 Using ap_ctrl_none Inside the Dataflow

3 Optimizing for Latency

1.Using Latency Constraints

2.Merging Sequential Loops to Reduce Latency

3.Flattening Nested Loops to Improve Latency

4 Optimizing for Area

1.Data Types and Bit-Widths

2.Function Inlining

3.Mapping Many Arrays into One Large Array

4.Array Mapping and Special Considerations

5.Array Reshaping

6.Function Instantiation

7.Controlling Hardware Resources

5 Optimizing Logic

1.Controlling Operator Pipelining

2.Optimizing Logic Expressions

你可能感兴趣的:(HLS)

2.7.1 canonical Form：规范形式