祥瑞Coding

卷积操作的HLS优化初步操作

背景：卷积操作运用到了三个for循环，非常耗时耗力，HLS综合之后需要耗费很多时钟周期，我们需要对卷积操作进行相应的优化，从而减少卷积运行的时间。

目的：优化卷积操作。

目录

0.原始未优化情况

0.1 testBench确保程序正确

0.2 原始时钟周期

1. 最内层pipeline

1.1直接pipeline

1.2 读写指令分开

1.3 创建变量用于存储

2. 批量读写卷积操作

2.1 array_partation

2.1.1 #define PARA_NUM 128

2.1.2 #define PARA_NUM 64

2.1.3 #define PARA_NUM 32

2.1.3 #define PARA_NUM 2

2.1.4 删掉第三个for循环的pipeline

2.1.5 用pipeline但去掉array_partation

3. 将数据实现在片上BRAM

3.1 直接运行

3.2 pipeline指令

0.原始未优化情况

//convolution codes
    M_kernelNum:
    for(i = 0; i < M; ++i){
    	N_kernelSize:
	for(k = 0; k < K; ++k){
            float A_PART = ALPHA*weight[i*lda+k];
	    K_outFeatureSize:
	    for(j = 0; j < N; ++j){
                output[i*ldc+j] += A_PART*feature[k*ldb+j];
            }
        }
    }

    //0 Init Program
    mloop_kernelNum:for(i = 0; i < M; ++i){
        kloop_kernelSize:for(k = 0; k < K; ++k){
            float A_PART = ALPHA*weight[i*K+k];
            nloop_featureSize:for(j = 0; j < N; ++j){
                output[i*N+j] += A_PART*feature[k*N+j];
            }
        }
    }

也可以写成下面这种形式。读写与运算指令分开，但是图也是一样的。

	float A_PART,product,sum;
	//0 Init Program
    mloop_kernelNum:for(i = 0; i < M; ++i){
        kloop_kernelSize:for(k = 0; k < K; ++k){
            A_PART = ALPHA*weight[i*K+k];
            nloop_featureSize:for(j = 0; j < N; ++j){
				product=A_PART*feature[k*N+j];
				sum=product+output[i*N+j];
                output[i*N+j] = sum;
            }
        }
    }

从BRAM上，读需要四个时钟周期，写需要两个时钟周期，加和乘个四个时钟周期。

0.1 testBench确保程序正确

testBench采用原始的算法与更改后的卷积算法进行对比，为了确保卷积操作是无误的。

#include 
#include 
#include 

#include "gemmOpt.cpp"

int main(){
	
	int M,N,K;
	float ALPHA=1;
	int i,j,k;
	float *weight, *feature, *output_core, *output_sw;
	M=16; K=27, N=173056;
	//weight[M*K],feature[K*N],output[M*N]
	
	//weight A[M*K], input B[K*N],output C[M*N]
	weight = ( float *)malloc(M*K*sizeof( float)+N*K*sizeof( float)+M*N*sizeof( float));
	feature = &weight[M*K];
	output_core=&feature[K*N];
	output_sw  =( float *)malloc(M*N*sizeof( float));
	volatile float *PtrMig=weight;

	//initialize value
	for(i=0; i %f\n", i, output_sw[i], output_core[i]);
		error=1;
		}
    }
	printf("	Comparison between Software and core finished!\n");
	if(error==1)
		printf("	FAILED!\n");
	else
		printf("	SUCCESS!\n");
	
	return 0;
}

0.2 原始时钟周期

这个卷积为变长度卷积，因此不能直接展开（Unroll指令）。仿真时需要用tripcount指令确定循环上限，这样我们就能知道相应的循环latency和interval

直接运行：相应参数

M:16,N:173056,K:27
gemm_nn:A[432],B[4672512],C[2768896]

clockcycles 1680719911,即16亿个时钟周期。

1. 最内层pipeline

1.1直接pipeline

可能pipeline之后更加耗时了。时钟周期由16亿变为11亿。但时钟周期延长了。加rewind指令比不加rewind快一个时钟周期。忽略不计。但是时钟标红表明差错。

1.2 读写指令分开

之前读取，相乘，相加指令在一个for循环之中，现在我们将该指令展开。

//most inner for		
for(j = 0; j < N; ++j){
#pragma HLS PIPELINE rewind
    float featurePart=feature[k*N+j];
    float product=A_PART*featurePart;
    output[i*N+j] +=product;
}

1.3 创建变量用于存储

	int i,j,k;
	float featurePart,A_PART,product;
    M_kernelNum:
	for(i = 0; i < M; ++i){
    	N_kernelSize:
		for(k = 0; k < K; ++k){
			A_PART = ALPHA*weight[i*K+k];
			K_outFeatureSize:
			for(j = 0; j < N; ++j){
			#pragma HLS PIPELINE rewind
				featurePart=feature[k*N+j];
				product=A_PART*featurePart;
				output[i*N+j] +=product;
			}
		}
	}

最耗时的语句就是读取数组的语句。我们必须想办法将数组一次性读出并且并行运算。

A_PART = ALPHA*weight[i*K+k];

featurePart=feature[k*N+j];

2. 批量读写卷积操作

运用宏指定并行数量，我们将卷积操作更改为下面这种模式，这种模式的卷积可以运用创建宏PARA_NUM进行并行运算。

#define PARA_NUM 1024

	unsigned int paraIters=N/PARA_NUM;
	int tailCalcu;
	int tailNum;
	if (paraIters*PARA_NUM

 
  2.1 array_partation 
   
   
  对最底层循环N进行pipeline，就是对更下层的进行Unroll，也就是并行 
  指令之中运用此指令对运算的数组进行分组，发现确实可以优化运算的时间。 
  2.1.1   #define PARA_NUM 128 
   
   
   风险项多出现在read的时候 
   
  2.1.2 #define PARA_NUM 64 
  时延大概 95亿 
   
   
  时钟周期反而更短，由191亿变为95亿。说明并非越大并行性能就越好。可能还受到其他一些影响。我们在这里看到FF和LUT的数量减少了，说明增大并行数量确实可以增大LUT的用量。但是可能在于读取的时间问题，越大的并行量反而会增加运行的时间。 
   
  但是依然没搞明白为什么减小并行数量反而带来了性能的提升。 
  2.1.3 #define PARA_NUM 32 
  时延大概47亿 
   
   
   
  依然是读取占用较多的时钟周期，7个时钟周期，这个是乘法操作占用四个时钟周期。 
  2.1.3 #define PARA_NUM 2 
  时延大概12亿 
   
   
  在上面那种模式之下，PARA_NUM越小则效果越好。 
  2.1.4 删掉第三个for循环的pipeline 
  PARA_NUM=2,  时延大概43亿，对比之前12亿确实需要加入pipeline流水线更快 
   
  PARA_NUM=16，时延大概233亿， 
   
   果然加入pipeLine是十分必要的。 
  2.1.5 用pipeline但去掉array_partation 
  PARA_NUM 64 
  时延大概95亿，与加array_partation一样 
   
  PARA_NUM 32 
  时延大概47亿，与不加arrayPartation一样。 
   
  3. 将数据实现在片上BRAM 
  3.1 直接运行 
   
   
  一次典型的操作。两次读，一次乘一次加，一次写。 
   3.2 pipeline指令 
   
   
  时钟周期变到8亿多，但是读和写操作作为风险项被标出来。


    
        你可能感兴趣的:(FPGA,机器学习)
        
            
                
                    TensorFlow GPU 2.10.1 for Python 3.9快速安装指南
                        疑样

                        本文还有配套的精品资源，点击获取简介：TensorFlowGPU2.10.1是专为Windowsx64和Python3.9设计的TensorFlow版本，它集成了GPU支持以加快深度学习模型的训练。本指南提供了该版本的概述、安装步骤及注意事项，旨在帮助开发者利用其性能优势提升机器学习项目的效率。1.TensorFlowGPU介绍1.1TensorFlow的起源与功能TensorFlow是由Goog
                    
                    进阶向:基于Python的智能客服系统设计与实现
                        

                        智能客服系统开发指南系统概述智能客服系统是人工智能领域的重要应用，它通过自然语言处理(NLP)和机器学习技术自动化处理用户查询，显著提升客户服务效率和响应速度。基于Python的实现方案因其丰富的生态系统（如NLTK、spaCy、Transformers等库）、跨平台兼容性以及易于集成的特点，成为开发智能客服系统的首选。系统架构系统核心包括两个主要功能模块：1.API集成模块负责连接各类外部服务，
                    
                    机器学习专栏（62）：手把手实现工业级ResNet-34及调优全攻略
                        

                        目录一、ResNet革命性突破解析1.1残差学习核心思想1.2ResNet-34结构详解二、工业级Keras实现详解2.1数据预处理流水线2.2完整模型实现三、模型训练调优策略3.1学习率动态调整3.2混合精度训练四、性能优化技巧4.1分布式训练配置4.2TensorRT推理加速五、实战应用案例5.1医疗影像分类5.2工业质检系统六、模型可视化分析6.1特征热力图6.2参数量分析七、常见问题解决方
                    
                    模式识别与机器学习课程笔记（1）：数学基础
                        Ro Jace
学习笔记机器学习笔记人工智能
                        模式识别与机器学习课程笔记（1）：数学基础特征矢量和特征空间随机矢量的描述随机矢量的分布函数随机矢量的数字特征随机变量、随机矢量间的统计关系随机矢量的变换正态分布正态分布的定义正态分布随机矢量的性质离散随机矢量及其分布信息论矩阵微分法基本知识矢量或矩阵对于数量变量的微分二、数量函数对于矢量的微分三、矢量函数对于矢量的微分特征矢量和特征空间特征量的类型：物理量、次序量、名义量物理量：直接反映特征的实
                    
                    ADC（Analog-to-Digital Converter，模数转换器）是什么？
                        Yashar Qian
嵌入式ADCmcu嵌入式硬件
                        ADC（Analog-to-DigitalConverter，模数转换器）是什么？ADC（Analog-to-DigitalConverter，模数转换器）是电子系统中一种至关重要的硬件电路或集成模块，它的核心功能是将连续的模拟信号（如电压、电流、温度、压力、声音等物理量转换成的电信号）转换为离散的数字信号（由0和1组成的二进制代码），以便数字系统（如微控制器MCU、处理器CPU、FPGA等）能够
                    
                    6+，基于免疫原性细胞死亡的非肿瘤分型文章，投稿到接收仅一个多月，肿瘤的热点已经传导至非肿瘤生信文章中！
                        生信小课堂

                        影响因子：6.147本文从投稿到接收仅一个多月关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因。2单个疾病结合免疫浸润，热点基因集，机器学习，分子分型等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析目前非肿瘤生信发文的门槛较低，有需要的朋友欢迎交流！研究概述：脑卒中是世界上死亡和残疾的主要原因之一，缺血性中风占80
                    
                    VSCode使用Jupyter完整指南配置机器学习环境
                        z日火
校招学习日记vscodejupyter机器学习
                        接下来开始机器学习部分第一步配置环境：VSCode使用Jupyter完整指南1.安装必要的扩展打开VSCode，按Ctrl+Shift+X打开扩展市场，搜索并安装以下扩展：必装扩展：Python(Microsoft官方)-Python语言支持Jupyter(Microsoft官方)-Jupyternotebook支持Pylance(Microsoft官方)-Python智能提示和语法检查推荐扩展：
                    
                    养老院管理系统基于SpringBoot的养老院管理系统系统设计与实现（源码+论文+部署讲解等）
                        

                        博主介绍：✌全网粉丝60W+,csdn特邀作者、Java领域优质创作者、csdn/掘金/哔哩哔哩/知乎/道客/小红书等平台优质作者，计算机毕设实战导师，目前专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌技术栈范围：SpringBoot、Vue、SSM、Jsp、HLMT、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习、单片机
                    
                    AI产品经理成长记《零号列车》第一集 邂逅0XAI列车
                        黑客思维者
AI产品经理养成人工智能AI产品经理大模型智能体
                        《零号列车》绝非传统意义上的AI产品经理教程——它是我沉淀二十多年跨行业数字化转型与工业4.0实战经验后，首创的100集大型小说体培养指南。那些曾在千行百业验证过的知识与经验，不再是枯燥的文字堆砌，而是化作一场沉浸式的学习旅程。这里没有生硬的理论灌输，而是用跌宕起伏的故事情节，串联起AI技术的底层逻辑。你会跟着角色的脚步推进剧情，在不知不觉中吃透机器学习、大模型应用等专业概念；更有深入浅出的技术拆
                    
                    人工智能时代下的数据新职业：新兴工作岗位版图研究
                        司南锤
economics人工智能
                        目录摘要第一章：AI驱动的数据价值链重构1.1从“沉睡金矿”到“流动的血液”：数据作为核心经济资产的激活1.2知识的新经济学：零边际成本革命1.3AI作为新的“操作系统”：重塑产业竞争格局第二章：基石层：数据准备与质量保障中的角色2.1数据标注与标签领导力：数据标注经理/主管2.2“地面真实”的守护者：AI数据质量专家第三章：技术核心层：构建AI与机器学习全生命周期的工程角色3.1AI生产线架构师
                    
                    Python领域制造业的Python应用
                        Python编程之道
Python编程之道python开发语言ai
                        Python在制造业中的应用：从自动化到智能制造关键词：Python、制造业、工业自动化、数据分析、机器学习、物联网、智能制造摘要：本文深入探讨Python编程语言在制造业中的广泛应用。从基础的自动化脚本到复杂的智能制造系统，Python凭借其丰富的库生态系统和易用性，正在重塑现代制造业。我们将分析Python在制造业中的核心应用场景，包括设备监控、质量控制、预测性维护和供应链优化等，并通过实际案
                    
                    【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型
                        AIGC零基础入门小白
AI大模型大模型教程人工智能机器学习科技AI大模型AIGCAI教程大模型教程
                        文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
                    
                    多通路fpga 通信_FPGA高速接口PCIe详解
                        weixin_39597636
多通路fpga通信
                        在高速互连领域中，使用高速差分总线替代并行总线是大势所趋。与单端并行信号(PCI总线)相比，高速差分信号(PCIe总线)可以使用更高的时钟频率，从而使用更少的信号线，完成之前需要许多单端并行数据信号才能达到的总线带宽。PCIe协议基础知识PCI总线使用并行总线结构，在同一条总线上的所有外部设备共享总线带宽，而PCIe总线使用了高速差分总线，并采用端到端的连接方式，因此在每一条PCIe链路中只能连接
                    
                    Verilog实现FPGA串口通信详解
                        CodeMystic

                        本文还有配套的精品资源，点击获取简介：FPGA以其灵活性和高效性在数字信号处理和接口通信领域广泛应用。本文详细介绍了使用Verilog硬件描述语言实现FPGA串口通信的基础知识和设计流程。主要内容涵盖UART协议的理解、Verilog中UART模块的定义和实现、设计流程的步骤以及注意事项。通过掌握这些知识点，读者可以学习如何在FPGA上实现UART串口通信，这一技能对于嵌入式系统设计至关重要。1.
                    
                    人工智能入门指南：从基础概念到实际应用
                        

                        前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
                    
                    FPGA通信设计十问
                        

                        1.FFT有什么用？FFT（快速傅里叶变换）是离散傅里叶变换（DFT）的高效实现算法，它的核心作用是快速将信号从时域转换到频域，从而简化信号分析和处理的过程。自然界的信号（如声音、图像、电磁波等）通常以时域形式存在（即随时间变化的波形），但很多特性（如频率成分、谐波分布）在频域中更易分析FFT能快速计算信号中各频率分量的幅值和相位。可以进行频率拆分与实时处理。FFT是“信号的透视镜”，让我们能“看
                    
                    Java与机器学习的邂逅：Weka框架入门指南
                        墨夶
Java学习资料1java机器学习数据挖掘
                        在这个数据驱动的时代，机器学习已经成为各行业创新和优化的关键技术。而Java，作为一门成熟且广泛应用的编程语言，在企业级应用开发中占据着重要地位。将二者结合起来，利用Java实现机器学习算法，不仅可以充分发挥其强大的生态系统优势，还能为开发者提供一个高效、稳定的开发环境。今天，我们将带您走进Java与机器学习的世界，探索如何使用Weka这一著名的机器学习库来开启您的智能之旅。Weka简介及其优势什
                    
                    FPGA相关通信问题详解
                        霖12
fpga开发笔记信号处理信息与通信学习开发语言
                        首先感谢大佬@征途黯然.-CSDN博客的就我的上篇文章《FPGA通信设计十问》提出的问题，我在此做出回复一.解释FFT（快速傅里叶变换）如何在FPGA的IP核中高效实现FFT作为将时域信号转换为频域的核心算法，其在FPGA中的高效实现依赖于硬件架构与算法特性的深度适配。1.流水线架构：提升吞吐量FFT的核心是“蝶形运算”，其计算过程可分解为log2(N)级（N为FFT点数），每级包含N/2次蝶形运
                    
                    机器学习基础：从数据到智能的入门指南
                        

                        一、何谓机器学习在我们的日常生活中，机器学习的身影无处不在。当你打开购物软件，它总能精准推荐你可能喜欢的商品；当你解锁手机，人脸识别瞬间完成；当你使用语音助手，它能准确理解你的指令。这些背后，都离不开机器学习的支撑。机器学习是一门让计算机能够从数据中学习并改进的学科。随着传感器技术的飞速发展，我们身边充满了各种传感器，如手机中的摄像头、麦克风，交通监控中的传感器等，它们收集了海量的数据。这些数据就
                    
                    神经网络项目--基于FPGA的AI简易项目（1-9图片数字识别）
                        霖12
深度学习pytorch神经网络fpga开发人工智能机器学习
                        1.训练MNIST模型importtorch#导入pytorch核心库importtorch.nnasnn#神经网络模块，如卷积层importtorch.optimasoptim#优化器fromtorchvisionimportdatasets,transforms#数据集与图像预处理工具#定义CNN模型classSimpleCNN(nn.Module):#PyTorch库中所有神经网络的“基础模
                    
                    大模型算法工程师技术路线全解析：从基础到资深的能力跃迁
                        Mr.小海
大模型算法数据挖掘人工智能机器学习深度学习机器翻译web3
                        文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
                    
                    Go与Python在数据管道与分析项目中的抉择：性能与灵活性的较量
                        真智AI
人工智能pythongo
                        你正在设计一个全新数据管道或启动一个分析项目，此时你或许正在思考该选择Python还是Go。五年前，这甚至不是个值得讨论的问题——你会毫不犹豫地选择Python，故事到此为止。然而，近年来Go在数据领域，尤其是在数据基础设施和实时处理方面，正逐渐被更多人采用。实际上，这两种语言都已在现代数据技术栈中找到了各自的定位。Python依然非常适合机器学习和数据分析，而Go则逐步成为高性能数据基础设施的首
                    
                    Python爬虫实战：从新浪财经爬取股票新闻的完整实现
                        Python爬虫项目
python爬虫开发语言数据分析php
                        第一部分：爬虫概述1.1什么是爬虫？爬虫是指通过程序模拟浏览器的行为，自动化地抓取网络上的数据。通过爬虫技术，能够从各种网站上提取信息，广泛应用于数据采集、数据分析、机器学习等领域。1.2新浪财经简介新浪财经是中国最大的财经信息平台之一，提供股票、基金、债券、外汇等多方面的财经新闻和数据。在股票领域，新浪财经提供了大量的股票行情、实时数据、新闻报道等信息，因此爬取新浪财经的股票新闻对于投资分析和决
                    
                    AI 智能运维，重塑大型企业软件运维：从自动化到智能化的进阶实践
                        AI、少年郎
人工智能运维自动化
                        一、引言：企业软件运维的智能化转型浪潮在数字化转型加速的背景下，大型企业软件架构日益复杂，微服务、多云环境、分布式系统的普及导致传统运维模式面临效率瓶颈。AI技术的渗透催生了智能运维（AIOps）的落地，通过机器学习、大模型、智能Agent等技术，实现从"人工救火"到"智能预防"的范式转变。本文结合头部企业实践，解析AI在运维领域的核心应用场景、技术架构及未来趋势，特别针对基础运维中流程重构、技术
                    
                    Spring AI 概述与功能简介
                        drebander
AI编程spring人工智能java
                        SpringAI是一个由Spring团队开发的开源框架，旨在为人工智能（AI）和机器学习（ML）提供一个成熟且高效的开发平台。它将Spring生态系统的设计理念应用于AI开发，尤其强调模块化、可移植性以及简洁的集成。SpringAI提供了丰富的功能，涵盖从AI模型的调用到与数据库的集成等多个方面，帮助开发者构建和管理AI驱动的应用程序。1.SpringAI背景SpringAI的背景源于Spring
                    
                    在二分类任务中如何处理包含中文的类别特征
                        Dush32
分类数据挖掘人工智能机器学习数据分析
                        在机器学习中，处理类别特征（CategoricalFeatures）是常见的任务，特别是在中文数据中，很多类别特征如省份、城市等都是字符串类型。如何将这些类别变量转换为模型可以理解的数值格式，是每个数据科学家都必须面对的挑战。在这篇文章中，我们将探讨两种常见的类别特征编码方法：astype('category')和LabelEncoder，并比较它们在二分类任务中的效果。我们以“省份”这一类别特征
                    
                    基于用户画像的商品推荐系统
                        Dush32
机器学习人工智能python推荐算法
                        随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
                    
                    AI原生应用领域多租户的技术架构剖析
                        AI天才研究院
AI-native架构人工智能ai
                        AI原生应用领域多租户技术架构深度剖析元数据框架标题：AI原生应用多租户技术架构：从隔离性到智能化的分层设计与实践关键词：AI原生应用、多租户架构、数据隔离、模型共享、云原生租户管理摘要：本文系统解析AI原生应用场景下多租户技术架构的核心设计逻辑，覆盖从数据层到模型层的全栈隔离与共享机制。通过第一性原理推导，结合云原生、机器学习生命周期管理（MLOps）等技术范式，提出包含租户上下文管理、动态资源
                    
                    Python爬虫实战：批量下载小红书笔记图片的全流程技术解析
                        Python爬虫项目
2025年爬虫实战项目python爬虫笔记开发语言音视频github
                        1.引言：为什么要爬取小红书笔记图片小红书作为新兴的生活方式分享平台，聚集了大量高质量原创笔记内容，涵盖时尚、美妆、旅游、美食等多领域。笔记中的图片往往是内容的核心，批量下载小红书笔记图片，有助于：内容归档与备份数据分析与用户行为研究图像识别与机器学习训练电商推广及内容再加工但小红书对内容保护做得较好，爬取难度较高，需要结合多技术手段突破。2.小红书平台特点与爬取难点动态加载与API接口多变：页面
                    
                    【机器学习】必会降维算法之：独立成分分析（ICA）
                        Carl_奕然
机器学习算法人工智能
                        独立成分分析（ICA）1、引言2、独立成分分析（ICA）2.0引言2.1定义2.2应用场景2.3核心原理2.4实现方式2.5算法公式2.6代码示例3、总结1、引言小屌丝：鱼哥，最近胡塞武装很哇塞啊。小鱼：你什么时候开始关注军事了？小屌丝：这…还用关注吗？都上新闻了。小鱼：嗯，那你知道胡塞武装为什么这么厉害吗？小屌丝：额…当然是光脚不怕穿鞋的。小鱼：…你可真是…小屌丝：真是啥？小鱼：一个字，自己体会
                    
                                插入表主键冲突做更新
                                    a-john

                                    有以下场景： 
用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。 
问题： 
如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。 
解决： 
mysql中提供了一个sql语
                                
                                Android xml资源文件中@、@android:type、@*、？、@+含义和区别
                                    Cb123456
@+@?@*
                                    一.@代表引用资源 
1.引用自定义资源。格式：@[package:]type/name 
android：text="@string/hello" 
  
2.引用系统资源。格式：@android:type/name 
    android:textColor="@android:color/opaque_red"
                                
                                数据结构的基本介绍
                                    天子之骄
数据结构散列表树、图线性结构价格标签
                                    数据结构的基本介绍 
数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。 
  
经典的数据结构大致如下： 
  
一：线性数据结构 
(1)：列表 
a
                                
                                通过二维码开放平台的API快速生成二维码
                                    一炮送你回车库
api
                                     现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 
       html代码如下:(二维码将生成在这div下)    
?       1      
 &nbs
                                
                                ImageIO读取一张图片改变大小
                                    3213213333332132
javaIOimageBufferedImage
                                    
package com.demo;

import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;

import javax.imageio.ImageIO;

/**
 * @Description 读取一张图片改变大小
 * @author FuJianyon
                                
                                myeclipse集成svn（一针见血）
                                    7454103
eclipseSVNMyEclipse
                                                                     &n
                                
                                装箱与拆箱----autoboxing和unboxing
                                    darkranger
J2SE
                                    4.2　自动装箱和拆箱 
 
基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 
 
4.2.1　autoboxing和unboxing 
 
在Java中，所有要处理的东西几乎都是对象(Object)
                                
                                ajax传统的方式制作ajax
                                    aijuans
Ajax
                                    //这是前台的代码 
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
                                
                                只用jre的eclipse是怎么编译java源文件的？
                                    avords
javaeclipsejdktomcat
                                    eclipse只需要jre就可以运行开发java程序了，也能自动 编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？ 还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ 
&nb
                                
                                前端模块化
                                    bee1314
模块化
                                    背景：   前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。       JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
                                
                                处理百万级以上的数据处理
                                    bijian1013
oraclesql数据库大数据查询
                                    一.处理百万级以上的数据提高查询速度的方法：        1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 
        2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
                                
                                mac 卸载 java 1.7 或更高版本
                                    征客丶
javaOS
                                    卸载 java 1.7 或更高 
sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 
成功执行此命令后，还可以执行 java 与 javac 命令 
 
sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 
成功执行此命令后，还可以执行 java 
                                
                                【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析
                                    bit1129
Stream
                                    第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中 
第二部，Spark Streaming读取Kafka中的数据，进行实时分析 
  
本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 
1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
                                
                                Erlang vs TNSDL
                                    bookjovi
erlang
                                      
    TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
                                
                                非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个
                                    ljy325
企业应用
                                    　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。 
 
相关新闻： 
（1）IT行业成五大疾病重灾区：过劳死平均37.9岁 

                                
                                读《研磨设计模式》-代码笔记-原型模式
                                    bylijinnan
java设计模式
                                    声明： 本文只为方便我个人查阅和理解，详细的分析以及源代码请移步 原作者的博客http://chjavach.iteye.com/ 
 
 



/**
 * Effective Java 建议使用copy constructor or copy factory来代替clone()方法：
 * 1.public Product copy(Product p){}
 * 2.publi
                                
                                配置管理---svn工具之权限配置
                                    chenyu19891124
SVN
                                    今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。 
安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 
pepos 
   component 
   webapps 
在conf里面的auth里赋予的权限配置为 
[groups]
                                
                                浅谈程序员的数学修养
                                    comsci
设计模式编程算法面试招聘
                                             
                        浅谈程序员的数学修养 
                                
                                批量执行 bulk collect与forall用法
                                    daizj
oraclesqlbulk collectforall
                                    BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 
FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。 
    有关FORALL语句的用法请参考：批量SQL之 F
                                
                                Linux下使用rsync最快速删除海量文件的方法
                                    dongwei_6688
OS
                                    1、先安装rsync：yum install rsync 
2、建立一个空的文件夹：mkdir /tmp/test 
3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。 

                                
                                Yii CModel中rules验证规格
                                    dcj3sjt126com
rulesyiivalidate
                                    Yii cValidator主要用法分析：  
 yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError 
 
                                
                                基于vagrant的redis主从实验
                                    dcj3sjt126com
vagrant
                                    平台: Mac 
工具: Vagrant 
系统: Centos6.5 
实验目的: Redis主从 
  
实现思路 
制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 
  
制作sentos6.5+redis的box 
  
mkdir vagrant_redis 
cd vagrant_
                                
                                Memcached(二)、Centos安装Memcached服务器
                                    frank1234
centosmemcached
                                    一、安装gcc 
rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 
 
开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：

建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码......


rpm -ivh kernel-head
                                
                                Remove Duplicates from Sorted List
                                    hcx2013
remove
                                    Given a sorted linked list, delete all duplicates such that each element appear only once. 
For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
                                
                                Spring4新特性——JSR310日期时间API的支持
                                    jinnianshilongnian
spring4
                                    Spring4新特性——泛型限定式依赖注入 
Spring4新特性——核心容器的其他改进 
Spring4新特性——Web开发的增强 
Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC  
Spring4新特性——Groovy Bean定义DSL 
Spring4新特性——更好的Java泛型操作API  
Spring4新
                                
                                浅谈enum与单例设计模式
                                    247687009
java单例
                                    在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构
造器，导出静态成员变量，以便调用者访问。

第一种 
package singleton;

public class Singleton {
        //导出全局成员
        public final static Singleton INSTANCE = new S
                                
                                使用switch条件语句需要注意的几点
                                    openwrt
cbreakswitch
                                    1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 
 
int main()
{
    int n = 1;
    switch(n) {
    case 1:
        printf("--1--\n");
    default:
        printf("defa
                                
                                配置Spring Mybatis JUnit测试环境的应用上下文
                                    schnell18
springmybatisJUnit
                                    Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有： 
 
 单元测试的app context不支持从外部properties文件注入属性 
 @Value注解不能解析带通配符的路径字符串 
 
解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。 
第二个问题的具体实例是： 
   
                                
                                Java 定时任务总结一
                                    tuoni
javaspringtimerquartztimertask
                                     Java定时任务总结  一.从技术上分类大概分为以下三种方式：  1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务;   说明：    java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
                                
                                一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法
                                    yangshangchuan
rank相似度计算文本相似度词袋模型余弦相似度
                                    本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。 
  
最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 
    1、注册多个账号（一般10个以上）。 
    2、从多个账号中选择一个账号，发表1-2篇博文
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.