AI异构

HAWQ：基于 Hessian 的混合精度神经网络量化

HAWQ：基于 Hessian 的混合精度神经网络量化

- - 摘要
  - 动机
  - 方法
  - - 海森方法的有效性分析
    - 海森矩阵方法推导
    - - 根据幂迭代求海森矩阵的最大特征值
      - 根据海森矩阵最大特征值确定量化精度与顺序
  - 实验结果
  - - ResNet20 On CIFAR-10
    - ResNet50 on ImageNet
    - SqueezeNext on ImageNet
    - Inception-V3 on ImageNet
  - 消融实验
  - - 海森混合精度量化的有效性
    - Block-Wise微调的有效性

本文为 UC Berkeley 大学发表在 ICCV 2019上的混合精度量化论文。旨在利用Block块的 Hessian 最大特征值选择各层的相对量化精度与量化微调 Block 块的顺序，在不同网络下测试获得了不错的精度提升。

论文题目：HAWQ: Hessian AWare Quantization of Neural Networks with Mixed-Precision

论文链接：https://arxiv.org/pdf/1905.03696v1.pdf

代码链接：https://github.com/Zhen-Dong/HAWQ

摘要

在许多应用程序中部署神经网络时，模型大小和推理速度/功率已成为主要挑战。解决这些问题的一种有前途的方法是量化。但是，将模型统一量化为超低精度会导致精度显着下降。一种新颖的解决方案是使用混合精度量化，因为与其他层相比，网络的某些部分可能允许较低的精度。但是，没有系统的方法来确定不同层的精度。对于深度网络，蛮力方法不可行，因为混合精度的搜索空间在层数上是指数级的。另一个挑战是在将模型量化到目标精度时用于确定逐块微调顺序复杂度是阶乘级别的。本文介绍了 Hessian AWare 量化（HAWQ），这是一种解决这些问题的新颖的二阶量化方法。 HAWQ 根据Block块的 Hessian 最大特征值选择各层的相对量化精度。而且，HAWQ基于二阶信息为量化层提供了确定性的微调顺序。本文使用 ResNet20 在 Cifar-10 上以及用Inception-V3，ResNet50 和 SqueezeNext 模型在 ImageNet 上验证了方法的结果。将HAWQ 与最新技术进行比较表明，与 DNAS 相比，本文在 ResNet20 上使用 8 倍的激活压缩率可以达到相似/更好的精度，并且与最近提出的RVQuant和HAQ的方法相比，在ResNet50 和 Inception-V3 模型上，当缩小 14％模型大小的情况下可以将精度提高 1％。此外，本文证明了可以将 SqueezeNext 量化为仅 1MB 的模型大小，同时在 ImageNet 上实现 Top-1 精度超过 68％。

动机

量化方法需要对NN参数（即权重）和激活都进行量化，以减少推理期间模型的总内存占用量。但是，这里的主要挑战是传统的量化方式会导致准确性的显著下降。尤其是，不可能将普通卷积网络的所有权重/激活的位数减少到超低精度，而又不显著降低精度。这是因为并非卷积网络的所有层都允许相同的量化级别。解决此问题的一种可能方法是使用混合精度量化，其中较高的精度用于网络的某些“敏感”层，而较低的精度用于“非敏感”层。但是，为每一层找到正确精度的搜索空间在层数上是指数级的。此外，为了避免准确性损失，需要对模型进行微调（即重新训练）。正如后面要讨论的，一次量化整个模型然后进行微调并不是最佳的。取而代之的是，需要执行多阶段量化，其中在网络的每个阶段将部分量化为低精度，然后进行量化感知的微调以恢复准确性。但是，用于确定首先要量化哪些层的搜索空间是层数的系数大小。为解决上述搜索空间大的问题，本文提出了一种Hessian指导的方法来应对这些挑战。本文贡献如下：

选择混合精度量化的搜索空间的层数是指数级的。因此，提出了一种新颖的确定性方法，用于根据每层的Hessian 频谱确定各层的相对量化级别。
模型的量化感知微调的搜索空间是块/层数的系数。因此，提出了一种基于 Hessian 方法来确定不同NN块的微调顺序。
最后进行了HAWQ的消融研究，并在 CIFAR-10 上使用 ResNet20 以及在 ImageNet 上使用 Inception-V3 / ResNet50 / SqueezeNext 提出了新颖的量化结果。与最新技术的比较表明，本文的方法实现了更高的精度（高达1％），更小的模型尺寸（高达20％）和更小的激活尺寸（高达8）。

方法

海森方法的有效性分析

基于最小描述长度(MDL)理论，在给定的阈值下，指定一个平坦区域所需的比特数较少，反之，指定一个具有尖锐曲率的区域所需的比特数较多。更通俗的解释，平坦区域的不精确位置所产生的噪声不会被放大，使得它更容易被量化。而尖锐区域则相反，即使是小的舍去误差也会被放大。因此，预计具有较高 Hessian 频谱的层(即较大的特征值)对量化更敏感。下图显示了CIFAR-10上的ResNet20和ImageNet上的Inception-V3的这些特征值对不同块的分布。可以发现，不同的区块表现出数量级的差异。例如，ResNet20第 9 个 block 相比于最后一个 block 的扰动更为敏感。

为了进一步说明这一点，本文提供了以下的一维损失可视化示意图。首先计算出每一个 Block 的海森特征向量，然后对每一个 Block 沿着特征向量分别计算损失的变化，如下图所示分别展现了 ResNet20（在Cifar-10上）和 Inception-V3（在ImageNet上）的结果。可以清楚地看到，具有较大的 Hessian 特征值（即曲率更尖锐）的 Block 表现出较大的损失波动。

海森矩阵方法推导

假设 NN 被划分为 b 个block $\left\{B_{1}, B_{2} \ldots, B_{b}\right\}$ , 对应的权重参数表示为 $\left\{W_{1}, W_{2} \ldots, W_{b}\right\}$ 。

根据幂迭代求海森矩阵的最大特征值

首先了解幂法求矩阵特征值的具体流程，如下Python代码：


# 参考代码：https://www.cnblogs.com/qizhou/p/12271287.html

import numpy as np

#矩阵A
A = np.matrix(
    [[-5.6,2.,0.],
    [3.,-1.,1.],
    [0.,1.,3.]])
L0=2#范数类型
v = np.matrix([[-2.],[-7.],[1.]])#v0（随机值）
u = v/(np.linalg.norm(v,L0))#u0

#迭代函数
def iterate_fun(A,u,final,L):
    i=0
    while i<final:
        v = A*u
        u = v/(np.linalg.norm(v,L))
        i=i+1
    print("幂法特征值：")
    print(np.linalg.norm(v,L))
    print("numpy特征值：")
    print(np.linalg.eig(A)[0])
    print("幂法特征向量：")
    print(u)
    print("numpy特征向量：")
    print(np.linalg.eig(A)[1])

iterate_fun(A,u,1000,L0)

根据下图算法1可以了解幂迭代求海森矩阵的最大特征值的具体流程，这里需要注意的是for循环的i与 $W_{i}$ 中的i是没有关系的，另外，算法1的巧妙之处是无需求解海森矩阵就可以求出海森矩阵的特征值。根据幂迭代的算法可以求解出海森矩阵的特征值 $\lambda_{i} = \|H v\|_{2}$ ，而$ H_{i} v$ 根据下面公式推导得出恰好为 $g_{i}^{T} v$ 关于 $W_i$ 的偏导数。

$\frac{\partial\left(g_{i}^{T} v\right)}{\partial W_{i}}=\frac{\partial g_{i}^{T}}{\partial W_{i}} v+g_{i}^{T} \frac{\partial v}{\partial W_{i}}=\frac{\partial g_{i}^{T}}{\partial W_{i}} v=H_{i} v$

根据海森矩阵最大特征值确定量化精度与顺序

量化精度由 $S_{i}=\lambda_{i} / n_{i}$ 决定。
量化Block的微调顺序由 $ \Omega_{i}=\lambda_{i}\left|Q\left(W_{i}\right)-W_{i}\right|_{2}^{2} $ 决定。

实验结果

ResNet20 On CIFAR-10

ResNet50 on ImageNet

SqueezeNext on ImageNet

Inception-V3 on ImageNet

消融实验

海森混合精度量化的有效性

Block-Wise微调的有效性

你可能感兴趣的:(神经网络量化,神经网络量化,混合精度量化,低比特量化)

大模型学习完整路径（一站式汇总），从零基础到精通！新手友好级指南 Python程序员罗宾学习语言模型知识图谱人工智能数据库 java
如果读者朋友不想深入学习大模型，则了解提示词的使用原则也可以了。要是既不想深入学习，又要做大模型相关的项目，则对于工程同学来说，学习RAG也能把大模型玩转起来。前排提示，文末有大模型AGI-CSDN独家资料包哦！先来一张整体结构图，越是下面部分，越是基础：可以按以下步骤学习：1.理解基础概念需要了解深度学习的基本原理和常见术语，如神经网络、梯度下降、反向传播、监督学习、无监督学习、分类、回归、聚类
深入理解 Netty：高效的网络通信框架 HelloZheQ java
在分布式系统和高性能应用程序中，网络通信是核心组成部分。尤其是需要处理大量并发连接、低延迟、高吞吐量的应用，传统的网络通信框架往往无法满足要求。Netty是一个高性能的网络通信框架，广泛应用于大型系统的网络层设计中。无论是在构建即时通讯应用、在线游戏、物联网系统，还是处理实时数据流，Netty都能提供强大的支持。什么是Netty？Netty是一个基于Java的网络通信框架，专为高效、可靠的网络通信
斩波放大器 chinahongjiang 硬件工程单片机嵌入式硬件
斩波放大器（ChopperAmplifier）是一类专为精密信号放大而设计的放大器，其核心思想是通过斩波调制技术将低频输入信号转换到较高频率区间，在高频段进行放大后，再经过解调和低通滤波还原回原始信号。这样可以大幅降低放大器本身因直流失调和1/f噪声引起的误差，从而实现高精度、低漂移的放大效果。下面详细介绍斩波放大器的工作原理、结构特点以及主要应用。1.工作原理传统放大器在放大微弱信号时常常受到输
安全见闻8 2401_87248788 安全 sql
安全见闻8量子物理学基础了解量子力学的基本原理，如量子态、叠加态、纠缠等概念。学习量子力学的数学表达，包括波函数、算符等，以便更好地分析量子计算系统的特性。一、量子计算原理与技术掌握量子比特、量子门、量子电路等量子计算的核心概念。了解量子算法，特别是对传统密码学构成威胁的算法，如Shor算法。传统网络安全知识巩固传统加密算法、哈希函数、数字签名等网络安全技术。熟悉网络全架构、访问控制、漏洞管理等方
网络安全之攻防笔记--通用安全漏洞SQL注入&sqlmap&Oracle&mongodb&DB2 Dawndddddd web安全笔记安全 sql
通用安全漏洞SQL注入&sqlmap&Oracle&mongodb&DB2数据库类型ACCESS特性没数据库用户没数据库权限没数据库查询参数没有高权限注入说法暴力猜解，借助字典得到数据注入方式联合注入偏移注入表名列名猜解不到偏移注入MySQL低权限常规注入高权限常规注入文件读取load_file文件写入intooutfile权限原因&判断代码连接用户决定查询函数user（）其他database()
Nginx反向代理与正向代理配置 wespten Linux 自动化运维智能运维性能监控系统调优 TS nginx 运维
一、Nginx主要功能1、Nginx简介Nginx是一款轻量级的Web服务器、反向代理服务器及电子邮件（IMAP/POP3）代理服务器。主要有反向代理，负载均衡等功能。官方网站：nginxnewsNginx是一款免费开源的高性能HTTP代理服务器及反向代理服务器（ReverseProxy）产品，它高并发性能很好，官方测试能够支撑5万的并发量；运行时内存和CPU占用率低，配置简单，容易上手，而且运行
DeepSeek 和 Qwen 模型快速部署指南 moton2017 深度学习运维模型部署 DeepSeek Qwen 大型语言模型 LLM 人工智能 AI
导读：DeepSeek-V3&DeepSeek-R1模型对比特性DeepSeek-V3DeepSeek-R1模型大小总参数量6710亿(671B),MoE架构,每个token激活370亿参数总参数量与V3相当,基于DeepSeek-V3-Base,采用类似的MoE架构训练方法包含预训练、监督微调(SFT)和强化学习(RL),使用14.8兆高品质文本进行预训练引入多阶段训练流程,冷启动微调后进行推理
秒杀ChatGPT ？国产之光DeepSeek探究南风过闲庭搜索引擎 ai 科技人工智能大数据 chatgpt
1.DeepSeek公司概况1.1成立背景与发展历程DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，由知名量化资管巨头幻方量化创立。幻方量化为DeepSeek的技术研发提供了强大的硬件支持，使其成为大厂外唯一一家储备万张A100芯片的公司。自成立以来，DeepSeek专注于开发先进的大语言模型（LLM）和相关技术，取得了显著的成果。2023年11月2日，
汽车电机控制新研究点大公开，抢占技术先机物联高科单片机网络服务器嵌入式硬件运维
近年来，随着新能源汽车环境保护和节能减排的愈加受到重视，汽车电机控制技术的研究和应用逐渐成为一个热门的研究领域。电机控制技术不仅关乎汽车的动力性能，还直接影响到能源的使用效率和车辆的安全性。一、电机控制的重要性电动汽车（EV）和混合动力汽车（HEV）作为未来发展的重要方向，其核心技术之一便是电机控制系统。电机控制系统的主要任务是确保车辆在不同工况下能够顺畅运行，并提供理想的动力响应和能量利用效率。
DeepSeek混合精度训练核心技术解析与实践指南燃灯工作室 Deepseek 数据挖掘语音识别计算机视觉目标检测机器学习人工智能
1.主题背景1.1Why混合精度训练（价值）混合精度训练通过结合FP16和FP32数据格式，在保证模型精度的前提下实现：40-60%显存占用降低（ResNet50案例：从7.8GB降至4.2GB）1.5-3倍训练速度提升（BERT-Large案例：从8h缩短至5h）突破大模型训练显存瓶颈（GPT-3训练显存需求从3TB降至1.8TB）1.2行业定位属于深度学习基础设施层的训练优化技术，处于模型开发
【产品小白】产品商业化广告设计百事不可口y 产品经理的一步一步产品经理产品运营用户运营内容运营学习
广告商业化是互联网产品的核心变现方式，但很多用户因广告体验差而卸载应用。优秀的广告设计需在商业价值与用户体验间找到动态平衡，同时实现精准投放与高效转化。一、广告设计的底层逻辑：三方博弈模型成功的广告体系需满足三方需求：用户侧：广告内容相关性强、干扰低、有价值获得感广告主侧：精准触达目标人群、转化成本可控平台侧：提升填充率与eCPM（千次展示收益），同时保障用户留存典型案例对比：失败案例：某资讯Ap
为什么词向量和权重矩阵dot运算就能得到想要的效果呢？ cjl30804 矩阵线性代数 nlp
最近在学习NLP算法的时候，进入到了深水区以后，发现了弄懂这个才是核心中的核心，抓住了主要矛盾了。特意拿出来跟大家分享。词向量（WordEmbeddings）和权重矩阵的点积运算之所以能够帮助我们实现特定的效果，主要是因为它们在神经网络架构中扮演的角色以及背后的数学原理。具体来说，在自然语言处理任务中，这种操作通常出现在如Transformer模型中的自注意力机制里。让我们深入探讨一下为什么这种方
浅显介绍图像识别的算法卷积神经网络（CNN）中的激活函数 cjl30804 算法 cnn 人工智能
激活函数的作用激活函数在神经网络中扮演着至关重要的角色，其主要作用包括但不限于以下几点：引入非线性：如果没有激活函数或仅使用线性激活函数，无论神经网络有多少层或多复杂，整个模型仍然只能表达线性映射。这意味着它无法学习和表示数据中的复杂模式。通过使用非线性的激活函数，如ReLU（修正线性单元）、Sigmoid、Tanh等，可以赋予神经网络学习复杂函数的能力。决定神经元是否被激活：激活函数根据输入信号
Engineering A Large Language Model From Scratch UnknownBody 语言模型人工智能自然语言处理
本文是LLM系列文章，针对《EngineeringALargeLanguageModelFromScratch》的翻译。从头开始设计一个大语言模型摘要1引言2Atinuke算法3结果4相关工作5讨论6结论摘要自然语言处理（NLP）中深度学习的激增导致了创新技术的发展和发布，这些技术能够熟练地理解和生成人类语言。Atinuke是一种基于Transformer的神经网络，通过使用独特的配置来优化各种语
深度学习（5）-卷积神经网络 yyc_audio 深度学习 cnn 人工智能
我们将深入理解卷积神经网络的原理，以及它为什么在计算机视觉任务上如此成功。我们先来看一个简单的卷积神经网络示例，它用干对MNIST数字进行分类。这个任务在第2章用密集连接网络做过，当时的测试精度约为97.8%。虽然这个卷积神经网络很简单，但其精度会超过第2章的密集连接模型。代码8-1给出了一个简单的卷积神经网络。它是conv2D层和MaxPooling2D层的堆叠，你很快就会知道这些层的作用。我们
深度学习（2)-深度学习关键网络架构 yyc_audio 人工智能机器学习深度学习
关键网络架构深度学习有4种类型的网络架构：密集连接网络、卷积神经网络、循环神经网络和Transformer。每种类型的模型都是针对特定的输入模式，网络架构包含了关于数据结构的假设，即模型搜索的假设空间。某种架构能否解决某个问题，完全取决于问题的数据结构与所选的网络架构假设之间是否匹配。这些不同类型的网络可以很容易组合起来，实现更大的多模式模型，就像拼乐高积木一样。某种程度上来说，深度学习的层就是信
python 使用WinRM连接远程windows Red丶哞 Python 桌面运维 python windows 开发语言
一、什么是WinRM服务WinRM是很早之前微软推出的一种新式的方便远程管理的服务WindowsRemoteManagement的简称，相比RDP远程桌面协议，WinRM这种服务更具备轻量、低宽带的特性，WinRM与WinRS（WindowsRemoteShell）的使用可以让远程连接的运维人员拥有CMDShell环境，通过命令执行对服务器与服务器数据进行管理。随着运维人员的任务量的增大，RDP的
Transformer大模型实战教师学生架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer大模型实战教师学生架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来近年来，随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进步。其中，Transformer模型作为一种基于自注意力机制的深度神经网络结构，因其优越的性能和灵活的适用性，在NLP任务中得到了广泛应用。然而，Trans
Qwen2.5-Coder Technical Report UnknownBody LLM Daily LLM for code Technical Report 语言模型人工智能自然语言处理
本文是LLM系列文章，针对《Qwen2.5-CoderTechnicalReport》的翻译。Qwen2.5-Coder技术报告摘要1引言2模型架构3预训练3.1预训练数据3.1.1数据组成3.1.2数据混合3.2训练策略3.2.1文件级预训练3.2.2仓库级预训练4后训练4.1指令数据的配方4.2训练策略5去污6在基础模型上的评估6.1代码生成6.2代码补全6.3代码推理6.4数学推理6.5通用
Transformer模型量化Quantization 笔记 Foolbird123 transformer 人工智能深度学习
模型参数与显存占用计算基础为了详细说明模型的参数数量和每个参数在显存中占用的空间大小，我们以facebookOPT-6.7B模型为例。逐步推理计算过程：1.估计参数总量：OPT-6.7B模型指一个含有大约6.7Billion（67亿）个参数的模型。2.计算单个参数的显存占用：OPT-6.7B模型默认使用Float16，每个参数占用16位（即2字节）的显存。3.计算总显存占用=参数总量×每个参数的显
如何了解和学习“已知的未知” 由数入道学习
了解和学习“已知的未知”（KnownUnknowns）是系统性知识管理的关键环节，需要建立结构化认知体系。以下提供融合认知科学、教育心理学和系统工程学的完整方法论，包含6大核心模块、28项具体技术，并配备量化指标和工具链。一、知识缺口识别系统1.认知地形测绘理论模型：基于VanMerriënboer的“四要素教学设计模型”（4C/ID）实施方法：知识域边界标定：使用领域本体论工具（Protege）
【深度解析】Java接入DeepSeek大模型：从零实现流式对话+多轮会话管理（完整项目实战） —— SpringBoot整合、API安全封装、性能优化全攻略 barcke java spring boot
一、DeepSeek接入全景图：不只是API调用核心优势对比特性DeepSeek其他主流模型免费Token额度500万/月通常10-100万响应延迟平均800ms1-3s流式响应兼容性原生支持需定制适配中文理解能力行业Top中等偏上适用场景推荐智能客服（实时反馈）代码辅助生成（流式输出）知识问答系统（多轮对话）分析报告（长文本生成）二、环境搭建：手把手配置开发环境1.创建SpringBoot项目（
周末总结(2024/02/22) 全栈黎明日记
工作人际关系核心实践：要学会随时回应别人的善意，执行时间控制在5分钟以内坚持每天早会打招呼遇到接不住的话题时拉低自己，抬高别人(无阴阳气息)朋友圈点赞控制在5min以内，职场社交不要放在5min以外职场的人际关系在面对利益冲突是直接质疑，要快准狠，不要内耗、回复消息要控制在30mins之内，一定要及时回复每周抽出10mins时间用来反思人际关系不能当面揭别人的短，这会显得自己情商很低三分假,七分真
Nginx原理以及基础知识详解黑夜照亮前行的路 nginx
Nginx是一个高性能的HTTP和反向代理服务器，具有高并发性、高可靠性、低内存消耗等特点。其工作原理和基础知识如下：一、Nginx的工作原理Nginx采用多进程模型，主进程负责接收客户端的连接请求，然后将连接请求分发给工作进程来处理。每个工作进程可以处理多个客户端连接，采用异步非阻塞的方式来处理连接请求。当一个连接请求到达时，Nginx会将其放入事件队列中，然后由一个工作进程异步地处理该请求。这
LLM的MoE架构的“动态路由”为什么能训练出来？互联网之路. 知识点架构
互联网各领域资料分享专区(不定期更新)：Sheet正文大型语言模型（MoE）架构中的“动态路由”之所以能够被有效训练，关键在于其设计融合了可微分的路由机制、专家协同优化以及负载均衡约束。以下是具体原因和技术原理的解析：一、动态路由的可微分性与端到端优化门控网络的可训练性动态路由的核心是门控网络（GatingNetwork），它是一个可训练的神经网络，通过输入数据生成专家权重分布。例如，输入经过门控
探索Controller、Service、DAO三层架构：软件开发的艺术_dao层service层controller层 2401_87033955 架构
控制层（Controller）：控制层位于架构的最前端，直接面对用户或外部请求。它负责接收用户的输入，并将请求转发给相应的服务层处理，最后返回处理结果给用户。控制层的主要任务是请求处理和数据转发，它不包含业务逻辑，确保了用户接口的轻量化。业务逻辑层（Service）：服务层是三层架构中的中心，承担着处理应用程序核心业务逻辑的任务。这一层解释用户的请求，执行必要的业务计算，调用数据访问层进行数据持久
三甲医院网络架构与安全建设实战 kate zhu 网络安全 R＆S Linux 网络安全
一、设计目标实现医疗业务网/卫生专网/互联网三网隔离满足等保2.0三级合规要求保障PACS影像系统低时延传输实现医疗物联网统一接入管控二、全网拓扑架构三、网络分区与安全设计IP/VLAN规划表核心业务配置（华为CE6865）interface100GE1/0/1descriptionPACS-CT-Modalitytrustdscp46#标记EF优先级qosqueueefbandwidth40%#
适用于呼叫中心质检的离线ASR模型狂爱代码的码农 VOIP那些事容器
以下是适用于中文呼叫中心质检的离线语音转文字（STT）模型及工具，根据性能、中文支持、部署灵活性等维度整理：1.开源模型与框架1.1WeNet(出门问问&西北大学)特点：端到端语音识别框架，专为中文优化，支持流式和非流式识别，适合工业场景。优势：预训练模型基于AIShell等中文数据集，准确率高。低延迟，适合实时处理（如质检中的实时监控）。支持GPU/CPU部署，提供Python和C++接口。部署
Linux/POSIX 多路IO复用 Mr.pyZhang Linux linux
多路复用IO概念如何管理fd的可读可写事件？IO多路：指同时对多个文件进行读写操作。大体有两种方案：阻塞IO模式一个线程只能处理一个流的IO事件缺点：若线程数增多性能会变差多个线程处理多个IO（浪费CPU资源，效率低）——单个线程while循环。while(true){select(stream[]);for(i->stream[]){ifihasdata{readdatauntilunavail
解锁机器学习核心算法｜朴素贝叶斯：分类的智慧法则紫雾凌寒 AI 炼金厂 #机器学习算法机器学习算法分类朴素贝叶斯 python 深度学习人工智能
一、引言在机器学习的庞大算法体系中，有十种算法被广泛认为是最具代表性和实用性的，它们犹如机器学习领域的“十大神器”，各自发挥着独特的作用。这十大算法包括线性回归、逻辑回归、决策树、随机森林、K-近邻算法、K-平均算法、支持向量机、朴素贝叶斯算法、主成分分析（PCA）、神经网络。它们涵盖了回归、分类、聚类、降维等多个机器学习任务领域，是众多机器学习应用的基础和核心。而在这众多的算法中，朴素贝叶斯算法
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他