qq_26898461

统计学习笔记（1）——统计学习方法概论

1.统计学习

统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科，也称统计机器学习。统计学习是数据驱动的学科。统计学习是一门概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科。

统计学习的对象是数据，它从数据出发，提取数据的特征，抽象出数据的模型，发现数据中的知识，又回到对数据的分析与预测中去。统计学习关于数据的基本假设是同类数据具有一定的统计规律性，这是统计学习的前提。

统计学习的目的就是考虑学习什么样的模型和如何学习模型。

统计学习方法包括模型的假设空间、模型选择的准则以及模型学习的算法。实现统计学习的步骤如下：

（1）得到一个有限的训练数据集合；

（2）确定包含所有可能的模型的假设空间，即学习模型的集合；

（3）确定模型选择的准则，即学习的策略；

（4）实现求解最优模型的算法，即学习的算法；

（5）通过学习方法选择最优模型；

（6）利用学习的最优模型对新数据进行预测或分析。

2.监督学习

监督学习从训练数据中学习模型，对测试数据进行预测，训练集通常表示为

人们根据输入、输出变量的不同类型，对预测任务给予不同的名称：输入变量和输出变量均为连续变量的预测问题称为回归问题；输出变量为有限个离散变量的预测问题称为分类问题；输入变量与输出变量均为变量序列的预测问题称为标注问题。

监督学习假设输入与输出的随机变量X和Y遵循联合概率分布P(X,Y)，P(X,Y)表示分布函数，或分布密度函数。统计学习假设数据存在一定的统计规律，X和Y具有联合概率分布的假设就是监督学习关于数据的基本假设。

监督学习的模型可以是概率模型或非概率模型，由条件概率分布P(Y|X)或决策函数Y=f(X)表示，随具体学习方法而定。

监督学习分为学习和预测两个过程，由学习系统与预测系统组成，如下图：

学习过程中，学习系统利用给定的训练数据集，通过学习得到一个模型，表示为条件概率分布P(Y|X)或决策函数Y=f(X)。预测过程中，预测系统对于给定的测试样本集中的输入

3.统计学习三要素

统计学习=模型+策略+算法

3.1 模型

统计学习中，首先要考虑学习什么样的模型，在监督学习中，模型就是所要学习的条件概率分布或决策函数，由决策函数表示的模型为非概率模型，由条件概率分布表示的模型为概率模型。

统计学习笔记（1）——统计学习方法概论_第2张图片

3.2 策略

有了模型的假设空间，统计学习接着需要考虑的是按照什么样的准则学习或选择最优的模型。监督学习实际上就是一个经验风险或者结构风险函数的最优化问题。风险函数度量平均意义下模型预测的好坏，模型每一次预测的好坏用损失函数来度量。

监督学习问题就是从假设空间F中选择模型f作为决策函数，对于给定的输入X，由f(X)给出相应的输出Y，这个输出的预测值f(X)与真实值Y可能一致也可能不一致，用一个损失函数来度量预测错误的程度。损失函数记为L(Y, f(X))。常用的损失函数有以下几种：

统计学习笔记（1）——统计学习方法概论_第3张图片

统计学习笔记（1）——统计学习方法概论_第4张图片

3.3 算法

统计学习问题归结为以上的最优化问题，这样，统计学习的算法就是求解最优化问题的算法。如果最优化问题有显示的解析解，这个最优化问题就比较简单，但通常这个解析解不存在，所以就需要利用数值计算的方法来求解。统计学习可以利用已有的最优化算法，也可以开发独自的最优化算法。

4. 模型评估与模型选择

当损失函数给定时，基于损失函数的模型的训练误差和模型的测试误差就自然成为学习方法评估的标准。

训练误差是模型Y=f(x)关于训练数据集的平均损失：

统计学习笔记（1）——统计学习方法概论_第5张图片

统计学习笔记（1）——统计学习方法概论_第6张图片

下图给出了M=0，M=1，M=3，M=9时的多项式函数拟合的情况，其中绿色曲线为真模型，红色为预测模型。

统计学习笔记（1）——统计学习方法概论_第7张图片

其中，M=0和M=1模型简单，拟合不足，训练误差较大；M=9模型复杂，过拟合，训练误差为0，但基本不具备推广性；M=3模型复杂度适中，泛化能力强，效果最好。

下图描述了训练误差和测试误差与模型的复杂度之间的关系：

统计学习笔记（1）——统计学习方法概论_第8张图片

当模型的复杂度增大时，训练误差会逐渐减小并趋向于0，而测试误差会先减少，达到最小值后又增大。模型选择的典型方法是正则化与交叉验证。

5.正则化与交叉验证

模型选择的典型方法是正则化，正则化的一般形式如下：

其中，第一项是经验风险，第二项是正则化项，正则化项可以取不同的形式，例如，正则化项可以是模型参数向量的范数。回归问题中，损失函数是平方损失，正则化项可以是参数向量的L2范数：

正则化项也可以是参数向量的L1范数：

经验风险较小的模型可能较复杂，这时正则化项的值会较大，正则化的作用是选择经验风险与模型复杂度同时较小的模型。

正则化符合奥卡姆剃刀原理，在所有可能的模型中，能够很好的解释已知数据并且十分简单的模型才是最好的模型。从贝叶斯估计的角度来看，正则化项对应于模型的先验概率，可以假设复杂的模型有较小的先验概率，简单的模型有较大的先验概率。

模型选择的另一种方法是交叉验证，使用交叉验证的前提是数据不充足，常见的有简单交叉验证、S折交叉验证和留一交叉验证。如果数据充足，选择模型的一种简单方法是随机的将数据集分成三部分，分别为训练集、验证集和测试集，训练集用来训练模型，验证集用于模型的选择，而测试集用于最终对学习方法的评估。如果数据不充足，可以采用交叉验证的方法来选择模型。

6. 泛化能力

统计学习笔记（1）——统计学习方法概论_第9张图片

7.生成模型与判别模型

判别模型

该模型主要对p(y|x)建模，通过x来预测y。在建模的过程中不需要关注联合概率分布。只关心如何优化p(y|x)使得数据可分。通常，判别式模型在分类任务中的表现要好于生成式模型。但判别模型建模过程中通常为有监督的，而且难以被扩展成无监督的。

常见的判别式模型有：

Logisticregression

Lineardiscriminant analysis

Supportvector machines

Boosting

Conditionalrandom fields

Linearregression

Neuralnetworks

生成模型

该模型对观察序列的联合概率分布p(x,y)建模，在获取联合概率分布之后，可以通过贝叶斯公式得到条件概率分布。生成式模型所带的信息要比判别式模型更丰富。除此之外，生成式模型较为容易的实现增量学习。

常见的生成式模型有:

Gaussian mixture model and othertypes of mixture model

HiddenMarkov model

NaiveBayes

AODE

LatentDirichlet allocation

RestrictedBoltzmann Machine

由上可知，判别模型与生成模型的最重要的不同是，训练时的目标不同，判别模型主要优化条件概率分布，使得x,y更加对应，在分类中就是更可分。而生成模型主要是优化训练数据的联合分布概率。而同时，生成模型可以通过贝叶斯得到判别模型，但判别模型无法得到生成模型。

8.分类问题、标注问题和回归问题

前面提到过，输入变量和输出变量均为连续变量的预测问题称为回归问题；输出变量为有限个离散变量的预测问题称为分类问题；输入变量与输出变量均为变量序列的预测问题称为标注问题。

对于二分类问题，常用的评价指标是精确率和召回率。通常以关注的类为正类，其他类为负类，分类器在测试数据集上的预测或正确或不正确，4中情况出现的总数分别记为：

TP——将正类预测为正类数；

FN——将正类预测为负类数；

FP——将负类预测为正类数；

TN——将负类预测为负类数。

则，精确率定义为：

统计学习笔记（1）——统计学习方法概论_第10张图片

许多统计方法可以用于分类，包括k近邻法、感知机、朴素贝叶斯法、决策树、决策列表、逻辑斯谛回归模型、支持向量机、提升方法、贝叶斯网络、神经网络、Winnow等。

标注问题的输入是一个观测序列，输出是一个标记序列。标注问题在信息抽取、自然语言处理等领域被广泛采用。例如，自然语言处理中的词性标注就是一个典型的标注问题：给定一个由单词组成的句子，对这个句子中的每一个单词进行词性标注，即对一个单词序列预测其对应的词性标记序列。标注常用的统计学习方法有：隐马尔科夫模型、条件随机场。

回归问题的学习等价于函数拟合：选择一条函数曲线使其很好的拟合已知数据且很好地预测未知数据。回归问题按照输入变量的个数分为一元回归和多元回归，按照输入变量和输出变量之间的关系的类型即模型的类型，分为线性回归和非线性回归。回归学习最常用的损失函数时平方损失函数，在此情况下，回归问题可以用著名的最小二乘法求解。

笔记来源于《统计学习方法》——李航著

你可能感兴趣的:(统计学习笔记（1）——统计学习方法概论)

Linux知识点3 .R^O^ linux 运维服务器
1.磁盘管理方式？MBR（MasterBootRecord主启动记录）每块硬盘至多可以划分4个分区划分更多分区时可对某一分区进行扩展单个分区最大2TB只能有1个扩展分区，其内可以有多个逻辑分区GPT（GUIDPatritionTable，全局唯一标识分区表)支持每个磁盘上多于4个分区Windows系统最多可以划分128个分区单个分区超过2TB主分区，扩展分区，逻辑分区空闲表法：管理简单，但查找连续
修改虚拟机的yum配置别惊鹊 linux
1.配置源，命令是：sudocurl-o/etc/yum.repos.d/CentOS-Base.repohttps://mirrors.aliyun.com/repo/Centos-7.repo2.再清空缓存，让配置生效，命令是：sudoyumcleanallsudoyummakecache3.测试是否配置成功。下载一个常见工具试一试，如果能下载成功，就证明这个操作完成了yuminstalltr
网关边缘计算：让数据处理更贴近一线北京天拓四方边缘计算人工智能
在工业4.0与智慧城市的浪潮中，数据如同新时代的石油，驱动着各行各业的变革。然而，传统云计算模式下，数据需长途跋涉至云端处理，这不仅带来了延迟问题，更在带宽成本、隐私安全等方面遭遇瓶颈。此时，网关边缘计算作为“边缘智能”的核心技术，正悄然改变着数据处理的规则——它将计算能力下沉到网络边缘，让数据在“家门口”就能完成分析与决策。一、技术亮点：边缘智能的三大突破1.低延迟响应，实时决策无忧在智能制造车
云原生边缘计算：重塑分布式智能的时空边界桂月二二云原生边缘计算分布式
引言：算力向数据源头迁移的革命特斯拉自动驾驶系统每小时产生20TB边缘数据，时延要求低于50ms。中国移动5G边缘云实现ARPU值提升38%，华为云IEF平台将工业质检响应速度提升至15ms以内。ABIResearch预测2026年边缘AI芯片市场规模达520亿美元，KubeEdge管理边缘节点数突破千万级，单节点资源开销仅为K8s的1/8。一、边缘计算架构范式演进1.1技术架构对比矩阵特征维度中
04. 滑动冲突处理花启莫你是不是傻面试 android java
文章目录00.思维树01.什么是滑动冲突1.1**什么是滑动冲突？**1.2**一个简单的例子**02.外部拦截法03.内部拦截法04.滑动冲突实例05.外部拦截法解决滑动冲突06.内部拦截法解决滑动冲突其他介绍01.关于我的博客00.思维树什么是滑动冲突处理？怎样解决？什么是外部拦截法？什么是内部拦截法？01.什么是滑动冲突1.1什么是滑动冲突？滑动冲突指的是：当父容器和子View都可以响应滑动
2025年渗透测试面试题总结-字某某动-安全研究实习生（二面）（题目+回答）独行soc 2025年渗透测试面试指南面试职场和发展安全网络安全红蓝攻防护网
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录字某某动-安全研究实习生（二面）1.护网行动中的核心工作2.防护层级选择（WAF/IDS）3.误报治理方案4.内网误报分布场景5.MySQL执行PowerShell防护6.资产收集经验7.漏洞攻击案例8.SQL注入攻防详解原理防御方案OrderBy防御特殊字符处理9.
Blender常用快捷键的汇总金米kk blender
一、基础操作全选/取消全选：A（全选）、AA（连续按两次A取消全选）复制物体：Shift+D（复制后需点击确认位置）移动物体：G（按X/Y/Z可约束轴向移动）旋转物体：R（按X/Y/Z可约束轴向旋转）缩放物体：S（按X/Y/Z可约束轴向缩放）撤销：Ctrl+Z重做：Ctrl+Shift+Z二、视图与导航切换三视图：Shift+``（FPS自由视角模式）前/后视图：Ctrl+1（小键盘）/Ctrl+
blender 坐标系金属度 AI算法网奇 3d渲染数码相机
目录指向原点，并保持y轴朝上设置金属度具体操作1.绕X轴旋转90度2.绕Z轴旋转90度旋转矩阵示例坐标系讲解视频指向原点，并保持y轴朝上direction=-camera.locationrot_quat=direction.to_track_quat("-Z","Y")#[[1,0,0],[0,0,-1],[0,1,0]]camera.rotation_euler=rot_quat.to_eul
双目立体视觉（6.1）测距 2501_90596733 双目立体视觉计算机视觉人工智能 opencv
在计算机视觉领域，双目相机测距是一项关键技术，它通过模拟人类双眼的视觉机制，利用两个相机从不同角度拍摄同一场景，进而计算出物体的深度信息。一、双目测距的基本原理1.1视差图（DisparityMap）视差图是一种存储了单视图所有像素的视差值的二维图像。视差值是同一物体在左右两幅图像中的列坐标差，即通过比较左右两幅图像的对应像素差异来计算物体的深度信息。视差图是以图像对中任一幅图像为基准生成的，其大
【微服务】SpringBoot 整合Redis Stack 构建本地向量数据库相似性查询小码农叔叔 AI大模型实战与应用 springboot 入门到精通向量数据库 redis stack java使用向量数据库
目录一、前言二、向量数据库介绍2.1什么是向量数据库2.2向量数据库特点2.3向量数据库使用场景三、常用的向量数据库解决方案3.1Milvus3.1.1Milvus是什么3.1.2Milvus主要特点3.2Faiss3.2.1Faiss是什么3.2.2Faiss主要特点3.3Pinecone3.3.1Pinecone是什么3.3.2Pinecone主要特点3.4Weaviate3.4.1Weavi
WPF框架---MvvmLight介绍白白白白纸呀 WPF知识总结 c#开发语言 wpf
目录1.MvvmLight框架准备2.MvvmLight中的相关基类3.MvvmLight中的数据绑定与通知a.核心功能b.关键方法与属性c.完整示例d.高级用法4.MvvmLight中的命令对象a.命令对象的作用b.核心接口：ICommandc.MvvmLight中的RelayCommandd.动态更新命令的可执行状态e.高级用法5.Messenger对象使用a.Messenger的核心作用b.
链表的插入排序 Linked List Insertion Sort 清风无情446 链表 list 数据结构
一、插入排序Insertionsort插入排序很像玩扑克牌中整理手牌的过程，从第二个数开始依次比较其与前面所用数据的大小，直到找到其需要在的位置。当从第二个数据遍历到最后一个数据之后就完成了整个数组的排序。voidInsertionSort(intarr[],intn){for(inti=0;i=0;j--){//将比temp大的数依次向后移动一位arr[j+1]=arr[j];}//将temp插
素数筛介绍，C++实现非德77 c++算法开发语言密码学
一、素数在数学的奇妙世界里，素数是一个独特而又基础的概念。素数，也被称为质数，是指在大于1的自然数中，除了1和它自身外，不能被其他自然数整除的数。例如，2、3、5、7、11等都是素数，而4（能被2整除）、6（能被2和3整除）等则不是。素数在数学领域中具有举足轻重的地位，是数论等众多数学分支的核心研究对象。在计算机科学领域，素数也有着广泛的应用，比如在密码学中，RSA加密算法就依赖于大素数的性质来保
LeetCode 538.把二叉搜索树转换为累加树南巷逸清风 LeetCode leetcode c++python 算法
题目描述给出二叉搜索树的根节点，该树的节点值各不相同，请你将其转换为累加树（GreaterSumTree），使每个节点node的新值等于原树中大于或等于node.val的值之和。提醒一下，二叉搜索树满足下列约束条件：节点的左子树仅包含键小于节点键的节点。节点的右子树仅包含键大于节点键的节点。左右子树也必须是二叉搜索树。示例1：输入：[4,1,6,0,2,5,7,null,null,null,3,n
工作中常用的linux命令,Linux日常工作中比较实用的一些命令合集。 Wu Jerry 工作中常用的linux命令
系统uname-a查看内核/操作系统/CPU信息head-n1/etc/issue查看操作系统版本cat/proc/cpuinfo查看CPU信息hostname查看计算机名lsmod列出加载的内核模块env查看环境变量资源free-m查看内存使用量和交换区使用量df-h查看各分区使用情况du-sh查看指定目录的大小grepMemTotal/proc/meminfo查看内存总量grepMemFree
LeetCode-04：实现链表的插入排序 qq_46993700 LeetCode 插入排序链表 leetcode
题目使用插入排序对链表进行排序。Sortalinkedlistusinginsertionsort.输入{3,2,4}输出{2,3,4}思路1、若要实现插入排序，则需要先明白插入排序的原理。通俗讲便是将一个无序的数组（链表）插入有序的数组（链表）中，详细做法为：将无序数组的第一个元素切割出来作为有序数组的第一个元素，再将无序数组的第二个元素切割出来插入有序数组的相应位置，再将…，直至切割完整个无序
物联网服务器搭建及部署详细说明：掌握 Node.js、MongoDB、Socket.IO 和 JWT 的实用指南极客小张物联网服务器 node.js mongodb 数据库 json 运维开发
关键知识点目录1.环境准备1.1硬件要求1.2软件要求2.搭建步骤3.数据处理与存储3.1数据存储3.2数据实时处理3.2.1安装Socket.IO3.2.2修改服务器代码4.安全性4.1身份验证与授权4.2加密通信4.2.1生成自签名证书（开发环境）4.2.2修改服务器以支持HTTPS5.数据分析和可视化5.1集成Grafana5.2.2图表数据更新6.事件处理与报警6.1事件检测7.接口与集成
c++ 运算符优先级的中文表格 JANGHIGH C++c++开发语言
c++运算符优先级的中文表格C++运算符优先级的中文表格：优先级运算符描述结合性1a::b作用域解析左到右→2a++、a--后缀递增和递减左到右→type(a)函数式类型转换a()函数调用a[]下标访问a.b、a->b成员访问3++a、--a前缀递增和递减右到左←+a、-a一元正负!a、~a逻辑非、按位非(type)aC风格类型转换*a解引用&a取地址sizeof取大小（注1）co_await协程
【QT】-易错点笔记-2025-2-7 追心嵌入式 qt 笔记开发语言
1，QListpList；为空不能append()追加，要先new,再用QListpList为空时，确实不能调用append()方法。原因很简单，QList是一个类对象，在C++中，指针本身并不代表它指向的对象。因此，当你有一个指向QList类型的指针时，必须确保它指向一个有效的QList实例。关键问题：如果pList是nullptr（空指针），那么你尝试调用append()时，程序会崩溃，因为n
打卡代码随想录第17天：LeetCode654.最大二叉树、 617.合并二叉树、 700.二叉搜索树中的搜索、98.验证二叉搜索树 jingjingjing1111 算法数据结构
学习资料：代码随想录文中含LLM生成内容，不一定对654.最大二叉树力扣题目地址思路：不断寻找该部分的最大值去切割数组，不断递归，到在左闭右开区间不成立时，返回空节点。/***Definitionforabinarytreenode.*structTreeNode{*intval;*TreeNode*left;*TreeNode*right;*TreeNode():val(0),left(null
打卡代码随想录第15天：LeetCode 110.平衡二叉树 257. 二叉树的所有路径 404.左叶子之和 jingjingjing1111 leetcode
学习资料：代码随想录文中含LLM生成内容110.平衡二叉树力扣题目链接思路：逐层返回当前节点的最大高度，比较各节点的左右孩子高度后续方法遍历，因为‘中’是比较环节，要在左右之后/***Definitionforabinarytreenode.*structTreeNode{*intval;*TreeNode*left;*TreeNode*right;*TreeNode():val(0),left(
打卡代码随想录算法训练营第11天： 150. 逆波兰表达式求值 239. 滑动窗口最大值 347.前 K 个高频元素 jingjingjing1111 leetcode
代码随想录文中含LLM回答内容150.逆波兰表达式求值力扣题目链接思路K:先理解逆波兰表达式是啥，是把运算符放在了两个要运算的数字的后边，又叫后缀表达式。遇见数字就入栈，遇见算符就计算栈里前两个数字，算完再存回去classSolution{public:intevalRPN(vector&tokens){stackpoland;for(inti=0;ique;voidpop(intval){if(
向量数据库及其在大模型应用落地中的作用一望无际的大草原高级数据应用读书笔记工作总结数据库向量数据库解决方案
一、几个术语需要弄清楚几个术语，比如向量、Embedding、向量检索、向量数据库，具体如下。1.向量：为AI理解世界的通用数据形式，是多模态数据的压缩，任何模态数据都可以转为向量。文本直接送给计算机是无法认识的，而且是高维数据，需要对其进行向量化处理（即Embedding），处理完成后就形成一个个向量。2.Embedding：将文字文本转化为保留语义关系的向量文本，相当于利用embedding模
Pod 一直处于Pending状态，可能的原因有哪些？沉默的八哥运维 kubernetes 运维
一、常见原因分类1.资源不足•节点资源耗尽：CPU、内存或磁盘空间不足。•Pod请求超过节点能力：Pod请求的requests或limits超过节点实际资源。2.镜像问题•镜像未正确拉取（仓库地址错误、认证失败、镜像不存在）。•镜像体积过大，导致下载超时或存储不足。3.调度策略限制•节点亲和性/反亲和性：Pod需要特定节点标签，但集群无匹配节点。•污点（Taints）与容忍（Tolerations
PostgreSQL 生产环境升级指南：pg_upgrade 快速完成版本升级！ pitt1997 数据库学习笔记 PostgreSQL pg_upgrade 生产环境升级 PostgreSQL大版本升级
前言PostgreSQL的版本号由主要版本号和次要版本号组成。例如，在10.1中，10是主要版本，1是次要版本。关于更多版本的规划，请参考PostgreSQL版本路线图。版本号规则：PostgreSQL10及以后：版本号采用X.Y形式（如10.1，11.2），其中X为主要版本，Y为次要版本。PostgreSQL10之前：版本号采用X.Y.Z形式（如9.5.3），其中X.Y为主要版本（如9.5），Z
Java高频面试之集合-03 牛马baby java 面试开发语言
hello啊，各位观众姥爷们！！！本baby今天来报道了！哈哈哈哈哈嗝面试官：说说ArrayList和LinkedList的区别ArrayList与LinkedList的详细对比一、底层数据结构特性ArrayListLinkedList存储结构基于动态数组基于双向链表内存分配连续内存块非连续内存，节点分散存储元素访问通过索引直接寻址（时间复杂度O(1)）需要遍历链表（时间复杂度O(n)）插入/删除
C++ 学生成绩管理系统非德77 c++算法开发语言
一、项目背景与核心需求成绩管理系统是高校教学管理的重要工具，本系统采用C++面向对象编程实现，主要功能模块包括：学生信息管理（学号/姓名/3门课程成绩）成绩增删改查(CRUD)操作数据持久化存储统计分析与报表生成用户友好交互界面二、系统架构设计1.类结构设计采用经典的MVC分层思想：示意图如下：┌──────────────┐┌──────────────┐│Student││ScoreSyste
介绍一下Qt中的动态属性已是上好佳 qt 数据库开发语言 c++
在Qt中，动态属性是一种强大且灵活的特性，它允许你在运行时为对象添加、修改和查询属性，而不需要在类的定义中预先声明这些属性。下面为你详细介绍Qt动态属性的相关内容：1.动态属性的基本概念在传统的C++类中，属性通常是在类的定义里通过成员变量来表示的，并且在编译时就已经确定。而Qt的动态属性打破了这种限制，它可以在程序运行期间为任何继承自QObject的对象添加额外的属性，这些属性以键值对的形式存储
HashMap源码解读十五001 基础哈希算法散列表算法
1.HashMap概述HashMap是基于哈希表的Map接口实现，允许空键和空值。它继承自AbstractMap，实现了Map、Cloneable和Serializable接口。2.底层数据结构在JDK1.8中，HashMap的底层数据结构由数组+链表+红黑树构成：数组：存储哈希表的节点（Node）。链表：解决哈希冲突，当多个键的哈希值相同或相近时，它们会被存储在同一个数组槽位的链表中。红黑树：当
Vim常用命令备忘 assaper vim 编辑器 linux
文章目录一、Vim支持模式二、Vim常用命令1.光标移动2.文本操作3.查找置换4.保存退出5.多文件编辑6.多窗口编辑7.多标签编辑8.目录操作9.运行命令10.可视化操作11.其他命令一、Vim支持模式普通模式：打开文件时的默认模式，在其他模式下按Esc键都可返回到该模式。插入模式：在普通模式下按i/a/o键进入该模式，进行文本编辑操作。命令行模式：在普通模式下输入:后会进入该模式，在该模式下
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他