slim1017

机器学习与数据挖掘、计算机视觉方法资料汇总（永久更新）

感觉这一学期学了挺多各种各样的机器学习方法，好多不经常用都快忘了。把各种方法我觉得讲得比较好的资料记录下来，永久更新。。。

后文提到的主要资料书籍汇总：

Ng CS229：斯坦福Andrew Ng 机器学习课程，网易公开课和coursera 上都有视频；

UFLDL教程：Andrew Ng 深度学习教程：http://deeplearning.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B

《独立成分分析》：作者：AapoHyvarinen周宗潭译

《模式识别张学工第三版》

《模式分类 Duda 第二版》

《机器学习实战》

《统计学习方法李航 2012年》

《The Elements of Statistical Learning:Data Mining, Inference, and Prediction》2009年第二版，作者：Trevor Hastie，Robert Tibshirani，Jerome Friedman

(这本英文可以好好啃啃）

数据分析与降维方法：

PCA（主成分分析）

核心要点：数据预处理，选取协方差矩阵最大K个特征值，降维同时保留大部分信息。

参考资料：Ng CS229 Part11 PCA；UFLDL教程 PCA部分

进阶：kernel PCA等

白化

核心要点：（1）数据的去相关（PCA中的乘以旋转矩阵已经去相关了），（2）所有特征具有相同方差；白化也是常见的预处理步骤。

参考资料：UFLDL教程白化部分；《独立成分分析》第6章。

LDA（线性判别分析）

核心要点：与PCA类似，但是投影目的不太一样；PCA强调寻找投影方向能保留更多的信息；DA强调投影后类间间距大，类内间距小。

参考资料：《模式识别张学工第三版》4.3

FA（Factor Analysis）

核心要点：又比较像PCA，但是它是对概率密度的估计。

参考资料：Ng CS229 Part10（用到了EM算法）

K-L变换（Karhunen-LoèveTransform）

核心要点：这次不是像PCA了，K-L变换包含PCA，当K-L变换中用数据的协方差矩阵作为K-L坐标系的产生矩阵时，就是PCA。

参考资料：《模式识别张学工第三版》8.4

MDS（多维尺度分析）

核心要点：样本间的距离关系在低维表示

参考资料：《模式识别张学工第三版》8.7； CSDN博客 http://blog.csdn.net/songrotek/article/details/42235097

Manifold Learning（流形学习）

核心要点：降维，最近才开始看，入个门：IsoMap 和 LLE

参考资料：论文 ISOMAP：A Global Geometric Framework for Nonlinear Dimensionality Reduction；论文 LLE-Nonlinear Dimensionality Reduction by Locally Linear Embedding；博客：流形学习综述http://blog.csdn.net/chl033/article/details/6107042 ；UCLA 提供的 matlab code ：http://www.math.ucla.edu/~wittman/mani/index.html

。。。好像连接不能用了，但是网上其他地方能找到代码：http://download.csdn.net/download/bachelor119/1562326 （流形学习的代码都相对挺简单的，代码中大部分都是GUI，只看算法部分就好）；相关论文：http://blog.csdn.net/stellar0/article/details/8741623

ICA（独立成分分析）

核心要点：s=Ax；

参考资料：Ng CS229 Part12 ICA

进阶：《独立成分分析》整本。

神经网络降维

核心要点：自编码器降维，受限波尔兹曼机降维

参考资料：论文：G. E. Hinton：Reducing the Dimensionality of Data with Neural Networks；UFLDL教程自编码器部分；Theano DeepLearning 教程自编码器部分。

分类方法：

KNN（最近邻分类器）

核心要点：新样本按与老样本欧氏距离最近表示最相似；

参考资料：《机器学习实战》第2章；《模式识别张学工第三版》6.1。

贝叶斯方法（朴素贝叶斯，贝叶斯分类器，贝叶斯信念网）

核心要点：贝叶斯公式，通过数据得到已知类别特征的概率，通过贝叶斯公式求出已知特征各类的概率。

参考资料：《机器学习实战》第4章；Ng CS229 Part 4.2；《统计学习方法》第4章。维基百科 https://en.wikipedia.org/wiki/Naive_Bayes_classifier

Logistic 回归

参考资料：Ng CS229 Part 1；《机器学习实战》第5章；《统计学习方法》第6章。

决策树

核心要点：用某种标准（熵增益）来量度哪个特征分类能力更强。

参考资料：《机器学习实战》第3章；《统计学习方法》第5章

Adaboost

（Adaboost，随机森林，SVM这几个都是计算机视觉使用最多的分类器）

核心要点：3个臭皮匠赛过猪哥亮！

参考资料：《机器学习实战》第7章；《统计学习方法》第8章

SVM（支持向量机）

核心要点：

线性支持向量机的优化目标实际上也是正则化，防止过拟合，这也是SVM泛化能力的保障；

加上惩罚函数C防止了某些偏离特别大的数据对决策面的过度影响；

加入kernel 把低维数据映射到高维，把低维不可分类变到高维后就可能可分了，但是数据维度高了之后，会引发维数灾变的问题，kernel trick的trick 就在于数据映射到高维去分类，却通过kernel 函数在低维空间计算高维特征的内积（SVM计算过程中只需要计算内积）。

参考资料：比较出名的博客：支持向量机通俗导论（理解SVM的三层境界）；《统计学习方法》第7章（我觉得统计学习方法这本书有些章节真心写得很细很细，想入门绝对值得一看）；Ng CS229 Part 5；

Mixtures of Gaussians（高斯混合模型）

核心要点：模型本身并没有太多需要理解的地方，但是这个模型的求解用到了著名的机器学习算法EM算法，这个真是得好好看看，对包含隐变量的概率问题经常用到EM算法。另外，05年斯坦福的无人车，视觉感知部分用到了这个模型来判断前方是否为可以通行区域（2分类问题）。

参考资料：Ng CS229 Notes 7a；EM算法是紧接着的 Part 9；

神经网络及深度学习（深度神经网络）

核心要点：多层感知器，自编码器，受限波尔兹曼机，卷积神经网络，RNN，LSTM。关于深度学习，我也写了UFLDL和Theano两个教程的笔记了。

参考资料：UFLDL教程；Theano DeepLearning 教程；这两个看完了可以看看 coursera 上 Hinton 的课：Neural Networks for Machine Learning-Geoffrey Hinton。

其他常见模型：

隐马尔科夫模型，条件随机场

核心要点：这两个在自然语言处理中用得挺多

参考资料：《统计学习方法》第10，11章

回归模型：

线性回归；局部加权线性回归；岭回归（对参数加上正则化项）；Lasso回归；Least Angle Regression；

参考资料：《机器学习实战》第8章；《The Elements of Statistical Learning》第二版（2009年）中回归部分（这本书真心值得读，英文的，慢慢啃）。

你可能感兴趣的:(机器学习与数据挖掘、计算机视觉方法资料汇总（永久更新）)

Java数据结构-----Map和Set
目录引入：模型：Map的使用：常见方法：Set的使用：常见方法：搜索树概念：操作：查找：插入：删除：哈希表概念：冲突哈希函数设计负载因子的调节解决哈希冲突闭散列开散列引入：Map和set是一种专门用来进行搜索的容器或者数据结构，其搜索的效率与其具体的实例化子类有关。以前常见的搜索方式有：1.直接遍历，时间复杂度为O(N)，元素如果比较多效率会非常慢2.二分查找，时间复杂度为O(logN),但搜索前
分库分表之实战-sharding-JDBC绑定表配置实战
大家好，我是工藤学编程一个正在努力学习的小博主，期待你的关注实战代码系列最新文章C++实现图书管理系统（QtC++GUI界面版）SpringBoot实战系列【SpringBoot实战系列】Sharding-Jdbc实现分库分表到分布式ID生成器Snowflake自定义wrokId实战环境搭建大集合环境搭建大集合(持续更新）分库分表分库分表之实战-sharding-JDBC水平分库+水平分表配置实战
iframe详解和用途解读
前端中的iframe详解1.什么是iframe？iframe（inlineframe）是一种在HTML页面中嵌入另一个HTML页面的方法。通过iframe，你可以在当前网页中显示另一个完全独立的网页，它们是彼此分离的。换句话说，iframe允许你在当前页面中创建一个子窗口，而该窗口可以加载另一个网站或内容。在这个例子中，iframe会在页面中嵌入并显示https://www.example.com
使用Python调用C++：简单易学的方法程序员杨弋 Python全栈工程师学习指南 python c++开发语言
Python是一种易于学习和理解的编程语言，而C++是强大的编程语言。Python代码可以在很短的时间内编写出来，但如果涉及到大量的计算或需要高性能，则需要使用更快、更高效的编程语言。在这种情况下，Python调用C++是一种常见的方法，因为它可以提供C++的高速性能和Python的便捷性。在本文中，我们将介绍如何使用Python调用C++。首先，需要创建C++函数库（DLL），并确保该库包含需要
Django怎么获取get请求里面的参数
获取get请求里面参数的两种方法之三种写法一，当get网址是127.0.0.1:8000/info/?id=20&s_id=30这种类型的网址时我们在urls的路由的urlpatterns里面里面这样定义路由url(r'info/$',views.info),那么我们怎么把参数取出来呢因为我们调用的是views里面的info函数，所以我们可以这样获取到通过request.GET获取请求携带的参数d
Ajax Get请求获取后台返回的数据 qi_rui_a Php
/**Ajax对象的成员*属性:responseText:以字符串形式接受返回的数据*readyState:*0:刚创建ajax对象*1:已经调用open方法*2:已经调用send方法*3:已经返回部分数据*4:请求完成,数据返回完整*onreadystatechange:事件:当readystatus发生改变的时候*方法:*open()创建新的http请求*send()把请求发送给服务器**/f
C++调用python的方法
一、C++中调用python接口在线手册：https://docs.python.org/3/c-api/intro.htmlWindows环境下python安装时提供了给C++调用的头文件及库文件。C++中引用头文件include，放在所有标准引用之前。将头文件目录、库文件目录添加到工程属性。调用python提供的API，传入模块名、函数名、函数参数（封装成PyObject的形式）获取返回值并解
项目篇：加入Python程序之如何在Python中使用C++？ guangcheng0312q python c++windows 开发语言
项目篇：加速Python程序之如何在Python中使用C++？通常像一些耗时的操作，我们期望在C++中去实现，然后使用Python去调用对应的接口，或者因为底层库的原因，需要支持对外的PythonAPI，那么我们通常需要支持在Python中访问C++，如何实现呢？方法比较多，本节以pybind11为例，引入一个完整的项目工程模版，如果你后续有这种需求，可以基于模版去修改。注：(懒人版)本节的所有代
python和C++相互调用使用妄想出头的工业炼药师 c++开发语言
结论：首选PyBind11：综合性能、易用性最佳（GitHub⭐48k+）优先考虑Cython：涉及大量科学计算或已有Cython代码避免Boost.Python（历史包袱重）和SWIG（配置复杂），除非维护旧项目。python调用C++接口C++调用python接口在C++中使用Python库，特别是使用pybind11，是一个非常强大的方法，可以让你在C++项目中轻松地利用Python的强大功
【论文笔记】GaussianFusion: Gaussian-Based Multi-Sensor Fusion for End-to-End Autonomous Driving
原文链接：https://arxiv.org/abs/2506.00034v1简介：现有的多传感器融合方法多使用基于注意力的拉直(flatten)融合或通过几何变换的BEV融合，但前者可解释性差，后者计算开销大（如下图(a)(b)所示）。本文提出GaussianFusion（下图(c)），一种基于高斯的多传感器融合框架，用于端到端自动驾驶。使用直观而紧凑的高斯表达，聚合不同传感器的信息。具体来说，
Redis 分布式锁实现与实践佑瞻数据库与知识图谱 redis 分布式数据库
在分布式系统架构中，多个独立进程对共享资源的并发访问控制是常见需求，分布式锁作为解决这一问题的关键技术，在缓存更新、任务调度、库存管理等场景中发挥着重要作用。本文将从基础原理出发，详细阐述基于Redis的分布式锁实现方案，包括单实例模式与Redlock算法，并探讨其在实际应用中的关键考量。分布式锁核心概念分布式锁是一种跨进程、跨机器的同步机制，用于保证多个分布式节点对共享资源的互斥访问。一个可靠的
脑电分析入门指南：信号处理、特征提取与机器学习 Ao000000 信号处理机器学习人工智能
脑电分析入门指南一、为什么要研究脑电1.课题目标（解决什么问题）2.输入与输出二、脑电分析的整体流程三、每一步详解1.数据采集2.预处理3.特征提取4.特征选择/降维5.分类与识别四、研究过程中遇到的挑战与解决方法五、学习感受一、为什么要研究脑电1.课题目标（解决什么问题）本课题旨在通过对脑电（EEG）的采集与分析，提取有用的神经信息，实现对某类脑状或行为的识别/预测/评估。例如：情绪识别、疾病诊
Unity Netcode自定义数据传输——结构体及其序列化未来的中科院院士 unity 游戏引擎
在UnityNetcode中，要实现自定义数据的网络传输，确实需要两个关键部分：✅两个必需组件：数据结构定义publicstructPlayerState:INetworkSerializable{publicintid;//字段1：玩家IDpublicboolisReady;//字段2：准备状态//...其他字段}作用：定义要传输的数据内容本质：声明"要传输什么"序列化方法实现publicvoi
使用工厂模式和策略模式实现布隆过滤器小菜0-o 策略模式
使用工厂模式和策略模式实现布隆过滤器的大概流程如下：定义布隆过滤器接口：首先定义一个布隆过滤器接口，包括添加元素和判断元素是否存在两个基本操作。实现具体的布隆过滤器类：创建一个具体的布隆过滤器类，实现布隆过滤器接口中的方法。在这个类中，需要定义布隆过滗器的数据结构（比如位数组）、大小等属性。定义哈希策略接口：定义一个哈希策略接口，包含计算哈希值的方法。实现具体的哈希策略类：创建多个具体的哈希策略类
PPT 图形制作神器推荐：从基础到 AI 的高效工具指南
在当今信息飞速传播的时代，PPT已成为展示观点、传递信息的重要媒介。一份出色的PPT，不仅要有清晰的逻辑和丰富的内容，美观且直观的图形更是吸引观众注意力、提升信息传达效率的关键。无论是商务汇报中展示数据趋势的图表，还是教学课件里解释概念的示意图，恰当的PPT图形都能让演示效果事半功倍。那么，如何高效地生成这些助力PPT出彩的图形呢？接下来，我们将深入探讨多种实用方法，并着重为您推荐功能强大的Pic
KTO（Kahneman-Tversky Optimization）技术详解与工程实现 DK_Allen 大模型深度学习 pytorch 人工智能 KTO
KTO（Kahneman-TverskyOptimization）技术详解与工程实现一、KTO核心思想KTO是基于行为经济学前景理论（ProspectTheory）的偏好优化方法，突破传统偏好学习需要成对数据的限制，仅需单样本绝对标注（好/坏）即可优化模型。其创新性在于：损失函数设计：将人类对"收益"和"损失"的非对称心理反应量化数据效率：无需构建偏好对（y_w>y_l），直接利用松散标注二、KT
Python中字符串的操作方法幻鸩605 python java 开发语言
字符串拼接使用+运算符将多个字符串连接起来。例如：s1="Hello"s2="World"result=s1+""+s2print(result)#输出：HelloWorld字符串重复使用*运算符重复字符串。例如：s="abc"result=s*3print(result)#输出：abcabcabc字符串长度使用len()函数获取字符串长度。例如：s="Python"length=len(s)pr
MySQL 触发器中判断 NULL 值不生效？问题解析与解决方案
前言在MySQL数据库开发中，触发器是一个非常实用的功能，它能在数据表发生插入、更新或删除操作时自动执行指定的逻辑。但在实际使用中，很多开发者会遇到一个棘手的问题：当触发器中涉及NULL值判断时，预期的逻辑往往不生效。本文就来详细分析这一问题的原因，并提供具体的解决方案。一、问题现象：为什么NULL判断在触发器中“失灵”？先来看一个常见的错误示例。假设我们有一张user表，包含name（姓名）和a
常见DDOS攻击方式与防护详解 “萌面大虾” 网络安全 ddos 网络网络安全
常见DDOS攻击方式与防护详解1四层DDOS1.1基于UDP协议的DDOS攻击与防护1.1.1UDPFlood攻击原理：攻击者发送大量UDP协议报文，UDP协议报文是面向无连接的，受害者只能被动接受所有报文，导致业务资源被占用。防护方法1、常见端口限速：如常见DNS、NTP、SNMP等协议均有固定端口，可以对其端口进行阈值限速处理，防止流量过大。2、特征提取过滤：UDP协议报文多为工具输出，具有一
大型语言模型中的提示工程系统综述：技术与应用 AI专题精讲 Paper阅读语言模型人工智能自然语言处理
摘要提示工程已成为扩展大型语言模型（LLMs）和视觉语言模型（VLMs）能力的不可或缺的技术。这种方法利用任务特定的指令（称为prompt），在不修改核心模型参数的情况下增强模型效能。与更新模型参数不同，prompt仅通过给定指令即可引出所需的模型行为，从而实现预训练模型在下游任务中的无缝集成。prompt可以是提供上下文以引导模型的自然语言指令，也可以是激活相关知识的学习向量表示。这一新兴领域已
JavaSE的集合（Collection） pkhlll java
集合主要分为两大系列：Collection和MapCollection：Collection的子接口有Set、List、QueueCollection是层次结构的根接口，是所有单列集合的父接口，在Collection中定义了单列集合(List和Set)的通用的一些方法：1、添加元素（1）add(Eobj)：添加元素对象到当前集合中（2）addAll(Collectionother)：添加other
freertos 外设同步 is0815 stm32 arm开发
是的，多个任务共享SPI、I2C、UART等外设时，通常必须加锁，否则会出现资源竞争、数据错乱、通信失败等问题。这是RTOS编程中常见的同步问题。为什么需要加锁？外设通常是共享资源，比如：SPI是一个总线，发送和接收过程是连续的，不能被中断打断；I2C通常只有一个控制器（master），多任务如果同时发起通信，会造成仲裁冲突；UART发送过程可能被打断，导致拼接成一条乱码。✅加锁的方法1.使用互斥
【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个
专栏导读本专栏收录于《华为OD机试（JAVA）真题（B卷+A卷+C卷+D卷+E卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od python javascript 华为OD机试 2025B卷
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
【全网首发】华为OD机试 2025B卷机考真题库清单（全真题库）含考点说明哪吒搬砖工逆袭Java架构师华为od java 2025B卷华为OD机试
专栏导读本专栏收录于《华为OD机试（JAVA）真题（E卷+D卷+A卷+B卷+C卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
【2025B卷首发】华为OD机试真题+全流程解析+备考攻略+经验分享+Java最佳实现
专栏导读本专栏收录于《华为OD机试（JAVA）真题（E卷+D卷+A卷+B卷+C卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
[C语言初阶]指针初阶
目录一、指针是什么？二、指针与指针类型三、野指针及其避免方法3.1什么是野指针？3.2野指针产生的原因：3.3如何避免野指针？四、指针运算4.1应用：实现strlen函数五、指针与数组六、二级指针七、指针数组指针是C语言的灵魂所在，也是许多初学者感到困惑的概念。本文将带你系统学习指针的基础知识，从指针的本质到指针运算，再到指针与数组的关系，最后介绍二级指针和指针数组的概念。通过本文的学习，你将建立
富集分析——GO、KEGG ersanshi055 生信小菜鸟富集分析 GO kegg
一、富集分析的基础认知在生物信息学研究领域，基因功能解析及通路阐释是众多分析流程中的关键环节，富集分析（EnrichmentAnalysis）是将基因或蛋白列表按照功能进行分类的统计方法，目的是找出在特定基因集中显著富集的功能类别或通路。通过这种方法，研究人员可以理解一组基因（如差异表达基因）在哪些生物学过程、分子功能或通路中代表。1.富集分析分类基因本体论富集分析（GeneOntologyEnr
蓝牙协议栈低功耗之安全管理协议层(SMP) 写代码的无赖的猴子 BLE低功耗蓝牙协议栈网络信息与通信物联网
逻辑链路控制和适配协议层L2CAPSMP层阶段一阶段二Legacyparing安全连接交换公匙鉴权阶段1鉴权阶段2阶段三LElegacypairing：LESecureConnections交叉密匙特性配对PDU类型Hello，我是无赖的猴子，一个蓝牙爱好者，分享蓝牙相关的知识，关注我，学习蓝牙：蓝牙文章链接直达：1.profile层（待更新）2.属性协议层(ATT)（待更新）3.安全管理协议层(
华为云服务器debain11.1 安装zerotier,并改成moon节点碎风影华为云服务器运维
看到华为云，46元一年2c2g的云服务器，果断入手。首先用它“安装zerotier,并改成moon节点”，据说可以提升两台机器之间的网速Debian11.1系统中安装ZeroTier的步骤首先，您需要更新您的系统以确保所有的包都是最新的。这可以通过运行以下命令来完成：aptupdate&&aptupgrade接下来，您需要下载ZeroTier的安装脚本。可以通过运行以下命令来实现：curl-sht
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他