蓁蓁尔

机器学习数据挖掘知识点总结大纲

**

Basis(基础)：

**

SSE(Sum of Squared Error, 平方误差和)
SAE(Sum of Absolute Error, 绝对误差和)
SRE(Sum of Relative Error, 相对误差和)
MSE(Mean Squared Error, 均方误差)
RMSE(Root Mean Squared Error, 均方根误差)
RRSE(Root Relative Squared Error, 相对平方根误差)
MAE(Mean Absolute Error, 平均绝对误差)
RAE(Root Absolute Error, 平均绝对误差平方根)
MRSE(Mean Relative Square Error, 相对平均误差)
RRSE(Root Relative Squared Error, 相对平方根误差)
Expectation(期望)&Variance(方差)
Standard Deviation(标准差，也称Root Mean Squared Error, 均方根误差)
CP(Conditional Probability, 条件概率)
JP(Joint Probability, 联合概率)
MP(Marginal Probability, 边缘概率)
Bayesian Formula(贝叶斯公式)
CC(Correlation Coefficient, 相关系数)
Quantile (分位数)
Covariance(协方差矩阵)
GD(Gradient Descent, 梯度下降)
SGD(Stochastic Gradient Descent, 随机梯度下降)
LMS(Least Mean Squared, 最小均方)
LSM(Least Square Methods, 最小二乘法)
NE(Normal Equation, 正规方程)
MLE(Maximum Likelihood Estimation, 极大似然估计)
QP(Quadratic Programming, 二次规划)
L1 /L2 Regularization(L1/L2正则, 以及更多的, 现在比较火的L2.5正则等)
Eigenvalue(特征值)
Eigenvector(特征向量)

Common Distribution(常见分布)：

Discrete Distribution(离散型分布)：

Bernoulli Distribution/Binomial Distribution(贝努利分布/二项分布)
Negative Binomial Distribution(负二项分布)
Multinomial Distribution(多项分布)
Geometric Distribution(几何分布)
Hypergeometric Distribution(超几何分布)
Poisson Distribution (泊松分布)

Continuous Distribution (连续型分布)：

Uniform Distribution(均匀分布)
Normal Distribution/Gaussian Distribution(正态分布/高斯分布)
Exponential Distribution(指数分布)
Lognormal Distribution(对数正态分布)
Gamma Distribution(Gamma分布)
Beta Distribution(Beta分布)
Dirichlet Distribution(狄利克雷分布)
Rayleigh Distribution(瑞利分布)
Cauchy Distribution(柯西分布)
Weibull Distribution (韦伯分布)

Three Sampling Distribution(三大抽样分布)：

Chi-square Distribution(卡方分布)
t-distribution(t-分布)
F-distribution(F-分布)

Data Pre-processing(数据预处理)：

Missing Value Imputation(缺失值填充)
Discretization(离散化)
Mapping(映射)
Normalization(归一化/标准化)

Sampling(采样)：

Simple Random Sampling(简单随机采样)
Offline Sampling(离线等可能K采样)
Online Sampling(在线等可能K采样)
Ratio-based Sampling(等比例随机采样)
Acceptance-rejection Sampling(接受-拒绝采样)
Importance Sampling(重要性采样)
MCMC(Markov Chain MonteCarlo 马尔科夫蒙特卡罗采样算法：Metropolis-Hasting& Gibbs)

Clustering(聚类)：

K-MeansK-Mediods
二分K-Means
FK-Means
Canopy
Spectral-KMeans(谱聚类)
GMM-EM(混合高斯模型-期望最大化算法解决)
K-Pototypes
CLARANS(基于划分)
BIRCH(基于层次)
CURE(基于层次)
STING(基于网格)
CLIQUE(基于密度和基于网格)
2014年Science上的密度聚类算法等

Clustering Effectiveness Evaluation(聚类效果评估)：

Purity(纯度)
RI(Rand Index, 芮氏指标)
ARI(Adjusted Rand Index, 调整的芮氏指标)
NMI(Normalized Mutual Information, 规范化互信息)
F-meaure(F测量)

Classification&Regression(分类&回归)：

LR(Linear Regression, 线性回归)
LR(Logistic Regression, 逻辑回归)
SR(Softmax Regression, 多分类逻辑回归)
GLM(Generalized Linear Model, 广义线性模型)
RR(Ridge Regression, 岭回归/L2正则最小二乘回归)，LASSO(Least Absolute Shrinkage and Selectionator Operator , L1正则最小二乘回归)
DT(Decision Tree决策树)
RF(Random Forest, 随机森林)
GBDT(Gradient Boosting Decision Tree, 梯度下降决策树)
CART(Classification And Regression Tree 分类回归树)
KNN(K-Nearest Neighbor, K近邻)
SVM(Support Vector Machine, 支持向量机, 包括SVC(分类)&SVR(回归))
CBA(Classification based on Association Rule, 基于关联规则的分类)
KF(Kernel Function, 核函数)

Polynomial Kernel Function(多项式核函数)
Guassian Kernel Function(高斯核函数)
Radial Basis Function(RBF径向基函数)
String Kernel Function 字符串核函数

NB(Naive Bayesian,朴素贝叶斯)
BN(Bayesian Network/Bayesian Belief Network/Belief Network 贝叶斯网络/贝叶斯信度网络/信念网络)
LDA(Linear Discriminant Analysis/Fisher Linear Discriminant 线性判别分析/Fisher线性判别)
EL(Ensemble Learning, 集成学习)

Boosting
Bagging
Stacking
AdaBoost(Adaptive Boosting 自适应增强)

MEM(Maximum Entropy Model, 最大熵模型)

Classification EffectivenessEvaluation(分类效果评估)：

Confusion Matrix(混淆矩阵)
Precision(精确度)
Recall(召回率)
Accuracy(准确率)
F-score(F得分)
ROC Curve(ROC曲线)
AUC(AUC面积)
Lift Curve(Lift曲线)
KS Curve(KS曲线)

PGM(Probabilistic Graphical Models, 概率图模型)：

BN(BayesianNetwork/Bayesian Belief Network/ Belief Network , 贝叶斯网络/贝叶斯信度网络/信念网络)
MC(Markov Chain, 马尔科夫链)
MEM(Maximum Entropy Model, 最大熵模型)
HMM(Hidden Markov Model, 马尔科夫模型)
MEMM(Maximum Entropy Markov Model, 最大熵马尔科夫模型)
CRF(Conditional Random Field,条件随机场)
MRF(Markov Random Field, 马尔科夫随机场)
Viterbi(维特比算法)

NN(Neural Network, 神经网络)

ANN(Artificial Neural Network, 人工神经网络)
SNN(Static Neural Network, 静态神经网络)
BP(Error Back Propagation, 误差反向传播)
HN(Hopfield Network)
DNN(Dynamic Neural Network, 动态神经网络)
RNN(Recurrent Neural Network, 循环神经网络)
SRN(Simple Recurrent Network, 简单的循环神经网络)
ESN(Echo State Network, 回声状态网络)
LSTM(Long Short Term Memory, 长短记忆神经网络)
CW-RNN(Clockwork-Recurrent Neural Network, 时钟驱动循环神经网络, 2014ICML）等.

Deep Learning(深度学习)：

Auto-encoder(自动编码器)
SAE(Stacked Auto-encoders堆叠自动编码器)

Sparse Auto-encoders(稀疏自动编码器)
Denoising Auto-encoders(去噪自动编码器)
Contractive Auto-encoders(收缩自动编码器)

RBM(Restricted Boltzmann Machine, 受限玻尔兹曼机)
DBN(Deep Belief Network, 深度信念网络)
CNN(Convolutional Neural Network, 卷积神经网络)
Word2Vec(词向量学习模型)

Dimensionality Reduction(降维)：

LDA(Linear Discriminant Analysis/Fisher Linear Discriminant, 线性判别分析/Fish线性判别)
PCA(Principal Component Analysis, 主成分分析)
ICA(Independent Component Analysis, 独立成分分析)
SVD(Singular Value Decomposition 奇异值分解)
FA(Factor Analysis 因子分析法)

Text Mining(文本挖掘)：

VSM(Vector Space Model, 向量空间模型)
Word2Vec(词向量学习模型)
TF(Term Frequency, 词频)
TF-IDF(TermFrequency-Inverse Document Frequency, 词频-逆向文档频率)
MI(Mutual Information, 互信息)
ECE(Expected Cross Entropy, 期望交叉熵)
QEMI(二次信息熵)
IG(Information Gain, 信息增益)
IGR(Information Gain Ratio, 信息增益率)
Gini(基尼系数)
x2 Statistic(x2统计量)
TEW(Text Evidence Weight, 文本证据权)
OR(Odds Ratio, 优势率)
N-Gram Model
LSA(Latent Semantic Analysis, 潜在语义分析)
PLSA(Probabilistic Latent Semantic Analysis, 基于概率的潜在语义分析)
LDA(Latent Dirichlet Allocation, 潜在狄利克雷模型)
SLM(Statistical Language Model, 统计语言模型)
NPLM(Neural Probabilistic Language Model, 神经概率语言模型)
CBOW(Continuous Bag of Words Model, 连续词袋模型)
Skip-gram(Skip-gram Model)

Association Mining(关联挖掘)：

Apriori算法
FP-growth(Frequency Pattern Tree Growth, 频繁模式树生长算法)
MSApriori(Multi Support-based Apriori, 基于多支持度的Apriori算法)
GSpan(Graph-based Substructure Pattern Mining, 频繁子图挖掘)

Sequential Patterns Analysis(序列模式分析)

AprioriAll
Spade
GSP(Generalized Sequential Patterns, 广义序列模式)
PrefixSpan

Forecast(预测)

LR(Linear Regression, 线性回归)
SVR(Support Vector Regression, 支持向量机回归)
ARIMA(Autoregressive Integrated Moving Average Model, 自回归积分滑动平均模型)
GM(Gray Model, 灰色模型)
BPNN(BP Neural Network, 反向传播神经网络)
SRN(Simple Recurrent Network, 简单循环神经网络)
LSTM(Long Short Term Memory, 长短记忆神经网络)
CW-RNN(Clockwork Recurrent Neural Network, 时钟驱动循环神经网络)
……

Linked Analysis(链接分析)

HITS(Hyperlink-Induced Topic Search, 基于超链接的主题检索算法)
PageRank(网页排名)

Recommendation Engine(推荐引擎)：

SVD
Slope One
DBR(Demographic-based Recommendation, 基于人口统计学的推荐)
CBR(Context-based Recommendation, 基于内容的推荐)
CF(Collaborative Filtering, 协同过滤)
UCF(User-based Collaborative Filtering Recommendation, 基于用户的协同过滤推荐)
ICF(Item-based Collaborative Filtering Recommendation, 基于项目的协同过滤推荐)

Similarity Measure&Distance Measure(相似性与距离度量)：

EuclideanDistance(欧式距离)
Chebyshev Distance(切比雪夫距离)
Minkowski Distance(闵可夫斯基距离)
Standardized EuclideanDistance(标准化欧氏距离)
Mahalanobis Distance(马氏距离)
Cos(Cosine, 余弦)
Hamming Distance/Edit Distance(汉明距离/编辑距离)
Jaccard Distance(杰卡德距离)
Correlation Coefficient Distance(相关系数距离)
Information Entropy(信息熵)
KL(Kullback-Leibler Divergence, KL散度/Relative Entropy, 相对熵)

Optimization(最优化)：

Non-constrained Optimization(无约束优化)：
Cyclic Variable Methods(变量轮换法)
Variable Simplex Methods(可变单纯形法)
Newton Methods(牛顿法)
Quasi-Newton Methods(拟牛顿法)
Conjugate Gradient Methods(共轭梯度法)。

Constrained Optimization(有约束优化)：
Approximation Programming Methods(近似规划法)
Penalty Function Methods(罚函数法)
Multiplier Methods(乘子法)。
Heuristic Algorithm(启发式算法)
SA(Simulated Annealing, 模拟退火算法)
GA(Genetic Algorithm, 遗传算法)
ACO(Ant Colony Optimization, 蚁群算法)

Feature Selection(特征选择)：

Mutual Information(互信息)
Document Frequence(文档频率)
Information Gain(信息增益)
Chi-squared Test(卡方检验)
Gini(基尼系数)

Outlier Detection(异常点检测)：

Statistic-based(基于统计)
Density-based(基于密度)
Clustering-based(基于聚类)。

Learning to Rank(基于学习的排序)：

Pointwise

McRank

Pairwise

RankingSVM
RankNet
Frank
RankBoost；

Listwise

AdaRank
SoftRank
LamdaMART

Tool(工具)：

MPI
Hadoop生态圈
Spark
IGraph
BSP
Weka
Mahout
Scikit-learn
PyBrain
Theano

转自：http://blog.csdn.net/heyongluoyao8/article/details/47840255

你可能感兴趣的:(机器学习相关)

深度学习--机器学习相关（2）在下小天n 深度学习深度学习机器学习人工智能
1.适应性矩估计适应性矩估计(AdaptiveMomentEstimation,Adam)是一种可以代替传统的梯度下降(SGD和MBGD)的优化算法。Adam算法结合了适应性梯度算法和均方根传播的优点。Momentum在学习机器学习时是很可能遇到的，是动量的意思。动量不是速度和学习率，应该说是类似于加速度。AdaGrad（适应性梯度算法）适应性梯度算法的特点在于：独立地调整每一个参数的学习率。在S
【个人学习笔记】概率论与数理统计知识梳理【五】已经是全速前进了概率论
文章目录第五章、大数定律及中心极限定理一、大数定律1.1基本概念1.2弱大数定理二、中心极限定理独立同分布的中心极限定理定理总结第五章、大数定律及中心极限定理写博客比想象中费劲得多，公式得敲好久，所以只得随缘更更了，想写一些机器学习相关的东西，但是强迫症又不允许我把这个扔掉不管，我太难了Orz这一节的内容比较深，即使我是一个喜欢数学的工科生，也没有精力再去深究了，各式各样的大数定律及中心极限定理我
【机器学习案例6】使用机器学习从图像中提取突出的颜色（含源码） suoge223 机器学习实用指南机器学习人工智能 python
专栏导读作者介绍：工学博士，高级工程师，专注于工业软件算法研究本文已收录于专栏：《机器学习实用指南》本专栏旨在提供1.机器学习经典案例及源码；2.开源机器学习训练数据集；3.机器学习前沿专业博文。以案例的形式从实用的角度出发，快速上手机器学习项目，在案例中成长，摆脱按部就班填鸭式教学。欢迎订阅专栏，订阅用户可私聊进入机器学习交流群（知识交流、问题解答），并获赠丰厚的机器学习相关学习资料（教材、源码
【机器学习案例7】计算机视觉中的小物体检测：基于补丁的方法 suoge223 机器学习实用指南机器学习计算机视觉人工智能
专栏导读作者简介：工学博士，高级工程师，专注于工业软件算法研究本文已收录于专栏：《机器学习实用指南》本专栏旨在提供1.机器学习经典案例及源码；2.开源机器学习训练数据集；3.机器学习前沿专业博文。以案例的形式从实用的角度出发，快速上手机器学习项目，在案例中成长，摆脱按部就班填鸭式教学。欢迎订阅专栏，订阅用户可私聊进入机器学习交流群（知识交流、问题解答），并获赠丰厚的机器学习相关学习资料（教材、源码
机器学习相关指标计算 miliyah
机器学习相关的科学计算指标其实本人也不精通上代码：#!/usr/bin/envpython#coding=utf-8importnumpyasnpfromsklearn.metricsimport*importmatplotlib.pyplotaspltdefmathematical_calculation(data_list1,data_list2=[]):"""1.误差errors：x1-x2
面向智算服务，构建可观测体系最佳实践阿里云云原生
作者：蓟北构建面向AI、大数据、容器的可观测体系（一）智算服务可观测概况对于越来越火爆的人工智能领域来说，MLOps是解决这一领域的系统工程，它结合了所有与机器学习相关的任务和流程，从数据管理、建模、持续部署的到运行时计算和资源管理。下图是开源ML-Ops平台MLReef在2021年发布的ML市场相关工具和平台玩家。时至今日，相关工具与平台玩家数量保持着持续高速增长。当前，随着大语言模型（LLM）
python 中和机器学习相关的库：numpy scipy pandas scikit-learn tensorflow-gpu matplotlib Hi-Lu ｐｙｔｈｏｎ python 机器学习数据分析人工智能数据结构
numpy：python科学计算的基础包，随机数生成、快速高效的多维数组对象ndarray，用于对数组执行元素级计算，直接对数组执行数学运算的函数；用于读写硬盘上基于数组的数据集工具等。scipy:微积分、矩阵分解、函数优化器（最小化器）、根查找算法、信号处理工具、稀疏矩阵和稀疏线性系统求解器。pandas：非常重要的库，提供了快速便捷处理结构化数据的大量数据结构和函数；用得最多的pandas对象
机器学习——泰坦尼克号乘客生存预测是dream 数据库前端 linux
前言本文章是我在完成机器学习课程设计写的总结，共计花费五天左右，在kaggle平台上测试，最高的一次准确率为0.78708。在使用机器学习相关知识去处理某个实际的问题的时候首先就是从需求理解和问题预处理开始，通过异常数据收集、数据整合、数据分析探索，到模型训练和调优，最后进行模型验证评估。需求理解和问题预处理是整个流程的基础，在本次课程设计中，目标是判断乘客的生还率，怎样基于已有的特征来预测是否生
VSCode问题记录 V丶Chao 工作历程 vscode python
20230304-0.引言这几年的编程方式还真是各种变化，从一开始直接VIM，到后面使用jupyter进行机器学习相关，然后再过渡到vim的形式并加以tmux批量化，最后去年使用了vscode作为IDE。随着工具的变化，那么很多习惯也都随之变化。在学校实验室，平时都是直接在服务器上进行编程，比较简单朴素，直接ssh+vim来干。那时候也尝试过sublime加插件来管理远程文件，但是他毕竟还是一个编
2018年机器学习数学基础及算法视频教程 20课适合基础学习高清课件代码答疑全花心五花肉
课程介绍：不管是算法工程师还是机器学习相关岗位，很多企业招人时都会选择数学专业的毕业生，更有甚至数学的优先级超过计算机专业，尤其人工智能方面，Al人才门槛高的让人望而却步，其中一个重要的原因就是对数学基础的要求太高，从而限制了很大一批人的进入。课程优势：相关实用数学基础原理，课程设计循序渐进，妙趣横生，使用多个源于生活的场景深入浅出的讲解，动画效果和有趣小游戏案例贯穿全课程，带领你在不经意间轻轻松
通俗易懂解释python和anaconda和pytorch以及pycharm之间的关系 qq_45091396 python pytorch pycharm
Python：Python就像是一门编程语言的工具箱，你可以把它看作是一种通用的编程语言，就像是一把多功能的工具刀。你可以使用Python来编写各种类型的程序，就像使用工具刀来制作各种不同的手工艺品一样。Anaconda：Anaconda就像是一个装有不同种类工具的大工具箱。这个工具箱里包括了Python语言，但还有其他许多数据科学和机器学习相关的工具和库，比如NumPy、Pandas、Matpl
什么是机器学习码农zz 机器学习人工智能
概述AIMLDL之间的关系AI最大的概念ML机器学习是AI的一个研究方向,一般指的就是软件编程DL深度学习,是机器学习的一个子领域,使用人工神经网络来解决问题MLDL的区别提到机器学习一般就是指传统的基于统计学的一些算法(或者没用神经网络)DL深度学习就是指使用了神经网络为什么要学机器学习从学习知识的角度,从简单到复杂还有一些领域在使用机器学习相关术语介绍机器学习模型=数据+算法数据:用于训练模型
学习Python必备的11本神书，你读过几本？速来下载PDF 可口可乐没有乐学习路线 python 人工智能开发语言 python 爬虫
前不久，和几位AI/python和数据分析领域的大神请教入行的初学者应该准备哪几本书？他们强烈推荐这11本神书01机器学习的数学宾大个人推荐指数：★★★★此书来自宾夕法尼亚大学计算机与信息科学系，涵盖代数，拓扑，微积分和优化理论，提供免费PDF下载(链接见文末)。打开细看，一股丰盛的数学大餐的气息迎面扑来：内置9大章节，1962页全面丰富的计算机科学和机器学习相关数学知识，有教学，还有习题。02深
手写python实现梯度下降算法（base问题：多元线性回归）小野堂 python 算法线性回归
手写python实现梯度下降算法因为课程设计的原因，接触了很多和机器学习相关的事情在学习的时候发现，机器学习如果只是听不写代码基本什么都学习不到于是自己利用python手写了大部分的常见的基础的算法很有趣呢~慢慢更新咯文章目录手写python实现梯度下降算法简介实现代码写在最后简介①梯度下降算法是在机器学习中常见的一种优化寻找最优模型的方法②是一种参数优化的方式，优化的时候让参数减去一定比例的梯度
波士顿房价预测(一) 星夜夏空99 python 机器学习
波士顿房价预测(一)导语：开始学习机器学习相关知识。波士顿房价预测，也是很经典的一个案例，我会陆续把自己完成整个项目的过程记录下来，还有就是可能会出现一定的差错，或者数据分析库使用的不是很熟练的情况，也希望大佬指出。另外，我是会一步步完善这个程序，但是只是从流程上完善，最后的结果因为数据集的原因可能不是会很准确。这篇文章更多是记录自己的学习情况，可能可借鉴度不高，如果是纯小白的话可以看一看，说不定
数据维度爆炸怎么办？详解5大常用的特征选择方法 wuxiaosi808 数据挖掘机器学习数据挖掘机器学习
数据维度爆炸怎么办？详解5大常用的特征选择方法Datawhale干货作者：EdwinJarvis，cnblog博客整理在许多机器学习相关的书里，很难找到关于特征选择的内容，因为特征选择要解决的问题往往被视为机器学习的一个子模块，一般不会单独拿出来讨论。但特征选择是一个重要的数据预处理过程，特征选择主要有两个功能：减少特征数量、降维，使模型泛化能力更强，减少过拟合增强对特征和特征值之间的理解好的特征
数据维度爆炸？5大常用的特征选择方法详解（上） Sim1480 python 机器学习人工智能数据分析深度学习
EdwinJarvis|作者cnblog博客|来源在许多机器学习相关的书里，很难找到关于特征选择的内容，因为特征选择要解决的问题往往被视为机器学习的一个子模块，一般不会单独拿出来讨论。但特征选择是一个重要的数据预处理过程，特征选择主要有两个功能：减少特征数量、降维，使模型泛化能力更强，减少过拟合增强对特征和特征值之间的理解好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进
为什么python会成为人工智能开发首选编程语言？千_锋小小千
Python借助AI和数据科学，目前已经攀爬到了编程语言生态链的顶级位置，可以说，Python基本上与AI已经紧密捆绑在了一起了。为什么人工智能开发要使用到python语言？我认为基于以下几个原因：简洁高效Python作为一门编程语言，对于程序员来说，想要从事AI和机器学习相关的工作，最好的语言莫过于Python。简洁优美、开发效率高，Python语言已经得到了越来越多公司的青睐，很多公司都开始选
hello word xiiatuuo
第一篇当然是用helloword开始～这个博客主要用来记录我的一些推荐系统和机器学习相关的资料的整理和总结，希望能坚持。
数据分析大作业：使用Python机器学习相关算法对某地区房地产数据分析预测报告完整代码+报告计算机毕设论文 python 数据分析房地产分析预测
定义挖掘目标：**1、**房价和哪些因素有关，在之后的中介推销中重点关注**2、**开发商该如何建造房屋才能让更多的客户来选择购买居住**3、**预估房屋价值，给房产中介提供合理的房价信息完整数据加代码：https://download.csdn.net/download/qq_38735017/87418814数据初步处理：%%matplotlibinlineimportpandasaspdim
算法……到底是干啥的？（摘自牛客网）芒果香菠菠算法
摘录自牛客评论区。链接：算法……到底是干啥的？_牛客网1.门槛学历双9平常就是看论文技术分享接项目给方案跑模型部署到终端清洗数据打比赛写论文写专利面试一般问对应岗位方向前沿的算法paper2.面试问项目问论文，问深度学习和机器学习相关八股，比如transfomer、Bert、gpt、过拟合欠拟合、数据不平衡、梯度消失梯度爆炸、损失函数激活函数啥的，可能再根据项目（比如我的）问点并行、混合精度之类，
AIGC: 关于ChatGPT中进行情感分析的功能 Wang's Blog AIGC Python AIGC
概念GPT是基于大模型去进行的机器学习的训练，对于机器学习相关的概念它是比较了解的比如:文本的分类,文本的情感分析等等相关的机器学习的功能,GPT如何支持？是否有相关接口供我们调用?有的，文档地址:https://platform.openai.com/docs/api-reference/embeddings/create基于这个接口，可以去进行分类，进行情感分析关于这个embeddings接口
使用Virtualenv安装机器学习环境 yaoleiroyal
本文档描述在ubuntu14.04环境中通过virtualenv来安装机器学习相关环境，安装的组件有jupyter，matplotlib，numpy，pandas，scipy，scikit-learn。我实际安装时，都是使用python3的环境，也就是使用pip3来安装相关组件！发出下列其中一条命令来安装pip和Virtualenv：$sudoapt-getinstallpython-pippyt
机器学习相关知识点总结月光_a126
线性代数PCA和SVD：https://zhuanlan.zhihu.com/p/58064462正定、半正定https://zhuanlan.zhihu.com/p/93392382投影矩阵：https://blog.csdn.net/weixin_44969779/article/details/90139312旋转矩阵：https://www.bilibili.com/video/BV1sR
【人工智能Ⅰ】实验4：贝叶斯分类 MorleyOlsen 人工智能人工智能分类数据挖掘贝叶斯
实验4贝叶斯分类一、实验目的1.了解并学习机器学习相关库的使用。2.熟悉贝叶斯分类原理和方法，并对MNIST数据集进行分类。二、实验内容1.使用贝叶斯方法对mnist或mnistvariation数据集进行分类，并计算准确率。数据集从网上下载（如百度飞桨平台）。2.改变算法参数，观察对识别准确率的影响。三、实验环境平台JupyterNotebook(anaconda3)Python版本python
机器学习基础Matplotlib绘图 softshow1026 机器学习 matplotlib 人工智能
一、运行环境学习工具：jupyter-notebookpython版本：311系统：Win11二、什么是matplotlib？matplotlib是基于python生态开发的一个可视化绘图库，它的出现让python在数据分析及机器学习方面占了重要的一部分，目前很多数据分析及机器学习相关方面的工程都有使用到这个库，并且由于其简单易用，安装简单等方面的优势深得广大开发者的喜爱。三、安装及导入1.安装p
机器学习相关概念的直观理解秃头的少女机器学习深度学习 cnn
目录深度学习：网络结构CNN结构包含：卷积运算池化运算激活函数损失函数深度学习：基于卷积神经网络CNN监督学习：已知规律，求出已知结果非无监督学习：未知规律，求规律结果语义分割：对图像进行对象区别注意力机制：找到特定对象网络结构CNN中的通道channels：代表特征，例如：一般的RGB图片，channels的数量是3（红、绿、蓝）上采样：放大图像下采样：缩小图像CNN结构包含：卷积运算本质为矩阵
01-概述 - OpenCV介绍与环境搭建 Ivy_belief OpenCV opencv 人工智能计算机视觉
目录1、OpenCV概念（1）OpenCV的介绍（2）图像处理（ImageProcessing）（3）OpenCV的架构和核心模块2、开发环境搭建3、代码与演示1、OpenCV概念（1）OpenCV的介绍OpenCV是计算机视觉开源库，主要算法涉及图像处理和机器学习相关方法；OpenCV的全称是OpenSourceComputerVisionLibrary,直译就是“开源计算机视觉库”。取代表开源
基于STM32的色彩识别与分类算法优化嵌入式杂谈 stm32 分类嵌入式硬件
基于STM32的色彩识别与分类算法优化是一项与图像处理和机器学习相关的研究任务，旨在实现高效的色彩识别和分类算法在STM32微控制器上的运行。本文将介绍基于STM32的色彩识别与分类算法优化的原理和实现步骤，并提供相应的代码示例。1.色彩识别与分类概述色彩识别与分类是一种通过分析图像中的颜色信息来进行目标检测、品质控制等应用。在嵌入式系统中，如STM32微控制器，需要优化色彩识别与分类算法以满足性
python最小生成树算法_最小生成树：Kruskal算法及python实现芒果大大 python最小生成树算法
本人数学专业本科，研究生读的计算机，方向是深度学习相关的，在平时上课和自己自学，看论文都是深度学习和机器学习相关的。打算毕业之后从事机器学习相关工作，但是不知道学完Dl，ML的相关算法之后，还需不需要学习传统的数据结构，比如二叉树，图，队列，栈什么的，还有必要学习算法导论里的算法吗？如果都学的话，那感觉时间不够，而且这些难度都挺大的。有没有前辈来指点一二呢？这是今天逛知乎时看到的一个提问“学习机器
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n
操作日期和时间的工具类 vipbooks 工具类
大家好啊，好久没有来这里发文章了，今天来逛逛，分享一篇刚写不久的操作日期和时间的工具类，希望对大家有所帮助。 /* * @(#)DataFormatUtils.java 2010-10-10 * * Copyright 2010 BianJing,All rights reserved. */ package test; impor

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他