九方先生

机器学习总结（lecture 1）机器学习基础知识

lecture 1：机器学习基础知识

目录

lecture 1机器学习基础知识
目录
- 0
- 1机器学习概念
- 2机器学习分类
- 3感知机Perceptron最简单的机器学习算法
- 4训练集测试集验证集
- 5过拟合
- 6正则化
- 7交叉验证
- 8梯度下降
- 9学习率
- 10特征约简
- 11正规方程和梯度下降

0

参考：https://morvanzhou.github.io/learning-steps/

1机器学习概念

机器学习：从经验E学习一些分类任务T和性能测量P，它在任务T中的性能（由P测量）随着经验E提升。

2机器学习分类

（1）监督学习
数据集是有标签的，就是说对于给出的样本我们是知道答案的，我们大部分学到的模型都是属于这一类的，包括线性分类器、支持向量机等等；

（2）无监督学习
跟监督学习相反，数据集是完全没有标签的，主要的依据是相似的样本在数据空间中一般距离是相近的，这样就能通过距离的计算把样本分类，这样就完全不需要label，比如著名的K-means算法就是无监督学习应用最广泛的算法；

（3）半监督学习
半监督学习一般针对的问题是数据量超级大但是有标签数据很少或者说标签数据的获取很难很贵的情况，训练的时候有一部分是有标签的而有一部分是没有的；

（4）强化学习
一直激励学习的方式，通过激励函数来让模型不断根据遇到的情况做出调整；

监督学习：分类、回归

1、回归问题 regression（输入、输出：连续值）

例如：已知一组数据，包含房屋的面积（x）和对应的价格（y），预测当房屋面积为特定值时（x=x0）对应的价格为多少。

2、分类问题 classification（输入、输出：离散值）

例如：已知一组数据，包含肿瘤的大小（size）和对应的性质（良性/恶性）（0/1），当给出肿瘤的大小时，判断其为良性还是恶性。

3感知机Perceptron—最简单的机器学习算法

感知机是最简单的机器学习算法，一般作为机器学习的入门级算法，也很好理解，但是麻雀虽小，五脏俱全，机器学习大致的思想和过程都涉及到了。

感知机可以认为是线性二元分类器，我们有一些特征数据，根据这些特征数据我们线性回归出一个值，如果超过了某个阈值，我们就说YES，否则NO．

一个简单的现实例子就是信用卡的发放问题，银行得到用户的一些个人信息，比如年龄，收入，信用记录等。
针对这些信息我们赋予一些权重，这样我们就能够得到一个具体的数值，以此来判断是否发信用卡。

后续会介绍详细的过程

4训练集、测试集、验证集

一般会把数据集分成两部分：一部分作为训练集，用来训练模型，一部分用来做测试，当作我们的未知数据。

测试集错误率作为我们的评价标准，因为我们最终应用机器学习模型时，面临的是未知的数据。
如果用训练集错误率来作为评判标准，可能引起的问题是过拟合，也就是我们训练效果很好而实际预测情况很糟糕，这是我们不想看到的。

总的来说，在机器学习中，我们要做两件事
１）测试错误接近于０，越小越好；
２）训练错误能够大致认为是预测错误，并且尽量使训练错误为零；

5过拟合

过拟合的特点：训练集错误率很低，测试集错误率很高，模型泛化能力差

过拟合主要的原因：模型的复杂度太高。

造成过拟合的原因主要是下面四个方面：

解决过拟合的方法：

1）从简单的模型开始尝试；

2）数据预处理，数据清洗；

3）额外的数据；

4）正则化，regularization；

5）验证，validation；

6正则化

正则化相当于给训练误差加了一个惩罚项，以防止过拟合的发生。

用的比较多的正则项是L1和L2
还有dropout、早停

正则化通过牺牲一定的训练集准确率而增加一定的泛化能力

正则化参数λ的影：

① λ 如果太小，则相当于正则化项没起到作用，无法控制过拟合；

② λ如果太大，则除了θ0，其余的参数都会约等于0，相当于去掉了那些项，使hθ(x)=θ0，毫无疑问这会得不偿失地导致欠拟合。

7交叉验证

验证的目的是选择最优的模型，而依据就是泛化误差，因为我们最终把模型应用的是未知数据。

目前用的最广泛的是V-fold cross validation，把数据集分成V份，每次拿出V-1作为训练集，而剩下的一份作为验证，通过V次的训练，把最后训练错误的平均值作为该模型的评价，然后选出最佳。

8梯度下降

假设函数 hθ(x)
代价函数 J(θ0,θ1)

梯度下降要同步更新

梯度下降的三种方式：
批梯度下降
随机梯度下降
小批量梯度下降

9学习率

这个α如果过小，则收敛很慢；
如果过大，则可能导致不收敛。

10特征约简

1.特征缩放
2.均值归一化

均值归一化不需要太精确，其目的只是为了让梯度下降算法收敛速度更快。

11正规方程和梯度下降

总体来说：正规方程计算巧妙，但不一定有效。梯度下降法速度慢，但是稳定可靠。
通常，n在10000以下时，正规方程法会是一个很好的选择，而当n>10000时，多考虑用梯度下降法。

你可能感兴趣的:(机器学习总结)

巴尔加瓦算法图解：K最近邻算法 Ashleyxxihf 码上行动：巴尔加瓦算法图解算法近邻算法
巴尔加瓦算法图解：K最近邻算法目录巴尔加瓦算法图解：K最近邻算法判断水果创建推荐系统1.判断相似程度练习回归（预测结果）机器学习总结本章内容❑学习使用K最近邻算法创建分类系统。❑学习特征抽取。❑学习回归，即预测数值，如明天的股价或用户对某部电影的喜欢程度。❑学习K最近邻算法的应用案例和局限性。判断水果判断这个水果是橙子还是柚子呢？一种办法是看它的邻居。来看看离它最近的三个邻居。在这三个邻居中，橙子
大数据开发之机器学习总结（一）闻香识代码大数据机器学习用户画像机器学习大数据算法
大数据开发之机器学习总结1.背景在大数据开发中，数据分析目的一般分为2大类，一个是基于已有数据，提炼出想要的数据汇总信息。一个是基于已有数据使用算法训练出模型，基于模型预测和分析未来的新数据。前者就是很多时候的大数据分析场景，后者则涉及到算法模型，机器学习的范畴。更进一步，人工智能，但机器学习和人工智能，本身其实技术上并没有非常严格的界限。2.机器学习概念机器学习，故名思意，让机器通过学习过去的经
机器学习总结净土_0342
朴素贝叶斯fromsklearnimportdatasetsiris=datasets.load_iris()fromsklearn.naive_bayesimportGaussianNBgnb=GaussianNB()y_pred=gnb.fit(iris.data,iris.target).predict(iris.data)支持向量机fromsklearnimportsvmX=[[0,0],
深度之眼-机器学习总结任嘉平生愿
为期三个月的西瓜书机器学习训练营结束，昨天听完了毕业典礼。我做了如下总结：校长讲话：定目标短时间自己的小团队闭环开环闭环----学习小部分就应用时间和努力的堆积打比赛应用人工智能的课题和方向资料tensorflow实战google深度学习框架和强者学习才会遇强则强博士讲话：1.坚持写博客2.github3.多练习4.英文原版的文章高级课程你目前的弱点是什么5.多读论文
机器学习总结 gridlayout 机器学习人工智能
对以下文章机器学习总结什么是深度学习?最易懂的机器学习入门文章-CSDN博客人工智能和机器学习之间的关系人工智能是一个最宽泛的概念，是一个研究领域，同时也是一个实现目标，而机器学习则是实现这一目标的一类方法。深度学习只是机器学习这一类方法中的一种。机器学习之前的建模方式对比:深度学习改变了很多领域算法的实现模式。在深度学习兴起之前，很多领域建模的思路是投入大量精力做特征工程，将专家对某个领域的“人
2023 Google开发者大会：你了解机器学习的新动向吗？ Mr.Winter` 前沿资讯机器学习人工智能 google 数据挖掘计算机视觉语音识别深度学习
目录0年度科技盛会1生成式机器学习2无障碍游戏体验3跨平台机器学习总结0年度科技盛会2023Google开发者大会在上海浦东举办，为开发者和科技爱好者们带来新技术、新产品、新动向可能很多同学对Google开发者大会还不熟悉，Google开发者大会是Google展示最新产品和平台的年度盛会，为开发者提供丰富的学习资源、实践操作和现场演示，提供与Google专家互动、与其他开发者交流的契机，助力开发提
【机器学习】许多仙机器学习算法支持向量机
说明：机器学习总结0、数据集1、贝叶斯分类器（一）计算题所有样本分为两类（c）：好瓜=是、好瓜=否（1）计算先验概率：P(c)（2）计算每个属性的条件概率：P(xi|c)（3）代入朴素贝叶斯公式：（4）结论：（5）拉普拉斯修正（平滑处理，可选）上面的公式中出现连乘现象，这会导致对于0特别敏感，比如出现一个0，就会直接导致最终结果直接为0其中：N——所有类别数，这里一个有两类，所以N=2Ni——第i
数字验证码识别新思路及对opencv支持向量机机器学习总结快乐的阿常艾念宝机器学习杂谈＆随想机器学习 opencv 支持向量机
验证码识别框架新问题最近遇到了数字验证码识别的新问题。由于这次的数字验证码图片有少量变形和倾斜，所以，可能需要积累更多的原始采样进行学习。但按照4个验证码10个数字的理论随机组合(暗含某种数字仅有少量变化，不然此组合数量还应更大)，也就是要采样差不多一万张图片；对每个图片适当分割后，那就差不多几万张图片了。想要对这些切割后的图片进行手工分类，成为基本数字的训练学习数据，手工工作量不小，也很无趣。当
机器学习总结（lecture 4）算法：逻辑回归Logistic Regression （LR）九方先生机器学习总结
lecture4：逻辑回归LogisticRegression目录lecture4逻辑回归LogisticRegression目录1分类和模型表示2逻辑回归1逻辑回归的代价函数的选取3过拟合和正则化1分类和模型表示先来谈谈二分类问题。课程中先给出了几个例子。邮件是垃圾邮件还是非垃圾邮件；网上交易是的欺骗性（YorN）；肿瘤是恶性的还是良性的。对于这些问题，我们可以通过输出值yϵ{0,1}来表示。注
朴素贝叶斯——机器学习总结古月哥欠666 机器学习算法
朴素贝叶斯基础知识概念优缺点一般过程利用python进行文本分类准备数据训练算法测试算法示例1：使用朴素贝叶斯过滤垃圾邮件一般步骤准备数据：切分文本测试算法：使用朴素贝叶斯进行交叉验证示例2：使用朴素贝叶斯分类器从个人广告中获取区域倾向一般步骤收集数据：导入RSS源RSS源分类器及高频词去除函数分析数据：显示地域相关的用词基础知识概念从简单的概率分类器开始，给出一些假设（条件独立性）学习朴素贝叶斯
Python-Level5-day07am:聚类的基于噪声密度/凝聚层次算法及评价指标及小结,机器学习补充练习,机器学习总结, dpq666dpq666 数据分析人工智能 python
之前讲解了基于中心聚类，采用kmeans聚类算法，下面讲解基于噪声密度聚类算法DBSACN与基于层次聚类算法（Agglomerative）算法2）噪声密度①算法定义噪声密度（Density-BasedSpatialClusteringofApplicationswithNoise，简写DBSCAN）随机选择一个样本做圆心，以事先给定的半径做圆，凡被该圆圈中的样本都被划为与圆心样本同处一个聚类，再以
机器学习总结-基于sklearn包 zaprily 总结 sklearn python 机器学习
流程集成学习数据预处理（特征工程）1.处理负值（oroutlier）标记有问题的特征，但是不删去defgetres1(row):returnlen([xforxinrow.valuesiftype(x)==intandx20,'neg1']=20#平滑处理2.填充缺失值缺失值也可以删去样本或者特征，不过在样本量比较少，特征不明确的情况下不建议直接删除特征。可以直接用fillna补充data['le
《吴恩达机器学习》18 机器学习总结 JockerWong 机器学习吴恩达机器学习课程总结
前言原机器学习最后一章的内容为图片文字识别，但是笔者在看了这一章的课程之后发现其内容可能实际应用性不大，课程讲的ocr识别的方法已经不适合目前主流的算法（目前主流使用CNN——卷积神经网络），故省略这一章节的笔记，改为对整个机器学习课程的总结。一、监督学习算法1、线性回归线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，运用十分广泛。其表达形式为hθ
吴恩达机器学习总结（三）——神经网络的反向传播 Anaconda_ 机器学习深度学习机器学习神经网络反向传播
神经网络的反向传播在上一篇博客中，利用神经网络对手写数字数据进行分类的结果虽然已经很高了，但和测试样本本身的输出值进行比较还是存在着一定的误差。这时我们需要使用这个误差值来调整神经网络本身，进而改变神经网络的输出值。误差传递我们知道在前向传播中，每个节点向下一层传递的信号所占权重不同。若只有一个节点的信号传递到输出节点，那调整神经网络输出值的方式将简单的多，只需要更新这个节点的权重即可。假如有多个
博客目标与内容 Geng Rain python
目标量化学习总结回测框架Backtrader量化机器人的搭建因子模型技术分析编程学习总结网络编程python基础数学学习总结高数线性代数概率论机器学习总结pytorch神经网络强化学习具体项目总结目标管理app打卡app学习方法总结学习方法
机器学习总结奋斗的海绵机器学习数据分析数据挖掘
（1）x（2）表示训练集中x的第二个训练数据，y(2)表示训练集中的y的第二个训练数据（2）需要注意的是对于一个模型构建出来的函数F，那么我们如何找出该模型的可以更好拟合训练数据的模型参数呢，我们通过使用代价函数（costfunction），通过计算不同的参数得到的预测值y和最终结果y之间的误差大小来最终确定应该如何选择最佳的参数。（3）梯度下降算法被用来寻找使得代价函数J的最小值，从而确定其此时
分布式机器学习总结 Liao_Wenzhe 机器学习与数据挖掘分布式数据研发大数据
目前主流的分布式架构包括：1.基于mapreduce模型的spark-mllib，采用数据分布式+同步的模式，缺点是对异步和模型分布式不支持，但是社区完善。2.基于参数服务器的Multiverso，既可实现数据分布式，也可实现模型分布式，同时支持异步和同步，也可实现大规模的参数更新。3.基于数据流图的tensorflow，可以和1，2结合组成复杂的分布式机器学习网络。4.3种模式的区别：5.各种框
百面机器学习总结笔记（第二章模型评估） Avery123123 算法岗面试笔试准备百面机器学习模型评估
百面机器学习总结笔记（第二章模型评估）百面机器学习总结笔记第二章模型评估第1节评估指标的局限性问题：准确率的局限性问题：精确率与召回率的权衡第2节ROC曲线问题：什么是ROC曲线？问题：如何绘制ROC曲线？问题：如何计算AUC？问题：ROC曲线相比于P-R有什么特点？第3节余弦距离的应用第4节A/B的陷阱第5节模型评估的方法问题：在模型评估中，有哪些主要的评估方法，他们的优缺点是什么？问题：在自助
机器学习总结 Bryant998 人工智能 python
均值、中值和众数从一组数字中我们可以学到什么？在机器学习（和数学）中，通常存在三中我们感兴趣的值：均值（Mean）-平均值中值（Median）-中点值，又称中位数众数（Mode）-最常见的值例如：我们已经登记了13辆车的速度：speed=[99,86,87,88,111,86,103,87,94,78,77,85,86]什么是平均，中间或最常见的速度值？均值均值就是平均值。要计算平均值，请找到所有
若特征的相关系数为0或接近0，就一定可以被过滤吗？相关系数的显著性检验也不一定可靠，如何判断？陈谦机器学习人工智能算法 python
系列文章目录添加机器学习总结提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、若特征的相关系数为0或接近0，就一定可以被过滤吗？二、验证步骤1.通过皮尔逊相关系数得出的结论，名称一样的特征排名靠后，反而在模型训练之后的特征重要性在中间。同样的模型得出的特征排名靠后反而皮尔逊相关系数靠前。总结前言若特征的相关系数为0或接近0，就一定可以被过滤吗？相关系数的显
周志华机器学习总结夜夜0810
Lecture3线性模型基本形式一般向量形式:优点:线性回归广义线性模型对数几率回归由对数几率函数确定$\boldsymbol{\omega}$和$b$线性判别分析(LDA)思想求解多分类任务多分类问题基本形式一般向量形式:f(x)=ωT∗x+bf(\boldsymbol{x})=\boldsymbol{\omega}^T*\boldsymbol{x}+bf(x)=ωT∗x+b优点:非线性模型可由
机器学习总结之——标准化与归一化的区别 Greatpanc 机器学习标准化归一化标准化与归一化过程缺失数据处理
机器学习总结之——标准化与归一化的区别1、标准化简单来说，标准化是依照特征矩阵的列处理数据，其通过求z-score的方法，将样本的特征值转换到同一量纲下。标准化的前提是特征值服从正态分布，标准化后，其转换成标准正态分布。公式如下：x′=x−XS（其中X代表样本均值，S代表样本方差）x'=\frac{x-X}{S}（其中X代表样本均值，S代表样本方差）x′=Sx−X（其中X代表样本均值
李宏毅课程-机器学习总结张学义深度学习
李宏毅课程-机器学习总结迁移学习：TransferLearning1.什么是迁移学习呢？2.为什么用迁移学习3.迁移学习的概述3.1第一类迁移学习3.2第二类迁移学习3.3第三类迁移学习3.4第四类迁移学习大佬的笔记较好，拷贝留档学习学习网址https://aistudio.baidu.com/aistudio/education/group/info/1978迁移学习：TransferLearn
机器学习总结一：Bagging之决策树、随机森林原理与案例想考个研机器学习决策树随机森林
机器学习算法总结一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-means一、Bagging之决策树、随机森林原理与案例1.决策树1.1简介决策树(DecisionTree)是一种非参数的有监督学习方法，它能够从一系列有特征和标签的数据种总结出决策规则，并利用树状图结构呈现这些规则
机器学习总结三：SVM原理推导与案例想考个研机器学习支持向量机算法
机器学习算法总结一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-means三、SVM1.原理推导（硬间隔）1.1分类问题代数化**svm原理一句话概括：找出一个最优的直线(或超平面)去隔离不同类别样本数据，达到分类目的。**图1图2图1:找出一条直线将样本完美地划分成两类（注意这样
机器学习总结二：boosting之GBDT、XGBT原理公式推导想考个研机器学习算法 boosting
一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-meansBoosting1.简介通过在数据上构建多个弱评估器，汇总所有弱评估器的建模结果，以取得比单个模型更好的分类或回归表现。加法模型，前向分步计算学习。2.基本元素弱评估器f(x)：一般为决策树(cart树)，不同boostin
机器学习总结四：逻辑回归与反欺诈检测案例想考个研机器学习逻辑回归算法
机器学习算法总结一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-means四、逻辑回归1、概述由线性回归变化而来的，应用于分类问题中的广义回归算法。组成：回归函数z=w1x1+w2x2+...+wnxn+b=[w1w2wnb]∗[x1x2⋮xn1]=wTXz=w_1x_1+w_2x
吴恩达机器学习总结（二）——Logistic回归和简单的神经网络（附作业） Anaconda_ 机器学习机器学习逻辑回归神经网络
在线性回归模型中，输入和输出一般都是连续的，对于每个输入x，都有一个对应的输出y，模型的定义域和值域都可以是(−∞,+∞)(-∞,+∞)(−∞,+∞)。而对于分类模型来说，其输入可以是连续的，但它的输出是离散的，即只有有限个输出y。例如，其值域可以只有两个值{0,1}，这两个值可以表示对样本的某种分类，高/低、患病/健康、阴性/阳性等，这就是最常见的二分类问题。二、Logistic回归逻辑回归带有
机器学习总结（三）——梯度下降详解时代&信念机器学习
梯度下降通俗解释机器学习的问题中，线性回归问题是一个特殊的情况，线性回归可以直接求解，但是其他问题不行！举一个通俗的例子针对我们的问题，我们想要找到loss最小值所对应的θ值。我们“下山”的路有很多条，哪一条下山最快呢？那必定是对应点处的切线方向啊，也叫对应点的梯度反方向。每下降一步（或者叫“下山”一步），对应的点都会改变，所以对应的梯度方向也会改变。我们每次走一步，一步应该多大呢？步长应该小一些
机器学习总结（二）时代&信念机器学习机器学习 python 人工智能
独立同分布的意义在机器学习中很重要的一点：误差是独立同分布的，并且服从均值为0，方差为⊖2\ominus^2⊖2的高斯分布。解释一下：什么是独立？就是数据样本之间互相独立（互相不影响），例如：张三来银行贷款，他贷款多少并不影响李四的贷款金额和情况。两个数据是相互独立的。什么是同分布？样本数据得满足相同的分布。不能是这个数据满足正太分布，这个数据满足泊松分布。例如：咋们研究的是，根据年龄和月薪，预测
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他