喜欢打酱油的老鸟

《机器学习实战》总结篇

https://www.toutiao.com/a6714092859475100171/

机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。

《机器学习实战》正文

对于样本容量大的数据集计算量比较大，即计算复杂度高；
必须保存全部数据集，即空间复杂度高；
KNN 每一次分类都会重新进行一次全局运算；
样本不平衡时，预测偏差比较大。如：某一类的样本比较少，而其它类样本比较多；
K 值大小的选择；
KNN 无法给出基础结构信息，无法知晓平均实例样本与典型实例样本具有什么特征，即无法给出数据的内在含义。

适用数据类型： 数值型和标称型。

应用领域： 文本分类；模式识别；聚类分析；多分类领域。

使用方法：

Ch3：决策树

决策树分类器就像带有终止块的流程图，终止块表示分类结果。开始处理数据时，首先需要测量集合中数据的不一致性，也就是熵（反映数据的无序程度），然后寻找最优方案划分数据集（选取信息增益（熵）最大的特征），直到数据集中的所有数据属于同一分类。构建决策树时，采用递归的方法将数据集转化为决策树。

优点：

决策树易于理解和解释，可以可视化分析，容易提取出规则；
计算复杂度不高，对中间值的缺失不敏感，可以处理不相关特征数据；
测试数据集时，运行速度比较快；
决策树可以很好的扩展到大型数据库中，同时它的大小独立于数据库大小。

缺点：

容易出现过拟合问题。
对缺失数据处理比较困难。
忽略数据集中属性的相互关联。
ID3 算法计算信息增益时结果偏向数值比较多的特征。

适用数据类型： 标称型和数值型。

改进措施（主要解决过拟合问题）：

对决策树进行剪枝，可以采用交叉验证法和正则化的方法；
使用基于决策树的 combination 算法，如 Bagging，Random Forest 等。

决策树流行算法： ID3、C4.5、CART

应用领域： 企业管理实践，企业投资决策，由于决策树很好的分析能力，在决策过程应用较多。

使用方法：

总结：Ch2 和 Ch3 都是确定的分类算法，数据实例最终会被明确的划分到某个分类当中。

Ch4：基于概率论的分类方法：朴素贝叶斯

使用概率，提供一种利用已知值来估计未知概率的方法。通过特征间的独立性假设（朴素一词的由来），降低对数据量的要求。

优点：

对大数量训练和查询时具有较高的速度。即使使用超大规模的训练集，针对每个项目通常也只会有相对较少的特征数，并且对项目的训练和分类也仅仅是特征概率的数学运算而已；
支持增量式运算，即可以实时的对新增的样本进行训练；
朴素贝叶斯对结果解释容易理解；
对数据较少的情况下仍然有效；
可以处理多类别问题。

缺点：

因为要将文本转化为词向量（文档中的每个词在词库中只表示出现与不出现，即 [0,1,1,0,0,1]，如果要表示一个词出现了多次，需要用到词袋模型，即 [0,1,3,2,0,0,2]），因此对于输入数据的准备方式较为敏感；
由于使用了样本属性独立性的假设，所以如果样本属性有关联时其效果不好。

适用数据类型： 标称型。

改进措施：

下溢出问题：对概率取对数；
词袋模型在解决文档分类问题上比词集模型好；
移除提用词（对分类基本上没有帮助的词，如助词、语气词等）。

应用领域： 欺诈检测；一封电子邮件是否是垃圾邮件；一篇文章应该分到科技、政治，还是体育类；一段文字表达的是积极的情绪还是消极的情绪；人脸识别等。

使用方法：

Ch5：Logistic 回归

寻找一个非线性函数 Sigmoid 的最佳拟合参数，求解过程可以由最优化算法（如梯度上升或随机梯度上升（占用更少资源，在线学习））来完成。

优点： 计算代价不高，易于理解和实现。

缺点：

容易产生欠拟合；
分类精度可能不高。

适用数据类型： 数值型和标称型。

改进措施：

用随机梯度上升训练算法代替梯度上升训练算法，实现在线学习。

应用领域：

用于二分类领域，可以得出概率值，适用于根据分类概率排名的领域，如搜索排名等；
Logistic 回归的扩展 softmax 可以应用于多分类领域，如手写字识别等；
信用评估；
测量市场营销的成功度；
预测某个产品的收益；
特定的某天是否会发生地震。

使用方法：

Ch6：支持向量机

一种二值决策分类“机”，泛化错误率低和较好的推广性使其被认为是监督学习中最好的定式算法。它试图求解一个二次优化问题来最大化分类间隔。支持向量机采用 SMO 算法每次只优化两个 alpha 值来加快 SVM 的训练速度。核方法（或核技巧）会将数据（有时是非线性数据）从一个低维空间映射到一个高维空间，将一个在低维空间中的非线性问题转化为在高维空间的线性问题，如径向基函数（度量两个向量距离的核函数）。

优点：

解决小样本下机器学习问题；
解决非线性问题；
无局部极小值问题（相对于神经网络等算法）；
可以很好的处理高维数据集，计算开销不大，结果易解释；
泛化能力比较强。

缺点：

对于核函数的高维映射解释力不强，尤其是径向基函数；
对参数调节和核函数的选择敏感，原始分类器不加修改仅适用于处理二类问题；
对缺失数据敏感。

适用数据类型： 数值型和标称型。

应用领域： 文本分类、图像识别、主要二分类领域。

使用方法：

Ch7：利用 AdaBoost 元算法提高分类性能

通过组合多个分类器（可以不同）的分类结果，获得了比简单的分类器更好的效果。选择不同的分类器可以缓解同一分类器可能放大的过拟合问题。

有三种集成方法：Bagging、Boosting 和 Random Forset。Bagging

通过随机抽样 S 次（有放回的抽样），得到 S 个与原数据集大小相同的数据集，作用到 S 个分类器上，最后根据投票决定分到哪一个类；Boosting 在 Bagging 上更进一步，它在数据集上顺序应用了多个不同的分类器。

Boosting 中最流行的的一个算法是 AdaBoost，以弱学习器作为基分类器，并且输入数据，使其通过权重向量进行加权。在第一次迭代中，所有数据等权重，在后续迭代中，前次迭代中分错的数据的权值增大，这种针对错误的调节能力正是 AdaBoost 的长处。

优点：

很好的利用了弱分类器进行级联；
可以将不同的分类算法作为弱分类器；
AdaBoost 具有很高的精度；
相对于 Bagging 算法和 Random Forest 算法，AdaBoost 充分考虑的每个分类器的权重；
泛化错误率低，易编码，可以应用在大部分分类器上，无参数调整。

缺点：

AdaBoost 迭代次数也就是弱分类器数目不太好设定，可以使用交叉验证来进行确定；
数据不平衡导致分类精度下降；
训练比较耗时，每次重新选择当前分类器最好切分点；
对离散点敏感。

适用数据类型： 数值型和标称型。

应用领域：模式识别、计算机视觉领域，用于二分类和多分类场景。

使用方法：

补充（非均衡分类问题）：

非均衡分类问题是指在分类器训练时正例数目和反例数目相差很大的一类问题，该问题在错分正例和反例的代价不同时也存在（比如错分导致死亡）。因此，ROC曲线、正确率和召回率有利于度量分类器的指标。

调节正例和反例的数目可以采用欠抽样（删除多的样本）和过抽样（赋值少的样本）的方法，另外一种方法就是在分类的过程中将错误的代价也考虑在内。

Ch8：预测数值型数据：回归

回归与分类的不同点在于，回归预测连续型变量，分类预测离散型变量。在回归方程中，求得最佳回归系数的方法是最小化误差的平方和。使用岭回归可以保证 X^T*X 的逆不能计算时，仍然能求得回归参数。

岭回归是缩减法的一种，相当于对回归系数的大小施加了限制。另一种很好的方法是 lasso 算法，难以求解，但可以使用简便的逐步线性回归来求得近似结果。

缩减法还可以看做对一个模型增加偏差（模型预测值与数据之间的差异）的同时减少方差（模型之间的差异）。

优点： 结果易于理解，计算不复杂。

缺点： 对非线性的数据拟合不好。

适用数据类型： 数值型和标称型。

使用方法：

Ch9：树回归

输入数据和目标变量之间呈现非线性关系，一种可行的方法是使用树对预测值分段，包括分段常数和分段直线。若叶节点使用的模型是分段常数则称为回归树，若叶节点使用的模型是分段直线则称为模型树。

CART 算法可以用于构造二元树并处理离散型或数值型数据的切分，该算法构造的回归树或模型树倾向于产生过拟合问题，可以采用预剪枝（在树的构建过程中就进行剪枝）和后剪枝（当树构建完毕再进行剪枝）。预剪枝更有效，但用户需要定义一些参数。

优点： 可以对复杂的和非线性的数据建模。

缺点： 结果不易理解。

适用数据类型： 数值型和标称型。

使用方法（R2为相关系数）：

Ch10：利用 K-均值聚类算法对未标注数据分组

聚类是一种无监督的学习方法（没有目标变量）。聚类将数据点归到多个簇中，其中相似数据点属于同一簇，而不相似数据点属于不同簇中。

K-均值算法是广泛使用的聚类算法，其中 K 是用户指定的创建簇的数目。算法以 K 个随机质心开始，计算每个点到质心的距离。每个点会被分配到最近的簇质心，然后更新簇质心。以上过程重复数次直至簇质心不再改变。

K-均值算法易受到初始质心的影响，为了获得更好的聚类效果，可以采用二分 K-均值聚类算法。二分 K-均值聚类算法首先将所有点作为一个簇，然后使用 K-均值算法（k=2）对其划分。下一次迭代时，选择有最大误差的簇进行划分。该过程重复直到 K 个簇创建成功为止。

优点： 容易实现。

缺点：可能收敛到局部最小值，在大规模数据集上收敛较慢。

适用数据类型： 数值型。

使用方法：

Ch11：基于 Apriori 算法进行关联分析

两种方式找到大数据集之间的关系。第一种使用频繁项集，它会给出经常出现在一起的元素项；第二种是关联规则，每条关联规则意味着元素项之间的“如果...那么”关系。

Apriori 算法保证在有限的时间内找到频繁项集。其原理是说如果一个元素项是不频繁的，那么那些包含该元素的超集也是不频繁的。Apriori 算法从单元素项集开始，通过组合满足最小支持度要求的项集来形成更大的集合。支持度用来衡量一个集合在原始数据中出现的频率。

每次增加频繁项集的大小，Apriori 算法都会重新扫描整个数据集。当数据集很大时，会显著降低频繁项集发现的速度。下一章的 FPgrowth 算法只需对数据库进行两次遍历，能够显著加快频繁项集的发现速度。

优点： 易编码实现。

缺点： 在大数据集上可能较慢。

适用数据类型： 数值型或标称型。

应用领域： 商店中商品的关联；网站的访问页面的关联；查看选举人及法官的投票历史等。

使用方法：

Ch12：使用 FP-growth 算法来高效发现频繁项集

FP-growth 算法是一种用于发现数据集中频繁模式的有效方法，利用

Apriori 原理，只对数据集扫描两次，运行更快。在算法中，数据集存储在 FP 树中，构建完树后，通过查找元素项的条件基及构建条件 FP 树来发现频繁项集。重复进行直到FP树只包含一个元素为止。

优点： 一般要快于 Apriori 算法。

缺点： 实现比较困难，在某些数据集上性能会下降。

适用数据类型： 标称型。

应用领域： 在多种文本文档中查找频繁单词；购物交易；医学诊断；大气研究等。

使用方法：

Ch13：利用 PCA 来简化数据

降维往往作为预处理步骤，其中独立成分分析、因子分析和主成分分析比较流行，主成分分析（PCA）最为广泛。

PCA 可以从数据中识别其主要特征，它是通过沿着数据最大方差方向旋转坐标轴来实现的。选择方差最大的方向作为第一条坐标轴，后续坐标轴则与前面坐标轴正交。协方差矩阵上的特征值分析可以用一系列的正交坐标轴来获取。

优点： 降低数据的复杂性，识别最重要的多个特征。

缺点： 不一定需要，且可能损失有用信息。

适用数据类型： 数值型。

Ch14：利用 SVD 简化数据

SVD 是一种强大的降维工具，可以利用 SVD 来逼近矩阵并从中获得主要的特征。通过保留矩阵的 80%~90% 的能量，就可以得到重用的特征并去除噪声。

优点： 简化数据，去除噪声，提高算法的结果。

缺点： 数据的转换可能难以理解。

适用数据类型： 数值型。

应用领域： 推荐引擎（协同过滤、相似度计算）、图像压缩等。

Ch15：大数据与 MapReduce

MapReduce 是一种并行处理框架。在 MapReduce 中，作业被分为 map 阶段和 reduce 阶段。先使用 map 阶段并行处理数据，之后将这些数据在 reduce 阶段合并，是一种多对一的模式。mapper 和 reducer 之间传输数据的形式是 key/value 对。一般地，map 阶段后还需要根据 key 值进行排序。

Hadoop 是一个流行的可运行 MapReduce 作业的 java 项目，它同时也提供非 java 作业的运行支持，叫做 Hadoop 流。

神经网络

优点：

分类准确度高，学习能力极强。
对噪声数据鲁棒性和容错性较强。
有联想能力，能逼近任意非线性关系。

缺点：

神经网络参数较多，权值和阈值。
黑盒过程，不能观察中间结果。
学习过程比较长，有可能陷入局部极小值。

应用领域： 目前深度神经网络已经应用与计算机视觉，自然语言处理，语音识别等领域并取得很好的效果。

五言近体句式总结篇10，2-3结构下篇，故国犹兵马他乡亦鼓鼙老街味道
前言王力先生把2-3的五言近体诗句式总结了23种，昨天介绍了前11种，今天看一下后面的12种。昨天的11种是简单句和复杂句，今天的12中句式为复杂句和不完全句。十二、复杂句：前2字形容词，后3字句子形式留滞-才难尽，艰危-气益增。FF-NdV。前2字是并列关系，所以都是大写FF。后3字是主谓结构的句子形式。出自唐朝诗人杜甫的作品《泊岳阳城下》江国逾千里，山城仅百层。岸风翻夕浪，舟雪洒寒灯。留滞-才
2月21天手写我心总结篇效艳一亩田
这是一篇真正的总结，此刻，写这篇总结，我真的很轻松，我完成了！我的内在小孩很兴奋，甚至有点为自己自豪。21天的写作，坚持下来，有补写过，有写不出过，有想放弃过，有批判自己过，有庆幸自己写过。我的生命中，到这个年纪，我才意识到，坚持是我生命中必修的功课。有时熬夜写，会在照顾身体和当日事当日毕中抉择，最终，我选择感觉，哪件事情让我更有喜悦感。有时是选择熬夜也要写完，有时选择先照顾身体。在写作小组里，有
机器学习实战笔记5——线性判别分析绍少阿机器学习笔记可视化机器学习 python 人工智能
任务安排1、机器学习导论8、核方法2、KNN及其实现9、稀疏表示3、K-means聚类10、高斯混合模型4、主成分分析11、嵌入学习5、线性判别分析12、强化学习6、贝叶斯方法13、PageRank7、逻辑回归14、深度学习线性判别分析（LDA）Ⅰ核心思想对于同样一件事，站在不同的角度，我们往往会有不同的看法，而降维思想，亦是如此。同上节课一样，我们还是学习降维的算法，只是提供了一种新的角度，由上
五言近体句式总结篇9，2-3结构上篇，草枯鹰眼疾雪尽马蹄轻老街味道
前言王力先生将五言近体诗的句式，归类为9种。其中最少是1-2-2句式，只有一种。最多的一种是2-3结构，多达23种。因此，我把2-3结构放在的部分，分为两篇，今天介绍的是前11种2-3句式。一、简单句：前2字名词语，后3字副词+动词及目的语例如：黄绮-终辞汉，巢由-不见尧，BB-dVB，B，表示专有名词。简单句中，很好理解的主谓宾结构。这个句式也可以理解为：2-2-1结构，黄绮-终辞-汉，巢由-不
机器学习实战----波士顿房价预测模型永远偷渡不了的非洲人机器学习机器学习 sklearn python
波士顿房价模型预测是一个回归问题，可以采用r2_score方法来作为评价指标。importnumpyasnpimportpandasaspdfromsklearn.metricsimportr2_score#从sklearn的数据库中导入波士顿房产数据fromsklearn.datasetsimportload_bostonfromsklearn.model_selectionimporttrai
python logistic模型_Python实践之逻辑回归（Logistic Regression） weixin_39922394 python logistic模型
机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python，然后也想对一些机器学习算法加深下了解，所以就想通过Python来实现几个比较常用的机器学习算法。恰好遇见这本同样定位的书籍，所以就参考这本书的过程来学习了。这节学习的是逻辑回归(LogisticRegression)，也算进入了比较正统的机器学习算法。啥叫正统呢？我概念里面机器学习算法一般是这样一个
unity3d引擎缓存优化技术_unity3d优化总结篇 weixin_39732991 unity3d引擎缓存优化技术
转自http://www.unitymanual.com/thread-21597-1-1.html此总结由自己经验及网上收集整理优化内容包括：1.代码方面；2.函数使用方面；3.ngui注意方面；4.数学运算方面；5.内存方面；6.垃圾回收方面等等...本着相互交流共同进步的原则好了，总结如下：1.尽量避免每帧处理,可以每隔几帧处理一次比如：[C#]纯文本查看复制代码functionUpdate
代码随想录算法训练营Final Day|| 感想总结篇+个人介绍和规划傲世尊算法
也算是一期不落完完整整地追完了训练营的内容。虽然图论章节有点懈怠了，感觉每天都是理解后抄代码。。。前面所有章节都是每天做到能独立从头写到尾才算打卡（虽然最前面几道难题很可能又忘了）。这确确实实是很辛苦的两个月。因为目前还在毕业实习，每天朝九晚五的上班，还要准备实习报告，修改简历，准备秋招，期间还有几个学校的小项目要做。在加入训练营之前，我还是个每天下班就开始摸鱼躺平的“懒人”，直到内心的焦虑战胜了
代码随想录算法训练营day55|第九章动态规划part16 .wsy. 代码随想录训练营算法动态规划
目录583.两个字符串的删除操作72.编辑距离编辑距离总结篇判断子序列不同的子序列两个字符串的删除操作编辑距离583.两个字符串的删除操作本题和动态规划：115.不同的子序列相比，其实就是两个字符串都可以删除了，情况虽说复杂一些，但整体思路是不变的。代码随想录dp[i][j]是以i-1为结尾的字符串word1，和以j-1位结尾的字符串word2，想要达到相等，所需要删除元素的最少次数。这道题有两种
代码随想录算法训练营第18天 | 第六章二叉树 part08 tt555555555555 C++学习学习笔记算法 leetcode 笔记学习 c++数据结构
第六章二叉树-Part08目录669.修剪二叉搜索树108.将有序数组转换为二叉搜索树538.把二叉搜索树转换为累加树总结篇669.修剪二叉搜索树这道题目比较难，比添加、增加和删除节点难得多，建议先看视频理解。这题虽然看起来比较难，但是实际思路并不难，一层层的往下遍历，遇见在范围内的保留，遇见不在范围内的删除掉，如果root（当前节点）的元素小于low的数值，那么应该递归右子树，并返回右子树符合条
(二十一)Seaborn知识学习8-python数据分析与机器学习实战(学习笔记) 努力奋斗的durian
文章原创,最近更新：2018-05-17课程来源:python数据分析与机器学习实战-唐宇迪引言:介绍seaborn热度图绘制学习参考链接:1、Seaborn官方0.8.1版本首先介绍以下热度图的作用,拿出离散群数据,离散群数据可能会发生波动变化.看一下哪个点的值比较高,看一下哪个点的值比较低?通过值的变化,用颜色表现出来,这个是我们要做的一件事.热度图是由不同的颜色构成的,这个颜色由可能是由浅入
书评｜总结篇《没出息的庄先生》、《山海高中》上篇陈欻欻
最不喜欢也最害怕遇到的，就是大长篇之中剧情不突出人物关系简单情节一波又一波没完没了的日常文和开篇就交往后面跟着一连串秀恩爱甜齁人迟迟不结尾的俗套恋爱文（当然我不是在说下面这两篇哦小可爱不要对号入座哦），我读这些食之无味又弃之，哦我一般是不会弃文，但是弃了我真的不会回头（角落里著名大大的著名之作静静地落灰中），就好难，真的好难。《没出息的庄先生》｜作者：寒菽现代日常搞笑文离家出走没出息的庄先生被网恋
《老喻的人生算法课》总结篇 Thehrdertheluck
《老喻的人生算法课》由两个模块构成：A计划：针对的是你内部世界的不确定性；B计划，针对的是你外部世界的不确定性。这是《人生算法》这门课程的最后一讲了。前面29讲的内容，通过人生算法A计划的九段修炼，以及B计划的18个人生难题，你已经为成为人生赢家做好了认知准备。作者说即使这门课里讲的概率、算法、心法和思维方式，你全都忘了，记住几点叮嘱，相信也够用了。人生的两类问题面对真实世界，到底需要你解决什么问
代码随想录算法训练营第60天（动态规划17● 647. 回文子串 ● 516.最长回文子序列 ● 动态规划总结篇芋泥肉松脑袋算法动态规划 java leetcode 开发语言
动态规划part17647.回文子串解题思路动态规划解法中心拓展法516.最长回文子序列解题思路动态规划总结篇647.回文子串动态规划解决的经典题目，如果没接触过的话，别硬想直接看题解。题目链接：647.回文子串文章/视频讲解：647.回文子串解题思路动态规划解法dp数组及其下标的含义布尔类型的dp[i][j]：表示区间范围[i,j]（注意是左闭右闭）的子串是否是回文子串，如果是dp[i][j]为
机器学习实战2--蒙特卡洛方法与Q-Q图(2022/10/12) 点灯的棉羊机器学习Jupyter笔记机器学习人工智能 numpy python
蒙特卡洛方法与Q-Q图文章目录蒙特卡洛方法与Q-Q图蒙特卡洛方法蒙特卡洛的定义和基本步骤一些常用的概率论相关函数使用蒙特卡洛验证大数定理Q-Q图Q-Q图的定义及用途importnumpyasnpfromnumpy.linalgimportinv,eigimportmatplotlib.pyplotaspltimportpandasaspdfromscipy.statsimportnorm蒙特卡洛方
机器学习实战1-基础运用（2022/10/11）点灯的棉羊机器学习Jupyter笔记机器学习 python numpy
机器学习实战1-基础运用文章目录机器学习实战1-基础运用numpy的简单运用生成矩阵和矩阵的简单操作用pandas库读取、保存csv数据文件read_csv()函数及读入的数据处理to_csv()保存数据matplotlib.pyplot库绘图的使用条形图的绘制箱型图的绘制分位数（Quantile）分位点/四分位数分位数与箱型图`boxplot()`函数绘制交叉报表热力图plt绘图基础import
机器学习实战Jupyter笔记专栏汇总点灯的棉羊机器学习Jupyter笔记机器学习 jupyter 人工智能
机器学习实战Jupter笔记开始博客学校开始的一门机器学习的课程，于是使用jupyter写这门课的作业，顺便将其完善为笔记发表为这个专栏的博客，并将专栏博客链接汇总到这里。由于是刚开始学习机器学习方面的内容，如有错误的地方，希望能有大佬能帮忙指正。笔记1机器学习实战1-基础运用种一棵树最好的时间–是十年前，其次是现在
朴素贝叶斯算法 YuanDaima2048 机器学习算法学习算法机器学习人工智能深度学习 python sklearn
朴素贝叶斯算法一、基本概念二、算法及代码应用朴素贝叶斯NB算法分类算法区别其他机器学习算法：机器学习实战工具安装和使用一、基本概念朴素贝叶斯（NB）是一种基于贝叶斯定理与特征条件独立假设的分类算法。它被广泛应用于文本分类、垃圾邮件过滤等领域。朴素贝叶斯算法简单易懂，其核心思想是假设在给定目标值时，各个属性之间相互独立。在实际应用中，朴素贝叶斯算法在垃圾邮件过滤中表现出色。它不仅准确率高，而且速度快
开启富而喜悦的人生，从成长、自律开始！ yy财富姐姐
大家好，我是于颖，今天是2020年7月31日，是我学习成长1000天打卡的第197天。今天和大家学习《家里的黄金》人类最重要的资产是头脑总结篇。前言:家居用品净资产，永不干枯的金矿。一、反正钱是你为了维持家居和生活方式而花费的金钱，因为你无可避免要花这份钱，所以从这些必须的开支中创造一些收入，而不是光出不进，要不我们也要买洗洁精，家居用品，美容产品和健康产品等等。二、不止现金返还有现金流入。三、富
代码随想录 Day-30 回溯总结篇 1234567今天你有没有摸鱼 python leetcode
回溯法理论基础回溯是递归的副产品，有递归就会有回溯回溯法就是暴力搜索回溯法能解决(组合问题/排列问题/切割问题/子集问题/棋盘问题)回溯三部曲：1）递归函数的返回值和参数2）确认终止条件3）单层搜索过程（可剪枝优化）组合问题：1）一个集合来求组合，需要startIndex2）多个集合取组合，各个集合之间相互不影响，不用startIndex3）当集合元素会有重复，但要求解集不能包含重复的组合时，使用
Linux环境基础开发工具总结篇唐唐思 Linxu系统编程 C语言 linux 运维
yum工具的常用选项有：install表示安装软件包；list列出所有可供安装的软件包；search搜索包含指定关键字的软件包；remove卸载指定的软件包yummakecache命令的功能是将服务器的软件包信息缓存到本地。yum工具在每次安装指定软件包的时候，都会检测源服务器上的软件包信息，为了便捷不用每次都去搜索软件包信息。yumsearch命令可以在所有软件包中搜索包含有指定关键字的软件包y
【机器学习实战】大数据与MapReduce 吵吵人
当运算需求超出了当前资源的运算能力，一、可以考虑购买更好的机器；二、可以将计算转换成并行作业，MapReduce就提供了这种方案的一个具体实施框架。MapReduce：分布式计算的框架MapReduce是一个软件框架，可以将单个计算工作分配给多台计算机执行。工作流程包括map和reduce阶段。第一阶段，输入数据被切片分发到节点上，各个节点对本地数据进行处理对应的运算代码叫做mapper。第二阶段
6年级云南游学——总结篇 6fe5a0b5c3c4
此次出行，我想孩子们收获着他们所有的收获，孩子从计划出行开始到兴奋的睡不着睡觉，再到平淡，内心的变化此起彼伏，那么我们一起来看看游学中那些印象记忆深刻的瞬间～～这次游学是孩子们双脚踏出四川走向省外的第一次游学。于他们而言是一个12-3岁从书本到现实求真的一个过程，这次游学累并快乐着，每天步数几万步，晚上工作到12点，还带着三个有挑战的娃，倒也不觉得很累，精神力量的加持远大于一切。来游学之前我做了各
《论语·公治长》10-总结篇小鑫芝士
正如本篇的题名，是一个人的名字，此人是孔子的女婿。以人名开始，自然也决定了本篇的定位，即对于人的评价。因此，我们按照对人褒与贬，把《公治长》这篇中赞扬和反对的行为分为两类，分别介绍如下。一、褒褒奖身正不怕影子斜：孔子首先表扬的就是自己的女婿公治长，说他不是因为自己的原因而惹上了牢狱之灾（缧绁之中），而且把自己的女儿嫁给了他，这是对其较高的褒奖。褒奖世事变化中的淡定：南容无论政治清明（有道）和黑暗（
书评｜总结篇《归妻》、《热浪》、《撞邪》、《喜新厌旧》陈欻欻
最近属实太惬意，根本不想更文虽然看书频率下降，但耐不住草稿箱里没更的文有点多，怎么办想出个大合集一下子都搞完。不过这么久不更文还是笔墨会生疏，内容几乎要忘光光，不会做笔记的人之好勤翻阅啦，大家不要介意，以后就更文随意了。《归妻》｜作者：刘水水早就离异的独身alpha在一个雨天，捡到了一个发情期的小omage，他忍住冲动想要离开却被对方可怜的模样打动，他无奈只好顺应本能爱怜这个曾经被人标记却又被抛弃
算法学习打卡day45｜动态规划：股票问题总结涛涛begin 算法学习打卡算法学习动态规划
Leetcode股票问题总结篇动态规划的股票问题一共六道题，买卖股票最佳时机和买卖股票手续费都是一个类型的问题，维护好买入和卖出两个状态即可，方法一摸一样。而冷冻期也差不多就是状态多了点，买入、保持卖出、当日卖出、以及冷冻期四个状态。做题方法还是动态规划五部曲：明确dp数组含义，这里六道题全部第i天都是手里买入状态或者卖出状态的现金数是多少，这篇文章下标0代表未持有，下标1代表持有。写出递推公式，
开启富而喜悦的人生，从成长、自律开始！ yy财富姐姐
大家好，我是于颖。今天是2020年8月5日，是我学习成长1000天打卡的第202天。今天继续和大家学习《家里的黄金》人类最重要的资产是头脑总结篇之六第八章:选择多元化~否则死亡。一、一直以来蓝领工作都是最缺乏保障的工作，因为外国工人能做相同的工作。工资水平却低得多。但是今日白热化的全球经济竞争，迫使急于盈利的公司为了节省开支，将数以百万计的白领工作岗位转移到海外。其结果是人们拥有工作保障的日子一去
[培训-Python机器学习]04-Git的使用和规范乱码奇糟软件开发 git
参考书Python机器学习实战作者裔隽张怿檬张目清出版社科学技术文献出版社难度入门安排计划：本章30分钟；作业：上网查阅Linus开发Git的背景；分析所在的开发团队所用的协作开发流程是什么？总结出Git使用和Git流程中遇到过的3个问题，发给大家讨论。非常有意思：2005年，由Linux的创始人LinusTorvalds开发；临危赴命，用时2周。分布式、本地管理、分支管理、提交机制Github、
[培训-Python机器学习]02-使用conda管理环境和包乱码奇糟软件开发 python conda
参考书Python机器学习实战作者裔隽张怿檬张目清出版社科学技术文献出版社难度入门安排计划：本章30分钟；作业：培训后实践本章的各种操作；结果：以Python3.10创建开发虚拟环境；再创建一个Python3.7版本以下的虚拟环境用来调试兼容性以前培训过venv，本次培训来说一说conda。conda其实可理解为：venv+pip，它的主要功能包括：环境管理：创建多个隔离的Python运行环境，每
DAY4-一小时读完一本书？（课堂总结篇）榴莲老丸子
清晨起床，外面飘着小雨，准备记录下昨天的梦境时，发现昨天并没有做梦，大概是多天早起早睡导致睡眠质量很好吧。今天是高效阅读课的第四天，也是讲解高效阅读的第一天，怀着激动的心情，我打开了课程，开始听讲。今天课堂的主题之一：高效阅读九步法。用自己的话定义步骤，可以分为内部准备、外部准备、潜意识调动、定时与预习、写出具体问题和关键词、心流全脑阅读、思维导图、输出、自己讲出来九步。具体步骤：1、外部准备：准
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

《机器学习实战》总结篇

目录

你可能感兴趣的:(《机器学习实战》总结篇)