GitChat的博客

机器学习极简入门课

特别提示

本课程为李烨老师达人课课程，需要购买训练营课程的同学请点击下方链接：

21 天入门机器学习-第03期

课程介绍

本达人课针对机器学习初学者，从机器学习、深度学习最基本的原理及学习意义入手，以模型为驱动，带领大家吃透几个最经典的机器学习模型——学习这些模型的原理、数学推导、训练过程和优化方法。

本课为每个模型提供了极小数据量的“极简版”实例，方便读者从直观上了解模型的运行原理。借助这些例子，大家可以将自己变身为“人肉计算机”，通过口算/笔算每一步的推导，模拟算法全过程，进而彻底理解每个模型的运作方式。

此外，本课还介绍了构建数据集、特征选择、调参、验证模型的方法，以及如何同步进行编程语言学习。帮助您掌握进行机器学习产品开发的基本能力。

作者介绍

李烨，高级软件工程师，现就职于微软（Microsoft），曾在易安信（EMC）和太阳微系统（Sun Microsystems）任软件工程师。先后参与聊天机器人、大数据分析平台等项目的开发。微信公众号：yuesiyuedu；个人微信号：julia_li_2013

课程大纲

本课程大纲分为六大部分，共计 42 篇：

课程内容

开篇词 | 入门机器学习，已迫在眉睫

大家好，我是李烨。现就职于微软（Microsoft），曾在易安信（EMC）和太阳微系统（Sun Microsystems）任软件工程师。先后参与过聊天机器人、大数据分析平台等项目的开发。在未来的 10 周里，我将通过“机器学习极简入门课”与同学们分享机器学习相关知识。

课程背景

首先，我们来看下当前机器学习领域招聘市场行情。

上面表格中所有带有“算法”、“人工智能”、“数据挖掘”、“视觉”字样的职位，都需要掌握机器学习相关知识。

在产品和服务中应用机器学习模型，已经逐步成为互联网行业的通行方法。甚至很多传统软件企业，也开始尝试应用机器学习。说得更直接些，人工智能正处在炙手可热的风口浪尖上，作为程序员不会机器学习都不好意思去找工作。

很多技术开发者迫切希望快速进入人工智能领域，从事工程或者算法等相关工作，这也是我推出这门课程的初衷。

课程大纲

本课程针对机器学习初学者，从机器学习、深度学习最基本的原理及学习意义入手，以模型为驱动，带领大家吃透几大最经典的机器学习模型——学习其原理、数学推导、训练过程和优化方法。配合精心设计的极小数据量的“极简版”实例，方便读者从直观上了解模型的运行原理，利用实例大家还可将自己变身为“人肉计算机”，通过口算/笔算每一步的推导，模拟算法全过程，进而彻底理解每个模型的运作方式。结合自身实践经验，我总结了多个构建数据集、特征选择、调参、验证模型的高效方法，并教授大家如何同步进行编程语言学习，助你快速拥有机器学习产品开发的基本能力。

本课程大纲分为六大部分，共计42篇。

第一部分：绪论

授人以鱼不如授人以渔。本部分从意义和作用出发，给出相应的学习方法和与理论配套的编程练习。

第二部分：基本原理

深谙其理，才能灵活应变。本部分带大家了解什么是机器学习、机器如何自己学习，以及机器学习三要素：数据、模型、算法之间的关系。
模型是机器学习的核心，那么模型是怎么得到的呢？本部分也将讲解模型的获取（训练）和评价（验证/测试）过程，相应数据集合的划分以及具体的评价指标。
这部分知识和后面讲述的具体模型结合起来，就可以实践了！

第三部分：有监督学习 I

抓住关键，个个击破。本部分重在详细讲解有监督学习中经典的线性回归、朴素贝叶斯、逻辑回归、决策树模型。这几个模型不仅基础、经典、常用，而且数学工具特别简单。

第四部分：有监督学习 II

百尺竿头，更上一层楼。本部分主要讲述支持向量机、支持向量回归、隐马尔可夫和条件随机场模型，从支持向量机开始，数学工具的需求较之前上了一个台阶，难度明显加大。

第五部分：无监督学习

无须标注，方便运行。本部分重在讲解无监督学习中的聚类、高斯混合及主成分分析等模型。训练数据无须标注，方便在各种数据上随时进行尝试，是这些模型的特征。在现实中，经常用来作为有监督的辅助手段。

第六部分：从机器学习到深度学习

超越自我，实现蜕变。本部分重在讲解深度学习基本原理、深度学习与机器学习的关联与衔接，以及深度学习目前的应用领域，为读者下一步学习“深度学习”奠定基础。

点击了解《机器学习极简入门》。

整个课程以经典模型为驱动，讲述每一个模型所解决的问题域，模型原理和数学推导过程。作为课程的主体，第三部分和第四部分讲解的每个模型，都附有实例和相应的 Python 代码。每个例子的数据量都非常小——这样设计就是为了让读者可以用人脑模拟计算机，根据刚刚学到的模型算法对这些极小量数据进行“模拟训练/预测”，以此来加深对模型的理解。

你将收获什么

AI 技术岗位求职知识储备

如果大家真的有意投身到人工智能领域，从事相关技术性工作，通过技术笔试、面试则是必要条件。在面试中被要求从头解释某一个机器学习模型的运行原理、推导过程和优化方法，是目前非常常见的一种测试方法。机器学习模型虽然很多，但是经典、常用的很有限。如果能学会本课程所讲解的经典模型，你将足以挑战这些面试题。

触类旁通各大模型与算法

各种机器学习模型的具体形式和推导过程虽然有很大差别，但在更基础的层面上有许多共性。掌握共性之后，再去学新的模型、算法，就会高效得多。虽然本课的第二部分集中描述了部分一般性共同点，但真要理解个中含义，还需要以若干具体模型为载体，从问题发源，到解决方案，再到解决方案的数学抽象，以及后续数学模型求解的全过程，来了解体味。这也就是本课以模型为驱动的出发点。

极简版实例体验实际应用

运用到实践中去，是我们学习一切知识的目的。机器学习本身更是一种实操性很强的技术，学习它，原本就是为了应用。反之，应用也能够促进知识的深化理解和吸收。本课虽然以原理为核心，但也同样介绍了：划分数据集、从源数据中提取特征、模型训练过程、模型的测试和评估等方法和工具。

配套数据+代码快速实操上手

本课程中各个实例的 Python 代码及相应数据，大家可以下载、运行、改写、参考。

课程寄语

我希望本课的读者在知识和技巧的掌握之外，能够将学习到的基本规律运用到日常生活中，更加理性地看待世界。

再遇到“人工智能产品”，能够根据自己的知识，去推导：How it works——

它背后有没有用到机器学习模型？
如果有的话，是有监督模型还是无监督模型？
是分类模型还是回归模型？
选取的特征是哪些？
如果由你来解决这个问题，有没有更好的方法？

我们自己用来判断万事万物的“观点”、“看法”、“洞察”，实际上都是我们头脑中一个个“模型”对所闻所见（输入数据）进行“预测”的结果。这些模型自身的质量，直接导致了预测结果的合理性。

从机器学习认识客观规律的过程中，我们可以知道，模型是由数据和算法决定的。对应到人脑，数据是我们经历和见过的万事万物，而算法则是我们的思辨能力。

作为人类，我们不必被动等待一个外来的主宰者，完全可以主动训练自己的思维模型，通过改进算法和增大数据量及数据多样性来提升模型质量——如果能在这方面给读者朋友们带来些许启发，我实在不胜荣幸。

最后，预祝每一位订阅课程的朋友，能够通过学习找到心仪的工作，如果大家有任何疑问和建议，也欢迎通过读者圈与我交流，我们共同学习，共同进步。

我之前分享的一场 Chat 《入行 AI，选个脚踏实地的岗位》中曾提到，工业界所需的 AI 技术人员，更多集中在算法、工程、数据相关岗位之上，并全面总结了不同岗位角色所需要具备的素质、日常工作的状态及职业发展路径。这场 Chat 也将收录在课程中，作为福利供大家免费阅读，加油！

点击了解《机器学习极简入门》。

第01课：为什么要学原理和公式推导

机器学习最直接的应用，就是利用模型解决实际业务中的问题。

本课所讲解的几个经典模型，均是前辈在机器学习发展的几十年间所总结出的、解决特定问题的固定模式，并且已在实践中得到很好证明。

学会这些模型，一则可以以它们为载体理解“机器学习”是一种怎样的机制；二则掌握了模型，也就掌握了当前许多实际问题的有效解决方案。

学模型就要学公式推导吗？

在实际工作中，我们要运用一种模型，其实有很多现成的算法库、学习框架。只要将相应的数据输入工具、框架中，用几行代码指定模型的类型和参数，就能自动计算出结果。

既然如此，何必再去学其中的原理，一步步推导让人头晕的数学公式？

对于这个问题，首先给出我的意见：

机器学习的原理和数学推导一定要学！

此处且举个直观的例子：

工具就像是武器，学会使用某种工具，只是学会了这种武器最基本的招式和套路。而理论学习即策略学习，决定了在未来真实对战中，遇到对手攻击时，你选取哪些招式套路，如何组合起来去迎敌。

反过来讲，如果根本不学模型原理，只是把一个个应用场景背诵下来，需要的时候直接把模型当黑盒使用——这样做我们能学到什么？

我们将学到：

算法库的安装；
库函数的调用；
数据的 I/O 转换。

这和调用任何一个封装好的 API（无论其功能）有什么区别？和调用同事撰写的模块接口又有什么不同？

学会这几件事能让你相对他人产生什么样的壁垒？作为一个原本非 AI 领域的开发者，难道因为会安装几个支持库，会调几个接口就身价倍增，就成为机器学习工程师了？

学习原理的必要性

回过头来，我们从正面来看学习原理的必要性。

功利层面

咱们先来看看最直接的用处。

面试会考

最起码，找工作的时候，但凡稍微靠谱点的企业，在面试“机器学习工程师”时，一定会问到模型原理和推导过程！所问到的模型，随着时间推移会越来越复杂。

三四年前甚至更早，企业技术面试时，大多会问线性回归。这两年，已经基本从逻辑回归开始问了。再过一两年是否会问支持向量机，不得而知，但理论考察势必会越来越难。

真想入这行，为了面试也得学其中的原理。

老板会问

在日常编码中，可能确实只是调 API 而已。

很多时候，在决定使用哪个工具、框架，调用哪个模型算法后，你还需要向老板、合作方甚至客户解释其中的缘由。

以前谁负责哪个模块都是自己搞定所有事，你怎么还想让别人给你标注数据呀？

花费这么多时间和人力训练出的模型，怎么连个 DSAT 都 Fix 不了啊？

既然再多投入几倍资源也达不到 95% 以上的正确率，为什么不干脆直接用 Rule-Base 来解决？

……

Manager、Tech Lead、PM 都有可能围绕机器学习/深度学习投入产出比，提出各种问题。要在工作中运用这些技术，首先要说服他们。这个时候，原理就派上用场了。

同事会质疑

对你应用 ML/DL 的疑问，不仅来自上司，很多时候也来自于同级别的同事。

相对于老板对性价比的关注，同事可能更关心技术细节——质疑新框架/工具/模型/算法，与之前的实施方案相比，在功能、性能等方面的差异。

别人都用 TensorFlow，你为什么要用 Caffe 呢？

以前这个分类器，我们用逻辑回归挺好的，你为什么非要换成 RNN 呢？

用这个谱聚类做数据预处理，归根到底不还是利用词袋模型算词频，比直接计算 tf-idf 做排序能好多少呢？

……

到了这个层面，只简单概括说说原理已经不够了，需要深入细节做对比：

不同模型的特质、适用场景，对当前数据的匹配程度；

不同算法对算力和时间的消耗；

不同框架对软硬件的需求和并行化的力度；

了解了这些，才有资格讨论技术。

【文-1】

实用层面

当然，在日常工作中可以完全不理会 Peer 的质疑，对于 Boss 的决定也可以照单全收绝无二话。Engineer 嘛，只要埋头干活就好了。但总得把活儿干好吧。

作为一个机器学习工程师，把活干好的基本标准是：针对技术需求，提供高质量模型。

再高一个层次则是：针对业务需求，提供高质量的解决方案。

优化模型

机器学习工程师又被戏称为调参工程师。

其所要做的工作就是在限定的数据上、规定时间内，为具体技术需求（比如训练一个分类器）提供性能尽量高、消耗资源尽量少的模型。

选特征、调超参、换模型，称为调参工程师的三板斧，要想有章法地使用它们，理论基础还是必不可少的。

至此，上面 【文-1】 处所描述内容，不再是和他人论战的“弹药”，而成了工作步骤的指导。

评判模型性能的指标有哪些，如何计算？

正在使用的模型是怎么工作的？

这些超参数是什么含义，调整它们会产生哪些影响？

特征选取有哪些原则、方法可运用？

如果连以上问题都不了解，又怎么优化模型？

针对实际问题定向建模

成为一名合格的调参工程师，固然可以在 AI 领域占据一席之地，但对于业务和团队而言，仍然是个可有可无的角色。

真正创造价值的，从来都是解决实际问题的人。

这些经典的模型、算法，是前人在解决实际问题中所研究出的、具备通行性的解决方案。它们被广泛应用，是因为所解决的目标问题总会持续出现。

然而，新问题也会随着新需求不断涌现，现有成果可能无法解决这些新问题，调参工程师这时将束手无策。

但对于理论知识扎实的机器学习工程师来说，他们完全有可能针对具体业务问题，构造出目标函数，甚至开发出符合自身软硬件资源特点的求解算法。

到了这一步，即使还使用现成工具，也不是靠 Google 一下 Best Practice，以及复制粘贴下代码就能解决的了。必须具备理论基础和数学层面的建模能力才行。

点击了解《机器学习极简入门》。

第02课：学习机器学习原理，改变看待世界的方式

学习机器学习，除了上一篇提到的实实在在的好处外，在务虚方面同样受益。

学习模型运作原理，可以了解现实事物如何转化为数字并被计算，结果又如何映射回现实世界来影响我们的生活。

掌握机器学习相关知识，能为我们客观认识现实带来下面这些帮助。

破除迷信

在这个看起来人工智能要席卷一切的年代，不光是正在或立志于在 AI 领域做技术工作的人，任何人都有必要从原理角度了解机器学习、深度学习是干什么的，以及如何发挥作用。

作为一个带有神秘色彩的热点概念，人工智能（AI）被热炒、被歪曲、被妖魔化是难免的。

人工智能是一个学术研究领域，目前在工业界有一定的应用和探索。AI 归根到底是个技术问题，可学、可用、可研究亦可质疑，而不是只能顶礼膜拜的法术神功。

具备最基本的判断能力，才有可能不会被“神话”迷惑，不被“鬼话”恐吓。

知道 ML/DL 模型是如何工作的，总不至于看了篇《AI 专业毕业生年薪 50 万》就慌慌忙忙报个了 2 万块的培训班，学了 pip install tensorflow ，通过复制粘贴代码可运行几个习题数据集，就以为能够找份年薪 50 万的工作了。

知道 AI 有哪些落地点和局限，就不至于瞟了几眼《XX 职业要消失了》，《XXX 岗位将被人工智能取代》之类的网文就骤然开始仇视社会，好像自己明天就没有活路了似的。

除了判断事，判断人可能更重要一些。

了解一件事的原理，自己有个基本的是非标准，再去看别人对它的评论，就不难看出评论者的“斤两”。也就不至于被其所说内容之外的语气、措辞，或者刻意的态度所误导。

《机器学习极简入门》。

追本溯源

人工智能从提出到现在已有几十年，几经沉浮。这些年间，模型、算法、实现技术已更迭了好几代，如今和当年已是天壤之别。

所有的发展都不是凭空出现的，新方法、技术均在原有基础上创新得来。每一个具体的进步，都仅仅是向前的一小步而已。

最容易创新的是技巧和细节，越“大”的创新，出现的频率越低。而原理所揭示的，就是这种“大”的、相对稳定的东西。

机器学习最经典的那几个模型，历史都不短，长则半世纪，短的也快 20 年了。

深度学习，早年是从属于机器学习的神经网络，因为运算能力不够而被束之高阁多年，近些年借助计算机硬件和分布式计算的发展而大放异彩。

虽然技术本身和应用结果产生了巨大的飞跃，但从根本的原理层面，却有着紧密的传承。

了解一件事是如何运行的，明晰事物发展的客观规律，知道从最简单的原理学着手逐层推进，比从一个已经很复杂的状态入手，一下子纠缠在各种不得要领的细节中要高效得多。

有了这样的认识，也就不会被一些名词所局限。不会仅仅因为人家做了一些细节改变，或者换了个说法就以为天翻地覆了。

具体到 AI 领域，真的了解了支柱技术的基本原理，总不至于：

看了一篇《当这位70岁的 Hinton 老人还在努力推翻自己积累了 30 年的学术成果……》，便宣布再也不学 CNN、DNN、RNN 了（好像真的学过一样）。

或者：

因为《深度学习已死，可微分编程万岁！》刷屏，就以为目前在视觉、语音、NLP 等领域已经在创造价值的 DL 工具瞬间消失无用了。

精进看待世界的方法

相较于仍然处于经验（“炼丹”）阶段的深度学习，传统的统计学习模型和方法已经具备了相对完善的理论基础。

我强烈建议：即使目标岗位是“深度学习工程师”，也应该从统计学习方法学起。

一方面深度学习与机器学习具有传承的关系，学习后者对于直观理解前者有极大帮助。

另一方面，统计学习方法建立在将概念“数字化”（向量化）的基础上，以数学公式和计算来表达概念之间的关联及转化关系。机器学习是一种认识世界的工具，借助它，我们可以从一个新的角度来看待世间万物。

换句话说，当我们知道机器是怎样通过学习事物特征的概率分布和转换来掌握事物规律的时候，我们就有可能反过来审视自己看待世界的方法，发现其中不合理的部分，并主动优化自己的思维模型。

比如，我在学习机器学习原理的过程中，对人类的思维方式产生了一些思考：

人类的道德标准实际是一种社会层面的极大似然估计。

遗忘是学习的一个步骤，是一种对信息的过滤方法，也是人类在脑力有限情况下对自身大脑的一种保护机制。

人类的偏见是一种长期训练的结果，在信息极其匮乏的情况下，对人们做决定往往是有正向帮助的。信息越丰富，偏见的负面影响也就越严重。

大多数人最常用的思维模型是 KV Pair，有些人似乎终身只有这一种思维模型。

一般人往往默认一类事物的所有个体在概率空间是均匀分布的。在考虑某一个事物个体时，对其在同类事物中所处的位置——是小概率事件还是常态？发生概率相对之前是稳定、上升还是下降？——通常毫不在意，而一概认为被提及的个体很重要。

对于原因和结果的关系，多数人根本没想过去探究其转换模型，而直接默认是线性关系。比如：A 地的年均 PM2.5 指数是 B 地的 10 倍，PM2.5 被认为与肺癌发病率有关，于是想当然以为 A 地肺癌发病率是 B 地 10 倍。

当一件事物比较复杂，涉及多个方面的时候，要对它有一个全面的评价，目前最常用的方法是构建一个线性回归模型：选定一些特征，针对每个特征独立打分，最终加权求和（例如大学排名之类）。

线性回归是一个非常简单的模型，往往无法达到很好的效果。但即使这样简单的模型，很多人还是无法掌握。

面对一项事物，既不能列举出其主要特征，也不知道如何评估每个特征，更不用提再加权求和了。多数人最常用的全面评价标准，如果是一手资料则一般以某（几）个个例的某个特征来代替全集；如果是二手资料，则一般选择相信自己最先接触到的他人结论。

以上这些仅是一些很初级的想法，并没有进一步的研究验证。

我分享出来只是想说明：学习机器学习原理和公式推导，并非只是做一些无聊的数字变换。很可能由此为我们打开一扇窗，让我们从新的角度看待世界，并为日常的思考过程提供更加可量化的方法。

点击了解《机器学习极简入门》。

第03课：如何学习“机器学习”

学习“机器学习”这件事，我走过很长的一段弯路。有一些心得、体会和方法，在此和大家分享。

《机器学习极简入门》

以模型为驱动，了解“机器学习”的本质

本课力图引导大家以模型为驱动，进行学习。

我选择了几种经典模型（例如：线性回归、逻辑回归、决策树、支持向量机、条件随机场、K 均值等），作为入门的进阶。

初次学习模型，不必贪多。但就这些选定的模型，一定要搞清楚其问题域、模型函数、目标函数、训练算法……潜入到数学公式推导的层面，对每一步的公式变换和对应的物理意义有所理解，然后再去实践。

这一个个的模型，就是机器学习的“肌肉”，我们要通过观察学习这一块块肌肉，以其为载体来了解机器学习的核心——将事物转化为数值，将关系、变换转化为运算，以事实（数据）为依据，以规章（算法）为准绳，通过计算来掌握事物的客观规律（模型）。

要知道，这些经典模型固然经典，但是到了实际应用中，它们并非神圣不可改变。也不是说机器学习就仅限于这些经典模型。

只有掌握了机器学习精髓的人，才可能灵活运用现有模型去解决实际问题，甚至进一步针对具体问题得出自己的模型和算法。

反复学习，从记忆到掌握

当然，达到这种程度并非一蹴而就，总要从最简单的模型开始。

根据我的经验，即使要真正掌握本课列出的这几个最常用且相对简单的模型，也需要反复学习。

有可能第一遍看完有点似懂非懂，或者感觉自己明白了，但要自己从头推导又卡壳了。

就像刚学完又忘掉的生字，或是背了一半后半部分怎么也想不起来的九九乘法口诀。这都是非常正常的现象。究其原因，就是还没有真正掌握。

多学几遍，从头到尾掌握整件事情的逻辑，知道一个模型是怎么从最初设定目标，到一步步实现目标的——当真正掌握了这个过程之后，再回头看一个个具体的模型，每一步都是顺理成章的。

掌握了事物内在的逻辑，再去记忆，就容易多了。

学习标准设置得不必太高，比如可以这样：

第一遍学，只要求自己能完全掌握机器学习数据、模型、算法相互作用的基本关系，训练过程和评价标准。具体的模型，掌握最简单的线性回归就可以。

只要从头到尾掌握了第一个模型，做到：能够从模型函数开始推导出目标函数，再用梯度下降算法求解，用（伪）代码实现梯度下降求解过程。

第一遍学习掌握一个模型；第二遍学习就不难掌握2-3个模型；第三遍就有可能掌握本课列出的大部分模型………如此由易到难，螺旋式推进。

对于一些本身就比较复杂的数学模型，比如条件随机场、隐马尔科夫这类涉及场论和势函数的模型，如果直接入手，往往会卡在模型函数本身上。但是当有了前面几个模型的基础，了解了更抽象层面的原理，掌握起来就容易多了。

数学需要多精深？

很多同学，想学机器学习。但是一上来就看模型，看到一大堆炫酷的公式，往往感觉很吓人。

有些人也就因此萌生退意，要么放弃，要么只用现成工具把模型当作黑盒使用。

其实，学习经典模型，并不需要多么精深的数学功底，只要掌握大学理工科本科所教授的数学知识就基本够用了。

基础数学概念

在学习的最初阶段，只要：

学过坐标系；
了解函数、向量和矩阵的概念；
能从直观角度对求导、求微与函数的关系有所理解；
并掌握最简单的矩阵运算。

就可以对本课中的经典机器学习模型有一定深度的感性认识了。

本课中的公式都是经过精简的，务必要掌握。如果数学工具实在掌握得太少，最起码也要读懂一组公式推导中的第一个和最后一个式子：

读懂它们都针对哪些变量进行了怎么样的运算；
这些变量和运算的物理意义是什么；
第一个式子是对哪种真实场景的数学描述；
最后推导的结果又具备怎样的特征。

初次学习者，可以暂且掌握到这个深度。

两条路径反刍数学知识

当然，仅仅掌握到这种程度，勉强可以套用现成的模型，却不可能达到灵活运用的程度。

所以，同学们应力求理解每一步推导过程。

如果有可能，可以事先复习一下大学本科的高数（数学分析）、概率统计和线性代数。或者，在学习模型的过程中，一旦遇到了数学上的阻碍，就回头去查找相应知识。

制定数学知识速查手册

很多数学问题，之所以让人头大，其实并不是真的有多难，而是符号系统比较复杂，运算繁复，或者运算所表达的物理意义多样。

很多时候造成困扰是因为想不起来这里用到什么定理，哪个公式，或者这样操作表达的含义是什么。

如果把常用的细小知识点都记录下来，按主题整理成速查手册（小字典），需要用的时候快速查找对应的知识点，这样我们的“机器学习”学习之路就顺畅不少。

下面两个是我自己制作的例子，供大家参考：

机器学习常用微积分知识速查手册
机器学习常用线性代数知识速查手册

日常学习 Tips

关联

把新学到的东西和日常的工作、生活联系起来，进行思考。比如：将理论代入现实，不同领域间事物的类比，相似内容的对比等。

以身边的实例来检测理论。不仅能够加深理论知识的理解，而且有助于改进日常事物的处理方法。

记录

准备一个笔记本，纸质版或电子版均可。有什么发现、感想、疑问、经验等等，全都记下来。

如果是对某个话题、题目有比较完整的想法，最好能够及时整理成文，至少记录下要点。

隔一段时间把笔记整理一下，把分散的点滴整理成块，一点点填充自己的“思维地图”。

知识技能这种东西，学了，就得“炫耀”——把学习到的新知识、理论、方法，分享给更多的人。如此一来，倒逼自己整理体系、记忆要点。这可以说是与人方便自己方便的最佳实例。

把自己的感想、体会、经验分享出来的同时，也锻炼了自己的逻辑思维能力和归纳总结能力。一举多得，何乐而不为？

点击了解《机器学习极简入门》。

第04课：为什么要学 Python 以及如何学 Python

第05课：机器是如何学习的？

第06课：机器学习三要素之数据、模型、算法

第07课：模型的获取和改进

第08课：模型的质量和评判指标

第09课：最常用的优化算法——梯度下降法

第10课：线性回归——从模型函数到目标函数

第11课：线性回归——梯度下降法求解目标函数

第12课：朴素贝叶斯分类器——从贝叶斯定理到分类模型

第13课：朴素贝叶斯分类器——条件概率的参数估计

第14课：逻辑回归——非线性逻辑函数的由来

第15课：逻辑回归——用来做分类的回归模型

第16课：决策树——既能分类又能回归的模型

第17课：决策树——告诉你 Hello Kitty 是人是猫

第18课：SVM——线性可分 SVM 原理

第19课：SVM——直观理解拉格朗日乘子法

第20课：SVM——对偶学习算法

第21课：SVM——线性 SVM，间隔由硬到软

第22课：SVM——非线性 SVM 和核函数

第23课：SVR——一种“宽容”的回归模型

第24课：直观认识 SVM 和 SVR

第25课：HMM——定义和假设

第26课：HMM——三个基本问题

第27课：HMM——三个基本问题的计算

第28课：CRF——概率无向图模型到线性链条件随机场

第29课：CRF——三个基本问题

第30课：从有监督到无监督：由 KNN 引出 KMeans

第31课：KMeans——最简单的聚类算法

第32课：谱聚类——无需指定簇数量的聚类

第33课：EM算法——估计含有隐变量的概率模型的参数

第34课：GMM——将“混”在一起的样本各归其源

第35课：GMM——用 EM 算法求解 GMM

第36课：PCA——利用数学工具提取主要特征

第37课：PCA——用 SVD 实现 PCA

第38课：人工智能和神经网络

第39课：几种深度学习网络

第40课：深度学习的愿景、问题、应用和资料

附录：入行 AI，选个脚踏实地的岗位

阅读全文: http://gitbook.cn/gitchat/column/5ad70dea9a722231b25ddbf8

你可能感兴趣的:(机器学习极简入门课)

今日关于嘴包臀的看法破晓的时光
不关注很久，最近才在朋友圈里看到嘴包臀的文章。平心而论，四处咬人的狗到处都是，我也不至于那么玻璃心，被狗咬一口，非得咬回去。何况我学的是IT，做的却不是程序员。但是，让人恶心到呕吐的是简叔，堂堂简叔的CEO，代言人，公开支持嘴包臀的文章。我就好奇了，他到底能不能分清楚多元、自由是怎么写的，到底能分清楚自由表达和人身攻击之间的界限吗？首页里那么多程序员辛辛苦苦写的文章，分享的知识，带来的活跃，是这样
郑州一模答案你的光芒
语文试题答案1.(3分）shàn覆赋（每字1分，共3分）2.(5分）示例：辩论共四个环节（1分）；立论阶段由双方的一辩正面论述己方观点：（1分）攻辩阶段由双方二辩提出质疑并回答对方提问：（1分）然后自由辩论，双方辩手可轮流发言，强调己方观点的同时进行反驳；（1分）最后总结陈词，双方三简总结。每一环节均不超过3分钟。（1分）3.(8分）①人生自古谁无死②留取丹心照汗青③苦将依强派作蛾眉④长风破浪会有
学习PET亲子沟通课第18课：怎样才能让孩子更亲近你刘小小乐乐
美国婚姻辅导专家查普曼博士:总结了爱一个人有五种方式，它们是：肯定的言辞，精心的时刻，礼物，身体的接触，服务的行动。这五种爱的方式称为五种爱语，爱的语言。孩子是爱的五项全能，没有他不擅长的爱语。第18课作业:1.写出家里每一个人的主要爱语。并试一试用这种方式去爱他们一个星期，观察他们的反应以及你们关系的变化。老公:服务的行动，肯定的言辞女儿:肯定的言辞，精心的时刻，礼物，身体的接触。2.你打算以后
生活是个大坑 2019_ddd4
早上看到浙大学霸密密麻麻的时间安排表，很受震撼！向他学习。问自己有什么,凭什么可以不够努力。十年是一个坎，07年毕业，2017年一个大坎，差点跨掉，虽然走过去了，但付出了极其惨重的代价！年轻的时候真的是自以为是，被社会大学好好给你上了一课后，摔得够痛，心有余悸。所以我给自己只剩十年的时光，2027年，希望也能平安度过！世上有另外一个世界吗？我是敬畏的。世上有心怀报复的人吗？有，所以面对它，凡事谨慎
2021年11月9日中原焦点团队网络初级第31期党育坚持第29天分享 3d947c9d58d6
今天的课刘老师让在小组内交流自己写的20条难得的感受。20条难得对我来说并不是难事，从新审视自己，一直以来，我好像很少看孩子的缺点，但也不是不责骂孩子，小时候对孩子严格要求也责骂过不少，我想不出他有哪些我不能忍受的缺点，在我的眼中包括邻居亲戚眼中他都是很好的孩子，尽管他成绩不是最好的。我也尽量不想生活中不开心的事，因为一想不开心的事就会觉得生活无趣，一眼能看到头，不如就当一天和尚撞一天钟，活在当下
成功日记（Day1115）狮子座的兔子姑娘
1、学习中药一课程。~1.5h。2、跟g夙微信闲唠嗑。~0.5h。3、给自己剪头发。~0.5h。4、和包、李微信闲唠嗑。~0.5h。5、和z鹤微信闲聊几句。~0.25h。6、在赫男那做了个生命密码的测试，说我今年会有工作上的大转折，然后又聊了会天。~1h。心情：尚可。还算开心。
语音识别开源项目推荐：GitHub热门仓库盘点 AGI大模型与大数据研究院 AI大模型应用开发实战语音识别开源 github ai
2024年必看！GitHub热门语音识别开源项目全解析：从入门到实战关键词语音识别(ASR)、开源项目、GitHub、Whisper、FunASR、PaddleSpeech、深度学习摘要想象一下：开车时只需说一句话就能自动发消息，听英文演讲时实时获得中文翻译，给视障人士读文本时精准转换——这些场景的背后，语音识别（AutomaticSpeechRecognition,ASR）技术正在改变我们与机器
从无人问津，到被打赏，我们一起努力小暖阳光
今天是在码字的第32天。最近已经习惯了睁眼先看疫情进展，期盼着疫情突然就过去了。第二件事则是打开看看文章下面的小钻石有没有增加。说来可笑，在混了一个月，我依然没整明白那些钻旁边的小数字是怎么增加的，但每天看着它在增长，阅读人数也变多，心里就会很满足。然而今天早上却把我惊呆了。今天除了有比往常多很多的互动点赞消息外，居然多了8个关注，最最吃惊的是有4个简友居然给我送了呗，被送贝的那篇文章下面的小钻石
MySQL入门学习-查询优化.EXPLAIN
在MySQL中，'EXPLAIN'命令用于获取查询执行计划的信息。一、关于'EXPLAIN'的一些常见查询优化方面的特点、使用方法、与其他比较及高级应用：1.特点：-提供查询执行计划的详细信息，帮助了解查询的执行方式。-可以用于优化查询性能，找出潜在的性能问题。-适用于各种类型的查询，包括简单查询和复杂查询。2.使用方法：-在查询语句前添加'EXPLAIN'关键字，例如：'EXPLAINSELEC
直播公开课|唯美彩铅风景——乡村小景木兰手绘
喜欢彩铅风景画的小伙伴们看过来，明天下午两点半在视频号：木兰手绘，给大家直播彩铅风景绘画，喜欢田园风景的小伙伴们不要错过哦～不知道在哪儿看的，可以留言或私信～以后不定期都会有免费公开直播课～
靠声音赚钱的六大方式，靠声音赚钱配音就业圈
在当今这个数字化与多媒体蓬勃发展的时代，声音作为一种独特而强大的媒介，正以前所未有的方式创造价值与财富。配音兼职接单推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种的配音任务，新手小白也可以接单。1、配音新手圈这是一个公众号配音新手圈里面每天更新配音任务(只要有手机就可以接单，对经验无要求)，都是适合没有基础的人去做的，每天都会发布新任务。适合新入门
11月27日，星期二，晴（鼓励践行打卡第126天）春天里的紫苏
刚刚和儿子大吵了一顿，伤心伤肝伤肺，心依然在疼，喉咙里还在冒烟……上数学课讲小话，不认真听讲，数学5单元测试作弊，语文作业没做……一天当中，他至少被点名三次，上的都是黑名单。再联想到他昨天拿自己的稿费30元随便就给了同学，连眼睛都不眨下。今早才匆匆赶昨天的作业，早点都没时间吃，还是落下了一项作业。因为饿着肚子，以致于在去学校的路上翻我的包找钱。我警告他说，我现在每天包里的钱都有数，你要是敢拿我一分
记录快乐的读书时光林姐_健康生活
“魔法人生·悦读俱乐部”第21天打卡（《业力管理》第97页~第112页）：生命终究是脆弱的，十几岁的少年骑电动车和三轮车发生车祸，人当场没了，可以想象到父母撕心裂肺的痛…到底是谁的错？孩子的胆大？父母的放纵？车主的粗心大意？揪谁的错没有意义，流逝的生命已无法挽回，安全警钟必须长鸣！一、今天阅读的有哪些重点内容，对我有哪些启发今天读了业力管理法则五：停止做决定1.“极简主义”设计，只有礼盒图片，没有
分布式文件存储（GlusterFS）入门指南，有一定难度！！ ubuntu 努力一点948 分布式gluster 分布式 ubuntu linux 服务器运维人工智能 gpu算力
以下有免费的4090云主机提供ubuntu22.04系统的其他入门实践操作地址：星宇科技|GPU服务器高性能云主机云服务器-登录相关兑换码星宇社区---4090算力卡免费体验、共享开发社区-CSDN博客兑换码要是过期了，可以私信我获取最新兑换码！！！之所以推荐给大家使用，是因为上面的云主机目前是免费使用的，不需要大家再去安装虚拟机，部署虚拟机，环境都搭配好了，非常适合新手入门，减少搭建的时间，把时
2023-09-03幸福日记89 静心love
1.感恩自己早起，睡到自然醒，精气神棒棒哒2.感恩自己早上阅读羊皮卷，给自己补充精神食粮3.感恩自己早上给家人们做的爱心早餐，营养健康4.感恩自己早上接水烧水间隙做个肩颈SPA，昨天搬家具显然有些累了肌肉有些拉伤，做了2次SPA，肩膀越来越挺拔5.感恩自己早上给自己化了妆，皮肤美美哒心情也就美美的6.感恩自己早上带大宝去体验斯坦星球体验课，带孩子体验感受静电、电流回路7.感恩爸爸今天送我们去上课，
【狂神说JAVA】JVM快速入门-1 Jackson Cortex jvm java
链接http://player.bilibili.com/player.html?aid=76728711&bvid=BV1iJ411d7jS&cid=131232435&page=1http://player.bilibili.com/player.html?aid=76728711&bvid=BV1iJ411d7jS&cid=131232435&page=1内容一、探究JVM0、面试题谈谈对J
磨课心得爬坡启动
这几天，严格的说是一个星期以来，参加中心学校选送县级参赛教师的磨课。参赛课题是人教版小学数学三年级上册分数单元的《认识几分之几》到《分数的简单应用》共五个课题中的一个。今天早上已经抽签定下来，我们乡镇参赛教师抽到的课题是五个参赛课题的第二个课时——《同分母分数大小的比较》，所以这个课题今天下午又给这位参赛老师听了第二遍。通过这几天参与磨课，收获颇多，简要记录于下。一、进一步认同了黄爱华老师所说的“
校内教研三原则程景轩
68到74页《静悄悄的革命》355天20190820图片发自App根据先生的设计，改变教学，从学校的改变开始，从开放教室开始，然而真正在校内进行教研活动时，他的原则真的让我大吃一惊。第一个原则，对应学生的教学。这个原则真的让我特别吃惊，在改革的第1年，所有教研活动的中心，目的不是上出精彩的课，而恰恰相反，改革的目的最重要的就是，在教师和学生之间建立起教师尊重每个学生的相互关系，以及学生之间相互影响
新活法训练营第七天2022-03-21 Diana_58d9
破解困惑的根源必修：学完这一课，你有哪些收获和心得，写出至少三点。1、通过张老师对动物假死的讲解，知道了所有的疼痛都是潜意识里的一种自我保护，叫创伤胶囊。对于创伤胶囊里的人或动物，给他足够的时间让他自己恢复是最好的。2、困惑也是启动了心理保护机制，是一种自我保护，面对困惑，首先接纳他，允许他在，第二，慢慢走进它，接受他在我们身上，第三，放下，转身做该做的事。如何突破困惑，首先有足够的意愿度，才能醒
Web创建网站登录页面怎么还没吃饭啊服务器运维
目录一、创建新窗体1.创建一个普通的ASP.NET空web网站2.创建login.aspx二、添加控件三、login.aspx页面中四、添加点击控件1.打开login.aspx页面源五、总结一、创建新窗体1.创建一个普通的ASP.NET空web网站新窗体自己命名为自己想要建立的名字，我就命名为一课一得了一定注意的是要选择一个空的应用程序用于创建ASP.NET应用程序的空项目模版2.创建login.
2022暑假总结 yanpinghappy
这个假期，娃都是按照每天的学习计划做事（10天日照旅游期间除外），大概是因为之前两三个寒暑假都是如此规律，所以娃也适应了这种按部就班的节奏。学习时间表，几乎都是我俩商量的结果，中间遇到时间紧张或者无法执行的情况，我们会再做调整。美中不足的是，复盘这一项我俩做得极少，这一点下次寒假时一定要加强起来。暑假第一个月，报了两个课程奥数和《水浒传》，时间排得满满的，把头一年报的游泳课挤出去了，到了第二个月才
Android UI 组件系列（五）：CheckBox、RadioButton 与 Switch 控件详解
博客专栏：Android初级入门UI组件与布局源码：通过网盘分享的文件：Android入门布局及UI相关案例链接:https://pan.baidu.com/s/1EOuDUKJndMISolieFSvXXg?pwd=4k9n提取码:4k9n引言在Android开发中，用户与应用的交互往往离不开各种“选择”操作，例如：注册表单中选择兴趣爱好（可多选）设置界面中切换通知、Wi-Fi开关（开/关状态）
2020-5-7晨间日记邓芬芳
今天是什么日子起床：五点三十五就寝：十一点之前天气：阴天有雨心情：焦虑纪念日：高品质的生活需要适度的焦虑任务清单昨日完成的任务，最重要的三件事：打扫卫生、听课、准备复学第一课团体训练活动改进：团体训练活动准备的不理想习惯养成：科学、合理安排时间，提高效率，知行合一周目标·完成进度积极主动高效快速完成领导安排的任务学习·信息·阅读继续阅读《自卑与超越》《权宜之计》等书籍继续学习微笑主义——整合心理学
PyCharm高效入门指南：从零开始掌握Python开发利器软考和人工智能学堂 Python开发经验强化学习 PyCharm
引言PyCharm是JetBrains公司推出的一款强大的Python集成开发环境(IDE)，被全球数百万Python开发者所青睐。无论你是Python初学者还是经验丰富的开发者，掌握PyCharm都能显著提升你的开发效率。本文将带你从零开始，全面了解PyCharm的核心功能和使用技巧。1.PyCharm的安装与配置1.1下载与安装首先访问JetBrains官网下载PyCharm。PyCharm有
重启 bydefault
昨天从家回学校可能坐车坐脑子短路，给忘更了。不过没关系，再来一次就是了。国庆回学校，课表上的课增加了不少。没有太焦虑，只是发觉要学的东西又多了那么那么多。《阿特拉斯耸耸肩》让我觉得书有点难读，加上我本身读书就慢，这样讲可能觉得自己做什么都慢，慢到现在连女朋友都没有。因此暂时转战韩寒的《1988》，了解了韩式幽默的写作。还是明天继续耸耸肩吧。
中原焦点团队 L玲珑剔透
龙玲坚持分享第518天（2020.11.4星期三晴）晴的如此好的天气，心情也很愉悦！今天午自习加下午一二节课，所以早晨女儿上学之后，我还有时间在家里有声读书打卡，然后又读了一点晚情的《越自律，越自由》。之后把汤骨炖上，女儿中午要回来吃饭，我没时间在家做午饭，炖上汤骨，先生走时再把饭预约上，到中午先生和女儿回来时，在肉汤里添点配菜，就可以吃午饭了。下午上课，因为九年级赶课，已经学到下册的内容，每学期
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
互相学习似水年华平
今晚受群内班主任的邀请，和大家分享我的学习心得。在晚上的分享会上，我听到了分享姐妹在讲述她们的故事，我不禁感叹，姐妹们的生活都是非常自律、人生有着清晰的目标。主播100课程班姐妹分享她每天早上如何练声，以及练声小技巧。蜕变100课程班姐妹分享她如何通过学习，制定人生的小目标、大目标以及终级目标。形象管理课程姐妹分享如何通过合理搭配穿衣打扮来提升自己的自信心。我和大家分享的是通过学习情商课，让我知道
【流水账】平淡一日金台望道
6月4日，星期五，晴【流水账】平淡一日早上：继续充实《启蒙第一课》第二册内容。上午：开始阅卷，半上午完成一个班的判卷。下午：参加教学改革经验座谈交流会，散会后搭同事便车一起回京。晚上：仅得完成当日百件文物之推送。
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情