Islotus

读书笔记 - Python机器学习及实践 —— 从零开始通往Kaggle竞赛之路

第1章简介篇
1.1机器学习综述
机器学习系统具备如下特点：
>许多机器学习系统所解决的都是无法直接使用固定规则或者流程代码完成的问题，通常这类问题对人类而言却很简单。比如，计算机和手机中的计算器程序就是不属于具备智能的系统，因为里面的计算方法都有很清楚而且固定的规程；但是，如果要求一台机器去辨别一张相片中都有那些人或者物体，这对我们人类来讲非常容易，然而机器却非常难做到。
>所谓具备“学习”能力的程序都是指它能够不断地从经历和数据中吸取经验教训，从而应对未来的预测任务。我们习惯地把这种对未知的预测能力叫做泛化力(Generalization)。
>机器学习系统更加诱人的地方在于，它具备不断改善自身应对具体任务的能力。我们习惯称这种完成任务的能力为性能(Performance)。塞缪尔的西洋棋程序和谷歌的AlphaGo都是典型的借助过去对弈的经验或者棋谱，不断提高自身性能的机器学习系统。
美国卡内基梅隆大学(Garnegie Mellon University)机器学习研究领域的著名教授Tom Mitchell的经典定义：
如果一个程序在使用既有的经验(E)执行某类任务(T)的过程中被认定为是“具备学习能力的”，那么它一定需要展现出：利用现有的经验(E)，不断改善其完成既定任务(T)的性能(P)的特性。

三个关键术语：任务(Task)、经验(Experience)、性能(Performance)
1.1.1 任务
机器学习的任务种类有很多，本书侧重于对两类经典的任务进行讲解与实践：监督学习(Supervised Learning)和无监督学习(Unsupervise Learning)。其中，监督学习关注对事物未知表现的预测，一般包括分类问题(Classification)和回归问题(Regression)；无监督学习则倾向于对事物本身特性的分析，常用的技术包括数据降维(Dimensionality Reduction)和聚类问题(Clustering)等。
分类问题，顾名思义，便是对其所在的类别进行预测。类别既是离散的，同时也是预先知道数量的。例如，根据一朵鸢尾花的花瓣、花萼的长度等数据，判断其属于哪个鸢尾花亚种；鸢尾花亚种的种类与数量也满足离散和预先知晓这两项条件，因此也是一个分类预测问题。（拓展：这里也同时暴露出一个分类问题的缺陷，就是所有需要预测的类别都是已知的。如果是新物种，我们便无法根据现有经验进行判断。常见的做法是对数据样本的分类表现打分；对于没有满足阈值设定的数据样本，就需要对其做进一步分析，甚至要求人工参与鉴定。）
回归同样是预测问题，只是预测的目标往往是连续变量。比如，根据房屋的面积、地理位置、建筑年代等进行销售价格的预测，销售价格就是一个连续变量。
数据降维是对事物的特性进行压缩和筛选，这项任务相对比较抽象。如果我们没有特定的领域知识，是无法预先确定采样那些数据的；而如今，传感设备的采样成本相对较低，相反，筛选有效信息的成本更高。比如，在识别图像中人脸的任务中，我们可以直接读取到图像的像素信息。若是直接使用这些像素信息，那么数据的维度会非常高，特别是在图像分辨率越来越高的今天。因此，我们通常会利用数据降维的技术对图像进行降维，保留最具有区分度的像素组合。
聚类则是依赖于数据的相似性，把相似的数据样本划分为一个簇。不同于分类问题，我们在大多数情况下不会预先知道簇的数量和每个簇的具体含义。现实生活中，大型电子商务网站经常对用户的信息和购买习惯进行聚类分析，一旦找到数量不菲并且背景相似客户群，便可以针对他们的兴趣投放广告和促销信息。
（威斯康星大学乳腺癌肿瘤数据：https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data）
1.1.2 经验
我们习惯性地把数据视作经验；事实上，只有那些对学习任务有用的特定信息才会被列入考虑范围。而我们通常把这些反映数据内在规律的信息叫做特征(Feature)。比如，在前面提到的人脸图像识别任务中，我们很少直接把图像最原始的像素信息作为经验交给学习系统；而是进一步通过降维，甚至一些更为复杂的数据处理方法得到更加有助于人脸识别的轮廓特征。
对于监督学习问题，我们所拥有的经验包括特征和标记/目标(Label/Target)两个部分。我们一帮用一个特征向量(Feature Vector)来描述一个数据样本；标记/目标的表现形式则取决于监督学习的种类。
无监督学习问题自然就没有标记/目标，因此也无法从事预测任务，却更加适合对数据结构的分析。正是这个却别，我们经常可以获得大量的无监督数据；而监督数据的标注因为经常耗费大量的时间、金钱和人力，所以数据量相对较少。
另外，更为重要的是，除了标记/目标的表现形式存在离散、连续变量的区别，从原始数据到特征向量转化的过程中也会遭遇多种数据类型：类别型(Categorical)特征。数值型(Numerical)特征，甚至是缺失的数据(Missing Value)等。实际操作过程中，我们都需要把这些特征转化为具体的数值参与运算，这里暂时不过多交代，实例中遇到时会具体说明。
在“良/恶性乳腺癌肿瘤预测”问题中，我们所使用的经验有两个维度的特征（也许读者会觉得好奇，这里的肿块厚度和细胞尺寸都不像是真正意义的数值，更像是级别的划分。事实上，的确是这。在大多数情况下，我们都无法使用最原始的数据进行机器学习任务；更多的需要我们对数据进行预处理。）：肿块厚度(Clump Thickness)和细胞尺寸(Cell Size)；除此之外，还有对应肿瘤类型。而且，每一行都是一个独立的样本。我们所要做的便是让我们的学习模型从上述的经验中习得如何判别肿瘤的类型。我们通常把这种既有特征，同事也带有目标/标记的数据集称作训练集(Training Set),用来训练我们的学习系统。
1.1.3 性能
所谓性能，便是评价所完成任务质量的指标。为了评价学习模型完成任务的质量，我们需要具备相同特征的数据，并将模型的预测结果同相对应的正确答案进行比对。我们称这样的数据集为测试集(Testing Set).而且更为重要的是，我们需要保证，出现在测试集中的数据样本一定不能被用于模型训练。简而言之，训练集与测试集之间是彼此互斥的。
对待预测性质的问题，我们经常关注预测的精度。具体来讲：分类问题，我们要根据预测正确类别的百分比来评价其性能，这个指标通常被称作准确性(Accuracy)；回归问题则无法使用类似的指标，我们通常会衡量预测值与实际值之间的偏差大小。以“良/恶性乳腺癌肿瘤预测”问题为例，我们使用准确性作为衡量学习模型/系统性能的指标，并且用于测试的乳腺癌肿瘤样本数据有175条。
前面已经提到过，作为一个学习系统，其自身需要通过经验，不断表现出改善性能的能力。

1.2 Python编程库
1.2.2 Python 机器学习的优势
使用Python编程技巧，接触甚至掌握机器学习的经典算法至少有以下4项优势。
>方便调试的解释型语言：Python是一门解释型编程语言，与Java类似，源代码都要通过一个解释器(Interpreter),转换为独特的字节码。这个过程不需要保证全部代码一次性通过编译；相反，Python解释器逐行处理这些代码。因此方便了调试过程，也特别适合于使用不同机器学习模型进行增量是开发。
>跨平台执行作业：上面提到Python的源代码都会先解释成独特的字节码，然后才会被运行。从另一个角度讲，只要一个平台安装有用于运行这些字节码的虚拟机，那么Python便可以执行跨平台作业。这点不同于C++这类编译型语言，但是却和Java虚拟机很相似。由于机器学习任务广泛地执行在多种平台，因此以Python这类解释型语言作为编码媒介也不失为一种好的选择。
>广泛的应用编程接口：除了那些被用于编程人员自行开发所使用的第三方程序库以外，业界许多著名的公司都拥有用于科研和商业的云平台，如亚马逊的AWS(Amazon Web Services)、谷歌的Prediction API等。这些平台同时也面向互联网用户提供机器学习功能的Python应用编程接口(Application Programming Interface)。许多平台的机器学习功能模块不需要用户来编写，只需要用户像搭积木一样，通过Python语言并且遵照API的编写协议与规则，把各个模块串接起来即可。
>丰富完备的开源工具包：软件工程中有一个非常重要的概念，便是代码与程序的重用性。为了构建功能强大的机器学习系统，如果没有特殊的开发需求，通常情况下，我们都不会从零开始编程。比如，学习算法中经常会设计的向量计算；如果Python中没有直接提供用于向量计算的工具，我们还需要自己花费时间编写这样的基础功能吗？答案是否定的。Python自身免费开源的特性使得大量专业，甚至天才型的编程人员，参与到Python第三方开源工具包（程序库）的构建中。更为可喜的是，大多数的工具包（程序库）都允许个人免费使用，乃至商用。这其中就包括本书主要使用的多个用于机器学习的第三方程序库，如便于向量、矩阵和复杂科学计算的NumPy与SciPy；仿MATLAB样式绘图的Matplotlib；包含大量经典机器学习模型的Scikit-learn；对数据进行快捷分析与处理的Pandas；以及集成了上述所有第三方程序库的综合实践平台Anaconda。
1.2.3 Numpy & SciPy
NumPy(http://www.numpy.org/)是全书最为基础的Python编程库。NumPy除了提供一些高级的数学运算机制以外，还具备非常高效的向量和矩阵运算功能。这些功能对于机器学习的计算任务是尤为重要的。因为不论是数据的特征表示也好，还是参数的批量计算也好，都离不开更加方便快捷的矩阵和向量计算。而NumPy更为突出的是它内部独到的设计，使得处理这些矩阵和向量计算比起一般程序员自行编写，甚至是Python自带程序库的运行效率都好高出许多。
SciPy(http://www.scipy.org/)则是在Numpy的基础上构建的更为强大，应用领域也更为广泛的科学计算包。这是出于这个原因，SciPy需要依赖NumPy的支持进行安装和运行。对这两个编程库感兴趣的读者，可以参考下面这个在线教程详细学习它们的方法:https://docs.scipy.org/doc/numpy-dev/user/quickstart.html。
1.2.4 Matplotlib
众所周知，MATLAB作为一款功能强劲，集数据分析和展现于一体的商业软件，受到无数自然科学工作者的青睐。然而在多数情况下，只有高等学校、科研和机构和大型公司才能负担的起其昂贵的正版许可证。就普通个人对数据展现方面的需求而言，我们更加希望有类似MATLAB的绘图功能，但是允许免费使用的Python程序库。Matplotlib(http://matplotlib.org)作为一款Python编程环境下免费使用的绘图工具包，因为其工作方式和绘图命令机会和MATLAB类似，所以立刻便成了本书的首选。欲了解详情的读者可以查阅Matplotlib的在线文档http://matplotlib.org/contents.html。
1.2.5 Scikit-learn
Scikit-learn(http://scikit-learn.org/)是本书所使用的核心程序库，依托于上述几种工具包，封装了大量经典以及最新的机器学习模型。该项目最早由David Cournapeau 在2007年 Google 夏季代码节中提出并启动。后来作为 Matthieu Brucher 博士工作的一部分得以延续和完善。现在已经是相对成熟的机器学习开源项目。近十年来，有超过20位计算机专家参与其代码的更新和维护工作。作为一款用于机器学习和实践的 Python 第三方开源程序库，Scikit-learn 无疑是成功的。无论是其出色的接口设计，还是高效的学习能力，都使它成为本书介绍的核心工具包。另外 Scikit-learn 还提供了详细的英文版使用文档 http://scikit-learn.org/stable/user_guide.html,也是值得参考的辅助学习资料。
1.2.6 Pandas
如果读者有机会采访在一线从事机器学习应用的研发人员，问他们究竟在机器学习的哪个环节最耗费时间，恐怕多数人会很无奈地回答您：“数据预处理。”事实上，多数在业界的研发团队往往不会投入太多精力从事全新机器学习模型的研究；而是针对具体的项目和特定的数据，使用现有的经典模型进行分析。这样一来，时间多数被花费在处理数据，甚至是数据清洗的工作上，特别是在数据还相对原始的条件下。Pandas(http://pandas.pydata.org/)是一款针对于数据处理和分析的 Python 工具包，具体文档见 http://pandas.pydata.org/pandasdocs/stable/ 。其中实现了大量便于数据读写、清洗、填充以及分析的功能。这样就帮助研发人员节省了大量用于数据预处理工作的代码，同时也使得他们有更多的精力专注于具体的机器学习任务。
1.2.7 Anaconda

读到这里，也许会觉得前面介绍的许多工具包相互之间或多或少都存在着一些依赖关系，一时间也很难弄明白；而且实际操作也可能比较复杂。是否有一个集成平台，一旦安装便不需要考虑这些琐碎的事情了呢？答案是：既然有需求，那么一定有！对于想快速上手的初学者而言，笔者推荐使用 Anaconda(https://www.continuum.io/)平台，只要下载并安装对应操作系统以及 Python 解释器版本的程序包，便可以一次性获得 300 多种用于科学和工程计算相关任务的Python编程库的支持；本书所涉及的编程库仅仅是其冰山一角。刚兴趣的读者可以深入阅读其文档：https://www.continuum.io/documentation。

《面向模式的软件体系结构3-资源管理模式》读书笔记（7）--- Coordinator模式 weixin_33699914 人工智能
3.3Coordinator模式Coordinator（协调者）模式描述了如何通过协调涉及多个参与者（每个参与者都包含资源、资源使用者和资源提供者）的任务的完成来维护系统的一致性。这个模式提出了一个解决方案，使得在涉及多个参与者的任务中，或者所有参与者的任务都完成，或者一项任务都没有完成。这确保了系统总是处于一致的状态。1.问题很多系统都会执行涉及不止一个参与者的任务。一个参与者是一个主动实体，既
读书笔记五 ---大数据之路--数仓分层 qq_38215991 big data 大数据
数据分层在流式数据模型中,数据模型整体上分为五层。ODS层跟离线系统的定义一样,ODS层属于操作数据层,是直接从业务系统采集过来的最原始数据（进行了数据清洗）,包含了所有业务的变更过程,数据粒度也是最细的。在这一层,实时和离线在源头上是统一的,这样的好处是用同一份数据加工出来的指标,口径基本是统一的,可以更方便进行实时和离线问数据比对。例如:原始的订单变更记录数据、服务器引擎的访同日志。（原始数据
2025.03.22【读书笔记】| fastq-multx：高效barcode拆分数据解决工具穆易青读书笔记数据处理读书笔记 linux 运维服务器
文章目录1.工具介绍为什么需要`fastq-multx`？`fastq-multx`的特点2.安装方式通过源代码编译安装使用包管理器安装3.使用命令基本命令高级参数设置结语1.工具介绍在生物信息学的世界里，工具的选择至关重要。今天，我们要介绍的这个工具，就是fastq-multx，一个用于高效barcode去复用和demultiplex的解决方案。fastq-multx是一个专门设计用于处理高通量
Effective Modern C++ 条款6：auto推导若非己愿，使用显式类型初始化惯用法举个栗子2 Effective Modern C++c++
更多C++学习笔记，关注wx公众号：cpp读书笔记Item6:Usetheexplicitlytypedinitializeridiomwhenautodeducesundesiredtypes在Item5中解释了比起显式指定类型使用auto声明变量有若干技术优势，但是有时当你想向左转auto却向右转。举个例子，假如我有一个函数，参数为Widget，返回一个std::vector，这里的bool表
数智读书笔记系列021《大数据医疗》：探索医疗行业的智能变革 Allen_Lyb 数智读书笔记大数据健康医疗人工智能 python
一、书籍介绍《大数据医疗》由徐曼、沈江、余海燕合著，由机械工业出版社出版。徐曼是南开大学商学院副教授，在大数据驱动的智能决策研究领域颇有建树，尤其在大数据驱动的医疗与健康决策方面有着深入研究，曾获天津优秀博士论文、教育部博士研究生新人奖。沈江等作者也在相关学术和实践领域有着丰富的经验和深厚的专业知识。这本书系统且深入地探讨了大数据技术在医疗领域的应用与变革，对推动医疗行业的智能化发展具有重要的理论
数据挖掘导论Pangaea-Ning Tan 读书笔记——（第一，二，三章）小黄人的黄数据挖掘数据挖掘
《数据挖掘导论》Pang-NingTan，MichaelSteinbach，VipinKumar读书笔记，第一章绪论数据挖掘任务预测任务描述任务分类任务回归任务聚类分析关联分析异常检测章节导读数据挖掘数据处理第2章第3章分类第4章决策树过拟合性能评估等第5章
《5G NR标准：下一代无线通信技术》读书笔记——LTE概述 Laolu5 读书笔记 5g
目录一.LTE概述1.频谱灵活性1.1载波聚合1.2授权辅助接入2.多天线增强2.1扩展的多天线传输2.2多点协作和传输2.3增强的控制信道结构3.密集度、微蜂窝和异构部署3.1中继3.2异构部署3.3微蜂窝开关3.4双连接3.5动态TDD3.6WLAN互通4.终端增强5.新场景5.1设备到设备通信5.2机器类型通信（MTC）5.3降低时延-sTTI5.4V2V和V2X5.5飞行器未完待续一.LT
低功耗设计的影响、概述、LPMM TrustZone_ 数字IC 低功耗
文章目录0-低功率芯片技术或影响整个芯片设计流程设计挑战2-更高抽象层1.数字IC设计中的低功耗处理方式概述1.1系统层面低功耗1.2处理器层面低功耗1.3单元层面低功耗1.4寄存器层面低功耗1.5锁存器层面低功耗1.6SRAM层面低功耗1.7组合逻辑层面低功耗3-《LowPowerMethodologyManualForSystem-on-ChipDesign》读书笔记1引言1.1功耗带来的问题
《数据仓库》读书笔记：第11章非结构化数据和数据仓库 search-lemon 数据仓库数据仓库
该系列博文为《数据仓库BuildingtheDataWarehouse》一书的读书笔记，笔者将书中重点内容进行概括总结。大致保留书中结构，一部分根据自己的理解进行调整。如发现问题，欢迎批评指正。章节博文1《数据仓库》读书笔记：第1章决策支持系统的发展2《数据仓库》读书笔记：第2章数据仓库环境3《数据仓库》读书笔记：第3章设计数据仓库4《数据仓库》读书笔记：第4章数据仓库中的粒度5《数据仓库》读书笔
两周学习安排 3分人生学习
日常安排白天看MySQL实战45讲，每日一讲看图解设计模式每天1-2道力扣算法题（难度中等以上）每天复习昨天的单词，记20个单词，写一篇阅读晚上写服创项目每日产出MySQL实战45讲读书笔记设计模式读书笔记力扣算法题ac记录单词本截图项目接口文档记录，git提交记录第二周MySQL：精读第1-6讲设计模式：学习工厂方法、抽象工厂、单例、建造者、适配器、桥接模式算法：每日1-2题第三周MySQL：精
嵌入式Linux设备驱动程序开发指南17（IIO子系统一）——读书笔记 Jack.Jia linux驱动 linux 运维服务器
IIO子系统一十七、IIO子系统(一)17.1简介17.2数模转换——DAC实验17.2.1IIO缓冲区17.2.2触发器17.2.3工业I/O事件17.2.4iio工具17.2.5LTC2607——DAC模块介绍17.2.5.1设备树17.2.5.2LTC2607驱动模块介绍17.2.5.2.1用作I2C交互的工业框架17.2.5.2.2用作IIO设备的工业框架17.2.5.3源代码17.3模数
丹尼尔·卡尼曼《噪声》——读书笔记阅读读书笔记思维
好久没有写博客了，趁着出差有时间，读完了《噪声》这本买了很久的书，整体感觉还是有一些认知层面的迭代的，也整理下书中的一些内容，让自己能够沉下心来把思维和逻辑整理清楚，也能给大家做个分享。书籍介绍这本书是已故诺贝尔经济学奖得主丹尼尔·卡尼曼的新书，之前就是在这位作者去世的时候买回来学习的。本书主要讲的是人类在判断过程中的一个常见“噪声”问题，由于人或者时间原因导致决策的随机性偏差。这本书通过对人类决
【读书笔记】《What is Mathematics》第一章：自然数还没入门的大菜狗具体数学读书笔记
为什么要读这本书啊？为什么要学数学？正如书的扉页所述：两千年以来，谙熟一定的数学知识是每一个文明人应有的基本智力为什么作为一个程序猿，也要从头学数学？我数学渣锻炼自己解决问题的能力数据结构逻辑训练为将来转行数据科学做底子（也许永远都不会转）考研（emmm想考一个非全日制玩一玩，感觉非全日制很适合工科学生）嗯，有了以上的理由，所以一定要坚持下去✊为什么是这本书？那么这本书做了什么呢？对整个数学领域中
【C++基础】第十一课：处理类型 x-jeff C++基础 c++开发语言
【C++基础】系列博客为参考《C++Primer中文版（第5版）》（C++11标准）一书，自己所做的读书笔记。1.类型别名类型别名是一个名字，它是某种类型的同义词。使用类型别名有很多好处，它让复杂的类型名字变得简单明了、易于理解和使用，还有助于程序员清楚地知道使用该类型的真实目的。有两种方法可用于定义类型别名。1.1.typedef第一种方法是使用关键字typedef，是一种比较传统的方法。typ
《DAMA数据管理知识体系指南》第十章参考数据和主数据管理读书笔记数据大包哥大数据
《DAMA数据管理知识体系指南》第十章参考数据和主数据管理读书笔记1.引言主数据和参考数据是组织跨系统共享的核心资源，其一致性直接影响业务决策和数据质量。主数据（如客户、产品）描述核心业务实体，参考数据（如国家代码、行业分类）提供分类和标准化支持。管理目标包括：确保数据完整、一致、最新降低集成成本和风险提升数据可信度参考数据和主数据语境关系图如图10-1所示。1.1业务驱动因素1.1.1主数据管理
《期权、期货及其他衍生产品》读书笔记（第五章：确定远期和期货价格） PerpetualLearner #期权量化期权期货衍生品远期价格期货价格
5.1投资资产与消费资产投资资产（InvestmentAsset）：至少有一些交易员仅仅是为了投资目的而持有的资产。可以从无套利假设出发，由即期价格与其他市场变量得出远期价格和期货价格。消费资产（Consumption）：持有目的主要是消费而不是投资。无法推演价格。5.2卖空交易另类报升（AlternativeUptick，2010.2）：当某一股票价格在某一天的跌幅超过10%时，在这一天与下一天
《Head First设计模式》读书笔记 —— 单件模式 Vcats 《Head First设计模式》读书笔记设计模式单例模式
文章目录为什么需要单件模式单件模式典型实现剖析定义单件模式本节用例多线程带来的问题解决问题优化Q&A总结《HeadFirst设计模式》读书笔记相关代码：Vks-Feng/HeadFirstDesignPatternNotes:HeadFirst设计模式读书笔记及相关代码用来创建独一无二的，只能有一个实例的对象的入场券为什么需要单件模式有些对象只能有一个实例线程池、缓存、对话框、设备的驱动程序的对象
【转载】2020融云：基于WebRTC的低延迟视频直播等风来不如迎风去 WebRTC入门与实战 webrtc 音视频网络
原文直接访问本文是读书笔记。基于WebRTC的低延迟视频直播需要学习rtp包的缓存设计，于是找到了这一篇文章rtp包缓存如何适应直播需求？直播与实时通信的区别流量更少：RTMP或者HLS主要基于TCP传输，WebRTC是基于UDP的传输，**UDP协议的头小。**TCP为了保证传输质量，因此会产生很多ACK，在网络不好的情况下会产生很多重传包，而WebRTC传输是基于RTP和RTCP，重传策略是基
《DAMA数据管理知识体系指南》第五章数据建模和设计读书笔记总结数据大包哥 #数据治理大数据
《DAMA数据管理知识体系指南》第五章数据建模和设计读书笔记总结在《DAMA数据管理知识体系指南》中，第五章围绕数据建模和设计展开深入探讨，数据建模和设计作为数据管理的关键环节，对组织有效理解、管理和利用数据起着基础性作用，为企业实现数据驱动的决策和运营提供了重要支撑。一、数据建模和设计的基础概念1.1定义与重要性数据建模是发现、分析和确定数据需求，并采用数据模型的精确形式表示和传递这些需求的过程
【机器学习基础】第六课：线性回归 x-jeff 机器学习基础机器学习线性回归人工智能
【机器学习基础】系列博客为参考周志华老师的《机器学习》一书，自己所做的读书笔记。1.线性模型基本形式给定由ddd个属性描述的示例x=(x1;x2;...;xd)\mathbfx=(x_1;x_2;...;x_d)x=(x1;x2;...;xd)，那么线性模型的基本形式可写为：f(x)=w1x1+w2x2+w3x3+...+wdxd+bf(\mathbfx)=w_1x_1+w_2x_2+w_3x_3
《JavaScript高级程序设计》——第四章：变量、作用域与内存管理 dorabighead javascript 开发语言 ecmascript
《JavaScript高级程序设计》——第四章：变量、作用域与内存管理大家好！我是小哆啦，欢迎回到《JavaScript高级程序设计》的读书笔记大本营！在这章中，我们要聊的是两个让人头疼又迷人的话题——变量、作用域与内存管理。有些人一提到这些，就会感到一阵头晕目眩，恍若置身一场JavaScript版的迷宫大冒险！但今天，小哆啦会带你们轻松过关，深入了解这些概念，并且保持足够的幽默感，让你既能笑着学
《Spring实战》读书笔记-第3章高级装配 2401_89790580 spring oracle 数据库
Spring表达式语言在上一章中，我们看到了一些最为核心的bean装配技术。你可能会发现上一章学到的知识有很大的用处。但是，bean装配所涉及的领域并不仅仅局限于上一章所学习到的内容。Spring提供了多种技巧，借助它们可以实现更为高级的bean装配功能。在本章中，我们将会深入介绍一些这样的高级技术。本章中所介绍的技术也许你不会天天都用到，但这并不意味着它们的价值会因此而降低。3.1环境与prof
【深度学习入门：基于python的理论与实现读书笔记】第五章误差反向传播法 Bin二叉深度学习 python 人工智能
目录摘要第五章误差反向传播法简单层的实现乘法层的实现加法层的实现激活函数层的实现ReLU层Sigmoid层Affine层和Softmax层的实现Affine层Softmax-with-Loss层误差反向传播法的实现摘要该文章简要介绍了神经网络的误差反向传播法，省去了大量的推理过程，重点讲述了神经网络误差反向传播法的代码实现。第五章误差反向传播法反向传播就是从后到前局部计算偏导数并将其与从上游传来的
使用 LLM 实现的 RSS 个性信息推送，效果实测 day2
每天早上，我都会点开coze推送的RSS邮件，经常能找到感兴趣的有用信息。因为铺天盖地的deepseek，蹭热点的文章很多，我往往只瞄一眼标题今天出现了这么3条信息，实在开心嵌入式那条，原因是我最近笔记里写了nRF的开发配置，我正在被zephyr开发工具链折磨。工作记忆那一条，跟我最近《学习的门道》读书笔记有关隐私优先那一条，跟我跟xBeta讨论笔记工具有关每天推送的邮件让人期待的感觉真好。
读书笔记 - 代码整洁之道：程序员的职业素养天罚神读书笔记 java
读书笔记-代码整洁之道：程序员的职业素养第1章职业道德了解你的领域，每个专业软件开发人员必须精通的事项坚持学习练习辅导第2章说“不”对抗角色高风险时刻要有团队精神试试看消极对抗说"是"的成本如何写出好代码第3章说“是”承诺用语承诺识别缺乏承诺的征兆坚守原则第4章编码不要在疲劳的时候写代码不要在焦虑的时候写代码理性应对中断如何应对阻塞状态关于调试保持好节奏进度延迟加班帮助帮助他人接受他人的帮助辅导定
读书笔记 - 修改代码的艺术天罚神读书笔记 java
读书笔记-修改代码的艺术第1章修改软件第2章带着反馈工作系统变更方式反馈方式遗留代码修改方法第3章感知和分离伪协作程序模拟对象第4章接缝模型接缝第5章工具自动化重构工具单元测试用具第6章时间紧迫，但必须修改新生方法（SproutMethod）新生类（SproutClass）包装方法包装类装饰器模式第7章永远都无法完成的修改第8章如何添加新特性测试驱动开发测试驱动开发使用了下面这样的步骤：对于遗留代
Effective Objective-C 2.0 读书笔记——内存管理（下）小鹿撞出了脑震荡 objective-c java 开发语言
EffectiveObjective-C2.0读书笔记——内存管理（下）在dealloc方法中只释放引用并解除监听对象在经历其生命期后，最终会为系统所回收，这时就要执行dealloc方法了。在每个对象的生命期内，此方法仅执行一次，也就是当保留计数降为0的时候。在这个方法之中，主要就是释放对象所拥有的引用。比如CoreFoundation对象就必须手工释放，因为它们是由纯C的API所生成的。在dea
【转】时间序列分析——基于R，王燕 weixin_30780221 r语言
《时间序列分析——基于R》王燕，读书笔记笔记：一、检验：1、平稳性检验：图检验方法：时序图检验：该序列有明显的趋势性或周期性，则不是平稳序列自相关图检验：（acf函数）平稳序列具有短期相关性，即随着延迟期数k的增加，平稳序列的自相关系数ρ会很快地衰减向0（指数级衰减），反之非平稳序列衰减速度会比较慢构造检验统计量进行假设检验：单位根检验adfTest()——fUnitRoots包2、纯随机性检验、
《构建之法》 –读书笔记 Lishq2004 读书笔记软件开发软件工程读书笔记构建
《构建之法》–读书笔记lishq为什么读这本书:这是一本非常接地气的讲《软件工程》的书，第一次了解到这本书是从豆瓣上看到，看了下密密麻麻的正面评论，觉得内容应该不错。翻阅了几个章节，发现干货确实挺多。为方便大家了解，摘抄作者简介以及部分书评如下。---------------------------------------------------------------------------
Java程序性能优化读书笔记（一）：Java性能调优概述 anxunnian1498 java 数据库操作系统
程序性能的主要表现点：执行速度：程序的反映是否迅速，响应时间是否足够短内存分配：内存分配是否合理，是否过多地消耗内存或者存在内存泄漏启动时间：程序从运行到可以正常处理业务需要花费多少时间负载承受能力：当系统压力上升时，系统的执行速度、响应时间的上升曲线是否平缓衡量程序性能的主要指标：执行时间：程序从运行到结束所使用的时间CPU时间：函数或者线程占用CPU的时间内存分配：程序在运行时占用内容的空间磁
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

读书笔记 - Python机器学习及实践 —— 从零开始通往Kaggle竞赛之路

你可能感兴趣的:(读书笔记)